资源行业动态知识图谱在零售业中的应用

知识图谱在零售业中的应用

2020-01-13 | |  106 |   0

原标题:知识图谱在零售业中的应用

来源:AI 研习社           链接:https://www.yanxishe.com/TextTranslation/2346


《编辑》杂志以一年一度的“黑客周”结束了2019年,这是在风险最小的情况下测试新创意的绝佳机会,同时也促进跨团队和专业的协作 。去年,我的团队致力于一个我一直热衷探索的研究领域:知识图表图谱。如何在零售业中利用和优化它们?

01副本.png01副本22.png


知识的兴起

在科技行业,知识图谱正呈爆炸式增长。语音助手、在线零售推荐和搜索引擎都在使用它们,而Facebook、谷歌和Netflix等科技巨头是它们最大的支持者。你很可能每天都能在谷歌搜索中看到一个方框或“知识面板”。谷歌使用从类似Wikipedia这样的网站上抓取的数据,这些网站使用JSON LD模式来声明页面的结构化数据,以及它根据自己对用户行为的理解来扩展搜索结果。以搜索 David Bowie  (左)为例。谷歌返回来自Wikipedia的摘要信息,如出生地、出生日期和配偶,以及流行歌曲和电影,以及用户定义的“用户同样也搜索了”。这就产生了一个信息更丰富的面板,其中数据是以实体为中心的,也就是“事物不是字符串.”

02.png

David Bowie   图谱


如果我们将David Bowie的从影记录数据视为一个图谱,它看起来就像上面这样:David Bowie(用红色表示人类节点)通过一个act in relationship连接到不同的电影(用蓝色表示电影节点)。我们可以使用与这些节点相关的数据(如电影中的其他演员)或与person节点相关的数据(如黄色的出生年份)进一步扩展此功能。


这个简单的图形可以以一种直观的方式存储数据,从而支持对传统RDBMS难以实现的查询(例如下面的链接)。我们可以看到这些关系,来自节点的每个路径都有一个相关的含义,比如“


acted in”。这种形式在本体论中,我们将领域特定的知识表示为属性、实体、概念和数据之间的连接和关系。


零售产品图谱

许多数据适合于本体模式,零售也不例外。让我们来看看编辑后的产品如何被视为产品图谱。为了方便起见,我们只包含了产品数据和字段的一个子集。有许多包可以用来构造图形,我们使用流行的Neo4j平台。

03.jpg

使用Neo4j将编辑后的产品化作图谱


这里我们有一个产品节点(橙色),它的名称具有唯一标识符。在这个产品节点中,我们有几个指向其他节点的关系,包括:HAS ATTR(绿色)、COLOR(蓝色)、CARE(粉红色)、BRAND(红色)和CATEGORY (beiqe)。have ATTR指的是一个属性,例如,这个产品包含了一个fastening,以及使用简单的TF-IDF单词提取(使用权重来分离重要属性的单词)来查找产品的名称、描述和维护。品牌是直接在抓取的时候取的。而其他关系,如类别和颜色,则是使用文本和基于图像的机器学习来发现的。


以这种格式存储零售数据就创建了一个可解析的数据结构。强调与产品以及其他产品的关系。例如,其他具有“ruffle”特性的产品也将指向“ruffle”节点,如下所示。这种结构还允许在我们抓取时不断地从管道中获取数据,因为图是可以适应的。通过将数据以图的形式存储,我们还可以应用使用图论制定的算法,如利用最近邻居的最短路径(这可能有助于产品匹配)和链接预测,在这些算法中,我们可以预测节点之间的关系。

1578914721373810.png

提取与我们的产品共享“ruffle”特性的其他产品 


陷入语义学

到目前为止,我们已经讨论了很多关于将数据表示为图的问题,但是我们讨论过知识图谱吗?在这个话题上有一些不同的观点,但我更倾向于将知识图谱定义为添加了特定领域知识的本体(参见Ehrlinger等人的论文)。虽然我们的产品数据使用机器学习来提取我们用作图中节点的产品属性,但对我来说,知识图谱使用外部数据或对零售的理解来构建本体。


例如,EDITED在我们的产品图中使用Burberry作为品牌节点。如果这是存在于知识图谱,它将有信息存储在节点,例如公司在何时何地成立,以及与品牌相关的某些属性,如遗产,印刷,奢侈品,Ricaardo Tisci(首席创意官)等。这需要零售专家的精心策划和深入研究。为了使这个知识图谱与我们的产品图区分明显,节点被涂成黄色。

05.png

零售知识图谱的示例子集使用与Burberry相关的词汇。节点类型包括年份、公司、国家、人员和关联词。


查询扩展——增强搜索引擎

现在我们有了一个零售知识图谱(其中黄色节点是零售行业中具有语义关系的实体)和一个EDITED的产品图(如颜色和品牌等产品数据的多色节点),我们可以利用这两个节点进行一些高级查询扩展。

我们利用知识图谱中的语义信息来获取与文化语境相关的词汇。以我们上面与Burberry相关的词汇为例,特别是通过“BRAND_FROM”连接到“Britain”的节点。我们可以使用这组知识图谱来返回英国品牌,如Burberry和Paul Smith。

下面我们在我们的产品图中有一个Burberry产品和一个Paul Smith产品,通过它们在知识图谱中相互关联的关系。它们在产品图中也通过一些共享节点(如连衣裙、衬衫、印花等)相互关联。因此,如果我们要搜索“英国设计师衬衫裙”,我们的知识图谱将返回基于英国品牌的结果,一个简单的搜索(如fuzzy)能确保我们专注于衬衫裙。

06.png


按品牌原产国分类的相关产品


语义搜索在零售业中很常见,特别是像“时髦的裙子”或“跳舞用的裙子”这样的搜索,会比搜索“黑色不对称亮片迷你裙”这样的特定产品名称更常见。我们还可以使用基于产品属性和语义实体的知识图谱将词汇关联在一起,与其说是本体,不如说是关键字联系,来构造简单的基于规则的分类,从而实现快速扩展。同样,行业专家在这个过程中至关重要的是,要根据他们对零售业的知识来选择这些词汇。下面是我们知识图谱的一个子集——一个与“party”相关的设计好的词汇列表。我们可以用这个来扩大客户的搜索范围。

1578914903389240.png

一个关于“party”的零售知识图谱子集

通过搜索“sassy dress”,我们可以在两个“路径长度”(即箭头)内从知识图谱返回与“sassy”相关的所有精确单词。我们还可以将其扩展到路径长度>2 以进一步挖掘知识图谱的关系,例如,返回以这些属性著称的品牌。这将返回一个“party”集群来查询我们的产品图,返回所有具有party相关词作为属性的产品(即通过HAS-ATTR关系),从而扩展我们原来的查询。我们可以使用知识图谱的任何部分重复此过程,例如,“leather jacket(皮夹克)”使用织物的本体(如皮革和绒面革),“sustainable(可持续)”使用可持续的本体(相关联的品牌、材料、关联词等)。

08.png

利用零售知识图谱来使用查询扩展,从而查询我们的产品图


这种将知识图谱连接到产品图的方法也允许我们进一步探索我们的零售数据。我们可以通过观察与某些词的连接增加,以及品牌之间共享节点数量增加的品牌集群,开始看到趋势集群的形成。


最后的思考

事实证明,知识图谱对科技的未来和零售业的下一次重大革命有着巨大的贡献。在几天的时间里,我们只报道了他们在零售业的一小部分潜力。然而,它们可以为零售公司带来巨大的价值,这些公司希望改进搜索扩展、个性化在线推荐、预测趋势、产品匹配等等。我们期待着在《编辑》杂志探索所有这些可能性。

THE END

免责声明:本文来自互联网新闻客户端自媒体,不代表本网的观点和立场。

合作及投稿邮箱:E-mail:editor@tusaishared.com

上一篇:NeurIPs 2019 最新最猎奇的论文有哪些?

下一篇:深度学习的 12 个面试问题(一)

用户评价
全部评价

热门资源

  • 国内人才报告:机...

    近日,BOSS 直聘职业科学实验室 &BOSS 直聘研究院...

  • AI使物联网更智能...

    看到微软对物联网和人工智能的结合感兴趣是一个明...

  • 推荐一批学习自然...

    这里推荐一批学习自然语言处理相关的书籍,当然,...

  • 安防智能化大势下...

    大部分传统安防设备不仅拍摄视野有限,而且无法事...

  • 20亿创业基金、10...

    近日,杭州举办了建设国家新一代人工智能创新发展...