知识表示指的是存储在知识图谱中的数据使用何种语言或者何种数据结构进行描述,从而能够使得知识图谱中的知识运算更加快捷高效。知识表示的方式主要可分为三种,一种是以三元组的形式对知识进行表示,一种是以图结构的形式对知识进行表示,还有一种是以向量的形式对知识进行表示。

(1)RDF三元组形式表示

从数据结构的角度来看,可以把知识图谱视为一个由节点与边组成的图形结构,其中节点代表一个类、概念、属性值或实体,边代表节点之间的关系。W3C制定了三种主流的技术标准用于描述由节点与边组成的图形逻辑,分别是RDF、RDFS、OWL,它们均把三元组作为底层基本的数据结构。

(2)图结构数据形式表示

由节点与边组成的RDF三元组本质上就是图结构数据,但基于RDF、RDFS或OWL标准的三元组所构建的知识图谱过于复杂,查询效率比较低,实际上不如基于图数据库的构建方便好用。图数据库舍弃了RDF、RDFS、OWL等本体定义标准中对于实体分类的复杂定义,仅用节点与边这种图结构来存储链接数据,因此在查询效率上图数据库相比于三元组数据库速度更快,这也是本文使用Neo4j图数据库取代Jena三元组数据库存储学术数据的主要原因之一。

(3)向量形式表示

近年来随着计算机运算能力的不断升级,神经网络重新走进公众的视野,又一次掀起了人工智能时代的浪潮。随着NLP自然语言处理中词向量嵌入技术的流行,人们开始使用低维稠密的向量来表示知识。对于知识图谱三元组中的主语、谓语和宾语使用词嵌入(WordEmbedding)技术转为初始的低维向量,然后将这些向量作为数据源输入到神经网络,通过不断地学习训练最终获得实体和关系在低维向量空间中的投影向量。使用向量进行知识表示为知识推理带来了新的启发,人们根据向量间的加减乘除四则运算获取到新的事实与关系向量,并且能够得到一些隐藏的事实与依据,因为这些隐藏的事实通常在现实中是不易被察觉、被人们主观所忽略的,通过向量空间内的逻辑运算才得以被发现。

声明:如果您在下载时遇到问题,或发现本站文章存在版权、稿酬或其它问题,请通过邮件yblook@foxmail.com或客服微信yblook_com联系我们,我们将第一时间回复您,并作平台维护、下架、删除等处理。 数研咨询 书云 流芳阁
研报之家 » 知识的表示方法