人工智能知识图谱概念和定义:
辛格博士在介绍知识图谱时提到的:“The world is not made of strings , but is made of things.” ”,知识图谱旨在描述真实世界中存在的各种实体或概念。其中,每个实体或概念用一个全局唯一确定的ID来标识,称为它们的标识符(identifier)。每个属性-值对(attribute-value pair,又称AVP)用来刻画实体的内在特性,而关系用来连接两个实体,刻画它们之间的关联。知识图谱亦可看作是一张巨大的图,图中的节点表示实体或概念,而图中的边则由属性或关系构成。
①实体:实体指的是具有可区别性且独立存在的某种事物。
世间万物即为实体,如某一种动物、某一个人、某一种植物、某一种商品。
②语义类(概念):主要指集合、类别、对象类型、事物的种类,如同人物、地理等。
③内容:内容通常作为实体和语义类的名字、描述、解释等,可以由文本、图像、音视频等来表达。
④属性(值):指一个实体指向它的属性值。
不同的属性类型对应不同类型属性的边。属性值主要指对象指定属性的值。
⑤关系:关系形式化为一个函数,它把K个点映射到一个布尔值。在知识图谱上,关系则是一个把K个图节点(实体、语义类、属性值)映射到布尔值的函数。
三元组的基本形式主要包括(实体1—关系—实体2)和(实体—属性—属性值)等。每个实体(概念的外延)可用一个全局唯一确定的ID来标识,每个属性—属性值对AVP可用来刻画实体的内在特性,而关系可用来连接两个实体,刻画它们之间的关联。换句话说,知识图谱是由一条条知识组成,每条知识表示为一个主语—谓语—宾语(SPO)三元组。
主语主题可以是国际化资源标识符internationalized resource identifiers(IRI)或空白节点(blank node)。
谓语属性通常是国际化资源标识符。
宾语客体是国际化资源标识符、空白节点或常量。
清华大学是一个实体,北京大学是一个实体,北京大学—院系—信息与工程科学部是一个(实体—关系—实体)的三元组样例。北京大学是一个实体,教工数是一种属性,20916是属性值。北京大学—教工数—20916构成一个(实体—属性—属性值)的三元组样例。