维基百科提供了许多特殊页面,可以帮助谷歌更好地理解、分组和分类实体。
用于按实体类型和类别进行分类的列表和类别页面
维基百科中实体所属的类别总是可以在文章末尾找到(见 5c)。在类别页面上,您将找到分配给此类别的所有主要类别、子类别和实体的概览。
列表页面(例如此处)与类别页面类似,提供与列表主题相关的所有元素的概述。
使用这两种页面类型,Google 可以将相应的实体分配给实体类型和类别。
与其他大型知识数据库相比,维基百科的类型类别最多。
资料来源:Krisztian Balog 的面向实体的搜索
科学论文《利用百科知识进行命名实体消歧》展示了维基 亚马逊数据库 百科在识别实体及其主题背景方面可以发挥的核心作用 。
谷歌可以通过维基百科内的注释或链接建立实体之间的关系。
“注释 是将 提及内容链接到实体。 “ 标签 是对文本的注释,它使用一个实体来捕获输入文本中的主题(明确提及)。”
重定向特殊页面以识别同义词
诸如此类有关互联网营销主题的特殊页面将维基百科用户引导至主要术语。在此示例中,互联网营销 (Internet Marketing)是主要术语在线营销 ( Online Marketing)的同义词。使用这些转发术语,Google 可以识别实体的同义词并将其分配给主要术语。这与搜索引擎优化中的规范标签类似。
用于识别多重含义的定义页面
诸如此类有关迈克尔·乔丹 (Michael Jordan)的定义页面概述了所有包含迈克尔·乔丹 (Michael Jordan) 这个名字的实体。这适用于 5 个不同的实体。请注意,所有 5 个实体的标题措辞不同,以清楚地区分它们。
这让 Google 可以概览哪些名称含有歧义实体。