实体链接的相关研究有着重要的意义:
实体链接的研究主要分两大块:
其中, 概率模型相似度 又可以细划分为:基于 主题模型 (计算主题相似度)和基于 语言模型 (计算生成概率)。
注释 : 流行度(popularity) 要与一些论文中的 commonness(常见度) 做区分, commonness刻画为: p(entity=e) = |in(e)| / |W| , 其中 in(e)是指向实体e的文档集合. 此外, 该值也可刻画为 p(entity=e) = |(anchors->e)| / |E| . 这些名词在不同的文献中有着不同的定义,一定要注意!
参考文献: [1]. 郭宇航, 秦兵, 刘挺,等. 实体链指技术研究进展[J]. 智能计算机与应用, 2014, 4(5):9-13. [2]. 舒佳根. 中文实体链接研究[D]. 苏州大学, 2015. [3]. D. Milne and I. H. Witten. Learning to link with wikipedia, 2008. [4]. Ratinov L, et al. Local and Global Algorithms for Disambiguation to Wikipedia[C], 2011.