示的词相似度计算-电动数控滚圆机滚弧机张家港电动钢管滚圆机滚
作者:lujianjun | 来源:欧科机械 | 发布时间:2019-06-21 11:51 | 浏览次数:

词相似度计算在自然语言处理、信息抽取等研究中发挥重要作用。基于语料的词相似度计算是一类重要方法,其基本思路是从语料中学习词的向量表示,基于向量余弦相似度值作为词的语义相似度。本文提出一种新的基于免疫原理词表示的词相似度计算方法,并在Sem Eval 2012 Task 4数据上进行了验证并和其他方法进行比较,实验表明本文的方法是有效的,并且优于大多数比较系统。 数据,该评价数据参照WS-353[10]构建,包含348个词对,50个词对用于开发。在评测提交的结果中,最好的结果达到0.05的相关系数[18]。本文实验采用这个评价数据。2基于免疫原理词表示的词相似度计算2.1词的表示文献[4]示的词相似度计算-电动数控滚圆机滚弧机张家港电动钢管滚圆机滚弧机折弯机提出了基于免疫原理的词表示和学习模型,该词表示受B细胞和词的一致性启发。在语句的依存结构中,一个词既处于支配的上下文中本文由公司网站滚圆机网站采集转载中国知网资源整理!www.gunyuanji.name,又处于依赖的上下文中,因此基于免疫原理的词表示是把词表示成两个向量,一个向量表示词的支配属性,另一个向量表示词的依赖属性。词表示方法如图1所示。词w的形式化表示如式(1)和式(2)所示,互补位Pw表示词w的支配属性及对应的权重,独特性Iw表示词w的依赖属性及对应的权重。图1基于免疫原理的词表示F,(dfwNp,ωwdfwNI)}(2)2.2词相似度计算分布语义假设(Dis认为出现在相似上下文的词具有相似的语义[19-20]。在本研究中,有关词的上下文分开为支配上下文和依赖上下文,因此,可把分布语义假设扩展为:如果两个词具有相似的支配上下文和相似的依赖上下文,那么两个词具有相似的语义。基于该假设,词w1和词w2的相似度计算公式如式(3)所示。sim(w1,w在式(3)中,simcosine(x,y)是余弦相似度函数,Pw和Iw分别表示词的支配属性向量和依赖属性向量。余弦相似度示的词相似度计算-电动数控滚圆机滚弧机张家港电动钢管滚圆机滚弧机折弯机本文由公司网站滚圆机网站采集转载中国知网资源整理!www.gunyuanji.name