一种改进的中文实体关系抽取方法

一种改进的中文实体关系抽取方法

摘 要:实体关系抽取是指从文本中发现两个实体之间的关系。提出一种新的基于语义核的中文实体关系抽取方法,在通常的序列核中嵌入语义信息,然后用改进后的k 均值算法进行聚类。实验结果证明我们的方法是比较有潜力的。

关键词:关系抽取;k

均值;语义核

1 中文实体关系抽取方法介绍

实体识别、关系抽取和事件抽取等是信息抽取包含的几个子任务。实体关系抽取不仅是信息抽取中的一项重要任务,也是事件抽取和其他应用的基础。关系抽取的主要任务是搜索并判定命名实体之间

的特定关系。

例如:在句子“抗议者抢夺了几个加油站”,关系抽取的任务就是识别“抗议者”(PERSON 实体)和“加油站”(LOCATION 实体)之间的“LOCATED AT”关系。

目前,至少有3种学习模式被应用到关系抽取任务中:有导、半

指导和无指导方法。

在有导方法中,首先对语料库中的句子进行人工标注实体及之间的关系,然后进行训练,并开始抽取。这种方法有个局限性:标注训练语料库是一个非常耗时、耗精力的事情,所以一般很难推广。半指导的方法是首先使用种子模式,然后进行自举学习。然后用这些种子去抽取新的模式,并用这种新的模式继续抽取新的种子。这种方法的问题是种子的选择存在很大的主观性。如果种子没选择好,会导致错

一种改进的中文实体关系抽取方法

摘 要:实体关系抽取是指从文本中发现两个实体之间的关系。提出一种新的基于语义核的中文实体关系抽取方法,在通常的序列核中嵌入语义信息,然后用改进后的k 均值算法进行聚类。实验结果证明我们的方法是比较有潜力的。

关键词:关系抽取;k

均值;语义核

1 中文实体关系抽取方法介绍

实体识别、关系抽取和事件抽取等是信息抽取包含的几个子任务。实体关系抽取不仅是信息抽取中的一项重要任务,也是事件抽取和其他应用的基础。关系抽取的主要任务是搜索并判定命名实体之间

的特定关系。

例如:在句子“抗议者抢夺了几个加油站”,关系抽取的任务就是识别“抗议者”(PERSON 实体)和“加油站”(LOCATION 实体)之间的“LOCATED AT”关系。

目前,至少有3种学习模式被应用到关系抽取任务中:有导、半

指导和无指导方法。

在有导方法中,首先对语料库中的句子进行人工标注实体及之间的关系,然后进行训练,并开始抽取。这种方法有个局限性:标注训练语料库是一个非常耗时、耗精力的事情,所以一般很难推广。半指导的方法是首先使用种子模式,然后进行自举学习。然后用这些种子去抽取新的模式,并用这种新的模式继续抽取新的种子。这种方法的问题是种子的选择存在很大的主观性。如果种子没选择好,会导致错


相关文章

  • 人物关系抽取
  • 学 士 学 位 论 文 论文题目: 基于人物信息嵌入的人物关系挖掘 姓 名: 刘春花 学 号: BK1231209 院 系: 信息科学学院 专 业: 计算机科学与技术 指导教师: 于东 二〇一六 年 六 月 北京语言大学学士学位论文 (20 ...查看


  • 知识图谱技术原理介绍
  • 知识图谱技术原理介绍 近两年来,随着Linking Open Data 1等项目的全面展开,语义Web 数据源的数量激增,大量RDF 数据被发布.互联网正从仅包含网页和网页之间超链接的文档万维网(Document Web )转变成包含大量描 ...查看


  • 基于依存语义分析的答案抽取系统
  • 基于依存语义分析的答案抽取系统 罗 强 于洪霜 (1. 中国工商银行软件开发中心510630) (2. 广东岭南职业技术学院 510663) 摘 要: 在答案抽取应用中,通过分析查询条件和备选答案间的逻辑关系,能否有效估计两者的逻辑相似度, ...查看


  • 一种基于TFIDF方法的中文关键词抽取算法
  • p 徐文海, 温有奎(西安电子科技大学 经济管理学院, 陕西 西安 710071) 一种基于TFI DF 方法的中文关键词抽取算法 摘 要:本文在海量智能分词基础之上, 提出了一种基于向量空间模型和TF I DF 方法的中文关键词抽取算法. ...查看


  • 文本情感分析论文总结
  • 文本情感分析 赵妍妍, 秦兵, 刘挺 - 软件学报, 2010 - jos.org.cn 按粒度,情感分析可分为词语级.短语级.句子级.篇章级.多篇章级:按文本类别,可分为基于新闻评论和基于产品的情感分析. 情感分析的研究任务:情感信息的抽 ...查看


  • 基于百科资源的多策略中文同义词自动抽取研究(1)
  • 基于百科资源的多策略中文同义词自动 抽取研究* 陆 勇 章成志 侯汉清 摘 要 采用实证的方法, 以百度百科语料库为实验抽取对象, 在对同义词自动抽取技术分析比较的基础上, 提出了多策略的中文同义词抽取的思路.综合利用字面相似度方法.特征模 ...查看


  • 基于短语的阿拉伯语到中文的机器翻译系统
  • 第26卷第6期2009年6月 计算机应用研究 ApplicationResearchofComputers Vol.26No.6Jun .2009 基于短语的阿拉伯语到中文的机器翻译系统 李 凯,郑 洁,蒋同海 (中国科学院新疆理化技术研究 ...查看


  • 会计信息集成中的数据采集方式优化问题
  • □财会月刊全国优秀经济期刊· 会计信息集成中的数据采集方式优化问题 刘依恬 刘亦陈(教授) (南昌大学经济与管理学院南昌330031) [摘要]数据采集是会计信息化的开始环节,目前主流ERP系统的数据采集方式还不能充分满足企业对会计信息集成 ...查看


  • 024047中文文本情感倾向性分析
  • 中文文本情感倾向性分析 1 黄萱菁 赵 军关键词:情感倾向 语料库 复旦大学 向-文本情感倾向性分析. 引言 所谓文本情感倾向性分析,就是对说话人的态度(或称观点.情感)进行分析,即对文大约在两年半前,<新华网>.<环球时 ...查看


热门内容