上QQ阅读APP看本书,新人免费读10天
设备和账号都新为新人
1.2.3 关系抽取
关系抽取指的是检测和识别文本中实体之间的语义关系,并将表示同一语义关系的指称(Mention)链接起来。图1-1所示为关系抽取的一个示例。输出通常是一个三元组(实体1,关系类别,实体2),表示实体1和实体2之间存在特定类别的语义关系。例如,句子“北京是中国的首都、政治中心和文化中心”表述的关系可以表示为(中国,首都,北京)、(中国,政治中心,北京)和(中国,文化中心,北京)。语义关系类别可以预先给定(如ACE评测中的七大类关系),也可以按需自动发现(开放域信息抽取)。关系抽取通常包含两个核心模块:关系检测和关系分类,其中关系检测判断两个实体之间是否存在语义关系,而关系分类将存在语义关系的实体对划分到预先指定的类别中。在某些场景和任务下,关系抽取系统也可能包含关系发现模块,其主要目的是发现实体和实体之间存在的语义关系类别。例如,发现人物和公司之间存在雇员、CEO、CTO、创始人、董事长等关系类别。
图1-1 关系抽取的一个示例