目录
摘要
abstract
这是一篇软件工程博士论文代写范文,细粒度实体分类;提示学习;类型层次;超矩形空间;知识点标注;为本次博士论文的论点,本文工作总结细粒度实体分类作为自然语言处理中的一项重要任务,旨在识别文本中提及实体对应的实体类型,对于提高信息提取、文本理解等任务的效果具有重要意义。近年来,细粒度实体分类虽然取得了较大的进展,但是仍然存在一些不足。例如,现有的细粒度实体分类研究首先难以有效的利用实体类型之间的层次关系对模型进行增强,其次在使用 BERT 等预训练语言模型时容易忽略提及实体自身的信息,再者现有的基于提示学习的细粒度实体分类方法难以有效的从上下文中提取与提及实体相关的信息。此外,现有的细粒度实体分类方法在真实场景中的应用仍较有限。本文针对细粒度实体分类进行了全面阐述,包括研究背景意义以及挑战,并针对细粒度实体分类存在的挑战提出了一系列的创新方法进行改进。
1.1 研究背景及意义互联网的迅速发展使得网络中每天产生大量的非结构化数据[1],这些非结构化形式存储的数据比较杂乱。如何从杂乱无章的数据中抽取出对生产、生活有用的信息就显得尤为重要,由此促进了信息抽取(Information Extraction)[2–4] 技术的发展。信息抽取旨在从大量杂乱无章的非结构化数据中,抽取出特定的实体、关系、事件等,最终将抽取出的信息转化成结构化的形式进行存储。随着信息抽取技术的发展,信息抽取逐步集中于命名实体识别、实体链接和关系抽取等方向。命名实体识别(Named Entity Recognition)[5, 6] 作为信息抽取的一项关键任务,其能够从非结构化形式的数据中获取实体相对应的实体类型,比如“地名”、“人名”、“组织名”等。命名实体识别获取的实体类型能够为自然语言处理[7–10]的众多下游任务提供信息支撑[11],比如问答系统[12]、实体链接[13]、知识图谱补全[14–16]、关系抽取[17]、文本分类[18, 19] 等。
1.2 国内外研究现状按照传统的分类方式,细粒度实体分类可以分为三个研究方向:基于类型层次建模的细粒度实体分类方法[24, 34–36],基于数据降噪的细粒度实体分类方法[37, 38],普通的细粒度实体分类方法[30, 39]。但是普通的细粒度实体分类方法往往忽略细粒度实体分类中的类型层次以及数据噪声,导致此类方法往往难以取得较好的效果[40]。因此,其并未成为细粒度实体分类的研究热点,本节不再对其展开陈述。另外,需要值得注意的是超细粒度实体分类(Ultra-Fine Entity Typing, UFET)[41],作为细粒度实体分类的一项延伸研究任务,其在任务定义时并未提供类型层次,而是将实体类型划分为三个粒度。因此,为了便于对超细粒度实体分类进行类型层次建模,现有的类型层次建模研究可以分为两种,一种为显式的类型层次建模方法(利用类型层次信息),另一种为隐式的类型层次建模方法(不利用类型层次信息)。尽管细粒度实体分类在自然语言处理领域取得了广泛进展,但其在特定下游任务中的探索仍显不足,尤其是在知识点标注任务的研究尚处于起步阶段。基于此,本文将细粒度实体分类应用于教育领域中的知识点标注任务,以探索细粒度实体分类在教育场景中的应用潜力。综上所述,本节将围绕四类方法展开论述:显式建模类型层次的细粒度实体分类方法、隐式建模类型层次的细粒度实体分类方法、基于数据降噪的细粒度实体分类方法以及知识点标注方法。

1.3 研究问题及挑战从前面两个小节的描述可以看出,本文以细粒度实体分类作为出发点进行研究,同时还将细粒度实体分类扩展至面向教育的试题细粒度知识点标注任务。现有方法在对细粒度实体分类进行建模时,通常未能充分依托实体类型之间的关系(例如,/organization/government 与 /organization 以及 /organization/military的关系)对模型进行强化,且难以全面的从上下文(句子)中获取信息。此外,现有方法多集中于开源数据集,其在实际应用场景的适用性仍存在明显局限。总而言之,虽然细粒度实体分类的研究取得了一定进展,但是根据本文的研究可以发现现有方法主要存在以下几个方面的挑战:
(1) 无法有效的借助实体类型所蕴含的语义信息且在部分场景下模型优化不精确。首先,现有方法在进行分类时未有效借助实体类型的语义信息以引入其对模型的影响,比如粗粒度的实体类型和细粒度的实体类型会对模型产生不同的影响。其次,现有方法在部分场景下无法指导模型进行精确的优化,比如当梯度等于零时。
(2) 未关注提及实体的语义信息且未深入利用类型层次关系对模型进行约束。其一,现有方法过于依赖上下文,普遍忽视提及实体自身的语义信息,然而提及实体自身的语义信息在很多研究中证明对提升模型性能是有益的。其二,现有的方法在建模类型层次关系时并未高效利用类型层次信息(父子节点关系和兄弟节点关系)约束模型,事实上类型层次信息对提升分类性能至关重要。
(3) 难以深入挖掘上下文中与提及实体相关的信息且未充分重视实体类型间的类型层次对模型的引导作用。现有方法在模板构造时往往缺乏对提及实体上下文语义信息的深入理解,导致难以设计合适的提示学习模板用于深度的从上下文中捕获与提及实体相关的信息。此外,现有方法未充分重视实体类型间的类型层次信息(父子节点关系和不同路径关系)在引导模型决策中的潜在作用,使得模型在分类时缺乏类型层次信息的引导。
(4) 基于细粒度实体分类的实际应用受限且缺乏相关的标注数据集。现有的细粒度实体分类方法往往针对开源数据集展开研究,其在实际应用中仍面临显著挑战,尤其缺乏专门针对试题细粒度知识点标注任务的数据集,限制了相关技术的发展。并且现有模型未能有效融合试题附加信息且不易系统挖掘试题题干隐含的语义信息,导致对试题语境中的关键信息抽取不足,限制了模型的实际应用效果。
1.4 本文贡献本文的研究聚焦于细粒度实体分类及其在试题细粒度知识点标注任务中的应用。本文首先回顾并分析现有的研究工作,指出现有的细粒度实体分类研究工作存在的不足,并提出相应的解决方案。具体而言,在充分总结现有研究的基础上,本文将研究重心聚焦于细粒度实体分类中的类型层次建模及其在教育领域中的应用,力求在方法和应用层面实现创新,本文总体框架如图1.2所示。通过对细粒度实体分类任务的深入分析,本文的研究内容可以系统化地概括为以下几个方面:
(1) 基于类型层次感知和距离优化的细粒度实体分类方法。首先,该方法通过基于交并比(Intersection over Union,IoU)的模块隐式度量实体类型在分类时产生的影响,该模块能够增强细粒度实体类型对模型的影响。其次,该方法包含一种基于几何距离度量的模型优化模块,该模块能够使得提及实体更加靠近与其相关联的实体类型,远离与其不相关的实体类型,从而提升模型的分类性能。
(2) 基于特征增强和高维超矩形空间建模类型层次的细粒度实体分类方法。该方法不仅在建模的初始阶段引入提及实体自身的语义信息,用于增强提及实体的特征表示。而且该方法首次在高维超矩形空间利用几何约束显式的对实体类型间的类型层次进行建模,该方法能够联合建模类型层次中的父子节点关系和兄弟节点关系,从而充分挖掘实体类型间的结构依赖性。值得一提的是,在对兄弟节点关系进行建模时该方法不仅考虑兄弟节点间的相似性,还保留兄弟节点间的差异性。
(3) 基于上下文感知提示学习和类型层次优化的细粒度实体分类方法。该方法在输入阶段引入适用于细粒度实体分类的上下文感知提示学习模板,旨在引导模型聚焦于与提及实体相关的关键信息。此外,该方法将模型的输出与类型层次进行有效的融合,用于对细粒度实体分类中的类型层次进行显式建模,该方法不仅利用类型层次中的父子节点关系对模型进行约束,还进一步利用类型层次中的不同路径关系对模型进行约束。
1.5 本文组织结构为了便于对本文的组织结构进行快速概览,本文将组织结构进行归纳总结,本文共划分为七个章节,涵盖从理论基础到实验验证的全面讨论与分析。本文紧紧围绕着细粒度实体分类的关键问题展开,逐步引导读者深入理解研究背景、核心方法、技术实现以及实验结果与分析。
基于深度学习的细粒度实体分类通常使用预训练语言模型进行特征抽取,本文的研究也均使用预训练语言模型[62–64] 进行特征抽取。此外,本文的研究还涉及类型层次建模技术以及提示学习技术。基于此,本章的主要内容可以归纳为以下几点。第一,本章介绍细粒度实体分类的问题描述。第二,本章介绍基于预训练语言模型的细粒度实体分类输入表示和提示学习。第三,本章介绍多种空间的类型层次建模技术,包括向量空间、双曲空间以及高维超矩形空间。第四,本章对细粒度实体分类的常用数据集、本文构建的 MathConcept 数据集以及评价指标进行相应的介绍。最后,对本章内容进行总结。
2.1 细粒度实体分类问题描述本文将细粒度实体分类视为多标签分类问题,这意味着提及实体(entitymention,m)依据其所在的上下文(context,c)可以被赋予多种实体类型,比如/person、/person/leader 和 /person/politician。在细粒度实体分类中,提及实体为上下文(句子)中出现的短语。比如句子“比赛前拉着顾老师合了好几张照片”中的提及实体为“顾老师”,顾老师所在的句子则为其上下文,如图2.1所示。在细粒度实体分类中,不同上下文中的提及实体可能属于不同的实体类型,而且一个上下文可能包含多个提及实体。
2.2 深度学习相关技术本节主要介绍与本文的研究相关的深度学习技术,包括基于预训练语言模型的细粒度实体分类输入表示、提示学习等。为了便于读者对如何在细粒度实体分类中使用 BERT、RoBERTa[65] 等预训练语言模型[66] 有一个直观的了解,本小节对 BERT 的输入部分进行展开介绍,并且以一个具体的例子展示如何将细粒度实体分类中的提及实体和上下文作为其输入。在细粒度实体分类任务中使用 BERT 等语言模型[67–69] 时,通常使用“[CLS]提及实体对应的上下文 [SEP] 提及实体 [SEP]”的形式构建细粒度实体分类的输入。其中,[CLS] 是一个特殊的标识符,用于表示整个输入序列的全局语义信息;[SEP] 也是一个特殊的标识符,用于区分不同的句子或文本片段。将图2.1中的例子“比赛前拉着顾老师合了好几张照片”(提及实体为“顾老师”)套入到“[CLS]提及实体对应的上下文 [SEP] 提及实体 [SEP]”中时,首先需要对“比赛前拉着顾老师合了好几张照片”使用分词工具(比如 jieba)进行分词(如果是英文,通常以单词为单位进行分词),假设分词后的结果为“比赛,前,拉着,顾老师,合了,好几张,照片”,那么输入可以表示为“[CLS] 比赛 前 拉着 顾老师合了 好几张 照片 [SEP] 顾老师 [SEP]”。在将该输入送入到 BERT 后,还会使用 BERT 所采用的分词器对其进行进一步分词。在细粒度实体分类中使用 BERT 等预训练语言模型时,通常使用 [CLS] 位置对应的向量作为抽取的特征以进行下一步操作。
2.3 类型层次建模相关技术本节主要介绍细粒度实体分类中与类型层次建模相关的技术,包含基于向量空间的类型层次建模技术,基于双曲空间的类型层次建模技术以及基于高维超矩形空间的类型层次建模技术。细粒度实体分类的先前研究[108, 109] 通常将细粒度实体分类视为传统的多标签分类任务[110]。然而在实际中,将细粒度实体分类视为传统的多标签分类任务并不合理[34, 36, 40],因为细粒度实体分类中的类型层次在细粒度实体分类中扮演着非常重要的角色[24, 111]。事实上,许多实践已经证明,细粒度实体分类中的类型层次结构有助于提升细粒度实体分类的性能[27, 39]。如何对细粒度实体分类中的类型层次进行建模是细粒度实体分类研究的一个难点,同时也是一个研究热点。Shimaoka 等人[34] 提出了一种可以对细粒度实体分类中的类型层次结构进行编码的方法 –NFGEC1。NFGEC 方法在对类型层次结构中的细粒度实体类型进行编码时,引入了相应的粗粒度实体类型的编码,比如将 /person 编码为 [1,0,0,0,...],将 /person/artist 编码为 [1,1,0,0,...],将 /person/artist/actor 编码为 [1,1,1,0,...]。通过这种编码方式,在同一类型层次中的实体类型可以共享共同父节点的参数,这样的方式有利于训练数据较少的实体类型进行学习。该方法之所以采用这种编码方式对类型层次进行编码,是因为细粒度实体分类中的细粒度实体类型对应的训练数据往往较少,难以对其进行充分的训练。通过在编码细粒度实体类型时引入相应的粗粒度实体类型,细粒度实体类型可以利用相应的粗粒度实体类型的信息,很好的解决了细粒度实体类型训练不足的难题。
2.4 数据集和评价指标
(1) OntoNotes 数据集。原始的 OntoNotes(original OntoNotes)数据集[113] 包含251K 训练数据、2K 开发数据和 9K 测试数据,实体类型形成一个深度为 3的类型层次。增强的 OntoNotes(augmented OntoNotes)数据集[41] 包含 793K训练数据。将 original OntoNotes 数据集和 augmented OntoNotes 数据集进行对比可以发现,original OntoNotes 数据集和 augmented OntoNotes 数据集共享相同的类型层次结构、开发集以及测试集,仅训练集不一致。
(2) BBN 数据集。BBN 数据集包含 84K 训练数据、2K 开发数据和 14K 测试数据,形成一个深度为 2 的类型层次。BBN 数据集与 OntoNotes 数据集的实体类型存在明显的差异,比如 OntoNotes 数据集的类型层次深度最大为 3,而 BBN数据集的类型层次深度最大为 2;OntoNotes 数据集将实体类型“/person”进行了进一步的划分,然而 BBN 数据集并未对实体类型“/person”进行进一步划分。BBN 数据集的另一个版本由 AFET[22] 提供,细粒度实体分类中的经典工作会使用该版本数据集,比如 PLE[23]、NFETC-CLSC[26]、NDP[25]、FBTree[114]、NDP-PTC[55]、FCLC[35] 等,本文第四章和第五章的工作基于此版本数据集。
(3) FIGER 数据集[108]。FIGER 数据集[108] 包含 2M 训练数据,10K 开发数据,但 FIGER 数据集的测试集仅包含 563 个数据,形成了一个深度为 2 的类型层次。将 FIGER 数据集与 OntoNotes 数据集进行对比可以看出,FIGER 数据集按照行政区域对实体类型“/location”进行划分。与 BBN 数据集相比,FIGER 数据集将实体类型“/person ”进行了进一步划分。
(4) UFET 数据集[41]。为了更好的模拟现实场景,最近新推出了超细粒度实体分类数据集 UFET[41]。该数据集包含 2k 训练数据、2k 开发数据和 2k 测试数据。与上述三个数据集不同的是,其不再提供类型层次,而是将实体类型划分为三个粒度(general,fine 和 ultra-fine),每个实体类型属于三个粒度其中的一个。其中 general 粒度包含 9 个实体类型,fine 粒度包含 121 个实体类型,剩余的实体类型属于 ultra-fine 粒度,绝大多数实体类型属于 ultra-fine粒度。
2.5 本章小结
近年来,随着自然语言处理的快速发展,细粒度实体分类已成为学术界和工业界的热点研究问题之一,本章主要针对与细粒度实体分类相关的技术进行陈述。本章首先介绍细粒度实体分类问题描述,预训练语言模型 BERT 在细粒度实体分类中的使用方式以及提示学习,以说明如何在细粒度实体分类中使用预训练语言模型 BERT 以及在细粒度实体分类中使用提示学习的必要性。其次,本章介绍基于不同空间的类型层次建模方法,对基于高维超矩形空间的类型层次建模方法进行了重点阐述。最后,本章介绍细粒度实体分类的常用数据集、本文构建的MathConcept 数据集以及评价指标。
3.1 引言
3.2 IBE方法
3.3 实验及分析
3.4 本章小结
4.1 引言
4.2 THBox方法
4.3 实验及分析
4.4 本章小结
5.1 引言
5.2 CPFET方法
5.3 实验及分析
5.4 本章小结
本章主要针对基于细粒度实体分类的试题细粒度知识点标注方法进行详细描述。本章的结构安排如下:首先介绍本章工作的研究背景及出发点;其次阐述基于细粒度实体分类的试题细粒度知识点标注方法;然后描述本章的实验与分析;最后对本章的工作进行总结。
6.1 引言
结合第三章至第五章的研究内容可以看出,细粒度实体分类的研究通常依托于开源数据集展开,相关成果在实际应用场景中的验证仍然较少。为进一步拓展细粒度实体分类的应用价值,本章尝试将其引入教育领域。教育一直以来都是社会关注的重要问题,直接影响每个个体。随着信息技术的不断演进,尤其是近年来大数据和人工智能技术的发展,教育和教学方式正在发生深刻的变革。这种变革不仅为教育带来新的可能性,同时也为教育面临的问题提供了创新的解决途径。在这个变革的潮流中,个性化学习环境的构建已成为重要趋势,而试题知识点标注技术则在其中扮演着至关重要的角色,其能够实现对学生知识点掌握情况的监测。通过对试题所涉及的知识点进行标注,能够更加准确的获取学生的学习表现,为教师、学生以及教育平台提供更有效的学习指导以及更符合学生自身学习水平的试题资源。因此,研究一种自动化的试题知识点标注技术显得尤为迫切。这项任务不仅在理论上有着深刻的意义,更在实际教育场景中扮演着关键的角色。当前针对试题知识点标注已有部分研究,然而这些研究主要集中于对粗粒度的知识点进行标注,而针对细粒度知识点的标注并没有深入研究,导致获取试题所涉及的细粒度知识点仍是一个挑战。在实际场景中,一道试题往往会涉及多个细粒度知识点,这些知识点可能来自不同年级或学科的课程。同一个知识点可能涉及到不同解题技巧或方法,例如可以用平面几何的方法来求解,也可以用极坐标的方法来求解。从上述的分析可以看出,细粒度的知识点表达了更多更具体的试题深层次特征,因此对试题所涉及的知识点进行细粒度标注是避免题海战术、减轻学生和老师压力的关键。
6.2 基于细粒度实体分类的试题细粒度知识点标注方法
本节将详细介绍基于细粒度实体分类的试题细粒度知识点标注方法,以揭示其背后的原理和细节。本节的具体安排如下:本节首先介绍选择细粒度实体分类实现试题细粒度知识点标注的原因,然后介绍改进后的 IBEe 方法,最后介绍使用上下文感知提示学习模板的 CPFETc 方法。细粒度实体分类本身作为一个多标签分类任务,其能够获取提及实体所对应的多个实体类型。在试题细粒度知识点标注任务中,可以通过手工标注的方式获取试题题干中的考点(细粒度实体分类中的提及实体),并根据标注的考点和试题题干获取考点所涉及的细粒度知识点,从而使用细粒度实体分类实现试题细粒度知识点标注。根据初中阶段和高中阶段的学习经验可知,试题题干往往不是单个考点的直接反映,而是多个考点的融合,不同的考点所对应的细粒度知识点并不相同,使用细粒度实体分类实现试题细粒度知识点标注能够更准确的获取不同的考点所对应的知识点,而不是获取整个试题题干所对应的全部知识点(试题题干对应的知识点多于试题中的单个考点对应的知识点)。从上述分析可以看出,基于细粒度实体分类实现试题细粒度知识点标注不仅能够降低获取细粒度知识点的难度,还能为下游任务提供更准确的信息,从而更好的实现学习任务的减负。
6.3 实验及分析
本节将通过实验验证本章的方法在 MathConcept 数据集上的有效性。本节的实验不仅包含在 MathConcept 数据集上的对比实验结果,还包括相应的消融实验和超参分析。此外,由于本章设计了适用于 MathConcept 数据集的上下文感知提示学习模板,因此本节也对其效果进行分析。然后,本节还通过案例分析验证本章方法的有效性。在正式呈现实验结果之前,本节简要介绍实验中涉及的评估指标、参数以及对比方法,为后续结果分析提供必要的背景说明。为了说明本章改进的 IBEe 方法和 CPFETc 方法在本文标注的 MathConcept 数据集的有效性,本节提供本章改进的 IBEe 方法和 CPFETc 方法在 MathConcept 数据集上与基线模型的对比结果,具体如表6.2所示。从表6.2首先可以看出,本章改进的 IBEe 方法取得了最优的实验结果,明显优于现有的细粒度实体分类方法。其次可以看出,CPFETc 方法的实验结果也优于现有的细粒度实体分类方法,这说明对本章对细粒度实体分类方法进行改进的必要性。从表6.2也可以看出,本节使用了多种预训练模型进行实验,通过实验结果可以看出使用较大的预训练语言模型并不能有效提升模型的性能,这种现象说明现有的预训练语言模型通常基于通用语料进行训练,难以很好的适配试题细粒度知识点标注任务。从表6.2同时可以看出,本章改进的 IBEe 方法和 CPFETc 方法在使用不同预训练语言模型时实验结果会有较大差异,这种现象可能是由于本章的参数均是针对 IBEe 方法和 CPFETc 方法进行优化的,其它预训练语言模型使用的均是 IBEe 方法和 CPFETc 方法上的最优参数。总而言之,表6.2中的实验结果充分展示了本章改进的 IBEe 方法和 CPFETc 方法在 MathConcept 数据集上的性能优势,验证了本章改进的方法在试题细粒度知识点标注任务中的有效性。
6.4 本章小结
本章将试题细粒度知识点标注任务转换为细粒度实体分类任务,针对该任务本章改进出两种方法,IBEe 和 CPFETc。其中 IBEe 方法不仅充分利用高维超矩形空间的优势,并且利用试题的附加信息对考点的特征表示进行增强,CPFETc 方法则针对试题细粒度知识点标注场景设计专用的提示模板以从试题题干中抽取与考点密切相关的信息。本章最后将提出的 IBEe 方法和 CPFETc 方法与现有方法进行对比,以说明本章提出的方法在 MathConcept 数据集上的有效性。
7.1 本文工作总结细粒度实体分类作为自然语言处理中的一项重要任务,旨在识别文本中提及实体对应的实体类型,对于提高信息提取、文本理解等任务的效果具有重要意义。近年来,细粒度实体分类虽然取得了较大的进展,但是仍然存在一些不足。例如,现有的细粒度实体分类研究首先难以有效的利用实体类型之间的层次关系对模型进行增强,其次在使用 BERT 等预训练语言模型时容易忽略提及实体自身的信息,再者现有的基于提示学习的细粒度实体分类方法难以有效的从上下文中提取与提及实体相关的信息。此外,现有的细粒度实体分类方法在真实场景中的应用仍较有限。本文针对细粒度实体分类进行了全面阐述,包括研究背景意义以及挑战,并针对细粒度实体分类存在的挑战提出了一系列的创新方法进行改进。首先,本文对目前细粒度实体分类的相关技术和研究现状进行归纳和总结,简要介绍细粒度实体分类的研究背景与意义。然后,介绍细粒度实体分类中的类型层次建模技术与提示学习技术。其次,介绍细粒度实体分类常见的数据集与评价指标。针对细粒度实体分类存在的挑战,本文主要的研究工作总结如下:
(1) 针对现有的基于高维超矩形空间的细粒度实体分类方法在分类时存在的不足。首先其在分类时未考虑实体类型的影响,降低了模型分类的准确性;其次其在两个超矩形完全分离或者重叠时无法进行精确的优化,影响了模型的分类性能。为解决现有的基于高维超矩形空间的细粒度实体分类方法存在的两个不足,本文首先通过基于 IoU 的方法在分类过程中引入实体类型的影响。其次本文提出了一种基于距离的优化方法,该方法能够在两个超矩形完全分离或者重叠时对模型进行精确的优化。最后,本文通过多目标优化方式融合本文提出的两个模块。
(2) 针对现有的基于高维超矩形空间的细粒度实体分类方法未利用类型层次的不足。一方面其在分类时忽略了提及实体自身的信息,导致提及实体的特征表示不充分。另一方面现有的基于高维超矩形空间的细粒度实体分类方法,在分类时未使用类型层次对模型进行增强,导致模型难以有效的感知细粒度实体分类中的类型层次。为了解决上述两个问题,本文首先在模型的输入阶段对提及实体的特征表示进行增强。其次在模型的输出阶段,本文在高维超矩形空间中对细粒度实体分类中的类型层次进行建模,以在模型中引入类型层次的影响。
(3) 针对现有的基于提示学习的细粒度实体分类方法未利用类型层次的不足。其一,现有的基于提示学习的细粒度实体分类方法,在进行分类时未根据细粒度实体分类的场景设计适合细粒度实体分类的提示模板,导致难以充分的从上下文中提取与提及实体相关的信息。其二,其在分类时未考虑类型层次产生的影响。为了解决上述不足,本文首先提出了上下文感知的提示学习模板,用于有效的从上下文中提取与提及实体相关的信息,本文还在输出阶段引入类型层次的影响以提升模型的分类性能。
(4) 针对细粒度实体分类实际应用较少以及试题细粒度知识点标注数据集缺失的不足。为解决上述问题,本文构建了一个试题细粒度知识点标注数据集,并将本文提出的多种方法进行融合与改进以适应该数据集。本文改进的方法不仅引入了试题附加信息的影响,而且引入了知识点对模型的影响,还能够通过上下文感知提示学习模板从试题题干中充分挖掘信息。
7.2 未来工作展望
尽管本文在细粒度实体分类领域取得了一定的成果,但仍然存在许多值得进一步研究和改进的方向。针对未来的研究工作,简要展望如下:
(1) 类型层次建模问题。类型层次建模模块在提升细粒度实体分类性能方面能够发挥重要作用,虽然本文提出的方法取得了一定的效果,但本文提出的多种类型层次建模方法是否可以进行融合仍是值得研究的问题,比如在高维超矩形空间引入基于预测概率的类型层次建模模块。
(2) 进一步优化提示学习方法。提示学习的模板设计具有高度复杂性,往往需要借助大量实验进行验证与优化,未来的研究可以探讨如何通过自动化的方法生成更加适应多场景的提示模板,以减少人工设计的依赖性。
(3) 与其它自然语言处理任务结合。细粒度实体分类可以与其它自然语言处理任务(如关系抽取、共指消解和命名实体识别等)进行结合,形成一个更加完整的信息抽取系统。
(4) 实际应用问题。目前的研究主要集中在基准数据集上,如何将这些方法应用到实际场景仍是一个重要的研究方向,如文本分析、文档处理等。虽然本文将细粒度实体分类应用于试题细粒度知识点标注并取得了一定的效果,但是其在实际应用场景仍面临挑战。
参考文献 略
相关文章
UKthesis provides an online writing service for all types of academic writing. Check out some of them and don't hesitate to place your order.