本文是一篇计算机硕士论文,笔者认为目前主流的汉盲转换大多采用基于神经机器翻译模型的端到端汉盲转换方法,该方法使用句子级语料库进行训练,推理时一步完成句子级别转换,相对于传统方法转换流程更加简单,准确率高。
第一章绪论
1.1研究背景与研究意义
信息无障碍[1]是指通过信息技术的应用,使每个人都能够无障碍地获得信息资源,其主要目的是通过科技手段,消除一些生理机能衰退或缺失的群体在信息获取和接受方面的障碍。据世界卫生组织的数据,全世界约有2.85亿视力障碍患者,其中3900万人完全失失明[2]。我国视障者群体庞大,应引起重视,目前我国盲人数量约为1700万,这些视力障碍者中大约有824万人完全失明1。随着社会文明不断进步,促进盲人事业发展已经成为国际社会的广泛共识。
虽然我国在助盲建设方面已取得显著成就[3-5],但仍存在许多不足。对视障人士而言,盲文出版物是获取外界信息和知识的关键渠道。然而,当前中国盲文出版资源极度匮乏[6],且内容相对陈旧。目前全国仅有中国盲文出版社一家专业出版机构,远无法满足视障群体的阅读需求。据统计,中国盲文目前每年出版盲文书刊1000多种,全国平均1.29万盲人一种,与明眼人人均享有40种出版物相比,盲文出版物严重匮乏。因此,解决盲文出版物稀缺问题,满足视障群体的阅读需求已成为亟待解决的社会课题。此外,我国盲文导向系统建设滞后,导致视障人士出行困难;银行、政府等公共服务机构缺乏适配服务;商品与药品包装缺少盲文标识,致使视障者日常生活诸多不便。当前我国盲人教育现状令人担忧。虽然经过多年发展并取得一定成就,盲人高等教育逐渐获得国家政策支持,接受高等教育的盲人数量也呈增长趋势,但与普通高等教育相比,盲人高等教育仍然严重滞后。根据中国残疾人联合会的统计数据[7],接受高等教育的盲人仅占在校盲人总数的1%。此外,全国专门招收盲人的高等院校数量极为有限[8],仅有长春大学、北京联合大学、滨州医学院等少数几所高校面向全国招收盲生,且培养目标局限于专科和本科层次,缺乏研究生层次教育,无法满足盲人获取更高学历的需求。
1.2国内外研究现状
1.2.1国外研究现状
(1)基于规则的盲文转换方法
在盲文转换领域,国外的研究早期主要集中在基于规则的转换方法上。2008年,AMS Al-Salman等人[12]开发了一个双向双语的阿拉伯语盲文转换/编辑系统,该系统通过配置规则文件可扩展至其他语言,为视障人士和明眼人之间的交流提供了便利。1997年,Blenkhorn[13]提出了一种基于规则的英文到盲文转换机制,该系统使用字典实现字符到盲文的映射,为早期盲文自动转换奠定了基础。2008年,Al-Salman[12]开发了一种成本较低的基于规则的阿拉伯语到盲文的转换解决方案,并支持盲文到文本的逆向转换。2014年,Yamaguchi等人[14]开发了一种专门针对STEM(科学、技术、工程和数学)领域的盲文转换系统,解决了技术符号在盲文中准确表示的难题,为视障人士参与科学研究提供了重要工具。2016年,Wang等人[15]开发了基于词分割的中文到盲文转换系统,通过语言特定的规则处理中文特有的语言结构问题。2013年S Padmavathi等人[16]提出了一种扫描盲文文档的盲文转换方法,该方法通过预处理、分割和点提取将盲文转换为数字序列,可映射到英语、印地语和泰米尔语等多种语言,同时支持通过键盘数字键盘输入盲文字符,提高了系统的实用性。2013年T Oda等人[17]针对医疗领域盲文转换程序eBraille-M的局限性,开发了基于机器学习的分词模型,通过将两个具有不同特征集的统计学习模型与规则分类器相结合,提升了日语医疗文本的分词效果。这一阶段的研究主要依靠语言学规则和字典映射实现盲文转换,虽然在特定语境下效果良好,但面对复杂语言现象时灵活性不足。
第二章相关理论与技术
2.1引言
本章详细介绍了本文研究所涉及的相关理论与技术。首先,对盲文进行了概述,重点介绍了中国盲文的发展历程及其特征。其次,本章详细分析了汉盲转换的两种主要方法——多步式汉盲转换方法与端到端汉盲转换方法,对比阐释了各自的工作流程、技术特点及优缺点。最后,本章深入探讨了本研究采用的深度学习核心技术,包括知识蒸馏、预训练技术以及非自回归翻译方法,为后续研究奠定了理论基础。

2.2盲文概述
2.2.1盲文简介
盲文是专门为视障者设计的一种文字系统,由法国人路易·布莱叶于1824年创造,盲人通过触摸来识别盲文,盲文是他们阅读与写作的载体,对盲人有着不可或缺的作用。
一个盲点由三行两列的六个凸点组成,左边一列从上往下分别是1、2、3点,右边一列从上往下分别是4、5、6点,根据排列组合,每个位置的凸起与否共有64种情况,所以共有64种盲点。图2-1为246点的盲点表示。
盲文ASCII码是计算机存储盲文信息的最基本的方式,从ASCII编码字符集中抽取出64个,分别代表64种盲文字符。在汉盲转换过程中,通常采用盲文ASCII码作为盲文的表示与存储方式,之后根据实际需求将盲文ASCII码转换为盲点形式。除此之外,盲文ASCII码被广泛应用于盲文点显器和盲文刻印机,作为其标准输入格式。
2.2.2中国盲文
中国盲文系统[36]以布莱尔盲文编码为原则,采用北京语音作为标准、以普通话为基础、按照词为基本单位、遵循盲文分词连写规则进行设计。中国盲文主要有三种形式,包括现行盲文、双拼盲文以及国家通用盲文。使用声母、韵母以及声调来体现一个完备音节。例如“不”的拼音为“bu4”,声母“b”对应的盲点为“......”,韵母“u”对应的盲点为:“......”,声调去声对应的盲点为:“......”,所以汉字“不”对应的盲文为:“..................”。
1953年,教育部公布了《新盲字方案》(亦称“现行盲文”),这是我国首个规范统一的盲文方案,至今仍在使用。现行盲文的设计简单易学,对广大视障群体的学习和阅读发挥了重要作用。该方案规定[37],省略“zhi、chi、shi、ri、zi、ci、si”中的韵母“i”,允许“zh、ch、sh、r、c、s”这七个声母单独成音节,该简写策略极大提高了书写与阅读效率。此外,现行盲文还规定[38]“仅在需要时标调”,即只有在某些字的读音存在歧义时才会标注声调。统计数据显示,在各类盲文出版物中,标注声调的音节仅占5%左右,同一词汇是否进行标调取决于个人习惯,因此可能导致不同的人使用不同盲文来表示同一个词。均未标调的情况下可能会产生更大的歧义,例如,现行盲文“..................”对应的拼音为“jiaoshi”,可被理解为“教师”或“教室”,二者均成立。因此,同音字的混淆问题对盲人学习和使用现行盲文构成了挑战。盲人在摸读过程中需要依赖上下文来推测读音及词义,这不仅对盲人的阅读速度产生影响,同时对盲人理解词义造成了困难。
第三章基于多任务的端到端汉盲转换方法研究............................23
3.1引言.........................23
3.2 TPL方法............................24
第四章基于预训练的汉盲转换方法...........................39
4.1引言...............................39
4.2预训练数据集的设计与构建......................39
第五章基于非自回归方法的汉盲转换模型..................52
5.1引言.....................................52
5.2序列扩充方法.........................52
第六章开放式汉盲转换系统优化与实现
6.1中国盲文数字平台简介
中国盲文数字平台1是一个开放式的盲文数字化资源平台,是我国首个盲文数字平台,该平台面向中国1700万视障群体,由中国残疾人联合会、中国盲人协会共同委托兰州大学信息无障碍研究中心研发,已在全国推广应用。中国盲文数字平台的首页如图6-1所示,该平台主要功能有两大块,一个是转换功能,包括将汉语、数学公式、化学公式、物理电路图和乐谱等转换为盲文,以及将盲文转换为汉语的功能。另一个功能是资源服务管理,盲文数字化资源库主要包含各种中文书籍、资料和音乐乐谱的盲文版本。用户可以在线浏览、朗读、搜索或下载这些盲文资源,并通过盲文打印机或点显器进行输出,从而为盲人提供丰富的阅读材料,支持他们的学习与阅读需求。

第七章总结与展望
7.1本文总结
目前我国盲人教育资源匮乏,盲人导向系统不完善,汉盲转换技术仍有较大提升空间。针对这些问题,本文对汉盲转换方法进行了深入研究。现有的汉盲转换方法主要分为两类:传统多步式转换方法和基于深度学习的端到端转换方法。本文针对汉盲转换任务中存在的问题以及现有研究方法的不足,提出了相应的解决方案。主要工作总结如下:
(1)本文针对传统汉盲转换方法中每个步骤无法充分利用上下文,多个步骤错误累加导致的转换准确率低以及端到端汉盲转换方法无法充分解耦两个子任务的问题,提出了一种基于多任务学习的汉盲转换方法,将汉盲转换任务分解为盲点生成以及盲文分词两个子任务,不改变端到端转换模型推理方式的同时,能够分别兼顾到两个子任务之间的差异与联系,从而整体提高了汉盲转换准确率。
(2)针对目前汉盲对照语料库匮乏,导致模型准确率受限,泛化能力不足的问题。本文基于预训练技术,根据盲文的特性设计并构建了三种带标签预训练数据集以及一种无标签与训练数据集,使模型在预训练结构学习到分词与拼音的相关先验知识,得到较好的初始化权重,随后在少量汉盲对照数据集上进行微调,提高了模型在少量数据集情况下的转换准确率。
(3)针对自回归推理模型推理速度慢的问题,本文提出了一种非自回归汉盲转换方法。该方法采用编码器框架,结合CTC损失实现非自回归转换,同时设计了两种序列扩充方法以满足CTC损失训练条件。该方法实现了推理速度的大幅提高,为后续模型部署奠定了有力基础。
参考文献(略)
相关文章
UKthesis provides an online writing service for all types of academic writing. Check out some of them and don't hesitate to place your order.