02 现在的位置:首页 > 期刊导读 > 2017 > 02 >

基于模糊匹配与音字转换的维吾尔语人名识别

【作者】 热合木·马合木提 于斯音·于苏普 张家俊 宗成庆 艾斯卡尔·艾木都拉    新疆大学信息科学与工程学院 乌鲁木齐830046 中国科学院自动化研究所 模式识别国家重点实验室 北京100190

【关键词】 维吾尔语 人名识别 模糊匹

摘要】维吾尔语是属于阿尔泰语系的黏着性语言,构词特点比较复杂,尤其是维吾尔语中的人名,由于来源差别巨大,识别难度很高,到目前为止,还未出现成熟的维吾尔语入名识别工具。大量维吾尔语文本中的人名统计发现,维吾尔族人名和汉族人名共占据了约83%,因此该文分别针对维吾尔语文本中出现的维吾尔族人名和汉族人名提出相应的识别方法。针对维吾尔族人名,提出基于字母的模糊匹配识别方法;针对汉族入名,借助机器翻译思想提出基于音字转换的识别方法。实验结果表明:所提方法识别维吾尔族人名F。值能够达到91.84%,识别汉族人名F1值能够达到95.86%。

上一篇:类别区分词与情感词典相结合的维吾尔文句子情感分类
下一篇:THUYG-20:免费的维吾尔语语音数据库

版权所有@清华大学  京公网安备 110402430053 号
地址:北京市海淀区清华园   邮政编码:100084