本报拉萨3月17日电 通讯员李键、记者尕玛多吉从西藏大学现代教育技术中心获悉,由该校自主研发的“阳光藏汉机器翻译系统”经过3年多的科技攻关,日前取得标志性成果,翻译准确率平均达75%,为目前国内首个藏汉专业翻译软件系统,并将于年内免费向社会提供服务。
在西藏大学实验室里,技术人员拥措在页面输入网址后,输入了一段藏文,点击了翻译键,不到2秒钟,汉语译文便出现在记者眼前。“这是一个藏汉双向翻译的软件系统,在准确率方面领先国际水平。”项目总负责人尼玛扎西教授介绍说,从前要花费十几个小时的翻译工作,现在只需十几分钟就可解决问题,节省了80%的工作量。
“阳光藏汉机器翻译系统”是2012年西藏自治区重点科研项目,对藏语自动分词与词性标注、藏语语料库、基于短语的藏汉统计机器翻译技术等领域进行了深入研究。尼玛扎西说:“随着藏汉文化交流的进一步深入,社会对藏汉翻译的需求很大,这套软件的推出将极大地提高翻译效率。”
据悉,在这个研究项目中,“阳光藏语自动分词系统”的分词速度达到每秒1000个藏文单词,在藏文现代公文领域的分词准确率达95%。同时,为了辅助藏语自动分词与词性标注,该研究项目修订完善了《信息处理用藏语词类标记规范》,使之更符合藏文自动分词、精确标注和藏汉机器翻译的实际需求。
研究团队还研发了用于辅助藏语自动分词与标注的藏文电子词典,包括10万词条的《机读词典》和《人读词典》。藏语语料库建设了约300MB的藏语通用语料库,包括约10MB藏语训练语料、30多万句藏汉双语精确对照语料等。