首页English
  • 时政
  • 国际
  • 时评
  • 理论
  • 文化
  • 科技
  • 教育
  • 经济
  • 生活
  • 法治
  • 军事
  • 卫生
  • 健康
  • 女人
  • 文娱
  • 电视
  • 图片
  • 科普
  • 光明报系
  • 更多>>
  • 报 纸
    杂 志
    文摘报 2021年12月23日 星期四

    冯志伟:我老了,机器翻译依然年轻

    《 文摘报 》( 2021年12月23日   05 版)

        冯志伟

        当今世界,人工智能研究方兴未艾,而机器翻译被学术界视为人工智能研究皇冠上最耀眼的一颗明珠。作为我国计算语言学的开拓者之一,世界上第一个“汉语到多种外语机器翻译系统”的研制者冯志伟,82岁高龄仍活跃在机器翻译领域。

        两个多月前,他又走上清华大学讲台,以“机器翻译和它的四个类型”为题发表演讲。基于规则的机器翻译、基于实例的机器翻译、统计机器翻译、神经机器翻译各有什么特点,难点在哪,前景如何,冯志伟娓娓道来。他告诫年轻学者,不要过分迷信目前广为流行的基于语言大数据的经验主义方法,不要轻易忽视目前受到冷落的基于语言规则的理性主义方法,而是要努力综合运用两种方法,把机器翻译研究推向深入。

        从昆明到北大

        冯志伟生于云南昆明一个贫困家庭,稚幼岁月是在跑警报躲轰炸的战火中度过的。在1957年,他以优异成绩考取北京大学地球化学专业。

        从云南边疆进入北京大学,冯志伟刻苦学习。在北大图书馆,他看到了美国语言学家乔姆斯基的论文《语言描写的三个模型》,认识到这是乔氏应用数学中的“马尔科夫链”来描述自然语言的生成过程,为语言建立了一套独特的数学模型。于是,冯志伟下定决心要学习这种崭新的语言学理论。

        两年后,冯志伟写出论文《“语法”定名胜于“文法”》,刊于《中国语文》1961年第2期。其实,1960年11月,《文汇报》刊发陈望道、吴文祺、邓明以撰写的文章《“文法”“语法”名义的演变和我们对文法学科定名的建议》,12月又登载了傅东华的文章《“文法”定名优胜于“语法”》。冯志伟读了这两篇文章,认为学术界已经使用“语法”多年,语法定名胜于文法。双方的意见针锋相对,引起一场学术争论。结果,“语法”的定名取代了“文法”。冯志伟的名字在北京、上海传开,许多人不知道他只是一个大二的学生。1964年,冯志伟考取北大研究生,师从岑麒祥教授学习现代语言学流派的理论。他仍然迷恋数学与语言学的跨学科研究,甚至把毕业论文题目定为《数学方法在语言学中的应用》。

        手工计算汉字的熵

        毕业后,冯志伟在天津教了三年英语,1970年8月调至昆明五中当物理教师,语言学专业没有了用武之地。但他利用业余时间写成长篇论文《数理语言学简介》,发表后犹如空谷足音,使人们认识到,在极其艰苦的条件下,仍然有人继续跨学科的探索。

        那段时间,冯志伟还研究了汉字的“熵”。熵是物理学术语,用于量度某些物质系统的状态,英语字母所含信息量的大小也可用“熵”来表示。那时,国外已广泛使用计算机。冯志伟想,中国人将来也要使用计算机,那就必须要给汉字编码。他动员精通算盘的岳父和朋友们一起,使用计算尺和算盘来手工计算。最后统计得出1万多个汉字的频度,确定汉字的熵值为9.65比特。这样,汉字只好采用双字节(2字节=16比特)来编码。

        闯进机器翻译的迷宫

        1978年,中科大研究生院成立并开始招生,冯志伟认真准备,一举考中,这个39岁的壮汉又变成了学生,背着书包从昆明到北京去上学。没过多久,他被公派法国留学。1979年3月1日,他在格勒诺布尔理科医科大学应用数学研究所“自动翻译中心”主任沃古瓦教授的悉心指导下,闯进机器翻译的迷宫,掌握了最新的计算机编程技术,学会使用当时最先进的IBM4341大型计算机,开始研制“汉语-法语机器翻译系统”。

        为了完成这项艰巨工程,他制定“887自律规则”:早8点上班,晚8点下班,一周7天工作。“汉-法系统”试验成功后,他又进一步研究“汉-法、英、日、俄、德”多语种翻译系统。冬去春来三个轮回,至1981年11月4日,系统终于研制成功。他在计算机上输入汉语,计算机立即自动将其翻译成五种语言。这是世界上第一个从汉语到多种外语的机器翻译系统。

        从软件工程师到计算语言学家

        研究工作结束,冯志伟立即回到北京,并把研究成果写成《自然语言机器翻译新论》在语文出版社出版。回国后,他分配到中国科学技术信息研究所计算中心担任软件工程师。1985年,时任国家语委副主任、语言文字应用研究所所长陈章太登门拜访冯志伟,希望他回到语言学队伍,担任语言文字应用研究所计算语言学研究室的负责人。不久,冯志伟调入该所,撰写《现代术语学引论》,受到国内外学术界高度评价。2008年6月,联合国教科文组织奥地利委员会和国际术语信息中心给冯志伟颁发了维斯特奖,表彰他在术语学研究中作出的突出贡献。

        已是耄耋之年,冯志伟坚持每天阅读和梳理国内外文献,先后撰写多篇关于人工智能、统计机器翻译、神经机器翻译、词向量生成的论文。2018年,中国计算机学会授予冯志伟NLPCC杰出贡献奖,表彰他在自然语言处理和中文计算方面的成绩。冯志伟是一个来自人文学科的语言学家,却得到了中国计算机学会的嘉奖,这是非常罕见的现象。颁奖仪式上,他深情地说:“我是近80岁的老人了,可是,我们从事的自然语言处理仍然是一门新兴学科,有着无比广阔的发展前景。一个人的有限生命与科学研究这棵枝叶茂密的参天大树相比,显得多么短促,多么渺小,多么微不足道啊!”

        (《光明日报》12.20 钱玉趾 陈星蒙)

    光明日报社概况 | 关于光明网 | 报网动态 | 联系我们 | 法律声明 | 光明网邮箱 | 网站地图

    光明日报版权所有