查看原文
其他

讲座纪要 | 冯志伟:机器翻译和它的四个类型


感谢关注我们!加油,研习人!

欢迎关注我们,一站式分享海量语言学术资源

来源编辑:THU人文研究生公众号

转载编辑:研习君



敬请星标应用语言学研习,喜欢请点赞,分享请转发




冯志伟:

机器翻译和它的四个类型

2021年10月9日下午,清华大学语言学研究中心举办的语言学系列学术讲座于清华大学法图B105举行。教育部语言文字应用研究所冯志伟教授做了题为“机器翻译和它的四个类型”的学术讲座,来自线上、线下的百余师生共同参与了本次讲座。

冯志伟教授在讲座中


冯志伟教授是教育部语言文字应用研究所学术委员会委员、博士生导师,中国人工智能学会理事。先后在北京大学和中国科学技术大学获双硕士学位,是我国计算语言学最早的开拓者之一,长期从事语言学和计算机科学的跨学科研究。1978-1982年在法国留学,曾在德国特里尔大学语言文学系、韩国高等科学技术院计算机科学与电子工程系担任教授,主要研究方向为计算语言学、数理语言学、西方语言学流派,发表论文400余篇,出版专著38部。曾获中国计算机学会NLPCC杰出贡献奖、奥地利维斯特奖。

本次讲座,冯志伟教授首先从巴别塔的传说中强调了在多语言的世界中人类交流的困难性。而在中国古代,也存在着“象胥”的说法,用以指代“翻译”。可见,无论国内外,翻译都是打破人类交流壁垒的一项重要任务。目前,世界上的语言种类众多,分布复杂,解决不同语言人们交流的方法可以是找到一种通用语(lingua franca),如英语。但是这种方法可能会导致不同文化的消解。随着互联网的出现,英语的地位逐渐衰退,网络变成了一个多语种的世界。在如今的大数据时代,伴随着数据爆炸,我们更加需要一种高效、性价比高的翻译方式。因此,机器翻译的发展蓬勃而生。


冯志伟教授在讲座中

冯志伟教授指出,当今的人工智能中非常重要的一个领域就是自然语言处理NLP(Natural Language Processing),而NLP中最重要的两个问题便是智能问答和机器翻译。随后,冯志伟教授介绍了四种类型的机器翻译。

第一种类型名为基于规则的机器翻译RBMT(Rule-Based Machine Translation)。其基本思想是进行包括形态分析、句法剖析、浅层语义分析和概念分析在内的言语分析和概念生成,此时的机器翻译是与语言学密切相关的。RBMT主要根据词典和规则进行翻译,包含词对词翻译法、短语分析转换法和中介语法等方法,并取得了一系列成果。第二种类型名为基于实例的机器翻译EBMT(Example-Based Machine Translation)。其主要方法是结合翻译实例库和翻译词典进行翻译。第三种类型名为基于统计的机器翻译SMT(Statistical Machine Translation)。这种翻译方法将翻译视为破译密码,翻译变成了一种数学问题。它不需要语言学知识,完全根据统计学,可以在完全不懂某种语言的情况下进行翻译。SMT需要大型的平行双语语料库,通过语料库计算概率,并进行对齐,其中加入一定的短语、句法等规则知识。SMT的准确率高于RBMT,并且不需要很多的语言学知识。第四种类型名为神经机器翻译NMT(Neural Machine Translation)。这种翻译方法不需要词典、规则和语言学知识,让机器自动从语料库中学习知识,使用词嵌入、注意力机制、循环神经网络、卷积神经网络、Transformer等深度学习模型进行。NMT的准确率大大提高,使得机器翻译从梦想变成了现实,但是仍存在着多义词翻译不准确、漏翻、缺乏文化和常识知识等问题。

最后,冯志伟教授对四种机器翻译方法进行了比较,并进行了展望。与机器相比,人类大脑的翻译系统更加高效、耗能更低、需要的数据更少。因此,在未来的发展中,机器翻译还需要融入更多语言学知识中的规则,并且需要解决资源稀缺和能耗的问题。

会后,冯志伟教授回答了现场观众的提问。整场学术报告在热烈的掌声中落下帷幕。


文字、图片 | 朱述承

排版 | 杨宜霖


综合编辑:应用语言学研习

微信公众平台审核:梁国杰

科研助力

文献综述的目的及写作方法指南

2022年度教育部人文社科项目申报线上培训——语言学专场

线上课程 | 人文社科研究方法——质化、量化、混合研究方法


文献延伸阅读(研习人指引)

本平台友情整理相关文献索引链接

欢迎感兴趣的朋友按需选购




科研助力

扫码享限时特惠!



扫码享限时特惠!

2022年度教育部人文社科项目申报线上培训——语言学专场
教育部人文社科项目申报书填写+立项案例
精选 | 应用语言学研习丛书(13种)一览:回顾经典 分析热点

友情推荐

点击左下方阅读原文,发现更多语言学好书!

出版社官方直销包邮!扫码查看详情

推荐阅读:
推荐 | 文献综述高分模版
预告 | “北外英语讲堂”系列活动
讲座预告丨刘海涛:数据驱动的(应用)语言学研究
专栏讲座 | 定性研究方法及论文写作(清华大学教授、博导主讲)
资源|网络上那些轻松愉快的语言学课程(值得收藏)
在线课程 | 人文社科研究方法——质化、量化、混合研究方法,报名马上学!
2021国家社科后期资助项目公示名单(语言学)
收藏 | 37个国家级、省级报纸理论版投稿邮箱
听说你还没用过这些论文写作神器?
数据告诉你:国家社科基金几年能结项?
语言人工智能正在升温
讲座专栏 | 思政核心期刊论文的写作与投稿
推荐 | 一文讲清国家社科基金和教育部人文社科项目
近五年国家社科中华学术外译项目立项名单及2021年推荐选题目录
2021年泰晤士高等教育世界大学排名
当谈论颜色时,我们在谈些什么?
刊讯 |《现代外语》2022年第1期目录、摘要及稿约
汇总 | 最全的月饼口味英文词汇
乔姆斯基 | Simplicity and the form of grammars
课题研究方案、立项申报书、开题报告的联系和区别
两岸三地翻译学博导知多少?最全名单来了(2021年版)
讲座专栏 | 教育部人文社科项目申报书填写+立项案例
重磅!6年社科基金统计出炉,这些高校是真正的“社科大牛”!
英语教学必备资源|一篇文章搞定220个常见sight words
讲座视频 | 认知语言学导论(9):认知语法
课程视频 | 认知语言学导论(6):概念整合
聚焦 | 国家社科基金:盲评、会评大揭秘
孔子语录英文版(理雅各 译),值得珍藏!
Google学术搜索使用方法及技巧Google学术来啦——最新免费镜像
诚邀参会│“2021语言智能教学国际会议”第3号征稿通知
2021年度国家社科基金项目公示(外国文学、语言学、翻译学)
我国区域与国别研究的现状和愿景(钱乘旦 汪诗明 张倩红)
《外语教学与研究》2021年第5期目录
“新文科”怎么搞?12所大学新文科建设典型案例汇总!
2022年度泰晤士世界大学排名发布:清北并列,中国大陆10所高校跻身200强
名单:C刊来源期刊目录(2021-2022),附快速查询通道!
于洋 姜飞:国际跨文化传播研究新特征和新趋势
最全3000个常见公共场所英语标示!(国家英文译写规范/收藏版)
学科分类版 | CSSCI扩展版来源期刊目录(2021-2022)
Michael Farrelly | 再论批评话语分析中的「互文性」
推荐 | 160个学术电子书下载数据库网站(部分网址已更新)
CSSCI南大核心来源期刊目录(2021-2022) 学科分类版
重磅 | 外语类新学科出现了!如何看待“国际语言服务”?
语言学再添新分支:北语创立国内首个“语言资源学”学科
推荐 | 在家也能免费下载知网等文献的10种方法
莫言:翻译家功德无量
赵新利:八路军的日语学习培训
高教司司长吴岩:新文科建设中外语教育教学不能缺位!
蔡基刚:英语在中小学的主课地位与公民素质和能力的培养 | 光明日报
翻译要忠实于原文吗?这是个问题
冯全功 | 翻译忠实观:争议与反思
《外国语》2021年第4期目录、摘要
收藏 | 公文写作常见错误更正对照表!
郑永年:一个国家有没有前途, 就看有没有给年轻人前途
复旦教授:人文社科类学生还是要老老实实读经典(外一篇)
学术争鸣|蔡基刚:课程思政与立德树人内涵探索——以大学英语课程为例
六位核心期刊主编眼中的“好论文”
特别推荐 | 语料库方法技术
PPT收藏丨2021-2018年教育部高教司吴岩司长报告汇总(附下载链接)
2021第九版北大核心期刊目录(语言学、文学、综合性学报)
陆俭明:语言研究要与未来接轨
我国二语写作研究的若干重点问题 |《外语教学与研究》2021(4)
收藏 | 国内外好用的语料库资源汇总
C 刊中常用的 107种人文社科研究方法
推荐 | 兰卡斯特大学免费慕课:语料库语言学方法、分析与阐释
胡壮麟:“语言学及应用语言学名著译丛”总序(首批30余种陆续出版)
王学典:何谓“新文科”?
郭英剑 | 新文科与外语专业建设
期刊《认知语言学》近20年数据简析(2000-2021)
王俊菊:新文科建设对外语专业意味着什么?
《现代外语》2021年第4-5期目录
刊讯 |《外语教学与研究》2021年第4期目录、摘要
胡钦谙 顾曰国 | 计算语言学研究70年
视频 | Tony McEnery:语料库与批评话语分析 前沿讲座
视频 | Paul Baker: 语料库与话语研究 前沿学术讲座
刘海涛:关于自然语言计算机处理的几点思考
人工智能的诗与远方,一文读懂NLP起源、流派和技术(外一篇)
关注人工智能时代的语言学研究(外一篇)| 中国社会科学网
重磅上市 |《国际中文教育中文水平等级标准》及解读本正式出版!
重磅 | 最新版北大核心期刊目录及投稿方式大全(语言学)
访谈视频 | Rod Ellis, D. Nunan & K. Bailey谈线上TESOL项目的发展
《外语教学》2021年第4期目录
刘海涛 林燕妮:大数据时代语言研究的方法与趋向
荐读 | 张辉教授团队“批评认知语言学”系列研究成果
张辉 张艳敏 | 批评认知语言学:理论源流、认知基础与研究方法
热点聚焦 | 本土语用研究—《外语与外语教学》专栏“人际语用研究的本土视角”)
讲座视频 | Martin Hilpert:语言与大脑的关系——从三个语言学实验谈起
讲座回放 | 宗成庆:机器翻译现状与语料资源建设
文秋芳《产出导向法:中国外语教育理论创新探索》评介
国内高校外语专业哪家强?教育部第四次学科评估 外语专业排名
讲座回放 | 李嵬教授:多元能力、超语行为及自主移动学习
王立非:加快建设“新文科语言学”!增设五个方向
新文科背景下外国语言文学学科发展与学术创新高层论坛(1号通知)
原版引进 | 德古意特认知语言学研究丛书+应用丛书(13种)
精选 | 应用语言学研习丛书(13种)一览:回顾经典 分析热点
热文 | C刊的“秘密”
中英全文 | 习近平:在庆祝中国共产党成立100周年大会上的讲话(中英双语+外媒报道)
文秋芳 常小玲 | 中国共产党百年外语教育与中华民族伟大复兴
重磅 | 2021软科中国大学专业排名出炉(中国语言文学 & 外国语言文学)
李战子教授原创随笔 | 人文学者与国际传播素养——话语研究者的观察与思考
施旭 | 文化视野下的话语研究 (浙外学报文化话语研究专题)
Rod Ellis教授关于二语习得的两个视频讲座
分享 | Rod Ellis教授讲座课件PPT
吴岩:教学改革改到深处是课程,改到痛处是教师,改到实处是教材
吴岩:抓好教学“新基建”  培养高质量外语人才
重磅丨2021软科中国语言类大学排名出炉(附中国大学完整排名)
重磅 | 语言学CSSCI(2021-2022)来源期刊投稿方式大全
收藏 | 史上最伟大的100部戏剧(附观看链接)
CSSCI南大核心来源期刊投稿方式大全(五)——综合社科和高校学报
讲座PPT:BCC语料库的理论和应用(荀恩东 邵田)
世纪对话 | Krashen教授与 Chomsky教授 谈现代语言学的发展
圆桌谈| Halliday, Labov, Mey, Embleton谈功能、语用与社会语言学的融合发展
「关联理论」超大份文献资源!
访谈视频 | Larsen-Freeman教授谈应用语言学中的复杂理论
冯志伟:大哉,计算语言学之为用!| 中国社会科学报
刘建军:思维方式差异与中西文化的不同特性 | 上海交通大学学报哲社版
2021年度语言教育重要国际学术会议(7-12月)
CSSCI来源期刊最新总目录(含扩展版,2021-2022),建议收藏!
陈平:语言学的一个核心概念“指称”问题研究
语言与心智:普遍语法是否存在?
国别和区域研究体系机制探讨专栏 (主持人: 罗林)
刊讯 | 《现代外语》2021年第5期目录、摘要及稿约
黄国文 李文蓓:作为应用语言学的生态语言学
视频 | 李嵬教授谈超语实践研究(附Applied Linguistics 高被引论文)
收藏 | 2020版《中文核心期刊要目总览》完整目录表格版(附增减变化明细)
孙茂松 | 人工智能与未来语言教育
蔡基刚:课程思政与立德树人内涵探索——以大学英语课程为例
新书预告 | 乔姆斯基《句法结构》第二版中译本(冯志伟审校)
“躺平”一词火到外网,这个翻译有意思!
外语教师面临的新形势 新问题 |《外语教学与研究》
【讲座回顾】多模态人类学的思考
黄国文 | 新文科与外语教育——从“术”与“道”的 关系谈起
蔡基刚 | 学科交叉:新文科背景下的新外语构建和学科体系探索
陈平 | 话语的结构与意义及话语分析的应用
书讯 | Routledge Handbook of Cognitive Linguistics 文旭&Taylor主编
话语研究四十年 | 热点话题·发展趋势·研究路径
图解 | 语言研究的哲学基础与理论渊源
新文科建设的理路与设计
访谈视频 | Dan Jurafsky:AI 如何改变我们对语言的理解
徐赳赳 | 篇章语用研究70年
刘海涛 | 数据驱动的应用语言学研究
黄国文:思政视角下的英语教材分析
北大中文核心期刊投稿方式大汇总(最全版)
王宁:新文科视域下的翻译研究 |《外国语》2021(2)
徐锦芬 | 应用语言学研究的国际动态与前沿分析
王克非 | 翻译研究拓展的基本取向
语言学家伤口撒盐:王冕死了父亲
语言学、外国文学、中国文学CSSCI (2021-2022) 源刊目录及官微汇总
胡键丨语言、话语与中国的对外传播
王文斌 柳鑫淼:关于我国外语教育研究与实践的若干问题
新书推荐 | 穆雷 等著《翻译学研究的方法与途径》
何宁 王守仁 | 高校外语专业学生外语运用能力的培养
中国国家治理话语体系的构成与演化:基于语词、概念与主题的分析
戴炜栋 胡壮麟 王初明等:新文科背景下的语言学跨学科发展
国外语言学学科眼动研究: 现状与前瞻( 1934-2020)
神经语言学国际热点与趋势的科学知识图谱分析

扫码关注↑↑↑ 即可获取最新入群二维码!

目前已有 4.35 万语言文学、区域国别与

跨文化传播学研习者关注本公号

欢迎加入交流群,分享学习,共同进步!

亲爱的研习人,

一起来点赞、在看、分享三连吧!

一个,点亮在看

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存