全球無障礙溝通的時(shí)代似乎即將來臨。
不久前,一個(gè)實(shí)時(shí)翻譯視頻風(fēng)靡網(wǎng)絡(luò),視頻中兩名分別說著英語和西班牙語的人借助skype軟件的實(shí)時(shí)翻譯功能竟然實(shí)現(xiàn)了無障礙交流。
這種之前只在科幻片中存在的場(chǎng)景如今已成現(xiàn)實(shí),而這一切都得益于機(jī)器翻譯技術(shù)。
機(jī)器翻譯(machine translation),又稱為自動(dòng)翻譯,是利用計(jì)算機(jī)把一種自然語言轉(zhuǎn)變?yōu)榱硪环N自然語言的過程。
在現(xiàn)在看來,機(jī)器翻譯毫無疑問是一項(xiàng)被公認(rèn)為具備廣泛應(yīng)用前景的技術(shù)方向,但縱觀該技術(shù)的發(fā)展史卻并非一帆風(fēng)順,其可行性和實(shí)用性曾不斷遭受質(zhì)疑。
下面就讓我們一起回顧機(jī)器翻譯這項(xiàng)曾被視為天方夜譚的技術(shù)如何實(shí)現(xiàn)“從無到有”,又有哪些前輩大牛們?yōu)樗倪M(jìn)步做出過不可磨滅的貢獻(xiàn)。
【草創(chuàng)】
機(jī)器翻譯的研究歷史最早可以追溯到二十世紀(jì)三四十年代。
二十世紀(jì)三十年代初,法國(guó)科學(xué)家G.B.阿爾楚尼提出了用機(jī)器來進(jìn)行翻譯的想法。
1946年,世界上第一臺(tái)現(xiàn)代電子計(jì)算機(jī)ENIAC誕生。隨后不久,信息論的先驅(qū)、美國(guó)科學(xué)家Warren Weaver于1947年提出了利用計(jì)算機(jī)進(jìn)行語言自動(dòng)翻譯的想法。1949年,Warren Weaver發(fā)表《翻譯備忘錄》,正式提出機(jī)器翻譯的思想。

(圖:Warren Weaver)
【萌芽】
1954年,美國(guó)喬治敦大學(xué)在IBM公司協(xié)同下,用IBM-701計(jì)算機(jī)首次完成了英俄機(jī)器翻譯試驗(yàn),向公眾和科學(xué)界展示了機(jī)器翻譯的可行性,從而拉開了機(jī)器翻譯研究的序幕。

(圖:IBM-701計(jì)算機(jī)的英俄翻譯)
隨后十年左右的時(shí)間內(nèi),機(jī)器翻譯研究熱度不斷上升。美國(guó)、前蘇聯(lián)及一些歐洲國(guó)家均對(duì)機(jī)器翻譯研究給予了相當(dāng)大的重視,機(jī)器翻譯一時(shí)出現(xiàn)熱潮。
【沉寂】
然而,正當(dāng)一切有序推進(jìn)之時(shí),尚在萌芽中的“機(jī)器翻譯”研究卻遭受當(dāng)頭一棒。
1964年,美國(guó)科學(xué)院成立了語言自動(dòng)處理咨詢委員會(huì)(Automatic Language Processing Advisory Committee)。委員會(huì)經(jīng)過2年的研究,于1966年公布了一份名為《語言與機(jī)器》的報(bào)告。

(圖:《語言與機(jī)器》報(bào)告)
該報(bào)告全面否定了機(jī)器翻譯的可行性,并宣稱“在近期或可以預(yù)見的未來,開發(fā)出實(shí)用的機(jī)器翻譯系統(tǒng)是沒有指望的”。受此報(bào)告影響,各類機(jī)器翻譯項(xiàng)目銳減,機(jī)器翻譯的研究出現(xiàn)了空前的蕭條。
【復(fù)蘇】
進(jìn)入二十世紀(jì)七十年代中后期,隨著計(jì)算機(jī)技術(shù)和語言學(xué)的發(fā)展以及社會(huì)信息服務(wù)的需求,機(jī)器翻譯才開始復(fù)蘇并日漸繁榮。業(yè)界研發(fā)出了多種翻譯系統(tǒng),例如 Weinder、EURPOTRAA、TAUM-METEO等。
其中于1976年由加拿大蒙特利爾大學(xué)與加拿大聯(lián)邦政府翻譯局聯(lián)合開發(fā)的TAUM-METEO系統(tǒng),是機(jī)器翻譯發(fā)展史上的一個(gè)里程碑,標(biāo)志著機(jī)器翻譯由復(fù)蘇走向繁榮。
【發(fā)展】
1993年IBM的Brown和Della Pietra等人提出的基于詞對(duì)齊的翻譯模型。標(biāo)志著現(xiàn)代統(tǒng)計(jì)機(jī)器翻譯方法的誕生。
2003年愛丁堡大學(xué)的Koehn提出短語翻譯模型,使機(jī)器翻譯效果顯著提升,借助同時(shí)期Franz Och提出的對(duì)數(shù)線性模型及其權(quán)重訓(xùn)練方法,短語翻譯模型在工業(yè)界開始廣泛采用。

(圖:Franz Och,曾擔(dān)任谷歌翻譯負(fù)責(zé)人。)
2005年David Chang進(jìn)一步提出了層次短語模型,同時(shí)還有多個(gè)大學(xué)和研究所在基于語法樹的翻譯模型方面研究也取得了長(zhǎng)足的進(jìn)步。
【繁榮】
正是因?yàn)橐淮茖W(xué)家們不懈的努力,才讓科幻一步步照進(jìn)現(xiàn)實(shí)。
2011年開始,伴隨著語音識(shí)別、機(jī)器翻譯技術(shù)的快速發(fā)展和經(jīng)濟(jì)全球化的需求,口語自動(dòng)翻譯研究成為當(dāng)今信息處理領(lǐng)域新的研究熱點(diǎn)。
Google、Microsoft紛紛推出自己的新一代智能語音翻譯產(chǎn)品,本文開頭提到的聊天軟件skype中使用的就是微軟的機(jī)器翻譯技術(shù)。

(圖:微軟接近實(shí)時(shí)的逐字對(duì)話語音翻譯功能Skype Translator)
而在這一輪的國(guó)際競(jìng)爭(zhēng)中,國(guó)內(nèi)的企業(yè)亦迎頭趕上。在2014年的國(guó)際口語機(jī)器翻譯評(píng)測(cè)比賽(International Workshop on Spoken Language Translation)中,首次參賽的科大訊飛即在中英和英中兩個(gè)機(jī)器翻譯方向中以顯著優(yōu)勢(shì)勇獲第一,標(biāo)志著我國(guó)的機(jī)器翻譯技術(shù)取得國(guó)際先進(jìn)水平。

(圖:科大訊飛機(jī)器翻譯技術(shù)已率先應(yīng)用在靈犀語音助手中。)
{{item.content}}