近年來AI技術(shù)的應(yīng)用成果似乎喜憂參半,但巨頭們大張旗鼓的行動卻無法掩飾對這項(xiàng)技術(shù)的看好,而AI技術(shù)的落地越來越傾向普惠性也讓不少細(xì)分領(lǐng)域得以枝繁葉茂,比如翻譯。2006年,谷歌推出在線翻譯APP;2012年,有道翻譯官上線;2013年,百度上線安卓版翻譯軟件;2015年,微軟上線正式版翻譯應(yīng)用;2016年,騰訊上線翻譯君……
AI的繁榮以及對AI的渴望讓巨頭們至今熱情不減。比如最近牛津大學(xué)出版社與搜狗達(dá)成合作,為其輸送牛津詞典相關(guān)內(nèi)容;百度聯(lián)合攜程推出WIFI翻譯機(jī);谷歌翻譯于去年重返中國市場等。
目前的翻譯排頭軍有國內(nèi)的百度、科大訊飛、網(wǎng)易有道、搜狗等,國外則有谷歌、Facebook、微軟等,而且各家目前的翻譯技術(shù)都在日益精進(jìn)。事實(shí)上,巨頭扎堆翻譯領(lǐng)域與翻譯技術(shù)的進(jìn)化以及商業(yè)化潛力密切相關(guān)。
技術(shù)是硬實(shí)力,也是硬道理
谷歌早在2016年便推出可商業(yè)部署的神經(jīng)系統(tǒng)機(jī)器翻譯(NMT),而且當(dāng)時準(zhǔn)確率可達(dá)86%,另外谷歌在去年年底還宣布在中國北京成立谷歌AI中心,其AI翻譯的技術(shù)或?qū)⒃诓痪煤笕〉眯鲁晒?/p>
再看國內(nèi),百度于2015年便在百度翻譯APP上線了NMT系統(tǒng),而且在2017年的百度世界大會上也秀了一次中英雙語同聲傳譯,同時李彥宏還介紹其準(zhǔn)確率能夠達(dá)到95%,足見百度在AI翻譯技術(shù)的改善上也是孜孜不倦;網(wǎng)易有道也在去年5月上線了NMT技術(shù),雖然來得有些晚,但卻絲毫不影響加固自己在翻譯賽道上的護(hù)城河。
而AI翻譯技術(shù)的進(jìn)步離不開不斷的學(xué)習(xí),以谷歌的AI翻譯學(xué)習(xí)過程為例,據(jù)悉其系統(tǒng)使用人類監(jiān)督的神經(jīng)網(wǎng)絡(luò),首先需要比較平行文本,即以前由人類翻譯過的書籍和文章,其次再通過比較這些平行文本中的大量數(shù)據(jù),從而學(xué)習(xí)任意兩種指定語言之間的對等關(guān)系,并獲得在它們之間快速轉(zhuǎn)換的能力。
可以看出,AI翻譯技術(shù)的進(jìn)化是以大量學(xué)習(xí)資料為前提的,簡單來說可以是缺哪兒補(bǔ)哪兒,而好的數(shù)據(jù)資料就像優(yōu)質(zhì)的教育資源一般,能夠培育出優(yōu)質(zhì)的AI學(xué)生。
進(jìn)擊的巨頭加上此起彼伏的NMT技術(shù)革新,成為了AI翻譯領(lǐng)域的常態(tài)。依靠大量人工翻譯的結(jié)果文本,翻譯技術(shù)才能夠不斷在吸收和學(xué)習(xí)中提高翻譯的準(zhǔn)確率,比如騰訊在最近的一次與中外翻譯公司的合作中提到的時政與專業(yè)類別翻譯由于受特定語境的影響較大,也是AI翻譯技術(shù)一直渴望攻克的難點(diǎn)。而中外翻譯公司的人工翻譯文本相當(dāng)于一個營養(yǎng)源,不斷喂食騰訊的機(jī)器翻譯技術(shù),幫助其進(jìn)一步完善和強(qiáng)化自身的學(xué)習(xí)能力。
一邊是近乎100%準(zhǔn)確率的人工翻譯,一邊是尚不完美、嗷嗷待哺的機(jī)器翻譯技術(shù),用數(shù)據(jù)喂養(yǎng)技術(shù)的訓(xùn)練方式是否最終會讓后來者騰訊的AI翻譯技術(shù)實(shí)現(xiàn)彎道超車,需要拭目以待。
就以上幾個案例來看,翻譯能力的進(jìn)化過程本質(zhì)上就是AI技術(shù)的進(jìn)化,通過給技術(shù)喂養(yǎng)各種翻譯數(shù)據(jù),從而使其習(xí)得越來越接近于人工翻譯的水平??偟膩碚f,就技術(shù)層面而言,在翻譯領(lǐng)域的AI可以代表一定的技術(shù)實(shí)力,這也是AI時代各巨頭愿意扎根這一領(lǐng)域的直接原因,打好了技術(shù)基礎(chǔ),就有能力面對后AI時代的“刀山火海”。