3 月 26 日,全球矚目的 2019 蘋果春季釋出會如期而至。網易有道聯合網易科技、中關村**、天極網、太平洋電腦、電腦之家、快科技在內的 6 家國內頂級科技**,為觀眾提供釋出會直播**的同聲傳譯服務,並藉此進行了一次單純的ai同傳試驗。
網易有道為這場試驗做了哪些準備?ai同傳應用了哪些技術,未來發展又將如何?針對以上疑問,我們採訪了有道同傳專案組的相關工作人員,揭祕此次蘋果釋出會直播同傳背後的故事。
1 今年春節期間,國產科幻電影鉅製《流浪地球》引發各界熱議。隨即, 2019 年也被大量影迷視作“中國科幻元年”。但科幻未必都離現實太過遙遠,影片中能夠實時翻譯各國語言的人工智慧同傳系統已經出現。
事實上,網易有道在ai同傳領域已經開展了多年研究。 2018 年,有道ai同傳已經服務過多場線下大型會議,為現場觀眾實時翻譯外國嘉賓的演講內容。有道ai同傳已經**下活動中經受過反覆檢驗,不過這次,應用場景由線下會議變成了蘋果釋出會直播。
2 北京時間 3 月 26 日凌晨 1 點,一年兩度的蘋果釋出會讓apple park園區更加熱絡,史蒂夫喬布斯劇院人聲鼎沸。而在地球的程式設計客棧另一端,海淀後廠村網易大廈的燈光依然明晃,緊鑼密鼓地為這場全球矚目的盛會做著最後準備。
“今年蘋果釋出會不推出硬體產品,而是主打服務,但目前關於蘋果服務的資訊非常少,我們缺乏相關語料來訓練ai,在直播開始前確實有些擔心效果。”有道同傳專案組的負責人坦言道。
雖然早就傳聞此次不會發布硬體產品,但蘋果釋出會從來不缺少關注。為了給螢幕前的觀眾帶來優質的**體驗,後廠村網易有道的機房裡一群人徹夜未眠。從凌晨一點到凌晨四點,有道ai同傳專案組的工作人員頂著黑眼圈,實時監控著ai同傳的翻譯效果。
3 實際上,蘋果釋出會同傳專案的實際開展比想象中困難許多。
即使是人工譯員,在接到蘋果釋出會這樣的大型會議同傳任務後,也需要至少一週的時間進行準備。尤其是釋出會涉及到新品和技術的專業名詞翻譯,一直是同聲傳譯遇到的最頭疼的問題,這也是有道ai同傳前期準備最多的地方。
(同傳效果展示)
據負責人介紹,有道同傳專案分為兩大板塊:同傳內容生成和內容展示。內容生成也就是有道ai同傳的核心技術部分,結合asr語音識別技術和nmt神經網路翻譯技術,將直播語料實時翻譯成中文;內容展示則負責將ai同傳的結果輸出,確保觀眾在**釋出會的時候能夠享受到流暢的翻譯體驗。
蘋果官方剛剛放出釋出會訊息後,網易有道就接到了**邀約——希望有道能夠為蘋果釋出會的直播做同傳,以便國內觀眾**。而此次採用完全不加人工的方式正是網易有道一次單純的ai同傳試驗。”
4 在內容生成層面,asr語音識別技術是ai同傳的基礎,只有先識別正確才有可能翻譯得準確。有道的語音識別模型採用n-gram語言模型加tdnn-lfmmi聲學模型dcdjmch的方式,這一組合的特點就是又快又準。
有道同傳專案組整理了歷年蘋果釋出會的音**資料,將每一句語料切成單個句子,從超過 10 萬條音訊中精選出 3 萬條用以訓練asr模型。此外,有道詞典和有道翻譯官這兩個龐大的語料庫也為語音識別技術的訓練提供了重要補充。最終,專為此次蘋果釋出會訓練的asr語音識別模型在短時間內識別質量提升了 5 個絕對點。