近期,國外一份調查報告誤將392萬和83萬的采購費用翻譯為39.2億和830萬,鬧出國際笑話。有分析認為,此烏龍事件是國外機器翻譯軟件造成的。
讓很多人意想不到的是,看似簡單的數字,在機器翻譯中向來是一大痛點。就以「392.687694萬元」為例,我們測試不同翻譯軟件的翻譯結果。
數字翻譯「中譯英」測試
首先測試「中譯英」,國內外9款主流翻譯軟件中,只有火山翻譯和騰訊翻譯君準確地翻譯出了392萬。其余7款產品,有翻譯成392的,有翻譯成39.2億的,甚至還有翻譯成392萬億的,比正確結果擴大一億倍,另外4款都翻譯成了3.92億。測試結果如下列組圖所示。
火山翻譯:
騰訊翻譯君:
上海:支持上海數據交易所設立數字資產板塊:金色財經報道,上海市人民政府辦公廳印發《立足數字經濟新賽道推動數據要素產業創新發展行動方案(2023-2025年)》,激發各類企業創數用數活力。增強國有企業數據運營能力,推動建設企業數據中心。提升跨國企業“上云用數賦智”水平。強化數據賦能中小企業數字化轉型,發揮上海市企業服務云作用,支持數商豐富數據產品,支持公共部門、國有企業等加大對中小企業數據產品和服務采購力度。引導互聯網平臺企業、行業龍頭企業與中小微企業雙向公平授權,建立科學合理收益分配機制。支持上海數據交易所設立數字資產板塊,研究與實體經濟相結合的數字資產上市發行和流通交易機制。[2023/8/15 21:25:36]
以下為其他7款翻譯產品的測試結果。
翻譯為39.2億:
量子匠星上線數字人“Dr.Yu宇博士”,瞄準元宇宙知識賽道:金色財經報道,近日,數字人科技公司“量子匠星”發布了首個知識類超寫實數字人“Dr.Yu宇博士”。
據介紹,Dr.Yu宇博士以量子匠星的視覺科技與內容積累為成長土壤,突破次元壁,穿梭虛擬與現實,扎根于知識輸出,剖析元宇宙與數字經濟的同時,也將解構商業、科技、文化以及社會現象,輸出有價值、有深度的內容。
量子匠星創始人兼CEO王博軒表示:文娛領域的虛擬偶像雖是當前的熱點,但在日益擴大的知識類用戶需求的推動下,“回歸價值”已成為了共識。對于Dr.Yu宇博士的創作團隊而言,我們不僅是在輸出專業知識,更是在傳達元宇宙背后的世界觀與價值觀。(新華報業網)[2022/4/11 14:17:31]
翻譯為392:
翻譯為392萬億:
IOTA基金會聯合創始人:GoShimmer測試網和框架將支持創建數字資產:IOTA基金會聯合創始人Dominik Schiner在昨天的AMA中談到IOTA未來幾個月的重點工作包括智能合約和數字資產。IOTA不斷更新RFC,以支持提供新數字資產框架以及NFT的智能合約。關于目前的狀況,Schiner透露,“我認為RFC將在未來幾天內更新。隨著NFT和數字資產的發展,我們的目標是在GoShimmer網絡上推出它們。這意味著GoShimmer網絡上的東西將與IOTA主網上完全相同。所以,如果你想建立一個NFT市場、發布代幣的引導網絡或者代幣鑄造廠,你現在就可以開始建立了。”GoShimmer將被合并到Coordicide激勵測試網Nectar。當RFC最終被移植到主網時,只需點擊一個按鈕,資產就可以很容易地被移植。
關于IOTA智能合約的進展,在GoShimmer最近的更新之后,這些智能合約正在被重構,以便智能合約可以在Coordicide測試網上編寫。此外還制定了技術路線圖,以推進以太坊虛擬機(EVM)和其他虛擬機的集成。在接下來的幾周里,GoShimmer將發布另一個Alpha版本。(Crypto News Flash)[2021/3/27 19:23:14]
翻譯為3.92億:
動態 | 數交會取得多項成果加強數字版權保護:據新華社消息,12月2日至4日,2019成都國際數字版權交易博覽會在成都舉行。在版權產業日益數字化、網絡化的趨勢下,數交會在數字版權綜合服務平臺、網絡版權保護研究基地建設等方面取得了豐碩成果。 數交會期間,“網絡版權保護研究基地”在咪咕文化科技有限公司成立;運用區塊鏈、云計算、大數據等關鍵技術的“斑馬”數字版權綜合服務平臺正式上線啟動,二者都將為網絡版權保護提供支撐。 本屆數交會期間還舉行了數字版權產業重點項目簽約,包括成都音像出版社有限公司與中國新聞出版傳媒集團簽約、拼多多與新華文軒簽約等。[2019/12/5]
美國參議員抨擊委內瑞拉的石油數字貨幣計劃:美國參議員馬可·盧比奧(R.-Fl)和羅伯特·梅嫩德斯(D.-NJ)在致美國財政部長史蒂文·努欽(Steven Mnuchin)的一封公開信中寫道:“我們對委內瑞拉是否有能力推出數字貨幣有嚴重的懷疑,但無論如何,美國財政部必須配備工具和執法機制來打擊使用數字貨幣來逃避美國的制裁,特別是案件。”[2018/1/23]
數字翻譯「英譯中」測試
我們用不同軟件把英文「3.92687694millionyuan(RMB)」翻譯回中文,會是怎么樣的結果?
這次只有火山翻譯準確翻譯出了392萬元人民幣。其他8款產品,有翻成3.92萬的,有翻成39.2億的,也有翻成392萬億的,另外5家都翻成了3.92萬億。測試結果見下列組圖。
火山翻譯:
其他產品的翻譯結果:
數字的重要性毋庸多言,在商業條款中如果翻譯錯一個數字,可能會帶來成千上萬的損失;建筑圖紙中一個數字翻譯的疏漏,就可能導致一項龐大建筑工程轟然倒塌。想要保證數字翻譯的準確度,遠不是謄寫一串阿拉伯數字再翻譯單位這么簡單。從上面測試中也可以看到,一些國際巨頭的翻譯產品,在數字翻譯中照樣會出現偏差萬倍甚至上億倍的錯誤。
數字翻譯難在哪?
數字翻譯對翻譯者關于目標語言數字表達的理解要求較高,在中英翻譯中,數字翻譯的難點主要在以下方面:
a.中英語言中不同的數字單位,如1000萬翻譯成10million,不能簡單地「拷貝」
b.很長的數字容易帶來偏差
c.超大數字的翻譯問題,如trillion、萬億以上的單位
d.中英語言中不同的計量單位,如中文中的“斤”,容易被翻譯成“kg”
e.帶有貨幣符號的數字容易犯錯
當前,很多翻譯軟件對數字沒有做額外的處理,采用的是與普通文字相同的sequence-to-sequence神經機器翻譯模型。這一模型翻譯質量較高,流暢性較好,但存在一個顯著的缺陷,就是缺乏常識和推理能力,無法理解對于人類來說比較簡單的規則,例如,“萬”和“million”的的轉換、單位貨幣之間的不同等。
火山翻譯如何解決數字翻譯難題?
我們從火山翻譯技術分享中了解到,火山翻譯的翻譯模型見到對應的數字之后,會將其抽取出來,通過推理、計算等智能過程,對數字進行跨語言的語義轉換,然后將其置于翻譯句子適當的位置中,類似人類的翻譯推理過程。
火山翻譯是字節跳動旗下火山引擎的AI中臺能力之一,技術能力已經在飛書的文檔、消息翻譯和火山引擎的企業級客戶中廣泛應用。由于當前機器翻譯場景中存在大量的數字內容,數字翻譯也一直是火山翻譯團隊持續優化的重要方向。目前,火山翻譯已經支持56門語言、3080個語向的翻譯。
世界上只有一種病,那就是窮病。 1、 最近,一支叫“奕凱達”的藥品上了熱搜。2019年6月,上海的陳阿姨被確診彌漫性B大細胞瘤,經過治療后又復發,一度絕望,基本就是“回家等死”的狀態.
1900/1/1 0:00:00一、前言:能源變革下的紅土鎳礦HPAL濕法冶煉 能源變革的大時代,鎳作為電動化下的第三種金屬,動力電池用鎳將隨著新能源車終端需求的爆發及高鎳化的逐步推進迎來爆發式增長.
1900/1/1 0:00:00為切實提高我市交通運輸系統創文實景圖片的拍攝水平,確保高質量完成網上申報圖片資料上報工作,進一步夯實創文工作基礎.
1900/1/1 0:00:00一、地域發展狀況 1.1地理和人口發展狀況北京,簡稱“京”,古稱燕京、北平,是中華人民共和國的首都、直轄市、國家中心城市、超大城市,位于東經115.7°—117.4°.
1900/1/1 0:00:00作者|顧念秋 編輯|胡展嘉 出品|零態LT 18萬美元買一個數字頭像,你可能認為這是瘋了。這是庫里在上周的激情下單.
1900/1/1 0:00:00Billions項目組自9月7日,比特幣和以太坊閃崩,便一路向下,9月22日,比特幣最低價39585美元,以太坊2650美元,NFT板塊的AXS最低價48.1美元.
1900/1/1 0:00:00