改名 Meta 之后,Facebook 的元宇宙愿景正在一點點實現。這一次,Facebook 把目光投在了元宇宙社交上。
Meta 發布語音處理模型 XLS-R
近日,Meta 正式發布 XLS-R——一套用于各類語音任務的新型自監督模型。據悉,XLS-R 由海量公共數據訓練而成(數據量是過去的十倍),能夠將傳統多語言模型的語言支持量增加兩倍以上。目前,XLS-R 共支持 128 種語言。
Meta 認為,語音交流是人們最自然的一種交互形式。“隨著語音技術的發展,我們已經能夠通過對話同自己的設備及未來的虛擬世界直接互動,由此將虛擬體驗與現實世界融為一體。”
保險巨頭Tokio Marine將在元宇宙中提供服務:金色財經報道,雖然游戲、社交和科技公司率先將元宇宙作為一個概念來接受,但其他公司現在也正在進入可用的元宇宙平臺。日本最大的財產和意外傷害保險集團Tokio Marine宣布將開始在元宇宙中提供保險服務。該公司將于1月在數字世界中提供保險和其他類型的保單,雇用將以化身表示的真實職員。[2023/1/1 22:18:58]
這與扎克伯格此前宣稱的“公司業務將以元宇宙優先”不謀而合。此前,扎克伯格曾概述了他建立“元世界”的計劃:一個建立在我們自己的數字世界之上的數字世界,包括虛擬現實和增強現實。“我們相信元宇宙將會接替移動互聯網”。
而 XLS-R 作為元宇宙社交中必不可少的一環,可以幫助母語不同的人在元宇宙無障礙對話。
Roblox計劃允許品牌合作方在元宇宙中投放廣告:9月11日消息,由于多家游戲巨頭停止或削減在俄羅斯的業務,Roblox Corporation因此受益,在俄羅斯擁有超過200萬活躍玩家。Roblox現在希望擴大其元宇宙產品。一些新產品將包括來自Gucci、Ralph Lauren、Chipotle等合作伙伴的元宇宙廣告。開發者可以通過交互式廣告牌、出租車車頂、海報或其他區域加入廣告,并從廣告收入中分一杯羹。還將推出游戲內3D門戶,為游戲玩家提供新的品牌體驗,例如Gucci Town或Chipotle一家虛擬餐廳。(Beincrypto)[2022/9/11 13:22:21]
值得一提的是,為了通過單一模型實現對多種語言的廣泛語音理解能力,Meta 對 XLS-R 進行了微調,使其獲得語音識別、語音翻譯及語言識別等功能。據介紹,XLS-R 在 BABEL、CommonVoice 以及 VoxPopuli 語音識別基準測試,CoVoST-2 的外語到英文翻譯基準測試,以及 VoxLingua107 語言識別基準測試中都取得了不錯的成績。
Inditex集團旗下服飾品牌Stradivariu在元宇宙平臺發布數字時尚服飾:4月18日消息,繼Zara和PullBear后,世界四大時裝連鎖品牌機構之一Inditex集團旗下服飾品牌Stradivarius也于日前在元宇宙平臺Zepeto APP上發布首個膠囊系列“Digital Fashion:wear the future now”,涵蓋連衣裙、緊身胸衣等,該系列服飾會限時免費上架供用戶體驗,原價1.9歐元至5.99歐元之間,用戶可以上傳自己的照片試穿想要的產品,購買后可下載照片在社交媒體上分享。據悉,Stradivarius成立于1994年,目前在全球64個國家擁有900多家門店。(Fashionnetwork)[2022/4/18 14:30:56]
為了盡可能降低功能訪問門檻,目前,Meta 與 Hugging Face 聯手發布了模型本體,并通過 fairseq GitHub repo 全面開放。
韓國樂天集團將在元宇宙平臺ZEP上舉辦招聘說明會:3月17日消息,韓國樂天集團宣布,將在元宇宙平臺“ZEP”上舉辦招聘說明會。樂天表示,在元宇宙空間進行招聘可以不受時間和空間的限制,也可以通過化身表達各種個性。樂天計劃從此次招聘咨詢開始,積極利用元宇宙進行面試和培訓,并通過定期舉辦局域網茶會來加強與求職者的雙向溝通??。(每日經濟日報)[2022/3/17 14:02:26]
試用地址:https://huggingface.co/spaces/facebook/XLS-R-2B-22-16
XLS-R 工作原理
據介紹,XLS-R 在 wav2vec 2.0 訓練集上接受了超過 43 萬 6 千小時的公開語音錄音訓練,從而實現了對語音表達的自監督學習方法。這樣的訓練量已經達到去年發布的當時最強的模型 XLSR-53 的 10 倍。利用從會議記錄到有聲讀物的多種語音數據來源,XLS-R 的語言支持范圍擴展到 128 種,涵蓋的語種量達到前代模型的近 2.5 倍。
作為 Meta 打造的有史以來最大模型,XLS-R 中包含超過 20 億個參數,性能遠高于其他同類模型。Meta 表示,事實證明,更多參數能夠更充分地體現、數據集中的各類語種。此外,Meta 還發現,規模更大的模型在單一語言預訓練方面的性能也同樣優于其他較小模型。
Meta 在四種主要多語言語音識別測試中對 XLS-R 做出評估,發現它在 37 種語言上獲得了超越以往模型的效能。具體測試場景為:BABEL 中選取 5 種語言,CommonVoice 中選取 10 種語言,MLS 中選取 8 種語言,以及 VoxPopuli 上選取 14 種語言。
BABEL 上的單詞錯誤率基準測試結果。XLS-R 較前代模型實現了顯著改進。
此外,Meta 還評估了語音翻譯模型,即將錄音資料直接翻譯成另一種語言。為了打造一套能夠執行多種任務的模型, Meta 同時在 CoVoST-2 基準測試的數個不同翻譯方向上對 XLS-R 進行了微調,使其能夠在英語與多達 21 種語言之間實現內容互譯。
在使用 XLS-R 對英語以外的其他語言進行編碼時,獲得了顯著的效能提升,這也是多語言語音表達領域的一次重大突破。據 Meta 介紹,XLS-R 在低資源語言學習中實現了顯著改進,例如印尼語到英語的翻譯,其中 BLEU 準確率平均翻了一番。BLEU 指標的提升是指模型給出的自動翻譯結果與處理同一內容的人工翻譯結果間重合度更高,代表著模型在改進口語翻譯能力方面邁出了一大步。
以 BLEU 指標衡量的自動語音翻譯準確率,其中較高值表示 XLS-R 從高資源語言(例如法語、德語)、中資源語言(例如俄語、葡萄牙語)或低資源語言(例如泰米爾語、土耳其語)語音記錄翻譯至英語時的準確率。
Meta 認為,XLS-R 證明擴大跨語言預訓練規模可以進一步提高低資源語言的理解性能。它不僅提高了語音識別率,同時也將由外語到英語的語音翻譯準確率提高了一倍以上。
“XLS-R 是我們朝著以單一模型理解多種不同語言(語音)目標邁出的重要一步,也代表著我們在利用公共數據推進多語言預訓練方面做出的最大努力。我們堅信這是一條正確的探索方向,將讓機器學習應用更好地理解所有人類語音、并促進后續研究,大大降低語音技術在全球范圍內、特別是服務匱乏社群中的使用門檻。我們將不斷開發新方法,通過低監督學習拓展模型的語言理解能力、逐步使其覆蓋全球 7000 多種語言,實現算法的持續更新。”Meta 提到。
https://ai.facebook.com/blog/xls-r-self-supervised-speech-processing-for-128-languages/
前言:虛擬土地資產儲值NFT可能會更先形成下一個超級熱點。NFT也是Token,而且具有比比特幣更適合資產儲值的特性,與實物NFT相比,更近的是數字資產NFT,與創作者作品NFT相比,虛擬土地資.
1900/1/1 0:00:00金色相對論 | 創世資本創始合伙人孫澤宇:挖礦在熊市是一種更穩健的投資:在本期金色相對論上,針對金色財經內容合伙人佟揚“如何理解牛市炒幣,熊市挖礦?”的提問.
1900/1/1 0:00:002021年被稱之為“元宇宙元年”,也迎來了元宇宙商標注冊的熱潮,2021年全年,注冊的元宇宙商標數量占目前元宇宙商標總數的99.9%.
1900/1/1 0:00:00近幾日隨著加密市場瀑布式下跌,BTC損失地址數達20個月高點,處于虧損狀態的ETH地址數量(7日MA)達到17個月以來高點,加密領域總市值也幾近“腰斬”,從峰值3萬億美元跌至1.62萬億美元.
1900/1/1 0:00:00“讓上海成為元宇宙之都,無論元宇宙怎么發展,都離不開上海的產業優勢。”從數字經濟的專題審議會,到小組討論的高頻熱詞,“元宇宙”成為今年上海兩會關注焦點.
1900/1/1 0:00:00眾所周知,以太坊是一個正在發生重要變化的區塊鏈網絡。近幾年,去中心化應用程序(Dapp)以及其他區塊鏈技術形式獲得了前所未有的發展,而其中諸多技術均構建于以太坊之上.
1900/1/1 0:00:00