在之前的文章中我們討論了當紅風頭正盛的ChatGPT,分析了它的技術本質、應用場景和法律風險初探。而在近期的《流浪地球》系列電影中,“虛擬數字人”的概念博人眼球。這不禁讓我想起另一個紅極一時的概念,“深度偽造”、“AI換臉”。
深度合成技術
事實上,“虛擬數字人”的構建離不開包括偽造技術在內的深度合成技術,而ChatGPT是深度合成領域下的一類模型。數據深度合成(DeepSynthesis)本身是一個中性概念,泛指借助深度學習算法模型等智能化方案自動生成文本、圖像、語音、視頻等數據內容的一系列處理技術。其中文本因為其較強的字符特征,只需滿足空間序上的合理性,與視頻、音頻類型數據的處理思路略有不同。
在ChatGPT一類的大型語言模型中,包含預訓練和下游任務訓練兩個部分。在預訓練階段,模型從大量的數據中學習復雜的上下文聯系,并將這種聯系向量化。Next-token-prediction和masked-language-modeling是用于預訓練語言模型的核心技術。在第一種方法中,模型被給定一個詞序列作為輸入,并被要求預測序列中的下一個詞,而在第二種方法中,其輸入句子中的一些詞被替換為特殊token,例如,模型被要求預測應該插入到位置的正確的詞。同時,在下游任務訓練中,In-contentLearning被提出以提升模型在各個場景任務下的表現能力。譬如標注者會給模型一個提示性的輸入,讓模型更加清楚的感知到應該輸出的范式。
華媒控股:公司參股的文交所正在試水數字藏品的發行:金色財經報道,華媒控股(000607.SZ)5月6日在投資者互動平臺表示,文交所系本公司參股公司,本公司持有其40%股權。目前文交所正在試水數字藏品的發行,已在一些合作平臺發行越窯青瓷“百朵向陽花開”、《城報》創刊號和《都市快報》創刊號數字藏品。該業務處于早期探索階段,尚未形成業務規模和盈利模式,未來發展狀況存在較大不確定性,對本公司的業績不會造成重大影響。(每經網)[2022/5/7 2:56:30]
在圖像、音頻類深度偽造模型中,生成網絡”或“生成器”負責制作復制原始數據集特征的合成數據如圖片、音頻記錄、視頻等,并制作“深度合成物”;鑒別網絡或者說鑒別器則負責識別合成的數據,檢測該視頻是否為偽造。通過反復的“無監督學習”過程,“生成網絡”制作并修改“深度合成物”,直到“鑒別網絡”無法再檢測出該合成物系經“深度合成”,最終形成高保真的信息內容。
媒體:中國企業開始試水“數字藏品”一級交易市場:金色財經報道,據新華網轉發《解放日報》文章消息,中國企業已開始試水“數字藏品”一級交易市場。文章提到,B站,騰訊、阿里和京東等互聯網巨頭均已開始布局NFT,并推出了相關平臺,阿里的鯨探、騰訊的幻核,其平臺上都不再提及NFT,而是使用了“數字藏品”這一稱呼。并且也都聲明,不鼓勵任何形式的數字藏品炒作行為。國外的NFT,大都依托以太坊之類的區塊鏈公鏈發行,可以在公鏈上進行交易。換言之,更利于炒作。而國內的NFT,只是依托各家公司自己旗下的聯盟鏈來發售,理論上無法在以太坊等公鏈上進行交易。目前這些國內平臺上,都沒開放互相交易的功能。從國內范圍來看,現階段我國企業基本依托自身聯盟鏈,開始試水數字藏品的一級交易市場,但似乎并沒有想好“怎么用”。[2022/1/10 8:37:17]
動態 | 全國首個區塊鏈電子處方上線 華山醫院與螞蟻金服合作試水:據中國證券網報道,全國首個區塊鏈電子處方來了。9月13日,復旦大學附屬華山醫院攜手螞蟻金服,推出全國首個區塊鏈電子處方。患者只需點開支付寶華山醫院生活號,就能線上看病,醫生遠程開好處方藥,患者在家坐等送藥上門。據了解,該技術能實現醫院處方精準無誤且不可篡改,以解決復診患者拿著處方不遵醫囑在外重復開藥等問題。[2018/9/13]
總體而言,基于深度學習的數據合成技術隨著算力的發展逐漸從研究型走向應用型,主要應用在文本合成、視覺合成、聽覺合成等三大領域,因循數據收集、模型訓練、偽造內容等核心步驟,創造虛擬數字人及其所處的生態環境。
相關戲仿性應用產品迅速迭代,一方面,數據深度合成的正向應用將創建的文本段落、虛擬角色、聲音模擬、視頻渲染等廣泛應用到社交通訊、娛樂文化等眾多場景之中,提升信息處理效率,增進臨場體驗。另一方面,深度合成內容難以精準及時地予以鑒識,部分主體傳播虛假信息,操控受眾反應,嚴重威脅整個社會的安全體系與保障機制,因此亟待構建和完善規模化的規制體系。
劉東明:資本試水區塊鏈大健康,場景應用時代已然來臨 :近日,北大國際經濟研究所新經濟與互聯網+課題組電商中心主任、電商島全球私董會主席劉東明表示,凡是有多次交易環節產生的行業,都可以用區塊鏈,區塊鏈在大健康領域尤其具有強大的多場景應用能力。大健康領域特別是醫療領域區塊鏈技術落地,帶來的積極效果最直白的理解就是安全。[2018/3/30]
《互聯網信息服務深度合成管理規定》解析
我國國家互聯網信息辦公室、中華人民共和國工業和信息化部、中華人民共和國部在2022年11月3日通過了《互聯網信息服務深度合成管理規定》,該規定基于深度合成應用的定性和風險的評估,從而提出包括內容標志、主體報備、用戶實名制、內容審核機制、救濟機制、個人信息保護和數據安全等方面的規制措施。
內容標志
深度合成服務提供者對使用其服務生成或者編輯的信息內容,應當采取技術措施添加不影響用戶使用的顯著標識,從而防止公眾混淆誤認。
主體報備和用戶實名制
具有輿論屬性或者社會動員能力的服務提供者和技術支持者應當按照《互聯網信息服務算法推薦管理規定》履行備案手續,并在網站、應用程序公示,同時按照國家有關規定開展安全評估;服務提供商需要對深度合成服務使用者進行真實身份信息認證。颯姐團隊認為之后會出臺針對深度合成內容專門的備案手續。
內容審核機制和救濟機制
服務提供者應當加強深度合成內容管理。采取技術或者人工方式對輸入數據和合成結果進行審核,建立健全用于識別違法和不良信息的特征庫,完善入庫標準、規則和程序,記錄并留存相關網絡日志。
服務提供者應當建立健全辟謠機制。發現利用深度合成服務制作、復制、發布、傳播虛假信息的,應當及時采取辟謠措施,保存有關記錄,并向網信部門和有關主管部門報告。
個人信息保護和數據安全
服務提供者和技術支持者應當加強訓練數據管理,采取必要措施保障訓練數據安全,若數據集中包含個人信息,則需遵循個保法相關規定和配套標準。
算法安全評估
規定要求合成服務提供者和技術支持者應當加強技術管理,定期審核、評估、驗證生成合成類算法機制機理,強調了處理具有生物識別信息、可能涉及國家信息的模型、模板需要進行安全評估,相關審核、評估機制尚未明確要求。颯姐團隊認為該類評估由于企業對核心技術披露的限制以及當前評估技術的局限性,困難重重。
寫在最后
深度合成歸根結底是人工智能技術,尤其是算力發展的產物,其獨特的創造性注定會逐漸走入生產生活,因此監管體系和合規體系的構建是必然路徑。
深度合成技術上的特殊性要求我們一方面做好深度合成配套法律法規、標準的制定和完善,企業逐步摸索出一條合規路徑,另一方面投入到深度合成檢測追蹤技術的開發與應用,法律、技術雙管齊下,為做優產業發展環境提供重要基石,最終促進整個行業的健康發展。
據悉,南方某省市場監督管理局、宣傳部、網信辦、工信廳、文旅廳、商務廳、廳、金融局、稅務局、通信局聯合發布:《關于加強數字藏品風險監管工作的通知》對省內數字藏品風險加強監管.
1900/1/1 0:00:002022年,NFT開始變得更加無處不在,成為資本的寵兒、鏈上世界的新星。Uniswap一雙襪子就賣了16萬美元,推特創始人五個單詞拍出250萬美元,加密藝術家Beeple數字作品“First50.
1900/1/1 0:00:0021:00-7:00關鍵詞:BNBChain、加息、Messari、Circle1.美聯儲3月加息25個基點的概率為82.7%;2.Messari:BNBChain尋求增長.
1900/1/1 0:00:00比特幣價格在劇烈波動一個月之后,目前的價格保持在幾大持有者群體的鏈上基礎成本之上。這導致大部分BTC持有者處于未實現盈利狀態,并暗示宏觀市場趨勢正在轉變.
1900/1/1 0:00:00回顧2022,Web3對于時代發展而言,是更好還是更壞?眾所周知,2022對于Web3行業而言注定是波瀾起伏的一年.
1900/1/1 0:00:00重押元宇宙一年多之后,Meta終于重回現實,資本支出的”大頭“又重點用到了改善傳統業務。在Meta發布的最新財報中,Meta的營收和凈利潤均呈現了同比下滑的情況,但公布的業績卻超出了市場的預期.
1900/1/1 0:00:00