來源:價值研究所
進入5月,國產大模型的風口非但沒有熄火,反倒越燒越旺。過去一個星期,就有多家企業發布AI大模型相關產品:
5月5日,網易有道發布了基于“子曰”大模型開發的AI口語老師劇透視頻,介紹其基于教育場景的類ChatGPT產品布局;5月6日,科大訊飛發布認知大模型“訊飛星火”,董事長劉慶峰表示有信心超越ChatGPT;同日,淘云科技發布“國內首個”兒童認知大模型“阿爾法蛋”……
在上述公司之外,還有很多企業宣布進軍大模型,類ChatGPT產品正在密鑼緊鼓研發中,預計不久便會正式上線。企業的熱情毋庸置疑,AI大模型似乎已經不是一條選擇題,而是必做題。
然而,狂熱背后不乏擔憂。大模型技術應用范圍雖廣,目前落地的場景畢竟有限。而這群入局大模型的企業,分別來自游戲、教育、動漫等諸多行業,和大模型的應用場景離得很遠。
當國產大模型變得泛濫,我們該如何分辨優劣?
沒技術不要緊,有公司靠“外援”搗鼓大模型
要評判一個大模型的優劣,首先看技術,其中最核心的是算法和算力,即訓練參數量。因為參數量越大,系統的知識面就會越廣,表現也會越穩定。資料顯示,openAI在2020年推出的ChatGPT-3參數量已經達到1750億,谷歌在一年后發布的PaLM則達到5400億,更不用說最新的ChatGPT-4了。
新興市場教父:比特幣或跌穿1萬美元,加密貨幣繁榮與美聯儲瘋狂印鈔有關:金色財經報道,新興市場教父Mark Mobius表示,比特幣價格可能在2023年跌破1萬美元,較當前價格再下跌40%以上。此前,他曾準確預測比特幣跌破2萬美元。他表示,比特幣已經跌破1.8萬美元、1.7萬美元的技術支撐位,那么距離跌破1萬美元已經不遠了。
他對媒體表示,他沽空比特幣的理由是利率上升和美聯儲收緊貨幣政策。隨著利率上升,持有比特幣或者其他加密貨幣的吸引力不再那么大,因為僅僅持有比特幣是無法賺取利息的。
他說,當然,有很多公司為加密貨幣存款提供5%甚至更高的利息,但這些公司基本都破產了。因此,隨著投資者遭遇損失,人們會更害怕為賺取利息而持有加密貨幣。加密貨幣的繁榮與美聯儲瘋狂印鈔有關。在過去幾年,美元貨幣供應量增長了40%以上。他解釋道,當美聯儲開始收回流動性時,人們在市場上的投資能力就會變得困難。[2022/12/4 21:21:50]
參照此技術標準,我們可以精準識別一批蹭熱點的企業:它們要么確實拿出了產品,但參數量和ChatGPT等有較大差距,功能也較單一;更有甚者,套用別家公司的硬件、數據庫來預訓練參數,本身缺乏核心技術。
當中的代表,有昆侖萬維。
4月10日,昆侖萬維宣布聯合奇點智源研發“天工3.5”國產大語言模型。根據發布會上的介紹,“天工3.5”定位為“中國第一個真正實現智能涌現”的大模型產品,具備智能問答、聊天互動、文本生成等多種應用功能以及豐富的科學、技術、文化、藝術和歷史知識儲備。
聲音 | John McAfee:將黃金與比特幣進行比較是瘋狂的:殺軟件之父、加密貨幣支持者John McAfee發推稱:黃金和比特幣的區別?黃金是一種商品,它占有空間,具有質量、溫度和形狀。比特幣是一種理念,通過一系列數字來體現,沒有真實的位置或實體——這是一個具有無限流動性的聰明概念。將他們進行比較是瘋狂的。[2019/5/29]
根據官方資料,昆侖萬維最早在2020年布局AIGC業務,投入數億元組建研發團隊。去年12月,“昆侖天工”首次亮相,初代產品提供圖像、音樂、文本及代碼AI生成功能。作為對比,大模型領頭羊openAI在2019年發布ChatGPT-1,每一代產品的研發周期都在一年左右。
乍一看,昆侖萬維的“天工3.5”功能全面對標ChatGPT,比起百度“文心一言”、阿里“通義千問”等國產大模型毫不遜色。在研發速度上,昆侖萬維也領先于大多數國內同行。不過昆侖萬維的缺點也很突出——“天工3.5”是和阿里云合作的產物,后者的參數、硬件設備幫了昆侖萬維很大忙。
事實上,昆侖萬維一直抱緊阿里云的大腿。資料顯示,過去幾年昆侖萬維的海外數據基本都在使用阿里云公有云儲存服務,2020年布局AIGC時也是在阿里云的協助下建立算力集群。在“天工3.5”發布后,還有媒體爆出昆侖萬維缺乏文本生成、數據處理專利的消息,和百度、阿里形成鮮明對比。
同樣遭遇技術質疑的,還有“AI四小龍”之一的商湯科技。
區塊鏈媒體跑步入場:資本瘋狂加持:21世紀經濟今日報道稱,在區塊鏈的行業風口之下,區塊鏈媒體平臺已經成為炙手可熱的細分投資領域,近期密集獲得資本市場的關注。3月9日,由游戲陀螺創始人余文鋒發起創辦的區塊鏈內容平臺陀螺財經宣布獲得700萬天使輪融資。3月6日,藍港互動創始人王峰創辦的區塊鏈門戶火星財經宣布獲得A輪融資,投資方包括IDG資本、泛城資本、明勢資本等。該項目在上線不到一個月的情況下,估值已經達到1.5億元,但具體融資金額并未透露。有統計數據顯示,一個月之內,行業中已涌現50家以上區塊鏈媒體。在微信公眾平臺上,名字中帶有“鏈”、“幣”的公眾號都已超過百家。[2018/3/10]
商湯科技在4月10日發布了自研大模型系統“日日新SenseNova”,內含AI數字人視頻生成平臺“如影”,3D內容生成平臺“瓊宇”和“格物”,類ChatGPT產品“SenseChat”等產品。別人都是發布單個產品,商湯科技一次過拿出一套“全家桶”,可見其野心之大。
然而,商湯的大模型全家桶在發布那天就有翻車跡象。演示視頻公布后,就有媒體和網友發現商湯“妙畫”生成的圖片和AI網站Civitai的圖片撞車,甚至還有來自Civitai的文字注釋。SenseChat則在一些基礎問題上表達含糊不清,其訓練參數量也遭到質疑。
在價值研究所看來,缺乏數據源,是昆侖萬維和商湯科技共同的命門。
“文心一言”背后有百度的海量搜索數據和語料庫,阿里的“通義千問”則有來自電商、云計算等領域的語料庫,流量大、用戶覆蓋面廣,能提供足夠的參數。缺乏面向C端用戶的通用產品、沒有參數積累,強行上馬大模型,昆侖萬維和商湯科技的尷尬處境完全可以預料。
瘋狂推薦競爭幣背后 John McAfee稱自己的Twitter賬戶被黑:此前,網絡安全大V麥咖啡(John McAfee)的個人Twitter曾頻繁推廣一些鮮為人知的加密貨幣,很多投資者在看到這些信息之后就買入了其推薦的加密貨幣。然而,就在今日凌晨,這位網絡安全先鋒向BBC透露稱,他的Twitter賬號已遭黑客入侵,他表示:“我無法控制Twitter的安全。”[2017/12/29]
沒應用場景又如何?這些企業硬要和AI攀關系
除了缺乏核心技術、產品缺陷明顯的昆侖萬維等企業,另一類企業的行為更讓人迷惑:在缺乏應用場景的情況下,硬要給自身產品貼上大模型標簽、“硬蹭”熱點。
這一類企業,以專注C端服務的互聯網公司為主,尤其是近年來處境不佳的教育、科技金融、游戲公司。
比如專注于智能教育硬件研發的淘云科技,在5月6日發布了首個兒童認知大模型“阿爾法兒童認知大模型”和GPT機器人,并宣布把平臺的兒童原始語料加入科大訊飛的“訊飛星火”大模型中。同樣來自教育領域的學而思,也在近日宣布研發數學大模型MathGPT,目前已取得階段性成果,預計年內推出。
這類企業最大的問題在于,大模型的應用場景、目標用戶和它們的業務有巨大差異。強推大模型,根本無法為它們的用戶帶來多少幫助。
根據淘云科技董事長劉慶升的說法,“阿爾法兒童認知大模型”基于兒童場景提供更貼近幼兒理解力的生成式內容,讓兒童用戶在輕松的氛圍下積累新知識。問題在于,類ChatGPT應用仍無法保證100%準確率,常識性的錯誤屢見不鮮。對于認知能力有限的兒童來說,并不穩定的大模型反倒可以帶來反作用。
李開復也談比特幣了 央視財經也說“比特幣太瘋狂了”:就在有消息曝出史玉柱等大佬參與投資OKCoin,周鴻祎的360接洽火幣之后,仿佛一時間,所有的傳統大佬的目光都移到了比特幣上。今天,就在剛剛,又有一位大佬加入比特幣關注大軍,他就是傳奇大佬兼創業導師:李開復。[2017/12/18]
當然,上面這些公司蹭熱點的目的雖然很明確,但好歹拿出了實打實的產品或規劃。還有一些企業,不僅業務場景和大模型相去甚遠,甚至還沒有拿出實際產品就開始往自己臉上貼金。
比如定位于“國漫IP孵化平臺和漫畫分享社區”的快看漫畫,就在4月27日宣布成立AIGC事業部。創始人兼CEO陳安妮更是在內部信中表示,AI將會給內容產業帶來“顛覆式”生態變革。
再比如最近一邊搗鼓直播電商、一邊忙著進軍本地生活的小紅書,也沒忘記籌備大模型團隊。根據36氪報道,小紅書在今年3月開始組建研發團隊,主要成員來自廣告NLP技術部門。4月,小紅書悄悄上線了一款名為“Trik”的AI創作應用,主打AI繪畫,但沒有大規模宣傳,至今沒有引發多少關注。
總的來說,這兩類企業的大模型布局都經不起推敲。但蹭上大模型風口,確實為其帶來了可觀的流量,也掀起資本市場的狂歡。前面提到昆侖萬維,在發布“天工3.5”次日股價暴漲16%。或許正因為市場過于狂熱,才會反過來迫使這些企業主動迎合熱點。
可惜這種熱度是無法持續的,而且還會遭到監管機構的重點關照。在“天工3.5”發布次日,昆侖萬維就收到了深交所的關注函,要求前者結合項目研發進度、行業政策風險、對公司財務的影響等情況,說明該業務可能面臨的風險。
雖然深交所沒有把話挑明,但明眼人都看得出這封關注函寫滿對昆侖萬維蹭熱點的懷疑。在價值研究所看來,蹭熱點的行為正在損壞行業生態。給大模型降降火、讓市場回歸理性,對踏實搞研發的企業來說非常重要。
追趕ChatGPT,一場艱苦的馬拉松競賽
不可否認,除了上面這些蹭熱點的公司外,國內有不少企業在認真打磨大模型產品,也有一定的技術積累和豐富的應用場景。不過從百度、阿里,再到360,幾乎所有頭部企業都承認自己的技術不如openAI的ChatGPT。
5月7日,周鴻祎應邀來到東方甄選直播間,和俞敏洪、董宇輝大談國內的大模型創業熱潮。周鴻祎直言,openAI比國內企業領先至少兩年,國產大模型有機會在一年內追上ChatGPT-3.5,但openAI已經開始訓練ChatGPT-5了。
“上來就說能超越ChatGPT,那叫吹牛。”
周鴻祎最后這番話,不少媒體認為是在影射5月6日發布“訊飛星火”認知大模型的科大訊飛。科大訊飛董事長劉慶峰在發布會上表示,“訊飛星火”在文本生成、知識問答、數學能力上已經超過ChatGPT,目標是到今年10月,通用認知能力對標ChatGPT,并在中文上超越ChatGPT。
周鴻祎是否意有所指不得而知,可以肯定的是,投資者、用戶對國產大模型的耐心正在流失,要求變得更加苛刻,外部的競爭也更加激烈——留給國產大模型的時間已經不多了。
5月4日,微軟宣布Bing預覽版全面開放,該系統此前已接入openAI的ChatGPT-4;一天后,谷歌也宣布向所有擁有Wordspace賬號的用戶開放BardAI工具訪問權限。
微軟和谷歌先后走向開放,意味著新一輪用戶爭奪戰正式打響。一旦它們滲透進國內市場,面對技術上的差距,國產大模型并沒有太多應對方法。比起那群蹭熱點的企業,追趕openAI的骨干力量更值得我們關注——特別是百度、阿里、騰訊三巨頭,周鴻祎治下的360,疑似被其揶揄的科大訊飛實力也不容小覷。
這幾家公司的優勢是相似的:雄厚的資金儲備;擁有諸多面向用戶的產品/服務,語料庫十分豐富;主營業務貼近大模型應用場景,如百度和360的搜索,騰訊的社交媒體,阿里的云計算和電商,科大訊飛的智慧辦公等。現階段,這些企業的產品距離ChatGPT當然還有一定差距,但并非沒有追趕的機會。
要知道,即便是技術領跑全行的openAI,也有自己的苦惱。過去一年,隨著ChatGPT走紅openAI的估值也是一路走高,成為全球范圍內升值最快的獨角獸——可惜隨之飆升的,還有虧損額。
據外媒報道,openAI上一財年凈虧損達到5.4億美元,同比幾乎放大一倍。每一次預訓練參數都要耗費巨資,要提升系統穩定性又必須不斷加大參數量和預訓練頻次,虧損自然成為無解難題。國盛證券的研報指出,通過測算,2800億參數量的大模型預訓練成本約為200萬美元/次,谷歌的PaLM號稱擁有5400億參數,單次預訓練成本將高達1200萬美元。
今年2月推出的付費版ChatGPT和其他商業化嘗試收效甚微,短時間內不可能覆蓋預訓練所需成本。CEOSamAltman曾暗示,公司未來幾年可能需要籌集約1000億美元的資金,才能進一步提升技術,打磨下一代產品。
openAI的經歷表明,AI大模型研發如同一場漫長且艱難的馬拉松——不要總是奢望彎道超車,踏踏實實和參數打交道是成功的基礎。
寫在最后
水能載舟亦能覆舟,狂熱的市場氛圍既給企業帶來了資金和關注度,也帶來了難以預估的風險。近段時間,證監會等監管機構已經加大管控力度,不少公司也主動出面自證清白:據不完全統計,4月底至今已有世紀天鴻、萬興科技、中科信息、唐德影視等多家上市企業發布股票交易異常波動公告,澄清自身業務和AI、大模型的關系。
經過移動互聯時代的洗禮,蹭熱點、追風口的情況太過常見了。似乎任何一個風口都逃不過從萌芽到爆發,再走向混亂、重塑秩序的過程。但在亂戰過后,有的風口出清泡沫、置之死地而后生;有的賽道卻徹底沉淪,如一顆流星般結束自己絢爛卻短暫的一生。
走在時代前沿的AI大模型,似乎更有可能成為前者,不過需要所有從業者、監管機構的共同努力才能保證健康發展。大模型是一條技術門檻、資金門檻都很高的賽道,蹭熱點的企業注定無法長久。加強監管、凈化行業環境、驅逐不良玩家可能會帶來短期混亂,但對行業的長期發展肯定是有益的。
來源/bankless 編譯/Nick 近日,隨著BRC-20標準的興起,meme幣狂熱已經不再是只在以太坊區塊鏈上引起注意的話題,而在比特幣區塊鏈上也呈現出相似的趨勢.
1900/1/1 0:00:00作者:NYDIG全球研究主管GregCipolaro?編譯:WEEXBlog 閱讀提要: 為什么比特幣交易積壓對礦工有利?更多的比特幣被更長期持有,意味著什么?美聯儲再次加息,加劇銀行業危機.
1900/1/1 0:00:00據Decrypt2月26日消息,漫威電影制片人AriArad宣布將通過其AradProductions工作室把藝術家BenMauro的以太坊NFT系列漫畫《Huxley》改編成電影.
1900/1/1 0:00:00頭條 ▌趙長鵬正尋求途徑減持幣安美國的股份據知情人士透露,加密貨幣交易所幣安美國創始人、大股東兼董事長趙長鵬一直在尋求減持該公司股份的方法.
1900/1/1 0:00:00近日,獨立國際金融咨詢公司deVereGroup發表了針對千禧一代的一項研究結果。結果中稱:千禧一代更喜歡比特幣而不是黃金作為避險資產.
1900/1/1 0:00:00據Coindesk10月16日消息,在美國證券交易委員會的五位委員舉行會議后,SEC于周五首次批準了比特幣期貨ETF。據悉,ProShares于夏天申請的比特幣策略ETF預計將于下周啟動交易.
1900/1/1 0:00:00