寫在前面
2月13日,《2022年北京人工智能產業發展白皮書》正式發布,其中提到全面夯實人工智能產業發展底座,支持頭部企業打造對標 ChatGPT的大模型,著力構建開源框架和通用大模型的應用生態。
很巧的是,颯姐團隊成員在今年10月份的時候測評過:百度文心、源1.0、某道,三款國內現有的大模型,當時對測評結果甚是遺憾。于是又將當時的測試內容讓ChatGPT做了一遍,試圖摸清國內外大語言模型在問答這一領域的實際差距,旨在希望國內產學研戒驕戒躁,穩扎穩打地發展。
測試方案
本次測試僅僅考慮非連續性的單次問答,且皆為常識性問題,答案唯一,但題目會有一定的挑戰性。具體的,涉及到What,When, Where, Who, Which五類問題。
越南成立區塊鏈協會助力國內該領域發展:金色財經報道,作為國家數字化轉型計劃的一部分,越南已經成立區塊鏈協會,該協會隸屬于越南內政部。越南科技部副部長TranVan Tung表示,在全球排名前200位的區塊鏈公司中,有7家是由越南人創辦。“我們在區塊鏈領域有10家企業,資本總額超過1億美元。越南的區塊鏈獨角獸也提高了它們的全球影響力。”區塊鏈技術是突破性的。隨著工程師和企業數量的增加,他們對聯系和共享的需求也在增長。因此,成立區塊鏈協會是必要的。據悉,越南區塊鏈協會旨在發展其成員,建立成員標準,告知公眾并提供政策意見等。(Vnexpress)[2022/6/4 4:01:27]
問題樣例如下:
1. “是什么(What)”型問題,如“爸爸的爸爸叫什么?”
2.“什么時候(When)”型問題,如“人們一般什么時候過元旦?”
3.“什么地點(Where)”型問題,如“孫中山安葬在哪里?”
遼寧省商務廳相關負責人:希望國內外企業在區塊鏈等領域與遼寧企業密切合作:遼寧省商務廳相關負責人表示,遼寧省在數字服務方面合作空間巨大,希望國內外企業在云計算、大數據、物聯網、人工智能、區塊鏈、5G技術等數字服務領域與遼寧企業密切合作,共享全球數字化發展機遇。(遼寧日報)[2020/9/5]
4.“是誰(Who)型問題”,如“中國歷史上第一個皇帝是誰?”
5.“哪?個(Which)型問題”,如“哪個洲是倒數第二小的洲?”
問答樣例對比
問題:“孫中山(孫文)安葬在哪里?”
ChatGPT:孫中山的遺體最初安葬在南京中山陵內,后因戰亂多次遷移。最終于1929年安葬在南京中山陵北麓的紫金山下,此地現為孫中山陵園。
百度文心:孫中山墓地
某道:"孫文(1866年-1925年10月12日),名文,字載之,號仲立,又名帝光,廣東省香山縣(今中山市)南朗鎮翠亨村人,1883年(光緒九年)隨父移居澳門。1904年參加孫中山領導的同盟會,任同盟會南方支部書記。曾兩次赴日,組織策劃惠州起義。后回澳門發展組織,被選為中國同盟會南方總支部庶務部長。1905年春,與陳少白、朱執信等在香港成立興中會,被舉為評議部評議員,旋被派往南洋聯絡同志,協助籌辦革命刊物《中興日報》。1906年冬,孫中山在日本東京成立中國同盟會中部總會,被委為秘書。1907年奉命回國,在廣東發動民軍起義。事敗后潛赴南洋,繼續組織發動華僑、華工和留學生進行革命活動。1911年武昌起義爆發后,被派往廣州協助籌劃起義,不幸事泄被捕,不久在廣州黃花崗就義。
深圳前海發布國內首個區塊鏈法律糾紛分析報告:4月16日下午,深圳市信息服務業區塊鏈協會(簡稱“深圳鏈協”)、深圳大學區塊鏈技術研究中心、廣東夢海律師事務所及前海傳媒共同在深圳前海發布了《全國區塊鏈法律糾紛分析報告》,這是國內首個聚焦區塊鏈領域法律糾紛的分析報告,對區塊鏈從業者掌握經營法律風險方面具有很高的參考價值。(前海金融城郵報)[2020/4/17]
源1.0:孫中山安葬在南京紫金山中山陵
問題:哪個洲是倒數第二小的洲?
ChatGPT:開始回答了錯誤的答案,與其對話后成功糾正(AMAZING!)
聲音 | 胡洪宇:國內的游戲發展比較迅速:金色財經現場報道,NEO Game Conference3月9日在日本東京開幕,會議第二天,在以“區塊鏈游戲的未來”為主題的圓桌討論中,成都鏈安科技安全負責人胡洪宇表示,國內的游戲發展比較迅速,無論是端游還是手游。對于玩家來說,他們需要新鮮感,而區塊鏈正好可以帶來這些。從去年下半年開始,在某些公鏈上,游戲的開發數量呈爆發式增長。胡洪宇建議,對于區塊鏈生態來說,無論是任何角色,都應該注重安全。不同的公鏈有不同的特性,開發者剛入門容易犯很多錯誤,所以公鏈的平臺方應該更多的指導開發者實現游戲邏輯。游戲開發者首先應該保證完備的游戲設計,因為玩家的重要資料與資產都在游戲中。而社區應該對開發者提供資源與幫助。用戶則應該保護好自己的私鑰。[2019/3/10]
百度文心:南極洲
某道:南美洲,南美洲面積最大,但人口最多,人口占全球人口的1/5,因此南美洲是僅次于亞洲的世界第二大洲。南美洲位于東半球的南部,包括巴拿馬運河以南的整個南美洲大陸。南美洲大陸東至圣赫勒拿島(西經34°40'),西至馬爾維納斯群島(西經61°10'),南至德雷克海峽,北至亞馬孫河下游平原,南北相距約5100千米。南美洲大陸最南端是厄瓜多爾首都基多城。南美洲北部以安第斯山脈為界與北美洲相分,東部以烏拉爾山脈和太平洋為界與亞洲相鄰,東南部經德雷克海峽與非洲相分,西部則與南極洲隔德雷克海峽相望。(摘自百度百科)“
北京市副市長:區塊鏈等領域的領軍企業,使北京成為國內領先的金融科技創新區域:近日,在2018年北京金融街論壇上,北京市委常委、副市長陰和俊表示,北京依托中關村國家自主創新示范區的創新優勢,在人工智能、大數據、區塊鏈、移動支付、監管科技、供應鏈金融、互聯網保險、智能投顧等領域涌現出了一批領軍企業,北京已初步發展成為國內綜合優勢領先的金融科技創新區域。[2018/6/2]
源1.0:大洋洲
總體分析
四個系統對于基本問題的問答可謂是手到擒來(本次樣例問題直接排除了簡單的基本問題,挑戰難度較高,因此整體錯誤率較高)。五類問題中,when問題和who問題整體回答的情況最好。三個國產系統中整體文心系統的表現最好。ChatGPT也會犯錯,但是往往只要略微引導,便能改正錯誤。
錯誤回答分析
錯誤語句生成:語句本身并不通順,前后主題不一致或者內容不一致,給人錯亂的感覺。
例如問:爸爸的爸爸稱謂是什么?
答: 爸爸的父親,也就是爸爸的爺爺,是媽媽的爸爸。爸爸的爺爺的爸爸叫太爺爺。爸爸的爺爺的爺爺叫太奶爺(奶奶的爸爸)
或問:我們黨二大在哪里召開?
答:1921年7月23日至31日,中國共產黨第二次全國代表大會在浙江省嘉興市南湖的一艘游船上召開。出席大會的正式代表共13人,候補代表5人,代表全國121名共產黨員。共產國際代表馬林、尼科爾斯基和鮑羅廷等參加了會議。
事實性錯誤:產生了事實性的錯誤。
例如問: 孫文去世的日子?
答:孫文去世的日子是1918年3月13日
偏見性素材:回答取自的素材較少,體現比較強的筆者的主觀性。
例如問:大家什么時候過元旦?
答:謝邀。我是在大學過的,所以元旦是在宿舍過的。我們宿舍六個人,有四個人都回家了,剩下我一個在宿舍,所以元旦那天我過得比較孤獨,不過還好啦,因為宿舍就我自己了,所以我可以一個人吃飯,一個人看電影,一個人逛超市,一個人睡覺,一個人......
含有邏輯性的問題無法識別:問題中存在復合問題或者邏輯判斷,一般難以處理。
例如問:哪個洲是倒數第二小的洲?
答:" 南美洲,南美洲面積最大,但人口最多,人口占全球人口的1/5,因此南美洲是僅次于亞洲的世界第二大洲。南美洲位于東半球的南部,包括巴拿馬運河以南的整個南美洲大陸。南美洲大陸東至圣赫勒拿島(西經34°40'),西至馬爾維納斯群島(西經61°10'),南至德雷克海峽,北至亞馬孫河下游平原,南北相距約5100千米。南美洲大陸最南端是厄瓜多爾首都基多城。南美洲北部以安第斯山脈為界與北美洲相分,東部以烏拉爾山脈和太平洋為界與亞洲相鄰,東南部經德雷克海峽與非洲相分,西部則與南極洲隔德雷克海峽相望。(摘自百度百科)
寫在最后
颯姐團隊認為,傳統的單一問答模型可用性不大,給予用戶的體驗感也欠佳,國產大語言模型下一個里程碑,前輩ChatGPT已經給出了方向,便是對話問答。在使用ChatGPT的時候,雖然它也經常會給出錯誤答案,但是其回答的邏輯依舊符合人的習慣,同時經過一定的對話引導,可以自行發現其回答邏輯性的缺失。
作為全新的一種數據合成方式,大語言模型的直接輸出可能是我們人類無法把控的,但是只要它能“理解”用戶的輸入,以此為依調整其輸出,最后得到滿意的回答,那便是可用的。進一步的,大語言模型未來的趨勢很有可能是提前預判用戶可能的“糾錯”,并提前“自糾錯”,并對糾錯結果進行評估。
肖颯lawyer
個人專欄
閱讀更多
金色早8點
金色財經
Odaily星球日報
歐科云鏈
澎湃新聞
Arcane Labs
深潮TechFlow
MarsBit
BTCStudy
鏈得得
CoolCats將在今年啟動品牌重塑,對于陷入低迷泥潭的CoolCats來說,能否借助市場反彈的“東風”再次雄起呢?下面.
1900/1/1 0:00:00金色財經記者 Jessy近日,隨著行情的回暖,元宇宙VR賽道大漲,元宇宙游戲Highstreet的代幣HIGH從1月29日開始,最高漲幅超300%.
1900/1/1 0:00:00在 Binance 與 Paxos 合作發行的穩定幣 BUSD 遭到美國監管大力打擊的一周之后,CEO 趙長鵬(CZ)昨天宣布將放棄 BUSD 作為主要穩定幣.
1900/1/1 0:00:00近期,跨平臺的即時通訊軟件Telegram盜號事件頻發,不法分子通過非法手段盜取用戶Telegram賬號,并以冒充好友的方式進行詐騙.
1900/1/1 0:00:00作者:Fungi Alpha,加密研究員編譯:Leo,BlockBeats不要一直處在錯過的情緒里,主動去發現的一些值得關注的新項目,碼住后體驗,成為這些項目的早期用戶吧.
1900/1/1 0:00:00▌加密做市商GSR再次裁員至少5%金色財經報道,據知情人士報道,加密貨幣做市商 GSR 已實施進一步裁員,影響 5% 至 10% 的員工。其中兩位消息人士稱,削減幅度接近 5%,而不是 10%.
1900/1/1 0:00:00