買以太坊 買以太坊
Ctrl+D 買以太坊
ads

LOKI:一文了解 ChatGPT 等 LLMs 得到明顯改進的 3 個變化_FROSTYFLOKI

Author:

Time:1900/1/1 0:00:00

原文作者:Tanya Malhotra

來源:Marktechpost

近年來,大型語言模型(Large Language Models,LLMs)在全世界受到了廣泛贊賞,并在自然語言處理領域備受歡迎。這使我們能夠使用比以往任何時候都更好、更清晰的語言理解來描述智能系統(Intelligent Systems)。

諸如 GPT-3、T5、PaLM 等 LLMs 的性能有了顯著提高,并且這些模型將繼續存在,因為它們可以完成從通過學習閱讀來模仿人類,到生成文本和總結長段落內容的所有工作。而根據一些深入的研究,如果 LLM 的規模很大,那么它的表現就會很好。通過在大量數據上訓練這些模型,它們可以理解人類語言的語法、語義和語用學。 

數據:某巨鯨通過交易MKR實現37萬美元收益,收益率達57%:7月30日消息,據鏈上數據分析師余燼監測,某巨鯨于6月18日和7月14日從幣安取出793枚MKR,均價818美元。其于7小時前將793枚MKR轉入幣安,價格為1287美元。該鯨魚通過交易MKR實現37萬美元收益,收益率達57%。[2023/7/30 16:07:11]

由 OpenAI 開發的流行的大型語言模型 ChatGPT 之所以發展得如此之快,正是因為采用了人類反饋強化學習(RLHF)等先進技術。通過 RLHF,機器學習算法結合并使用人工輸入提高了模型的性能。它針對預訓練的 LLM 進行了微調,用于開發聊天機器人、虛擬助手等任務。

幣安將支持Optimism網絡升級及硬分叉,屆時將暫停OP代幣充提業務:5月31日消息,據官方公告,幣安將支持Optimism(OP)網絡升級及硬分叉,具體安排如下:幣安預計將于6月6日23:30暫停OP代幣的充值、提現業務,以支持Optimism(OP)將于6月7日00:00進行的網絡升級及硬分叉。網絡升級及硬分叉期間,OP交易不受影響。

此前5月16日消息,Optimism主網Bedrock升級將于6月7日進行,屆時需停機2至4小時。[2023/5/31 11:49:56]

此外,ChatGPT 等 LLMs 所基于的預訓練基礎模型也得到了明顯的改進。這主要是由于三個方面的變化:

Binance.US宣布上架Floki Inu (FLOKI):金色財經報道,Binance.US 宣布上架 Floki Inu (FLOKI),用戶現在可以存入 FLOKI,FLOKI/USD 和 FLOKI/USDT 交易對將于 2023 年 4 月 25 日美國東部時間早上 8 點開始。[2023/4/25 14:25:53]

1.實踐證明,模型的擴展性(Scaling)對提高其性能很有幫助。以 Pathways 語言模型(Pathways Language Model,PaLM)為例,該模型通過擴展小樣本學習(few-shot learning)大大影響了其性能,小樣本學習可以減少根據具體應用調整模型所需的特定任務訓練實例的數量。

數據:過去兩周交易所提幣交易主導地位比例達47.4%,創年內新高:金色財經報道,據區塊鏈分析公司Glassnode最新報告顯示,比特幣目前正以每月-17.27萬枚比特幣的速度流出交易所,超過了2022年6月拋售后創造的前一個峰值。在過去的兩周里,確認的比特幣交易總額也出現了上升,達到了多月來的高點,每天有24.6萬筆確認交易。在這個總數中,大約29.2%是與交易所有關的提幣轉賬(7.71萬筆提幣),18.2%是交易所存款轉賬(4.81萬筆充值)。這種與交易所有關的活動的爆發將交易所提幣交易的主導地位推至47.4%,是今年迄今為止的最高水平。[2022/11/24 8:02:12]

通過使用 Pathways 語言模型在 6144 TPU v4 芯片上擴展和訓練 5400 億個參數,PaLM 展示了重復擴展的好處,其表現超過了各種傳統模型,并顯示出很大的進步。因此,深度和寬度的擴展都是提高基礎模型性能的一個重要因素。

2.另一個變化是在預訓練時增加標記數量的過程。像 Chinchilla 這樣的模型(開源語言模型)已經證明,通過增加預訓練數據,大型語言模型的表現會更好。

Chinchilla 是一個計算最優模型。在相同的計算預算下,在 70B 參數和比 Gopher 模型多四倍的數據上進行訓練,Chinchilla 的表現一致優于 Gopher,它甚至比 GPT-3、Jurassic-1 和 Megatron-Turing NLG 等 LLMs 效果更好。這清楚地描述了對于每一個計算最優的訓練,標記的數量應該相應地縮放——即模型大小的兩倍,因此訓練標記的數量應該是兩倍。 

3.第三個變化是使用干凈和多樣化的預訓練數據。Galactica 的性能證明了這一點,它是一種存儲、混合和推理科學知識的大型語言模型。經過幾篇科學論文文本的訓練,Galactica 的表現優于 GPT-3、Chinchilla 等模型。另一個大型語言模型 BioMedLM 是一種針對生物醫學文本的特定領域 LLM,在針對特定領域數據進行訓練時,它表現出了巨大的性能提升。它清楚地表明,在特定領域的數據上進行的預訓練勝過在通用數據上的訓練。

LLMs 的成功無疑歸功于多種因素的混合,包括 RLHF 的使用和預訓練基礎模型的發展。這三個變化極大地影響了 LLMs 的性能。此外,GLaM(通用語言模型)通過使用稀疏激活的混合專家架構(Mixture-of-Experts architecture),以更少的訓練成本擴展模型的容量,從而顯著提高了性能。因此,這些變化為更高級的語言模型開辟了道路,而這些模型將繼續讓我們的生活變得輕松。  

DeFi之道

個人專欄

閱讀更多

金色財經 善歐巴

金色早8點

Odaily星球日報

歐科云鏈

Arcane Labs

深潮TechFlow

MarsBit

BTCStudy

澎湃新聞

Tags:CHIFLOLOKIFLOKIchianetworkFROSTYFLOKIValentine FlokiFloki Run

比特幣交易所
NFT:金色Web3.0日報 | 武漢元宇宙數字產業基地今日揭牌_元宇宙

DeFi數據 1、DeFi代幣總市值:518.55億美元 DeFi總市值及前十代幣 數據來源:coingecko2、過去24小時去中心化交易所的交易量26.

1900/1/1 0:00:00
SEA:Bankless:OpenSea 和 Blur 之間的市場戰爭才剛剛開始_blur幣最新消息

作者:Donovan Choy 來源:Bankless OpenSea 多年來的市場主導地位幾乎是絕對的,這使得 Blur 的驚人崛起更加令人印象深刻.

1900/1/1 0:00:00
EOS:解讀香港證監會咨詢文件:該如何監管虛擬資產交易?_SFC

原文:《重磅 | HK證監:虛擬交易是“少設限”還是“高門檻”?》 作者:肖颯法律團隊 2023年2月20日,香港證監會(以下簡稱“SFC”)就監管虛擬資產交易平臺的建議.

1900/1/1 0:00:00
比特幣:熊末牛初:Ordinals是福是禍?_ORDI

近期,加密市場經歷了2023年以來的首次重大回調,同時還有美國的監管舉措和美國證券交易委員會SEC打擊行動的消息.

1900/1/1 0:00:00
WEB:Folius Ventures:「抽稅制」商業模式更適合Web3游戲_fold幣知乎

原文作者:Aiko、Jason(MLC),Folius Ventures基于上一篇研報引發的思考和討論.

1900/1/1 0:00:00
RDN:Radiant:始于Arbitrum的全鏈借貸市場_rdnt幣能達到多少錢

原文:《 Radiant:全鏈貨幣市場》 作者:藍狐筆記 Radiant(RDNT)于 2022 年 7 月份推出,是 Arbitrum 上的原生借貸市場項目。從貨幣市場角度,它們類似.

1900/1/1 0:00:00
ads