買以太坊 買以太坊
Ctrl+D 買以太坊
ads
首頁 > MANA > Info

INK:看不下去AI胡說八道,英偉達出手給大模型安了個“護欄”_DFN

Author:

Time:1900/1/1 0:00:00

來源:量子位

作者:蕭簫

大模型們胡說八道太嚴重,英偉達看不下去了。

他們正式推出了一個新工具,幫助大模型說該說的話,并回避不應該觸碰的話題。

這個新工具名叫“護欄技術”,相當于給大模型加上一堵安全圍墻,既能控制它的輸出、又能過濾輸入它的內容。

一方面,用戶誘導大模型生成攻擊性代碼、輸出不道德內容的時候,它就會被護欄技術“束縛”,不再輸出不安全的內容。

另一方面,護欄技術還能保護大模型不受用戶的攻擊,幫它擋住來自外界的“惡意輸入”。

Lido上周Polygon市場新增3210萬枚MATIC的存款凈額:金色財經報道,Lido Finance發推特表示,上周Lido上Polygon市場新增3210萬枚MATIC的存款凈額,其中3000萬是由某個巨鯨地址質押,質押率增長34.56%,Lido在Polygon的市場份額達到3.47%。[2023/5/16 15:06:18]

現在,這個大模型護欄工具已經開源,一起來看看它的效果和生成方法。

防止大模型胡言亂語的三類“護欄”

根據英偉達介紹,目前NeMoGuardrails一共提供三種形式的護欄技術:

話題限定護欄、對話安全護欄和攻擊防御護欄。

數字藝術家Jack Butcher發布“Checks Elements”NFT并將在佳士得拍賣:金色財經報道,數字藝術家Jack Butcher在社交媒體宣布推出“Checks Elements”, 這是一個創新的152件實體單版畫作品并搭配鏈上NFT系列,該系列基于經典元素:地球、火、水和空氣,其中地球、空氣和水元素的相關作品首次拍賣將于5月16日在佳士得開始,該系列的其余部分將于5月23日上架拍賣。[2023/5/15 15:04:18]

話題限定護欄,簡單來說就是“防止大模型跑題”。

大模型具備更豐富的想象力,相比其他AI更容易完成創造性的代碼和文字編寫工作。

但對于特定場景應用如寫代碼、當客服而言,至少用戶不希望它在解決問題時“脫離目標范圍”,生成一些與需求無關的內容。

加密錢包公司Dfns:“Magic Links”存在嚴重漏洞:金色財經報道,加密錢包初創公司 Dfns 表示,越來越多的加密錢包和網絡應用程序采用的無密碼登錄方法 Magic Links 存在嚴重漏洞,Dfns 將其發現的漏洞歸類為“零日”漏洞利用。Dfns 在一份聲明中表示,該漏洞可能“對全球經濟的很大一部分構成相當大的風險。 受影響的服務表示,在 Dfns 發布詳細介紹所謂的零日漏洞的博客文章之前,他們幾乎沒有收到任何通知。

Magic Links是由網站或應用程序生成的唯一的一次性 URL,用于驗證用戶身份而無需他們輸入密碼。當用戶單擊 Web 應用程序發送給他們的Magic Links時,它會驗證他們的身份并將他們登錄到他們的帳戶中。[2023/2/24 12:27:50]

這種情況下就需要用到話題限定護欄,當大模型生成超出話題范圍的文字或代碼時,護欄就會將它引導回限定的功能和話題上。

FTX攻擊地址成為ETH的第30大持幣地址:金色財經報道,據派盾監測,FTX攻擊地址(以“0x59ab”開頭)目前持有價值約2.87億美元的ETH,成為ETH的第30大持幣地址。[2022/11/18 13:21:09]

對話安全護欄,指避免大模型輸出時“胡言亂語”。

胡言亂語包括兩方面的情況。

一方面是大模型生成的答案中包括事實性錯誤,即“聽起來很有道理,但其實完全不對”的東西;

另一方面是大模型生成帶偏見、惡意的輸出,如在用戶引導下說臟話、或是生成不道德的內容。

攻擊防御護欄,即防止AI平臺受到來自外界的惡意攻擊。

這里不僅包括誘導大模型調用外部病APP從而攻擊它,也包括黑客主動通過網絡、惡意程序等方式攻擊大模型。護欄會通過各種方式防止這些攻擊,避免大模型癱瘓。

所以,這樣的護欄要如何打造?

如何打造一個大模型“護欄”?

這里我們先看看一個標準的“護欄”包含哪些要素。

具體來說,一個護欄應當包括三方面的內容,即格式規范、消息和交互流。

首先是格式規范,即面對不同問題的問法時,規定大模型要輸出的內容。

例如被問到“XX文章是什么”,大模型必須給出特定類型的“文章”,而非別的東西;被問到“誰發表了什么”,大模型必須給出“人名”,而非別的回答。

然后是消息定義,這里以“用戶問候”話題為例,大模型可以輸出這些內容:

最后是交互流的定義,例如告訴大模型,怎么才是問候用戶的最好方式:

一旦問候用戶的機制被觸發,大模型就會進入這個護欄,規規矩矩地問候用戶。

具體工作流程如下:首先,將用戶輸入轉換成某種格式規范,據此生成對應的護欄;隨后,生成行動步驟,以交互流指示大模型一步步完成對應的操作;最后,根據格式規范生成輸出。

類似的,我們就能給大模型定義各種各樣的護欄,例如“應對用戶辱罵”的護欄。

這樣即使用戶說出“你是個傻瓜”,大模型也能學會冷靜應對:

目前,英偉達正在將護欄技術整合進他們的AI框架NeMo中,這是個方便用戶創建各種AI模型、并在英偉達GPU上加速的框架。

對“護欄”技術感興趣的小伙伴們,可以試一試了~

Tags:FNSDFNLIDINKFNSA價格DFNORMMOSOLIDtronlink錢包官網

MANA
OWL:達摩院貓頭鷹 mPLUG-Owl 亮相:模塊化多模態大模型,追趕 GPT-4 多模態能力_PLUG

來源:機器之心 純文本大模型方興未艾,多模態領域也開始涌現出多模態大模型工作,地表最強的GPT-4具備讀圖的多模態能力,但是遲遲未向公眾開放體驗,于是乎研究社區開始在這個方向上發力研究并開源.

1900/1/1 0:00:00
Llama:兩大可商用開源大模型同時發布!性能不輸 LLaMA,羊駝家族名字都不夠用了_JMPT幣

來源:量子位 從Meta的LLaMA發展出的羊駝家族一系列大模型,已成為開源AI重要力量。但LLamA開源了又沒全開,只能用于研究用途,還得填申請表格等,也一直被業界詬病.

1900/1/1 0:00:00
CHAT:人工智能教父Hinton:關于ChatGPT與AI發展的11個核心觀點_HATCH價格

來源:AI商業研究所 導讀: GeoffreyHinton被稱為“人工智能教父”,從上世紀80年代開始研究神經網絡,是這個領域從業時間最長的人.

1900/1/1 0:00:00
DIN:veDAO研究院:比特幣NFT協議Ordinals生態匯總_NFT Index

NFT作為可以代表獨一無二的數字資產或實物資產的加密代幣,它在區塊鏈上具有唯一性和不可替代性。NFT在以太坊等智能合約平臺上已經發展了多年,誕生了許多著名的項目和應用.

1900/1/1 0:00:00
ELT:一文了解Filecoin推出的FWS(Filecoin Web Service)_DEL

原文來源:FilecoinNetwork 對我們的工程團隊來說,這是一次重要的發布日。生態里的工程團隊在FilecoinWebServices?項目上來到了一個重要的里程碑——這次?FWS?發布.

1900/1/1 0:00:00
ASH:金色圖覽 | NFT行業周報(4.30 - 5.06)_國內最好的區塊鏈公司

周報概要: 1、上周NFT總交易額:187,377,632(美元)2、上周NFT總交易筆數:283.

1900/1/1 0:00:00
ads