買以太坊 買以太坊
Ctrl+D 買以太坊
ads

OPEN:顛覆想象的AI繪畫:Dall-E 2使用指南_OPEN價格

Author:

Time:1900/1/1 0:00:00

圍繞OpenAI推出的第二代DALL-E 2系統的討論一直處于兩極分化的狀態,甚至在其推出了幾個月后依舊如此。

有用戶認為這是一項可以重新定義藝術的突破性創新,而批評者則將其視為人工智能圖像生成器給創意產業帶來厄運的開始。

然而毫無疑問的是,DALL-E 2為我們創造和消費藝術開辟了新的可能性和挑戰。本文詳細介紹了AI圖像生成器DALL-E 2的用法和缺點。

DALL-E 2是一款人工智能圖像生成器,它可以根據自然語言的文本描述創建圖像和藝術形式。換句話說,它是一個根據文本生成圖像的人工智能系統。

2021年1月,OpenAI推出了DALL-E模型,DALL-E 2是其升級版。“DALL-E”這個名字源于西班牙著名藝術家Salvador Dalí和廣受歡迎的皮克斯動畫機器人“Wall-E”的組合。

2022年7月,DALL-E 2進入測試階段,可供白名單中的用戶使用。同年9月28日,OpenAI取消了白名單的要求,推出了任何人都可以訪問并且使用的開放測試版。

聲音 | Libra協會副主席:Libra正構建治理模式 以顛覆匯款支付行業:Libra協會副主席Dante Disparte在采訪中表示,現有的支付體系就像“有圍墻的花園”。Disparte斷言,在匯款通道中沒有太多的競爭,現有的匯款通道要么是“一個大的壟斷者,要么是一個雙寡頭運營商”控制著這些匯款通道。在談到Libra開發這個領域的前景時,他說:“如果我們為數字錢包提供商提供了互操作的機會,那將是世界的一個重大游戲規則改變。要做到這一點,當然意味著你必須經歷我們現在正在經歷的過程——建立一個能夠承受任何組織和協會的變化無常和興衰的治理模式,但也要建立一個能夠實現保護消費者的監管標準的模式。”(AMBcrypto)[2020/1/28]

與最初的DALL-E一樣,DALL-E 2也是一種語言生成模型,它使用文本提示來創建原始圖像。

盡管和之前DALL-E具有的120億個參數的模型不同,DALL-E僅僅具有大約35億個參數,但DALL-E 2生成的圖像分辨率是DALL-E的四倍,這是一次令人印象深刻的升級。同時,DALL-E 2在真實感和字幕匹配方面似乎也做得更好。

聽起來,DALL-E 2很有未來感,可能會讓新用戶望而生畏,但它使用起來非常簡單。我們不進行詳細介紹,僅通過迷你教程為大家提供快速概覽。

聲音 | 黃奇帆:區塊鏈等構成的技術平臺正在滲透、顛覆人類社會生產生活的各個方面:9月26至28日,“2019中歐綠色智慧城市峰會”在廣西南寧舉辦。中國國際經濟交流中心副理事長黃奇帆在主旨演講中表示,當前,人類社會正在向5G時代邁進,以大數據、云計算、人工智能、區塊鏈以及移動互聯網、物聯網等移動通訊等五大科學技術構成了技術平臺,正在滲透、顛覆人類社會生產生活的各個方面。(每日經濟新聞)[2019/9/27]

首先,登陸DALL-E 2的官網并創建一個帳戶,如果您此前已經擁有OpenAI的帳戶,登陸即可。需要注意的是,系統會要求您提供電子郵件和電話號碼以進行驗證。

一旦帳戶準備就緒,我們就可以開始生成圖像。用戶最多提供400個字符的描述性文本,AI藝術生成器將對其進行處理。根據測試,我們可以從文本提示中得到許多原創且有趣的結果。

比如,我們輸入“狼群在滿月時嚎叫”就收到了如下的結果。

輸入“一個3D渲染的羅馬士兵正在休息”則獲得了以下的圖像。

聲音 | 諾獎得主:沒有任何跡象表明 加密貨幣已經足以顛覆現有的主權貨幣體系:據金融界消息,諾獎得主Lars Peter Hansen在接受采訪時表示,當前區塊鏈的應用場景尚不明朗,即便是支付場景也有很大的不確定性,加密貨幣價格的大幅波動也是“支付場景不確定”的一個側面。當前加密貨幣更多用于黑色與非法交易,“灰色”屬性就如烙印一般,一直伴隨著比特幣這類加密貨幣的成長壯大。鏈下可以濫發法幣,鏈上一樣可以濫發加密貨幣。另外,沒有任何跡象表明,加密貨幣已經足以顛覆現有的主權貨幣體系。允許加密貨幣交易的國家往往具備一個比加密貨幣穩定得多的法幣體系。對于擁有穩定法幣體系的國家而言,即便新技術可能帶來新利益,它們也沒有必要以身犯險。[2019/2/10]

DALL-E 2為AI圖像生成器的質量提供了新的基準。它與之前的同類產品相比,能夠更好地理解文本描述。

其卓越的自然語言理解能力可以更嚴格地控制圖像的風格、主題、角度、背景、位置和概念,并獲得更高質量的圖像和令人印象深刻的藝術形式。

那么讓我們來看看DALL-E 2的工作原理。

要了解AI圖像生成器的工作原理,我們首先需要了解CLIP、先驗模型和解碼器擴散模型(unCLIP)。

動態 | 帝國理工學院報告:比特幣可顛覆金融系統本質:據btcmanager消息,倫敦帝國理工學院(Imperial College London)的一份報告稱,比特幣和以太坊等加密貨幣已經達到了貨幣的三個主要標準之一,而前者有可能顛覆金融體系的本質。

根據Knottenbelt教授的觀點,要將資產視為貨幣,它必須能夠同時作為價值儲存、交換媒介和計量單位來運作。目前,重要的數字資產被廣泛認為是一種強大的價值儲存手段,全球金融領域的投資者已將數十億美元投資于比特幣、以太坊和其他重要的加密貨幣作為長期投資。

考慮到用戶可以在接受數字資產的商家用加密貨幣購買商品和服務,并且可以輕松地將加密貨幣轉換為法定貨幣,因此可以認為,重要的加密貨幣已經成為一種有效的交換媒介。但是,在交換媒介方面必須取得重大進展,特別是在商家采用方面,以便將數字資產視為貨幣。

報告稱,對于滿足最后兩個標準的加密貨幣,必須對其可擴展性、設計和監管進行重大改進。帝國理工學院(Imperial College)的研究人員表示,從長期來看,隨著第一層和第二層網絡的增加,當費用不再成為商家的一個問題時,加密貨幣將能夠被視為貨幣。

雖然傳統金融領域的大多數人對加密貨幣仍持懷疑態度,但Knottenbelt表示,數字資產正在迅速滿足成為一種廣泛認可的支付方式和新的貨幣標準的標準。[2018/7/12]

什么是CLIP?CLIP指的是對比語言圖像預訓練,是DALL-E 2架構中最關鍵的模塊。

曾鳴:很難判斷區塊鏈是否會顛覆BAT:湖畔大學教育長曾鳴今日表示,現在很難判斷區塊鏈是否會顛覆BAT。曾鳴解釋稱,回答這一問題首先要思考區塊鏈是否是一個顛覆性的技術。如果是,區塊鏈行業就會出現與BAT等量的企業。但這個問題的答案,曾鳴稱,現在“很難下一個比較有把握的判斷”,還“需要時間去觀察”。[2018/3/2]

該訓練基于用戶可以用自然語言教計算機不同圖像之間如何相互關聯,并由文本和圖像編碼器這兩個神經網絡組成。

文本和圖像編碼器都接受了大量不同的圖像文本對集合的訓練。該模型分析這些圖像-標題對以創建稱為文本/圖像嵌入的矢量表示。換句話說,CLIP充當文本(輸入)和圖像(輸出)之間的橋梁。

先驗模型采用標題/CLIP文本嵌入,并以此為基礎生成CLIP圖像嵌入。

unCLIP則是使用CLIP圖像嵌入生成圖的原始CLIP模型的逆模型。DALL-E 2通過先驗模型和unCLIP模型來創建輸出。

下圖大致概述了其基本過程。

如圖所示,unCLIP模型創建了圖像的“心理”表示。基于此,創建了原始圖像。

這些“心理再現”保留了語義一致的核心特征和特點,例如“動物、物體、顏色、風格和背景等關鍵要素”。然而,因為擴散學習是變化的,每一次輸出的圖像也會有所不同。

請注意,上文只是DALL-E 2工作原理的簡要表述,實現的技術細節和數學更加復雜,我們就不在這里贅述。如果您對DALL-E 2的技術規格感興趣,可以參看OpenAI在今年早些時候發表的論文《Hierarchical Text-Conditional Image Generation with CLIP Latents》。

只要用戶給出精確和具有描述性的文本提示,就可以通過AI藝術生成器得到多個高質量的圖像,甚至在幾秒鐘的時間里實現畫家或數字藝術家需要數小時甚至數天才能達到的質量水平。

用戶可以免費查看所有這些視覺創意,無需支付場地費,也無需向創意人員和模特支付工資。

然而這也對我們的內容創作經濟帶來了一定的影響。

DALL-E 2使用自己對主題、風格、調色板和所需概念意義的“理解”,生成相應的圖像。

每個圖像最多可以產生四個變體。每一個都與原作的外觀、感覺和意義相呼應,但又具有自己獨特的風格。

您也可以在DALL-E 2中編輯圖像,無需任何照片編輯經驗。與Adobe Photoshop不同,使用DALL-E進行編輯非常簡單。

例如,用戶想要在火星上行走的宇航員的肖像中添加一只狗,只需要輸入“在宇航員身后放一只狗”。同樣,用戶還可以要求程序通過放大和縮小來更改圖像的視圖框架,直到獲得所需的結果。而就DALL-E 2的功能而言,這些只是冰山一角。

同時,根據設計,該系統無法生成涉及、血腥或元素的內容。也就是說,該程序有其合理的局限性和缺點。

DALL-E 2的輸出質量很大一部分取決于用戶提供的文本提示的質量,文本越具體,獲得所需輸出的機會就越高。然而,該系統有一些內在的局限性。

例如,當前它還不具有很精確組合性,盡管似乎會隨著時間的推移而改善。這意味著DALL-E 2通常無法有意義地合并多個對象或對象屬性,例如形狀、方向和顏色。

同時在一些意料之外的情況下,有一些相對簡單的文本,程序也可能無法充分執行。

例如,我們輸入文本“一百只打扮成羅馬士兵的青蛙在沙漠中行進”。即使我們嘗試了多種提示變體,結果也不盡如人意。

另一個例子是當我們嘗試相當簡單的提示時,如“霸王龍騎著獨輪車在艾菲爾塔前”。不知道為什么,程序拒絕畫獨輪車,取而代之的是自行車。而當我們從提示中刪除“Eifel Tower”,產生預期圖像則沒有任何阻礙。

這些只是DALL-E 2局限性的幾個例子。更令人擔憂的問題本質上很復雜,可能會對公司及其用戶造成嚴重不良影響。

OpenAI限定DALL-E 2不創建公眾人物和名人的圖像。事實上,它完全拒絕生成包含真實面孔或真人的圖像,這是朝著防止濫用該程序邁出的重要一步。

隨著DALL-E 2越來越受歡迎,版權侵權也可能成為一個大問題。OpenAI堅持認為,用戶“獲得了將他們使用DALL-E創建的圖像商業化的全部權利,包括轉載、銷售和商品化的權利。”

然而,人工智能藝術生成器依賴于分析、學習人類藝術家的作品來創造藝術。因此,不能排除潛在的侵犯知識產權法的可能性,無論是否有意。

DALL-E 2完美嗎?作為一項正在完善的項目,答案是否定的。

但是,正如機器學習的本質一樣,隨著時間的推移,該程序正變得越來越聰明,也越來越有能力。從純技術的角度來看,DALL-E 2是AI技術演進的一大進步。

人們普遍認為人工智能系統在創意領域實際上無法超越人類,至少不會很快。但是DALL-E 2已經使這個論點受到了沖擊。

然而盡管OpenAI已經采取了一系列措施來預測和防止DALL-E 2的潛在濫用,但這并非萬無一失。在沒有任何道德界限的情況下可以使用的AI系統將在多久后出現?需要我們保持警惕。

無論如何,我們都需要密切關注這個新興行業。因為AI藝術生成器及其背后的技術只會在未來的歲月里變得更加普遍。

元宇宙之心

企業專欄

閱讀更多

金色財經

金色財經 子木

金色早8點

去中心化金融社區

虎嗅科技

CertiK中文社區

區塊律動BlockBeats

深潮TechFlow

念青

Odaily星球日報

Tags:ALLDAL加密貨幣OPENpolkawallet挖礦教程IDALL加密貨幣行情追蹤工具OPEN價格

比特幣價格
NFT:錯過了 Aptos 來看看 Sui 還有哪些空投機會_區塊鏈

10 月 19 日,Aptos 官方向超過 11 萬社區用戶空投了逾 2000 萬枚 APT,只要參與過 APTOS 激勵測試網申請或鑄造測試網 NFT 的用戶便可申領.

1900/1/1 0:00:00
EARN:如何找到下一個StepN?從建立X to Earn分類體系開始_TEP

撰文: W Labs 瓜哥X to Earn 里的項目真的都是同質化的嗎?怎么從不同的角度去歸類?如何從投資邏輯上去研判項目的好壞?回顧從 2020 年到 2022 年這一波完整的「谷底→高峰→.

1900/1/1 0:00:00
AME:年終盤點 | 2022 年 GameFi 的 26 個關鍵數據_GameAntz

去年的 GameFi 領域發生了很多事情。雖然 Axie Infinity 和 The Sandbox 仍舊占據著最多的頭條新聞,但幾個不為大眾所知的項目得到了許多玩家的青睞.

1900/1/1 0:00:00
MIC:MicroStrategy增持比特幣因逃避清算?首次拋售又為哪般?_STRAT

來自 |TheBlock、blockworks作者 |CaseyWagner、OsatoAvan-Nomayo 編譯 |PANews 2022年12月28日.

1900/1/1 0:00:00
AVE:CeFi潰敗正發生 哪些 DeFi 協議能讓我們重拾信心?_Aave USDT

原文:《How to Double Down on DeFi》by William M. Peaster 編譯:DeFi 之道 今年最大的加密貨幣崩盤事件背后有一個共同的主題.

1900/1/1 0:00:00
BSP:OECD報告:如何對加密資產征稅?_CAR

報告信息 Crypto-Asset Reporting Framework and Amendments to the Common Reporting Standard加密資產申報框架及共同申.

1900/1/1 0:00:00
ads