圖片來源:由無界版圖AI工具生成
最近的谷歌像個大漏勺,這不,又有AIGC核心成員聯手跑路咯!
量子位獨家獲悉,這回跟谷歌say byebye的,是文生圖核心團隊——AI繪畫模型Imagen論文的四位核心作者,出走目的是要搞自己的AI公司。雖然公司名稱暫未對外公布,但新公司將一以貫之的路線是很清楚的:
以Imagen為基礎,沿著原來的項目做下去,不僅繼續做文生圖,還要做視頻方向。
核心人才創業,自然少不了VC塞錢——已經按1億美元的驚人天使估值完成了首輪融資,而且更多VC想給錢而趕不上、投不進。
這也算是文生圖、文生視頻、AIGC賽道上,最知名的研究團隊之一了。
新公司聯創四人,Chitwan Saharia、William Chan、Jonathan Ho以及Mohammad Norouzi,都出自谷歌。
他們之前精力重點放在AIGC的文生圖板塊,是谷歌用來對抗DALLE-2的大殺器Imagen的論文共同作者,位置都挺重要的那種。
NFT投資組合跟蹤平臺Floor推出支持符合蘋果和谷歌政策的NFT購買新服務“Floor ICONS”:金色財經報道,NFT投資組合跟蹤平臺Floor在其官推宣布推出支持符合蘋果和谷歌政策的NFT購買新服務“Floor ICONS”,該服務通過應用內購買提供移動優先、法幣優先的體驗,同時Floor還將在APP內啟動一個新興的創作者平臺,讓藝術愛好者更接近他們喜愛的藝術和藝術家,并將NFT購買整合到其移動平臺中。[2023/7/21 11:08:13]
先來介紹一下Chitwan Saharia,也是Imagen的共同一作。
Chitwan本科畢業于孟買理工學院計算機科學與工程專業,在孟買理工學院和蒙特利爾大學都當過程序和算法方面的研究助理。2019年加入谷歌,base多倫多,花了3年時間從二級軟件工程師做到高級研究科學家,去年12月從谷歌離職。
Chitwan有語音識別、機器翻譯的經驗,在谷歌工作時,主要負責領導image-to-image擴散模型的工作。
第二位William Chan,也是Imagen論文共同一作。他同樣出身計算機工程,先后就讀于加拿大滑鐵盧大學、卡內基梅隆大學,中間在新加坡國立大學當過1年交換生。
Web3基礎設施公司Fortress與谷歌云合作推出NFT數據庫解決方案:9月28日消息,Web3基礎設施公司Fortress Blockchain Technologies宣布推出Fortress Vault,這是一種基于谷歌云開放、安全、可擴展和可持續的云基礎設施的新型NFT數據庫解決方案。Fortress Vault通過私人存儲區塊鏈支持的可訪問性、隱私性、可移植性和來源的內容,幫助跨行業縱向市場的公司保護其代幣化知識產權(IP)和資產。(prnewswire)[2022/9/28 5:58:30]
在卡內基梅隆大學拿下博士學位后,William還在加拿大最大的社區學院之一喬治布朗學院,主攻烘焙和烹飪(?),學了3年。
Willian從2012年起加入谷歌,于2016年成為谷歌大腦的一份子,去年5月離職時,他已經是谷歌大腦多倫多的研究科學家了。
然后要介紹的是Jonathan Ho,UC伯克利博士畢業。
他不僅是Imagen論文的core contribution,還是Diffusion Model奠基之作《Denoising Diffusion Probabilistic Models》的一作。
谷歌母公司Alphabet CEO計劃投資區塊鏈和Web3:2月7日消息,在 2021 年全年和第四季度財報電話會議上,谷歌母公司 Alphabet Inc. 的首席執行官 Sundar Pichai 表示,該公司正在監控區塊鏈行業和 Web3 的發展,許多科技公司都在涌入該領域并擁有數億美元的投資,Alphabet 可能很快也會效仿。
Pichai 在財報電話會議記錄中還表示,在 Web3 上,Alphabet 肯定會關注區塊鏈,如此有趣和強大的技術,其應用范圍比任何一個應用程序都要廣泛得多。因此,作為一家公司,我們正在研究如何為生態系統做出貢獻并增加價值。此外,Alphabet 的云團隊還正在研究如何支持客戶在基于區塊鏈的平臺上構建、交易、存儲價值和部署新產品的需求,所以我們肯定會密切關注這個空間,并盡可能地支持它。(Dailycoin)[2022/2/7 9:35:52]
博士畢業于UC伯克利計算機科學專業的Jonathan,之前在OpenAI當過1年的研究科學家,后來在2019年加入谷歌,共工作了2年零8個月,去年11月以研究科學家的身份從谷歌離職。
新公司的最后一位聯創叫Mohammad Norouzi,也是Imagen論文的共同一作。
△
假冒Uniswap網站在谷歌搜索中顯示為廣告:金色財經報道,加密影響者BitBoy發現,去中心化交易所Uniswap的用戶可能面臨假冒UniSwap網站的風險,該假冒網站在谷歌搜索中顯示為廣告。根據BitBoy的說法,在谷歌搜索“UniSwap”時,第一個搜索結果是一個廣告鏈接,點擊該鏈接會進入一個假冒的Uniswap網站,并索要錢包的助記詞。如果輸入助記詞,加密資金將會被盜。[2020/8/13]
他在多倫多大學計算機科學博士就讀期間,拿到了谷歌ML博士獎學金。畢業后他加入谷歌大腦,在那兒工作了7年,在谷歌的最后title是高級研究科學家,工作重點是生成模型。
同時,Mohammad也是谷歌神經機器翻譯團隊的原始成員,SimCLR的聯合發明人。他在GitHub主頁上小小地透露了自己的最近動態:
這句話以外,關于新公司的更多信息,四人在任何社交平臺都沒有更詳細的透露。
這已經是谷歌最近漏出去的第n波人了。
就拿剛剛過去的2個月來說,先是包括顧世翔(Shane Gu,‘讓我們一步一步地思考’研究者)在內的至少4名谷歌大腦成員加入OpenAI;情人節時,Hyung Won Chung和CoT最早的一作Jason Wei攜手組團叛逃OpenAI。
本周三,您猜怎么著?嘿,又跑了一個:
動態 | 黑客將以太坊區塊鏈系統與谷歌系統相連,可通過電子郵件發送ETH:金色財經報道,三名黑客提出了一個創新的項目,將以太坊的區塊鏈系統與谷歌系統連接起來,這樣就可以將ETH發送到一個電子郵件地址,并通過這個電子郵件地址發送到另一個電子郵件地址。人們只需通過Metamask將ETH存入選擇的電子郵件地址,該電子郵件地址即已擁有ETH,并由谷歌的授權系統保護。[2019/11/13]
OpenAI狂喜,只有谷歌大漏勺本勺受傷的世界誕生了。
了解完谷歌漏走的這四個人,回頭來說說為他們職業生涯贏得掌聲的Imagen項目。
Imagen是谷歌發布的文生圖模型,發布時間在DALL-E 2新鮮出爐一個月以后。
本文開頭放的熊貓震驚表情包,就是朝Imagen輸入“一只非常快樂的毛茸熊貓打扮成了在廚房里做面團的廚師的高對比度畫像,他身后的墻上還有一幅畫了鮮花的畫”后,得出的一張要素完備的AI生成畫作。(不好意思,請自行斷句)
在Imagen出現之前,文生圖都共用一個套路,那就是CLIP負責從文本特征映射到圖像特征,然后指導一個GAN或Diffusion Model生成圖像。
Imagen不走尋常路,開辟了text-to-image新范式:
純語言模型只負責編碼文本特征,具體text-to-image的工作,被Imagen丟給了圖像生成模型。
具體來講,Imagen包含一個凍結的語言模型T5-XXL(谷歌自家出品),當作文本編碼器。T5-XXL的C4訓練集包含800GB的純文本語料,在文本理解能力上比CLIP強不少,因為后者只用有限圖文對訓練。
圖像生成部分則用了一系列擴散模型,先生成低分辨率圖像,再逐級超采樣。
依賴于新的采樣技術,Imagen允許使用大的引導權重,所以不會像原有工作一樣使樣本質量下降。這么一來,圖像具有更高的保真度,并且能更好地完成圖像-文本對齊。
概念說起來簡單,但Imagen的效果還是令人大為震撼的。
生成的狗子飆車技術一流:
比起爆火的DALLE-2,Imagen能更準確地理解同時出現兩個顏色要求的情況:
一邊繪畫一邊寫字這種要求,Imagen也成功完成,不僅寫得對,還能加光影魔術手般的煙花特效(不是)。
以及對后來研究更有幫助的是,谷歌通過Imagen的研究,優化了擴散模型。
首先,增加無分類器引導(classifier-free guidance)的權重可以改善圖文對齊,同時卻會損害圖像保真度。
為了解決這個bug,在每一步采樣時引入動態閾值(dynamic thresholding)這個新的新的擴散采樣技術,來防止過飽和。
第二,使用高引導權重的同時在低分辨率圖像上增加噪聲,可以改善擴散模型多樣性不足的問題。
第三,對擴散模型的經典結構U-Net做了改進,變成了Efficient U-Net。后者改善了內存使用效率、收斂速度和推理時間。
后來在Imagen上微調,谷歌還推出了能“指哪打哪”版本的文生圖模型DreamBooth。只需上傳3-5張指定物體的照片,再用文字描述想要生成的背景、動作或表情,就能讓指定物體“閃現”到你想要的場景中。
比如醬嬸兒的:
又或者醬嬸兒的:
大概是Imagen效果太過出色,劈柴哥后來親自宣發的谷歌AI生成視頻選手大將,就叫做“Imagen Video”,能生成1280*768分辨率、每秒24幀的視頻片段。
啊,等等,谷歌有Imagen Vedio,這和四人的新公司不是撞方向了嗎?
仔細看了下論文,無論是Imagen還是Imagen Video,各自都有大篇幅涉及風險、社會影響力的內容。
出于安全、AI倫理和公平性等方面考慮,Imagen和Imagen Vedio都沒有直接開源或開放API,甚至連demo都沒有。
哪怕市面上出現開源復刻版本,也不是最正宗的味道。
此前就曝出過在谷歌每年的內部員工調查“Googlegeist”中,員工表示對谷歌執行能力不佳的質疑。也許,這四人出走,繼續做Imagen,并做Imagen的視頻版,說不定就是為了想把項目放到一個更開放的AI環境。
而且這種出走創業,也是熱錢大錢向AIGC洶涌的結果。
所以既然AIGC的創投熱潮已經在太平洋那頭開啟,那應該在太平洋這頭也不會悄無聲息。
或許你已經聽說了一些同樣的大廠出走創業,歡迎爆料說說~~
來源:“量子位”(ID:QbitAI),DeFi之道
作者:衡宇
DeFi之道
個人專欄
閱讀更多
金色財經 善歐巴
金色早8點
Odaily星球日報
歐科云鏈
Arcane Labs
MarsBit
深潮TechFlow
BTCStudy
澎湃新聞
美國證券交易委員會就幣安的穩定幣是否是一種證券發出警告,這可能會暗示某種類型的與美元掛鉤的代幣可能會受到監管審查.
1900/1/1 0:00:00GMX全鏈樂高會挑戰dYdX龍頭地位嗎?作者:Momir Amidzic, IOSG Ventures 沒有解決方案,只有取舍 本文討論了后FTX時代DEX衍生品市場的狀況.
1900/1/1 0:00:00談起NFT,持有它的人在期望獲得什么?擁抱一種新技術以跟隨時代潮流?還是看好它的發展前景或作為一種投機資產?回看2022年的NFT市場,Web3CN發現它正在經歷改變.
1900/1/1 0:00:00原文標題:《Pureplay On-Chain Games》原文作者:ID Theory 首席投資官 James Brodie原文編譯:比得潘 @BlockBeats隨著區塊鏈技術日趨成熟.
1900/1/1 0:00:00面對火熱的ChatGPT,狂歡的粉絲,再看看自家冷冷清清,凄凄慘慘的Horizon Worlds,估計但凡是個有點東西的企業都坐不住,更何況是扎克伯格和改名明志的Meta呢?前不久.
1900/1/1 0:00:00原文作者:William Peaster,由 DeFi 之道編譯。在熊市中,您應該學會提高尋找 alpha 的策略。這就是這篇文章的目的.
1900/1/1 0:00:00