編者按:很多人都預測2023年將是AI之年。但AI顯然不是今年才開始爆發或者炒作起來的。但是2022年圖像生成工具以及聊天工具ChatGPT等消費者化是人工智能開始普及應用的標志,2023年這股趨勢只會愈演愈烈。本文剖析了AI的用例與商業模式,也許我們將迎來繼農業革命、工業革命以來的第三種通用技術的普及。文章來自編譯。
現在AI令人興奮的一點是平臺層正在固化,這意味著應用層該出現了。換句話說,也就是你我每天都會接觸到的東西該出現了。
過去這幾個月的時間里,我已經寫了好幾篇與AI正在發生的事情有關的文章。鑒于這是我們進入2023年要面對的技術主題,在此我想把那些文章都整合一下,寫一篇深度探討的文章,然后進一步拓展。
其結果是這篇文章的篇幅要長很多,但在關于我們現在處在什么位置的事情上,我希望它能提供一份類似‘國情咨文’的快照,同時就“我們未來要去哪里”給出一些提示。
讓我們開始吧。
每當我思考人工智能領域在發生著什么時,我往往會想到兩部電影。一部是33年前問世的老片,一部是10個月前問世的新片。
1990年上映的《超國度》幾乎已被人遺忘。這部科幻電影的導演是道格拉斯·亞當斯,他更出名的身份是《銀河系搭車客指南》的作者。電影的假設是亞當斯對被動式的線性電視已經厭煩了,電影稱就是“那種發生在你身上,而你就像一個沙發土豆一樣坐在它面前的電視。”
為了尋找更具互動性的媒體形式,亞當斯把他的電視帶到了一個垃圾場,在那里他遇到了湯姆。湯姆是一位軟件代理——本質上屬于一個數字管家,能夠根據你的特定興趣為你提供個性化的信息和娛樂飲食。湯姆帶領我們的主人公穿行于一個超媒體的虛擬世界——一個由鏈接的文本、聲音、圖像和視頻組成的世界。換句話說,湯姆帶著亞當斯踏上了互聯網之旅。。
《超國度》,尤其是湯姆這個角色,讓我想到了我們目前的現實:人工智能驅動的算法推薦引擎,根據我們獨特的興趣圖譜塑造出的一個超個性化的互聯網。這就是我所說的“一切都被TikTok化”。
我想到的第二部電影面世的時間要近得多:2022年3月的《瞬息全宇宙》,在我看來,這有可能是今年奧斯卡最佳影片的潛在競爭者。在我最近的記憶中,《瞬息全宇宙》屬于線索比較混亂的電影之一。這部電影講述的是伊芙琳的故事,她是一名中國移民,經營著一家正在接受美國國稅局審計的自助洗衣店。伊芙琳很快發現,她生活在無限宇宙里面的一個宇宙,她必須穿越多重宇宙才能拯救她的家人。
從很多方面來說,這部電影都是對互聯網之亂的隱喻。在接受Slashfilm的采訪時,電影導演之一的丹尼爾·謝納特是這么說的:“我們希望這部電影的極簡主義能夠與沒完沒了地刷屏的感覺建立關聯”。
YouTuberThomasFlight稱《瞬息全宇宙》是第一批“后互聯網”電影之一,因為它捕捉到了在線生活的怪異之處。生活在2023年的迷人的一點在于,我們的大腦與一個世紀前相比沒有什么不同,但我們的世界在100年內卻發生了翻天覆地的變化。正如Flight所說的那樣:“我們現在生活在這樣一個時代,在一次30分鐘TikTok狂歡里,我們體驗到的有趣想法、概念、人物以及地方,就要比我們被困在當地目不識丁的祖先一輩子所經歷過的東西都要豐富。”快速演變的數字混沌會如何扭曲我們緩慢進化的人類思維呢?
《瞬息全宇宙》里面的宇宙是多種多樣的,而且非常非常的奇怪。在一個沒有人類生命的宇宙里,每個人都是一動不動的石頭。里面還有一個宇宙,這個宇宙里面每個人都是蠟筆畫。另一個宇宙里,每個人的手指都變成了熱狗。
《瞬息全宇宙》這部電影捕捉到了互聯網的運動能量與無情的節奏。
不過,這部電影讓我想到的不是互聯網,而是生成式人工智能正在發生的事情。就像電影讓主人公將她想象中的任何東西都轉化為有形的現實一樣,生成式AI也讓我們將想法變成了文字、圖像和視頻。
這是當我輸入提示“Apersonmadeentirelyoffruit”時Midjourney生成的結果:
這是我輸入“NewYorkCityskylineinthestyleofVanGogh”時得到的結果:
我可以花幾個小時去試驗這樣的提示。
2022年取得突破的生成式人工智能是自十多年前移動和云計算興起以來最引人注目的技術。平臺層正在鈣化,我們正目睹著令人興奮的應用層的萌芽——這些產品有可能成為數十億人日常生活的一部分。
這篇文章的目的是研究AI這一時刻背后的“為什么是現在”,并探索初創企業可以如何利用AI來進行開發。本文內容將分為以下幾部分:
Binance上以太坊永續期貨中持有看漲/看跌押注的資金費率處于2021年5月以來的最低水平:金色財經報道,在以太坊技術升級Merge計劃不到24小時,ETH相關的永續期貨市場中持有空頭頭寸或看跌押注的成本正在飆升。在加密貨幣交易所 Binance上市的以太坊永續期貨中持有看漲/看跌(多頭/空頭)押注的資金費率或成本處于2021年5月以來的最低水平。根據Coinalyze 追蹤的數據,包括 Binance 在內的主要交易所的平均融資率跌至創紀錄的低點。
換句話說,空頭向多頭支付的維持頭寸的補償已經飆升并在幣安上達到了16個月來的最高水平,反映出對潛在價格下跌的押注的過度需求。[2022/9/14 13:29:56]
搭好舞臺
算法推薦系統
圖像模型
語言模型
生成式人工智能的用例
商業模式
最后思考及待回答的關鍵問題
好了,讓我們開始吧。
搭好舞臺
在過去十年里,有兩股重要力量推動了技術的發展:分別是移動和云計算。
移動促進了大型消費互聯網公司的崛起:Uber與Lyft、Instagram與Snap、Robinhood與Coinbase。這些公司基本上都成立于2009年至2013年間。數字廣告在2010年代迅速轉向移動設備,Facebook等桌面時代的公司不得不爭先恐后地重塑業務。
明年移動應用內廣告的支出預計將超過桌面廣告-MarketingCharts
云計算則支撐了軟件即服務(SaaS)的爆發式增長,并讓數據變成企業最寶貴的資源。這一領域的新興公司基本上也都成立于2009年至2013年之間,其中包括Slack與Airtable、Stripe與Plaid、Snowflake與Databricks等。
從2015年到2022年間,存儲在云端的企業數據占比翻了一番:
存儲在云端的企業數據;資料來源:Statista
這是過去10年AWS收入情況圖,很少有圖表比這幅圖更令人印象深刻:
AWS收入;資料來源:Statista
移動和云計算讓2010年代成為技術領域非常非常好的十年。但在過去的幾年里,我們看到很多人都在嚷嚷接下來會發生什么。虛擬現實?增強現實?自動駕駛汽車?加密貨幣?Web3?
這些技術個個都很有趣,原因各不相同,有趣的用例也各異,但都還非常非常早。整個VR行業僅相當于蘋果2021年營收的2%。圍繞新技術的炒作太多,而源于對移動和云計算的焦慮的“平臺轉變”已經……過時了。AWS推出時間是2006年;iPhone在2007年問世。移動和云計算都還沒有飽和,但它們的新機遇并不像以前那樣成熟了。與此同時,我們看到前所未有的私有資本開始涌入,去追逐創業公司:
風投資金在2021年激增至3300億美元
2020年代最引人注目且最有可能推動技術發展的力量是什么?也許是人工智能。人工智能在過去幾年中得到了顯著改善。直到最近,Gmail的自動補充句子功能幾乎還沒法用;但現在已經好得嚇人。Facebook用戶將認識到AI在識別照片里面的朋友方面已變得有多么出色;實際上,Facebook的DeepFace引擎現在比人類還要擅長面部識別。就在去年夏天,我們看到了從StableDiffusion到Midjourney、ChatGPT到Lensa的一切事物的涌現。人工智能正在成為主流。
Facebook的DeepFace現在比人類還要擅長面部識別
我們正處在人工智能的轉折點,這個轉折點正在支撐起創新的寒武紀大爆發。2009年至2013年誕生了數十家由移動和云計算技術提供支持的變革型初創公司。未來幾年這樣的公司將再度涌現,但這次,人工智能將成為催化劑。
前一段時間,有位朋友問了我一個問題:AI是泡沫,還是下一個大事件?答案可能是兩者兼而有之。
報告:Metaverse房產銷售額到2026年將增長50億美元:金色財經報道,根據全球市場研究公司Technavio的一份報告,從2021年到2026年,在混合現實和加密貨幣日益流行的推動下,元宇宙房地產市場預計將增長53.6億美元,年復合增長率為61.74%。(forkast)[2022/7/25 2:36:05]
現在有很多令人興奮的事情,其中很多是有理由的,但其中很多可能是非理性的、不成熟的,或者兩者兼而有之。但是當你將畫面拉遠時就能發現,毫無疑問我們正處于一個激動人心的技術新時代的風口浪尖。
算法推薦系統
最近的大部分討論都圍繞著生成式人工智展開,但“傳統”的人工智能仍有很大的發展空間。曝光度最高的人工智能應用是什么?也許沒有比TikTok的ForYouPage更高的了,對于《超國度》那個具有先見之明的超個性化的互聯網來說,這可以說是它最好的現代類比。
TikTok沉浸式、算法性的ForYouPage開創了內容策劃的新風尚。一開始,每個發布出去的視頻都會被推送給一組的初始受眾,然后根據他們觀看了多長時間、是否喜歡視頻、是否對視頻發表了評論等等,對這些觀眾的反應進行評估。如果受眾反應良好,視頻就會被推送給更多的受眾,如此循環往復。
TikTok的算法
我最近跟同事Martin討論了一下移動和云計算之后技術的下一步會是什么。我們聊起了AI,并回想起十年前那張著名的“解綁Craigslist”的圖表。
就是這張圖:
將業務從Craigslist解綁出來誕生了大批初創企業,迄今為止這批企業的融資額達到了88.7億美元資料來源:CBInsights
這里還有一張,要表達的概念是一樣的,但更清晰:
平臺Vs垂直領域及下一個大解綁|AndreessenHorowitz圖片來源:AndrewParker
這些圖有一個基本前提,那就是原先市場的主要品類正在被更專注、更好的產品所重塑。通常,顛覆者會利用某項新技術:比方說,Tinder是第一批只支持移動設備的約會app之一。
AI應用可能也會帶來類似的清算。主要的品類——如約會、房地產、求職等——可能會因為有人能更好地利用人工智能而被徹底顛覆。當AI可以把跟你完美匹配的對象呈現出來時,為什么還要上Tinder沒完沒了地刷屏?十年之后,我們可能會看到上圖有了一個新版本,里面出現的也許是全新的公司logo——AI優先的公司會重塑每一個品類。當然了,生成式人工智能一定會從中發揮作用,但類似TikTok的推薦系統也很強大;就數字世界將越來越適合我們的獨特品味和偏好而言,我們仍處于早期階段。
讓我們看個例子——交易。
從很多方面來說,SHEIN都算是TikTok的姊妹公司。SHEIN與字節跳動都是中國公司,而且位列全球最有價值的三大初創公司之一。
就像TikTok滲透了美國的媒體一樣,SHEIN也打入到美國的快時尚——
美國快時尚市場Shein占據了最大的份額-BloombergSecondMeasure
這張圖換了個視角,把SHEIN與H&M和Zara的銷售額進行比較:
中國快時尚品牌Shein如何征服美國市場-Euromonitor.com
SHEIN的爆發式增長非常引人注目:SHEIN已經連續八年每年的增長率都超過100%,其在非公開市場的最新估值已經超過Zara和H&M市值之和。2022年6月,SHEIN取代亞馬遜,成為iOS和Android應用商店排名第一的購物應用。
SHEIN的速度令人矚目:這里每天都要上架8000件新商品,而Zara每周才新增500件。SHEIN基本上屬于互聯網原生的Zara和H&M轉世,利用了更好的技術把從設計到生產的時間從三周壓縮到了三天。SHEIN通過梳理競爭對手的網站和GoogleTrends,找出流行的款式,然后快速做出自己的設計,預測需求,實時調整庫存。
機構分析:美國加息前景支撐2022年美元走強:12月25日消息,道明證券認為,鑒于美聯儲準備最早在3月份加息,美元可能在2022年走強。摩根大通分析師也表示:“美聯儲最近的講話表明3月(加息)即將到來,我們繼續認為風險/回報偏好會尊重這一結果,從而支持美元在新的一年走強。”與此同時,他們預計歐元兌美元EUR/USD將在1.12-1.14區間內整固,但也存在大幅跌破該區間的風險,因有關資產負債表最終走向的傳言可能會推高美國實際利率。 (金十)[2021/12/25 8:02:42]
我們再說回AI,SHEIN給我留下的其中一個深刻印象是它的推薦。就像字節跳動會預測你想看的內容一樣,SHEIN會預測你想買什么衣服。SHEIN之于電商就像字節跳動之于內容。
這個周末,為了給朋友即將舉行的30歲生日聚會準備東西,我打算到網上購物。這個派對以《亢奮》為主題,也就是說,基本上你得穿得像HBO那部美劇的里Maddie、Cassie或NateJacobs一樣。我之前從來都沒上SHEIN買過東西,但我輸入了“男士黑色網紗上衣”來找衣服。然后我點擊了“褲子”品類,結果看到了這個屏幕:
只是搜索了一次網紗上衣,SHEIN就能夠預測出風格和主題非常相似的褲子。這非常令人印象深刻。
從某種程度來說,這是StitchFix開創的個人造型訂閱盒概念的更復雜版本。StitchFix給整個過程引入了人,也利用了數據科學,但其基礎是新客戶引導冗長的問卷調查。而SHEIN只根據我輸入的四個詞就做出了準確的推薦。
StitchFix的個人造型市場已被證明相對小眾,而且它的股票也已受到重創。活躍客戶已降至390萬,同比下降20萬人。該公司正在努力向Freestyle產品轉型——這是一種更傳統的購物體驗——但這個細分市場仍然只占該公司業務的一小部分。
StitchFix的訂閱盒里面是由造型師和數據科學策劃的推薦產品
盡管StitchFix舉步維艱,但它的目標是突破性的——個性化商務。這家公司幾年前就提出了這個概念,但當時人工智能還不夠成熟,沒法取代冗長的問卷調查以及小規模的數據科學家隊伍。SHEIN朝著正確方向邁出了一步,但我們仍站在人工智能驅動推薦的風口浪尖。
想象一下,如果有家公司能梳理你的相機膠卷,并以驚人的準確性為你推薦一大批新衣服會怎樣?或者,也許這家公司只需要請你將Instagram帳戶關聯一下,然后就能消化你的所有點贊和關注,即可提供極其準確、個性化的時尚推薦。
人工智能的主要消費者應用將大量依賴于嫻熟的推薦。這些推薦能預測到連你都不知道的需求與愿望——就像TikTok的ForYouPage一樣:它能夠在人們自己還沒意識到之前就向對方表明他們是性少數者。也許上面的示例公司可以在一條FYP動態消息中重塑商業,讓你每次瀏覽一個精心策劃的商品——雙擊即可購買,向上滑動即可查看下一件東西。
世界正在向著個性化轉變,而人工智能是在給這股趨勢火上澆油。我的朋友Alex說的一席話我很喜歡:
在AI的幫助下,一對一輔導正在成為可能
突然之間,“一對一”體驗可以大規模復制了——與我們在未來幾年看到的應用相比,今天的AI應用仍處在初級階段。想想看,上面的每一個Craigslist類別——教育、書籍、家居裝飾等。每一個都即將被重塑。
圖像模型
2022年文本生成圖像AI爆發了。首先出現的是來自OpenAI的DALL-E。當然,不是誰都可以直接用DALL-E,但這方面的創作已經開始在互聯網上火起來了;Twitter上面我最喜歡的賬號是WeirdDALL-EGenerations。
互聯網上用DALL-E生成11張最奇怪的圖像|Mashable
對于這個世界大部分的地區來說,DALL-E是AI的第一個真正的“哇哦”時刻。在與麻省理工學院交流時,OpenAI的SamAltman把這一點歸功于圖像所傳遞的情感力量:
我想說的是,其實相對于DALL-E,技術界對2020年推出的GPT-3要更加認可。從GPT-3這里,你第一次真正感受到了系統的智能。它可以做人做的事情。我認為它的出現讓以前根本不相信AGI的人也要認真對待這一話題了。發生在GPT-3身上的有些事情是我們大家都沒預料到的。
2020年持有至少1000枚BTC的錢包已達2052個創新高:12月11日消息,Chainalysis首席經濟學家Philip Gradwell表示,2020年,持有至少1000個比特幣的錢包(即由單個實體控制的一組區塊鏈地址)增加了302個,目前達到創紀錄的2052個。(CoinDesk)[2020/12/11 14:57:45]
但是圖像卻有著獨特的情感力量。相對于GPT-3,世界其他地方對DALL-E的欣賞要高很多。
人往往更喜歡更豐富的媒體格式:Instagram一直都比Twitter更受歡迎;與此同時,TikTok在使用上一直在蠶食Instagram的市場,迫使后者也得向視頻轉型。在我看來,類似的偏好也會發生在生成式人工智能身上:圖像>文本,很快,視頻也會>圖像,以及最終沉浸式3D體驗將>視頻。
在DALL-E起勢之后,去年夏天StableDiffusion和Midjourney的出現徹底改變了局面。StableDiffusion具有開創性,因為它是開源的,這意味著開發者基于它做開發。稍微解釋一下,StableDiffusion將擴散從像素空間轉移到了潛在空間,從而推動了質量的顯著提高。與此同時,Midjourney在可訪問性方面具有開創性。Discord上就能使用Midjourney:任何人都可以注冊一個免費賬號,并獲得25個積分,圖像則是用公共服務器生成的。用完25個積分之后,每月支付10美元或30美元就可以繼續使用。Midjourney已迅速成為Discord上最受歡迎的服務器之一,擁有740萬會員。
下圖是Midjourney、DALL-E2以及StableDiffusion在使用相同的文本提示時生成的圖像,各自風格略有不同:
下面這條時間線從更寬泛的角度展示了AI圖像生成在過去十年是如何得到改進的:
去年是圖像模型的轉折點,生成的圖像質量得到了迅速提高。舉個例子:眾所周知,AI很不擅長創作手。除非AI具有出色的上下文感知能力,否則很難知道已經弄出了多少根手指。其結果是我們最終會得到很多有四根或六根手指的手。下圖是Midjourneyv3與Midjourneyv4生成結果的對比,你能看出結果有了明顯改進:不再會出現有兩只喙或三條腿的企鵝。
當我想到圖像生成早期遇到的挑戰時,就會回想起一個世紀前動畫在早期面臨的挑戰。米老鼠為什么要戴手套?原因之一是這樣制作動畫可以更快;手是很難畫的。《聰明笨伯》和喬治·杰森也是如此——你看不見他們的脖子,因為有脖子意味著角色的整個身體都得跟隨每個動作和表情而移動。這意味著動畫師要做更多的工作。領帶和高領讓動畫師得以投機取巧,加快制作動畫的速度。
杰里·鄧肯與聰明笨伯交談-DeanKaner,《幽默時代》
當然了,半個世紀之后,動畫已經取得了長足進步。《海底總動員》在某種程度上是皮克斯展示自己可以制作出逼真的水動畫的借口。《怪獸電力公司》里面的形象也是如此。皮克斯一直等到第6部動畫片《超人總動員》才第一次開始描寫人類的故事,因為CGI技術之前還沒有為此做好準備之所以專門講玩具,部分是因為皮克斯還不能對逼真的人類細節進行渲染——所以在電影中你幾乎看不見安迪和他媽媽的影子)。
數字創作的軌跡正在沿著動畫的軌跡前進,但技術發展的步伐只會越來越快。比方說,上面Midjourney生成的企鵝圖像之間的差異只是短短幾個月之間的對比結果。
語言模型
《黑鏡》第二季的《馬上回來》講的是一對夫妻一起搬進了新家。結果第二天,丈夫出車禍身亡了。后來他的遺孀得知有一項新服務可以讓她與已故的丈夫聊天;這款工具能夠消化短信以及社交媒體的歷史記錄,從而了解伴侶會如何回應,然后代替他與客戶聊天。這一集的情節現在已經成為現實。在針對個人數據進行訓練的基礎,初創企業HereAfter.ai就提供了與已故親屬的互動化身聊天的服務。
去年,在圖像模型出現飛躍的同時,語言模型也突飛猛進。去年11月,OpenAI推出了ChatGPT,剛推出五天,這款聊天工具就收獲了100萬用戶。ChatGPT的表現令人難以置信;使用它的感覺跟你第一次用上GoogleSearch一樣,都有“魔法時刻”降臨的感覺。
下面的一些例子說明了ChatGPT能做什么:
提示:“什么是蟲洞?把我當作5歲小孩給我解釋一下。”
聲音 | Nexo平臺負責人:2020年比特幣將輕松達到5萬美元:據Cointelegraph今日消息,比特幣借貸平臺Nexo負責人Antoni Trenchev表示,比特幣可以在2020年輕松達到5萬美元,他稱,自比特幣誕生以來,此次比特幣的價格上漲幾乎與以往任何時候都不一樣。[2020/1/3]
讓chatgpt用通俗易懂的方式解釋蟲洞
提示:“提供一個29歲生日派對的創意。”
使用chatGPT提出派對創意
提示:“用伴奏的和弦寫一首關于在家工作的歌曲。”
讓chatgpt用和弦寫音樂
人工智能現在這種發展和采用的節奏可以追溯到2017年當時谷歌發表的一篇開創性論文,《AttentionIsAllYouNeed》。這篇論文由Cohere.ai創始人AidanGomez與人合著,從中催生出一個規模呈指數級增長的“transformer”模型時代。
不到三年前的GPT-3推出時的參數規模為約2000億,但新的GPT-4將有約1,000,000,000,000個參數。
來源:ErinPrice-Wright
在提出新想法、理解上下文以及回憶信息的能力方面,每個新模型都實現了飛躍。但更大的模型的訓練成本也高很多。訓練有數千億個參數的模型可能要花費數百萬美元。出于這個原因,大規模模型正在成為初創公司創立的基礎。我的同事ErinPrice-Wright將其類比為亞馬遜的AWS或微軟的Azure——數百萬企業所依賴的云計算平臺。
比方說,許多初創公司都建立在OpenAI的GPT-3基礎之上。舉個例子,Jasper提供了一個由GPT-3提供支持的AI撰稿人。每月只需交29美元,Jasper就能讓你擁有寫作的超能力。不過,Jasper對OpenAI推出免費的ChatGPT感到吃驚,擔心這會蠶食自己的業務。基礎模型和基于這些模型建立的公司之間的關系會如何發展?這是今年值得關注的一件事情。
生成式AI的用例
手寫文字識別是最早的人工智能形式之一,郵政服務主要用它來讀取信封上的地址。但是人工智能的這個用例非常特殊。在生成式人工智能方面,我們已經看到:1)圖像和語言模型有了巨大改進,以及2)OpenAI、HuggingFace、Stability.ai等公司提供的寶貴基礎設施。這兩個因素相結合拓寬了用例的可能性。
AI系統的語言與圖像識別能力得到了迅速改進資料來源:OurWorldinData
之前在與DanielGross和BenThompson進行對話時,NatFriedman關于機會的思考方式我很喜歡:
一說到AI和大型語言模型時,人們往往認為需要大量專業知識。為了處理這些東西,我得了解深度學習,以及,哦天哪,我可能還得懂微積分或至少線性代數,可是我根本就不太喜歡那種東西。我需要知道怎么給Nvidia硬件編寫CUDA內核程序?這可太嚇人了。
我認為他們疏忽了一點,這其實是個謬誤。這個謬誤就好比要想制作顏料,你得是化學家。所以如果我想成為一名畫家的話,我必須學習化學。但現實情況是,你不需要知道如何制作顏料就能成為一名偉大的畫家。同理,我認為你不需要弄清楚大型模型是怎么做出來的,也可以用它們做出出色的產品。
我喜歡這個比喻。任何人都可以更輕松地開發出利用AI去畫畫的工具。變革每個行業的機會已經成熟。
如果極度簡化的話,我們可以把用例分為兩類:1)創意類,以及2)生產力類。
說到創意,我們看到生成式人工智能降低了創作的門檻。利用Midjourney,你可以給電影制作概念圖。Latitude.ai等公司開發出AIDungeon等游戲,利用GPT-3進行AI驅動的探索。與此同時,Alpaca所做的Photoshop插件演示在Twitter掀起了一股風暴;這家公司的使命是“將AI圖像生成能力與人類技能結合到一起”。
我過去也曾寫過創意工具日益普及的文章。早在2015年時,StevenJohnson就曾在《紐約時報》上撰文:
消費文化的成本可能已經下降,盡管下降的幅度沒有我們擔心的那么多。但制造成本下降得更厲害。作者不需要印刷機或國際分銷商的服務就可以為全球讀者創作和出版小說。對于獨立電影制作人來說,幾年前可能要花費數萬美元的直升機航拍畫面,現在只需不到1000美元的GoPro和無人機即可拍攝;有些導演用iPhone即可拍攝一整部高清質量的電影。蘋果售價為299美元的剪輯軟件FinalCutProX就可以剪輯奧斯卡獲獎影片了。利用NativeInstruments軟件,音樂家即可以驚人的保真度重現在維也納音樂廳演奏的施坦威三角鋼琴的聲音,或數百種不同的吉他放大器聲音,或甲殼蟲樂隊在《永遠的草莓地》中使用的Mellotron合成器聲音。15年前,這些聲音可能需要花費數百萬美元才能合成出來;今天,你只需幾千美元就可以擁有所有這些。
這很了不起,而且至今依然適用:2020年奧斯卡最佳影片《寄生蟲》就是用FinalCutPro剪輯的。工具正逐漸變得更實惠、更容易獲得,讓更多的創作涌現。
人工智能拓寬了可能性。想象一下由人工智能驅動的RobloxStudio,或者當人工智能與Figma結合在一起時可以解鎖什么。我制作這張圖至今已過去兩年多了:
YouTube是革命性的,但卻給創作制造了很高的門檻:1)工具需要昂貴的投入,以及2)使用這些工具需要具備know-how知識。TikTok這一類似無代碼的方式降低了這些門檻,創造出一個公平的競爭環境。其結果是YouTube上大概每1000人才有1人創作內容,而接近60%的TikTok用戶都會自己創作內容。
也許今年這張圖可以用第三個框更新一下——一個超越無代碼創作工具的更直觀、強大的工具,并在創作內容的過程中利用生成式人工智能。用這個工具為Instagram制作照片、為TikTok制作視頻或為全新社交網絡創作內容。
就像人工智能增強了創意一樣,人工智能也增強了生產力。我們在賦予作者和營銷人員超能力的工具中就能看到這一點,比方說像Jasper.ai、Copy.ai、Lex這樣的工具。我讓ChatGPT幫我頭腦風暴,給我的自媒體設計新標語,它的推薦令人印象深刻:
我們從Gong身上看到了生產力的提升,它運用了AI來幫助B2B銷售團隊提高效率和效力。我們在Osmosis身上也能看到這一點,它可以幫助廣告代理商生成AI廣告。我們在GitHubCopilot身上也能看到這一點,它可以將自然語言提示轉化為數十種編程語言的編碼推薦,而且從2022年6月開始,所有開發者均可用上這款插件。
GitHubCopilot:你的AI結對程序員|GitHub博客_
人工智能的早期目標是死記硬背的重復性任務。我認為有一個領域被重塑的時機已經成熟:那就是客戶支持。這些是今天的人工智能已經可以取得重大進展的領域。更復雜的任務在未來會有進一步的發展。但任何涉及人類創作的行業都會感受到人工智能的影響。
我看到有人已經開始拿早期AI應用和早期iPhone應用做比較。還記得手電筒app、lightsaberapp、lighterapp嗎?還記得《水果忍者》以及《勁樂團》嗎?我們正處在app的早期階段,現在判斷什么樣的應用是殺手級應用還為時過早。一個迫在眉睫的問題是企業如何才能建立起競爭性護城河;真正的技術差異化將變得很罕見,公司需要找到保持競爭優勢的方法,也許是通過建立網絡效應,也許是建立用戶互動與產品改進的迭代循環。畢竟,事實證明,2008年代的手電筒應用并沒有多厚實的護城河。
現在的手電筒應用已經多如牛毛
但正如我們在幾年內就從lightsaber應用發展到Uber,從《水果忍者》發展到Instagram一樣,生態體系也將迅速發展,有生命力、差異化、跨時代的公司也將會出現。
商業模式
軟件即服務是個好東西。可預測的經常性收入。80%以上的毛利率。理想情況下,凈收入留存率>100%,這意味著即便沒有獲得任何新客戶,你的業務也會逐年穩步增長。。
我的直覺是,很多最好的人工智能初創企業將是SaaS公司。好東西為什么要改?
比方說,Runway就是最令人興奮的人工智能公司之一。Runway提供了一個由AI驅動的創作套件,看過它的產品演示之后你會瞠目結舌的。
從演示視頻可以看出,Runway提供了文本生成視頻功能,讓你可以用魔法召喚出一條城市街道,然后快速做出更改。想象一下你在好萊塢從事特效工作——Runway可以讓你在幾秒鐘之內添加大爆炸效果,而如果沒有AI的話,你得花費大量的時間和金錢來做特效。CBS就是他們的客戶之一,使用Runway之后,他們的晚間秀剪輯時間從5小時縮短到了5分鐘。NewBalance是另一個客戶,他們在Runway上用定制的生成模型來設計下一代運動鞋。
Runway的定價對于任何SaaS愛好者來說都很熟悉:
我們還看到人工智能公司轉向了其他我們熟悉的商業模式。Midjourney依賴消費者訂閱。去年12月,Lensa開始風靡全球,其商業模式是免費增值+小額支付。50個一組的自定義頭像花掉了我8.99美元。
1/Lensa的興起可以作為消費者行為的一個有趣的案例研究:Lensaapp其實早在2018就有了,但在推出四年之后的本周才升至應用商店的第一名。關鍵是Lensa推出了AI驅動的“魔法化身”功能。
當然了,Lensa面臨的挑戰是防御能力;Lensa的命脈建立在Instagram、Twitter和TikTok之上,它得弄清楚如何建立自己的護城河。話雖如此,也許Lensa并不太關心護城河——據報道該公司在短短幾周內就賺了4000到5000萬美元,將來會出現許多能賺錢且對開發者很有意義的AI應用,它們無需取得風投規模的成果。
PromptBase這家富有創意的新公司采用的商業模式我們也很熟悉。PromptBase是文本生成圖像提示的交易市場——這可能是生成式人工智能的首批交易市場之一。想出正確的提示,從而制作出令人驚嘆的AI藝術作品是非常困難的。最美的作品往往源自于詳細的提示,而撰寫提示本身就是一門手藝。以下是生成StableDiffusion圖像的示例提示:
一座具備遙遠未來主義風格的城市,被籠罩在一個巨大的透明玻璃穹頂下,里面充斥著高樓大廈,位于一篇片只有大型沙丘的荒蕪沙漠之中,有太陽的光線,Artstation,滿天星的深空掛著一顆閃耀的太陽,大規模,有霧,非常寫實,電影般的,彩色的。
PromptBase上面交易的是類似這樣冗長、高度具體的提示。到目前為止,該交易市場已有11000名用戶。
關于AI應用商業模式的走向,一個簡短回答是我們可能會看到與上一代技術相同的商業模式。也會有廣告驅動的社交網絡、小額支付驅動的MMO、按使用的定價模式。交易市場可能被證明是需要更多資本來擴大規模的業務,但將體現出強大的網絡效應,從而建立起強大的護城河。SaaS將證明是最理想的商業模式之一,盡管針對“企業型SaaS市場已經十分擁擠”的噪音,AISaaS型公司將需要一流的產品來消除大家的疑慮。
最后思考及關鍵問題
一旦某項技術普遍改變了各種商品或服務的生產方式,就會被稱為是“通用技術”。OurWorldInData的團隊認為,人類有兩種主要的通用技術:1)農業革命賦予我們大規模的糧食生產,讓我們從狩獵和采集過渡到農業;2)工業革命賦予了我們大規模制造的能力。我認為互聯網的出現——也就是數字革命——將標志著第三次革命的出現。但我也同意他們的觀點,TransformativeAI是下一個通用技術:
這是一個激動人心的時刻。炒得過火了?也許有一點。但這種炒作也會吸引到推動該領域發展的人才;從某些方面來說,炒作有自我實現的成分。
人工智能不會自己發展。我們需要弄清楚如何與人工智能共存,并利用它來增強人類的能力。學校正在努力弄清楚如何應付ChatGPT,有很多學校選擇禁止它的使用。但我同意沃頓商學院教授EthanMollick的觀點,他認為,“大型語言模型在未來幾年內不會停止發展。我們需要找到一種辦法來適應這些工具,而不僅僅是取締它們。”今天的孩子將生活在一個到處都是人工智能的世界里;他們需要了解如何去駕馭那個世界。
當然,還有一些重大的倫理問題需要解決——技術的飛躍往往會在影響深遠與反烏托邦這兩個極端之間徘徊。我們需要弄清楚的問題包括:
誰為人工智能的錯誤負責?
誰是人工智能作品的創作者?是人工智能嗎?還是開發者?或者是寫提示的人?抑或是那些自己的作品被用來訓練模型的人?
我們如何確定哪些是人造的,哪些是機器制造的?區分這兩者的界線在哪里?
我們如何擺脫AI的偏見?
創業公司如何才能脫穎而出,并樹立自己的護城河?
生態體系的價值在什么地方積累,價值創造應該如何分配?
人工智能會成為凈就業創造者還是凈就業破壞者?我們如何對因人工智能而失業的員工進行再培訓?
要弄清楚的事情還有很多。大規模的技術進步往往會引起大規模的社會不和與爭執,甚至還會導致沖突。這是悲觀的看法。
我輸入的提示:“生活在一個用人工智能建設的未來社會,賽博朋克風格,高分辨率”,Midjourney生成的結果
但我永遠是個技術樂觀主義者,對我來說這是一個激動人心的時刻——只要我們采取正確的保護措施即可。我以前曾引用過Midjourney的DavidHolz的這句話,但我喜歡的是它對機會的思考方式:
我們不認為這跟藝術或深度偽造有關,而是跟我們如何擴展人類的想象力有關。什么意思?當計算機的視覺想象力比99%的人類都要擅長時,這意味著什么?這并不意味著我們將停止想象。汽車跑得比人快,但這并不意味著我們就不走路了。當我們需要遠距離運輸大量物品時,我們需要引擎,需要飛機、輪船或者汽車的引擎。我們把這項技術看作是想象力的引擎。所以這是一個非常積極、非常人文主義的東西。
Midjourney對提示“想象力引擎”的詮釋
再用一個令人興奮的想法來結束本文:生成式人工智能很快就會與其他成熟的技術發生沖突,比如VR和AR。想象一下生成沉浸式三維虛擬世界的文本提示。這可能會在不久之后成為可能。技術發展往往非常迅速:在人的一生之內,我們就從萊特兄弟首次實現飛行發展到了將人送上距離地球384400公里之遙的月球。而今天出生的人們,他們將目睹人工智能重塑人類生活、工作和社會的方方面面。
譯者:boxi。
Tags:人工智能GPTSHE人工智能技術應用學人工智能后悔死了人工智能考研考哪些科目GPT價格GPT幣SHE價格SHE幣
近日,歌手林俊杰曬出一個“空錢包”引發無限猜想。有消息稱,林俊杰購買的虛擬地產浮虧超90%。再加上今年以來,不少科技企業收縮元宇宙業務戰線,元宇宙要“涼涼”了嗎? 虛擬地產價格扛不住了 據多家媒.
1900/1/1 0:00:00界面新聞記者|司林威 近期飛速上升的加密貨幣市場迎來一波回調。4月21日,行情數據顯示,全球最大加密貨幣比特幣的價格在過去24小時內下跌3.4%至28,200美元.
1900/1/1 0:00:002019年5月,中國科學院深圳先進技術研究院/中國科學院深圳理工大學與澳門大學簽署戰略合作框架協議。根據協議,雙方開始合作招收聯合培養的博士研究生.
1900/1/1 0:00:00最近有一種聲音說,晚唐詩人杜牧的名詩《山行》遭到家長舉報,強烈要求從教科書上刪除。理由是,“停車坐愛楓林晚”這句有歧義,帶有性暗示,“太污”,容易影響少年兒童心理健康的發展.
1900/1/1 0:00:00首先,我們先定義一下,什么叫國際貨幣?顧名思義,國際貨幣,就是可以在國際上廣泛流通的貨幣。一種貨幣要做到在國際上能廣泛流通,其最重要的基礎就是,大家都愿意接受這種貨幣.
1900/1/1 0:00:00在經歷了2022年的動蕩之后,很多專家學者、企業家都本著從不確定中尋找確定的心路,給出對2023年零售業發展的預測.
1900/1/1 0:00:00