買以太坊 買以太坊
Ctrl+D 買以太坊
ads
首頁 > Gateio > Info

TOC:主網上線在即,AI 數據的分布式存儲協議 EpiK 如何變垃圾數據為有效數據?_EpiK Protocol

Author:

Time:1900/1/1 0:00:00

撰文:ZeoZhang

來源:鏈聞ChainNews

騰訊創始人馬化騰曾在2017年「邁進智能新時代」中國IT領袖峰會上坦言:

目前很多大數據是垃圾數據,因為沒有標簽,用再好的算法也算不出來,數據清洗、標簽化難度非常高,我們甚至要耗費很多人工先清洗數據,再讓AI學習。

一席話道出人工智能發展難點。在互聯網計算機迭代數十年后,算法和算力的積累已將人工智能推向一個新的階段,但缺乏高質量的有效數據,成為掣肘人工智能發展的重要原因之一。在解決這一問題上,測試網已經平穩運行一年的AI數據的分布式存儲協議EpiKProtocol提出了結合區塊鏈的解決方案。

2021年8月15日,測試網已經平穩運行一年的AI數據的分布式存儲協議EpiKProtocol將正式上線主網。作為一個首次集數據標注、分布式存儲以及數據應用等功能于一身的項目,EpiKProtocol嘗試解決市場缺乏有效數據問題,構建共建共享共益的AI數據的分布式存儲協議?

為什么缺乏有效數據?

一方面,平臺默許甚至鼓勵虛假的刷數據行為,造成無用數據橫行。

對于傳統互聯網行業來說,刷數據現象司空見慣:新開的網店九成以上會選擇刷單吸引客流量;即使是訂閱量超百萬的微信大號也經常通過刷閱讀量滿足廣告客戶的數據需求;更甚者,某旅游平臺曾被爆出通過機器+人工的形式,冒充用戶發表了數千萬的用戶評價,以假亂真,影響用戶對產品的真實測評。

Etherscan將于3月1日在以太坊主網上執行預定服務器維護和升級:金色財經報道,區塊鏈瀏覽器Etherscan發推表示,將于3月1日13:30在主網上執行預定服務器維護和升級,預計維護時間為 2 至 4 小時,在維護期間新區塊不會更新,合約驗證也不可用。[2023/2/28 12:34:28]

對于一向標榜公開、透明、鏈上可追溯的區塊鏈行業來說,刷數據現象仍不鮮見,分布式存儲領域明星項目?Filecoin?也曾陷入「無效數據」質疑:在Filecoin網絡剛上線時,較高的挖礦收益吸引大量礦工參與,甚至有部分礦工利用外部程序進行灌裝虛擬數據或自己封裝一些毫無價值的垃圾數據。

Filecoin存儲算力快速暴增,從而導致存儲的數據量短時間爆增。再加上Filecoin網絡一開始無法對存儲的數據進行分辨,真實有效數據極少,大量物理存儲被浪費,對整個Filecoin生態發展帶來不良影響。

另一方面,數據處理成本居高不下,多數人工智能不堪重負。

眾所周知,人工智能需要不斷深度學習,這需要龐大的數據量支撐。

龐大的用戶群體每天活躍在互聯網中,產生龐雜的數據。然而這些數據并不能被直接使用。人工智能的深度學習需要數據集的獲得、數據的標注等,其中數據的標注會造成巨大的人力成本。

Tezos在其主網上激活Kathmandu升級:金色財經報道,根據開源區塊鏈平臺Tezos團隊,Kathmandu的升級于美國東部時間周五下午4點30分在Tezos PoS主網的2,736,129區塊激活。這是Tezos自2018年成立以來的第11次升級,也是一次有可能改善擴展性的升級。(The Block)[2022/9/24 7:19:05]

廣泛應用深度學習網絡需要大量已標注的數據進行訓練才有可能達到預期的效果,但大數據時代下,雖然有海量的數據取之不盡,絕大部分卻是未進行標注的數據,這些訓練數據的標注需要人為進行。

對于數據品質要求越高,數據的標注需求就越精細,對標注人員的素質和專業知識的要求也就越高,相對應成本也越高。

長久以來,這些數據都由專門的數據標簽分類公司進行加工處理,以供人工智能等數據需求領域發展使用。然而,用戶-數據處理公司-數據需求者的三方協作,使得有價值的數據獲取成本極高。

標注、存儲、銷售:EpiKProtocol的一站式數據服務

EpiKProtocol生態引入領域專家、賞金獵人、數據企業三類角色,致力于構建去中心化的大規模共建共享共益的AI數據存儲協議,通過去中心化存儲技術IPFS、去中心化自治組織DAO及通證經濟模型,組織并激勵全球社區成員將人類各領域知識梳理成可用的AI數據,并持續更新這一人類永恒知識庫。

加密隱私貨幣協議Zcash NU5升級在主網上激活,增強隱私并消除可信設置:6月1日消息,加密隱私貨幣協議 Zcash 的 NU5 升級于區塊高度 1687104 (約北京時間 1:56)在主網上激活。Zcash 表示,NU5 是自 2020 年 11 月以來的首次重大升級,此次網絡升級包括 Halo 零知識證明系統的首次實施、Orchard 屏蔽支付協議的推出以及統一地址類型的引入。Zcash 還計劃于今年晚些時候在 Android 和 iOS 商店上線其 ECC 錢包(尚未正式命名)。

此外,團隊注意到一些 zcashd 節點在 NU5 激活后遇到導致崩潰的競賽條件,團隊建議重新啟動節點解決該問題。[2022/6/1 3:54:44]

在數據標注方面,EpiKProtocol連接C端用戶推出AI數據標注系統。

「領域專家」設計不同領域的AI數據格式,并發布數據標注任務;人人都能注冊成為「賞金獵人」,參與數據標注成為AI老師,獲得EPK代幣獎勵。

完成數據標注后,「賞金獵人」返還處理過的數據,「領域專家」驗收所負責領域AI數據獲得EPK代幣獎勵。此外,「領域專家」還會根據數據結果優化AI數據格式,良性循環下,數據質量得到不斷提升。

在數據存儲方面,EpiKProtocol推出AI數據存儲系統。

鏈上ChainUP VP Jade Chen:Filecoin挖礦入局者會在主網上線后迎來真正的考驗:IPFS100.com現場報道,8月3日,由IPFS100.com主辦,CapitalN節點咨詢承辦,金色算力云聯合主辦,深圳市先河系統技術有限公司金牌贊助,逆熵科技銀牌贊助,金色財經作為聯合主辦媒體的星際漫游指南·逐鹿中原·IPFS技術與應用研討論壇在鄭州舉行。

在主題為《Filecoin離落地商用還差什么》的圓桌環節,鏈上ChainUP VP Jade Chen表示,Filecoin主網上線后可能會面臨一地雞毛的局面,但是雞毛里能否飛出火鳳凰,時間會告知我們答案。

她還指出,提到IPFS背后更多的是新基建。今年,政策層面在新基建方面給予了極大的支持,但是距離IPFS商業落地,還有一定的距離。[2020/8/3]

完成標注并通過驗收的數據將由「領域專家」上傳至AI數據存儲系統進行分布式存儲,參與數據存儲的設備也都可以獲得EPK代幣獎勵。

在數據銷售方面,數據企業可通過質押EPK來訪問數據,并從AI數據存儲系統中付費下載有效數據。

由于EpiKProtocol的AI數據標注系統直接面向C端用戶,消除了中間戶數據標注公司的存在,簡化了數據處理流轉的各個環節,因此成本更低。以一條可用的AI語音方言數據為例:傳統市場一條可用數據成本約在12元左右,而在EpiKProtocol系統成本約為2元,是傳統市場的1/6。

動態 | Kadena公鏈的主網上線,將進行第三次代幣銷售:金色財經報道,區塊鏈平臺服務提供商Kadena的公共區塊鏈Chainweb本周一正式啟動主網,該區塊鏈為類似于比特幣的PoW網絡。Kadena試圖通過將多個PoW區塊鏈編織在一起并發運行來解決可擴展性有限的問題。此外,Kadena還將于11月5日至11月22日舉行第三次代幣銷售,計劃籌資2000萬美元。將在CoinList上進行兩項并排的代幣銷售。其中一項是面向未經認證的非美國的投資者。一項將作為未來代幣簡單協議(SAFT)執行,僅對美國境內或國外的合格投資者開放。

該項目由投行巨頭摩根大通的前區塊鏈負責人Stuart Popejoy和摩根大通的區塊鏈原型Juno的首席工程師Will Martino共同創立。[2019/11/5]

更重要的是,由于EpiKProtocol系統中有來自各行各業的「領域專家」把關數據治理,因此EpiKProtocol系統產生的有效數據更能夠精準符合不同AI領域的數據需求。

協同B端、C端和行業專家的開放經濟模式

不同于目前分布式存儲主要圍繞B端歸檔數據存儲服務的商業模式,EpiKProtocol是一個協同B端企業、C端用戶和領域專家的去中心化協同AI數據存儲協議,在成本控制、收益提升和服務體驗方面,都具有媲美中心化互聯網巨頭的能力。

C端用戶:更低的數據標注門檻

EpiKProtocol針對C端用戶打造了AI數據采集應用「知識大陸」,降低了數據標注門檻,同時提升了趣味性。卡通的界面和簡明的布局讓數據標注這種枯燥而繁雜的工作變為有趣的游戲,通過游戲化形式組織其全球社區成員共建大規模開放AI數據庫。

各行各業都可以在「知識大陸」中創建AI數據類型,包括金融、醫藥、法律、社交、電商等,未來隨著知識大陸的發展和運用,有數據需求的公司都可以選擇在此進行共同協作收集整理并處理數據。

其次,EpiKProtocol的標注效率更高。AI數據標注系統運營三周以來,EpiKProtocol標注了17272條有效數據,且數據指標完整,每條數據被人工驗證次數高達10次。相比較于傳統標注方式,EpiKProtocol的標注效率高了近乎10倍。

最重要的是,參與EpiKProtocol數據標注的用戶能夠獲得更高收益。傳統數據標注模式中,數據處理者僅作為一種人工勞動力,并不享有數據分紅權。而在EpiKProtocol中,對數據做出貢獻所獲得的EPK實際是獲得了數據的股權,分享數據在后續使用過程中的盈利分紅。后期數據需求越大,EPK需求就越高,EPK便會升值,EPK持有者便可以獲益。

B端用戶:激勵有效數據

EpiKProtocolAI數據存儲系統采取經典的1+3配置,即1Deamon+3Miners配置。與Filecoin相比,EpiKProtocolAI數據存儲系統參與出塊最小算力為0、存儲免費,無需指定節點且默認無限份數、無限時間,更能夠充分調度起每臺閑置存儲設備。

最重要的是,Filecoin存儲無用數據也可獲得算力,但EpiKProtocol存儲系統中只有通過「領域專家」驗證過的數據才可獲得算力,這不僅保障了數據的高質量,而且進一步遏制了無效數據浪費存儲空間的不良影響。

項目團隊

EpiKProtocol擁有行業頂級顧問以及實力派投資機構。著名AI科學家、SigularityNET創始人、全球首個機器人公民Sophia之父的首席科學家BenGoertzel出任EPIK?銘識協議顧問,協助EPIK推動歐美數據市場,助力構建高質量的AI數據生態。

融資方面,EpiKProtocol獲得了包括FBGCapital、JACKDAW、1475、ChainUpCapital、7O'clockCapital等機構的青睞,助力AI數據的分布式存儲以新的勢頭進入大眾視野。

主網即將上線

根據團隊最新消息,EpiK「主網1.0羅塞塔」將于2021年8月15日中午12點正式上線。該時間也是EpiK測試網上線1周年的時刻。目前測試網5.0在測節點已超過6萬個,穩定出塊。

隨著主網的日益臨近,挖頭礦也成為EpiKProtocol用戶的關注焦點之一。作為EpiKProtocol生態激勵代幣,EPK總發行量為10億,其具體分配規則如下:

1.創世團隊:5%,每90天釋放1/16;

2.基金會:5%,每90天釋放1/4;

3.投資人:20%,每90天釋放1/7;

4.社區:70%,出塊速遞每90天衰減一次,4年減半,分50年釋放完畢。

EpiKProtocol擁有AI數據標注和AI數據存儲兩大系統,也對應了兩種主要參與方式:

第一類,參與標注AI數據,成為EPK賞金獵人。利用閑暇時間參與標注不同AI領域數據,完成任務越多,EPK收益越高。認真答題還有機會贏取知識徽章NFT,后續可憑借NFT參與EPK空投活動。

第二類,參與存儲AI數據,成為EPK存儲節點。利用閑置的存儲設備即可參與存儲AI有效數據,每個存儲節點需要完成1000EPK的基礎質押才能擁有出塊權。存儲節點是隨機獲得出塊機會的,但是其隨機被選中的概率和其成功存儲的數據大小掛鉤:存的數據越多,被選中概率越高,同一個文件的Top100存儲者享有雙倍算力。

只有通過領域專家驗證過的數據才被計為有效存儲,存儲節點才能獲得算力,因此,為了獲取更多的有效存儲,就需要完成額外的流量抵押。1EPK可以用于訪問10Mib數據,也可用于封裝10Mib數據。目前,基礎抵押提現的解鎖期為0天,流量抵押提現的解鎖期為3天。

結語

EpiKProtocol還開啟了在分布式治理領域的探索,于7月20日發布了EpiKDAO。作為分布式存儲賽道首個DAO治理模型,社區用戶可以借助EpiKDAO參與EpiK生態資源的動態調節,有效保障EpiK社區的可持續發展,修復未來可能發生的資源錯配問題。

隨著Web3.0時代的日益來臨,數據的重要性日益凸顯。EpiKProtocol從數據標注到數據分布式存儲再到對接企業實現數據應用,打造了一個低門檻、高效率的數據收益共享閉環,未來EpiKProtocol如何實現豐富的落地應用場景值得期待。

Tags:EPIKPROTTOCPROEpiK ProtocolRobinHoodProtocolQuickX ProtocolProject Coin

Gateio
CEO:英偉達財報:加密貨幣“挖礦”用的芯片產品CMP當季銷售額僅為2.66億美元_Armacoin

鏈捕手消息,美國芯片巨頭英偉達發布了截至8月1日的公司2022財年第二季度財報,財報顯示,英偉達在截至8月1日的2022財年二季度營收65.1億美元,至少連續三個季度創新高.

1900/1/1 0:00:00
DEFI:Synthetix 創始人:關于 DeFi、NFT、藝術和游戲交叉點的思考_syn幣前景

本文作者是Synthetix創始人KainWarwick,并由鏈聞翻譯。最近我一直在思考DeFi、NFT、藝術和游戲的「交叉點」.

1900/1/1 0:00:00
ATRI:加密金融服務平臺 Matrixport 完成1億美元融資,計劃3-5年內上市_MATRIX

作者:胡韜 今日,加密金融服務平臺Matrixport宣布以10億美元融前估值完成C輪融資,融資規模超過1億美元.

1900/1/1 0:00:00
NFT:NFT 音樂平臺 Catalog 完成 220 萬美元融資,1confirmation 領投_PRI

鏈捕手消息,NFT音樂平臺Catalog完成220萬美元融資,1confirmation領投,Inflection、DelphiDigital、WndrCo和天使投資人CooperTurley、.

1900/1/1 0:00:00
KBI:咨詢公司埃森哲遭比特幣勒索軟件攻擊,數據已在暗網泄露_LOCK

鏈捕手消息,財富500強、咨詢公司埃森哲遭遇了黑客組織Lockbit的比特幣勒索軟件攻擊。Lockbit發布勒索消息稱會在幾小時內發布從該公司竊取的數據,除非埃森哲想買回它們.

1900/1/1 0:00:00
GUILD:Yield Guild Games 獲得 a16z 領投的 460 萬美元融資,Kingsway Capital等跟投_ELD

鏈捕手消息,去中心化游戲公會YieldGuildGames宣布完成460萬美元融資,由風險投資機構AndreessenHorowitz領投.

1900/1/1 0:00:00
ads