買以太坊 買以太坊
Ctrl+D 買以太坊
ads

RENA:AI Arena:掌握游戲機制 訓練你的下一個拳王_NAN

Author:

Time:1900/1/1 0:00:00

人工神經網絡

一個最重要的創新:人工神經網絡

簡單來講,神經網絡意味著理論上它可以學習任何用戶動作的映射!

為了介紹一會兒將使用的一些術語,從狀態到行動的映射將被稱為“策略”。

為了讓拳手的神經網絡學習策略,AI Arena將采取模擬學習和強化學習。其中神經網絡架構存儲在IPFS上。

在上圖中,神經元之間的連接稱為“權值”。當你的神經網絡正在“學習”時,所發生的是它正在改變權值的值。

RAI Finance已將團隊代幣轉移至RAI Finance DAO:9月26日消息,跨鏈交易協議RAI Finance已將團隊代幣轉移至RAI Finance DAO相關錢包地址。

據悉,SOFIP-028提案此前已通過,要求RAI Finance核心貢獻者建立一個多重簽名錢包,并將團隊代幣(SOFI)轉移到RAI Finance DAO。[2022/9/26 7:21:21]

權值最終將決定狀態如何映射到動作,這意味著我們可以將權值解釋為“智能”。

神經網絡權值對于每個NFT都是唯一的,并存儲在以太坊上。

AI設計機制全攻略

狀態

(1)什么是狀態?

狀態是環境在某個時間點的表示。它并沒有包含所有信息——只包含了其中必要的信息。

迪拜推出國家元宇宙戰略“Dubai Metaverse Strategy”:金色財經報道,據阿聯酋王儲哈姆丹·本·穆罕默德在社交媒體發文宣布推出國家元宇宙戰略“Dubai Metaverse Strategy”,旨在促進新技術的創新。目前迪拜擁有1,000多家在元界和區塊鏈領域運營的公司,為我們的國民經濟貢獻了5億美元。哈姆丹·本·穆罕默德表示,該戰略計劃在未來五年內將阿聯酋與元宇宙相關的公司數量翻一番,并躋身10大元宇宙經濟體之一,推動該國在采用數字解決方案方面處于全球領先地位。[2022/7/19 2:21:36]

例如:研究人員使用屏幕上的所有像素作為狀態,讓AI計算出像素代表什么。然后根據他們認為對決策過程重要的因素進行人工調試。

AI Arena一再強調其關心的是為所有人提供平等的機會——團隊希望獎勵能夠更多地給予堅持訓練AI的用戶,而不是獎勵擁有更多資源的用戶。

Rari Capital聯合創始人Jai Bhavnani已退出,正專注于新事物:6月11日消息,穩定幣DeFi智能投顧Rari Capital聯合創始人Jai Bhavnani發推稱,已從Rari Capital的職位上退下來幾個月,正在專注于新事物,之后將分享正在做的事情。

據領英資料,Jai Bhavnani于2020年3月至2022年4月期間擔任Rari Capital聯合創始人,于2017年創建應用程序Ambo,2019年1月Ambo被MyCrypto收購后,Jai Bhavnani擔任MyCrypto戰略副總裁至2020年6月。[2022/6/11 4:18:26]

(2)游戲將使用哪些變量?

下面是狀態中包含的變量列表。需要注意的是,AI Arena將使用下標1表示用戶自己的AI,下標2表示對手。

Huobi鎖倉DOT挖礦RAI 獎勵率達125%,鎖倉HT達308%:據Huobi 數據,用戶在Huobi Global 挖礦寶靈活鎖DOT參與RAI 新幣挖礦獎勵率達到125%,鎖HT獎勵率達到308%,鎖STPT獎勵率達到1014%。

據悉,Huobi Global“全球觀察區”將于2021年4月7日上線波卡板塊項目 RAI (RAI Finance),Huobi將于4月7日10:00 開放 RAI的充幣業務;4月7日15:00 開放 RAI幣幣交易。

同時Huobi 已上線RAI挖礦活動。4月1日至4月7日期間,用戶在Huobi 靈活鎖定HT、DOT、STPT 參與RAI 新幣挖礦,每日總挖礦獎勵為83.3萬RAI。鎖定HT、DOT、STPT 可隨存隨取。[2021/4/3 19:42:32]

此外,競技場的左邊界的X位置為0,右邊界的X位置為1。

動態 | 非盈利組織AI Grid Foundation為其區塊鏈項目募集2000萬美元:據unhashed消息,AI Grid Foundation今天宣布已經募集了2000萬美元資金用于其區塊鏈項目項目ELONCITY,該項目還將擁有自己的令牌協議,這將有助于客戶參與能源交換。核財經App注:AI Grid Foundation是一個總部設在新加坡的非營利組織,倡導使用去中心化的可再生能源來解決集中式電網面臨的緊迫問題。[2018/10/1]

訓練

(1)訓練概述

這是改變神經網絡中權值的過程,以使AI能夠起作用。

例如:如果我們在對手面前,我們可能希望我們的戰士出擊。

有一系列的權值可以實現這一點,訓練的重點是讓AI學會在特定場景中采取特定的行動。

AI Arena在應用程序中嵌入了以下培訓計劃:

模仿學習

為了學習如何戰斗,你的AI將觀察你并學習模仿你的動作。

自我學習

為了學習你無法教給它的技能,你的AI將與自己的副本對抗,以不斷提高。

(2)為什么需要訓練?

1·隨機初始化

首次創建NFT拳手時,神經網絡權值也隨之生成。一開始它會隨機采取行動,因為它不知道在什么情況下應該采取什么行動。

因此為了準備戰斗,我們必須訓練它,使它學會一個好的作戰策略。

2·隨機策略

正如上文“神經網絡”部分中提到的,從狀態到動作的映射稱為策略。

換句話說,策略定義了代理在某些情況下的行為方式。在訓練之前,NFT拳手還沒有學會一個好的戰斗策略,所以只是隨機行動。

(1)通過觀察學習

理解模仿學習的最好方法是想象你是一個師父,你的AI是一個你正在準備戰斗的戰士。

你用你的人工智能進行搏擊,它學習模仿你在特定場景中的動作。

我們正在寫一篇關于模仿學習的綜合博文,到時候會將其鏈接到這里。

(2)演示

實際情況:你實際操控的是左邊的灰色拳手,而你的AI在右邊。你可以測試一些動作,觀察AI如何模仿你。

請注意:它不會立即復刻你的動作,因為神經網絡需要一點時間來學習,所以在AI學會之前,你可能需要多重復幾次你的動作。

為簡單演示,目前AI Arena只允許用戶使用這些操作:向左跑、向右跑、單拳、雙拳和防守。

(1)完美匹配

最完美的拳擊搭檔就是用戶自己。通過自我學習,你的AI總是在不斷地挑戰自己,不斷地改進。

(2)不同的學習范式

通過模仿學習,AI通過觀看演示進行學習。在自我學習中,AI像對手一樣學習和戰斗沒有多大意義,因為對手是人工智能本身的克隆。

但是如果沒有專家向人AI展示如何戰斗,那么它如何學習該做什么呢?——通過獎勵。

AI將學會采取給予它更多正向獎勵的行動,而減少采取給予它負面獎勵的行動。

定制訓練

Python環境[正在準備中]

AI Arena計劃為玩家引入一個python環境來訓練他們自己的模型。

目前,用戶僅限于使用團隊在應用程序中提供的兩種培訓方法;但不久的將來,應用程序將可以允許玩家導入其自定義培訓模型并上鏈。

游戲模式探索

戰斗

AI Arena目前有兩種可用的作戰模式:模擬賽和排位賽。除此之外,團隊計劃在不久后整合另外兩種作戰模式。

1)模擬賽

玩家可以在對抗競技場測試他們的拳手來預先訓練的AI。在這種模式下將沒有任何獎勵。

2)排位賽

玩家將讓他們的拳手去對抗來自世界各地的拳手。玩家的唯一目標就是努力攀登排行榜,成為競技場的冠軍!

玩家在排行榜上的排名越高,贏得一場戰斗的回報獎勵就越高。

3)目標

雖然每種戰斗模式都有其獨特之處,但它們都有一個共同的勝利目標:在指定的時間內消耗對手所有生命值。

鏈金交易員總結

目前AI Arena尚處在早期,很適合提前埋伏觀察。據官方透露,游戲正式版本大概率于明年推出,而今年年末推出的測試版本將只有白名單用戶可以參與體驗。

白名單用戶名額的獲取方式是參與團隊即將推出的解密游戲,通過游戲后的用戶將會被隨機選擇是否進入白名單。

有興趣的玩家可以加入他們的Discord嘗試體驗,大概率后期會有早鳥空投獎勵。

Tags:RAINANRENRENARai Reflex IndexSimpli FinanceFRENMiner Arena

比特幣最新價格
SHO:三分鐘速覽ShowMe 打造Web3上的NFT社交Club_SHOW

ShowMe SocialFi、NFT、Web3ShowMe隸屬于Gryffindor Labs,是一款建立在Web3上的NFT社交訂閱平臺.

1900/1/1 0:00:00
SHEEP:Sheepdex:不僅僅是 BSC 鏈上的 Uniswap V3_unshETH

在本輪加密貨幣牛市中,最大的創新之一就是 DeFi 了,DEX、去中心化借貸、合成資產等得到了巨大的發展,而在這些 DeFi 細分賽道中,對我們影響最大的要屬 AMM 模式 DEX 的興起了.

1900/1/1 0:00:00
PEG:淺析東南亞Pegaxy賽馬游戲_TIM

首先看下項目白皮書 Pegaxy是一款玩家贏取PVP風格的賽馬游戲,玩家可以與其他11名賽車手爭奪前3名的位置。每個種族都有隨機的元素變量,包括風,水,火,速度等.

1900/1/1 0:00:00
FAIR:隱私公鏈Findora首個DEX「FairySwap」冷啟動 普通用戶如何參與?(附教程)_Internet Computer(Dfinity)

以隱私為中心的公鏈Findora在完成主網完全EVM兼容后,成功上線首個DEX — FairySwap.

1900/1/1 0:00:00
TLM:三分鐘讀懂 Alien Worlds:融合 DeFi、NFT 與 DAO 的太空探索游戲_tlm幣未來價格

撰文:Groot 去年夏天以來,DeFi 以及 NFT 概念的先后爆發促成了加密貨幣市場有史以來最長的一輪牛市,不過正如 DeFi 快速發展過程中所「倚仗」的高度可組合性這一特征.

1900/1/1 0:00:00
EVER:新Dapps報告:Worldwide Webb_Microverse

這份新的Dapps報告著眼于Worldwide Webb,一個使用Web3錢包通過任何瀏覽器都可以訪問的區塊鏈虛擬世界。我們深入探討了該項目最近的成功,并強調了它在市場上的表現.

1900/1/1 0:00:00
ads