雷鋒網按:自從比特幣的價格暴漲以來,關于數字貨幣的炒作一直不斷。每天都有新的數字貨幣的信息,它們有的被證實是騙局,有些則會在幾個月成為新的頂級貨幣。炒幣人士通常會為了一個傳言而買入賣出,自然,也會有人嘗試用機器學習來對數字貨幣的價格變化進行分析,來找出影響數字貨幣價格變動的因素。近日在外媒Medium上,就有一位叫做ChalitaLertlumprasert的博主發表了如何用機器學習來預測數字貨幣價格變化的文章,雷鋒網整理如下:
機器學習分析數字貨幣價格變化的原理
在經典的時間序列分析中,我們認為觀察到的時間序列是模式和隨機變量的組合。使用這種方法,我們可以根據歷史數據預測未來的價值。這種方法在大多數情況下可行,但是如果這個時間序列更加隨機化呢?如果一個時間序列主要是基于當前事件的推測,而不是具有一定的內在模式呢?嗯,你一定猜到了,低價數字貨幣就是這樣。
那么,究竟是什么在推動數字貨幣的價格?對于數字貨幣的猜測?創新?法律問題?公眾輿論?供給/需求的變化?比特幣的流行程度?甚至,土豪心血來潮決定購買一百萬個代幣?OK,現在是讓數據說話的時候了。
那么,影響加密價格的因素是?
美聯儲古爾斯比:尚未對下一步利率行動做出決定:金色財經報道,芝加哥聯儲主席古爾斯比表示,有關美國通脹放緩的數據是個“好消息”,但現在尚未決定是否應在下次政策會議上支持暫停加息。“對于9月份的利率行動,我還沒有下定決心,”他周一說。“我們迄今還走在一條黃金路徑上,它將通往勝利,目前看這種可能性是肯定存在的”。古爾斯比指的是在不觸發衰退的情況下,通脹可以達到美聯儲目標。今年有貨幣政策投票權的古爾斯比表示,對于政策利率是否具有限制性,美聯儲必須“見機行事”。他說“在下次會議之前,我們將獲得幾個主要數據點,但看起來我們取得了很好的平衡。”[2023/7/31 16:09:37]
因素1:許多人說,答案是比特幣。區塊鏈技術是首先由比特幣實施的分散式數據庫系統,被認為是極有可能改變現代商業模式的一種技術趨勢。隨著比特幣備受關注,人們不斷推出也基于區塊鏈技術的替代數字貨幣。從某種意義說,比特幣幾乎是所有數字加密貨幣之母,其首先應用了這個行業的基本技術。這就是為什么我認為當比特幣價格飆升時,所有其他數字貨幣都會隨之上升,反之亦然。以下圖表是比特幣和以太坊的價格變化曲線。
正如你所見,這當中的對應關系看起來相當準確。但是,如果沒有統計方法上的證明,我們不會急于下結論。稍后,我們將更多地討論使用格蘭杰因果檢驗來確定一個“協整關系對”。
SBF律師否認在刑事欺詐案中的證人篡改指控:金色財經報道,在最近給主審法官的一封信中,FTX創始人Sam Bankman-Fried(SBF)的法律團隊堅決否認在刑事欺詐案中篡改證人的指控。律師們強烈反駁了檢方的指控,聲稱SBF與《紐約時報》記者的討論遠不構成篡改證人。律師表示,他確實與《紐約時報》記者接觸過,甚至分享了某些個人文件。然而,他的當事人沒有違反任何有關此案的保護令,也沒有違反任何保釋條件或管轄其行為的法律法規。[2023/7/25 15:56:15]
因素2:很明顯,法律因素或其他足以影響游戲規則的技術手段也在影響數字貨幣的價格。去年九月中國禁止數字貨幣的時候,所有數字貨幣價格迅速下降,一切都陷入混亂。為此,我們從PytrendsAPI獲取重大事件的GoogleNews搜索頻率數據。下面的圖表中的紅色曲線顯示了當數字貨幣價格下降時,“數字貨幣”的搜索頻率達到峰值。
很有意思吧?在本項目中,搜索的關鍵詞由Google關鍵詞工具選擇,這個工具不僅讓你知道關鍵詞的流行程度,還提供了相關關鍵詞的列表。通過所提供的列表和PytrendAPI,我們獲得了七個不同的關鍵詞的搜索頻率數據。在稍后的章節中我將詳細介紹這些術語。
彭博社:加密公司在英國難以獲得銀行服務:4月3日消息,多位消息人士表示,加密公司在英國難以獲得銀行服務。少數仍在與加密公司合作的銀行要求提供更多關于他們如何監控客戶交易的文件和信息。加密公司的挑戰包括面臨申請被拒、賬戶被凍結和繁重的文書工作。
Coinbase國際政策副總裁Tom Duff-Gordon表示,英國銀行業的反應比歐盟反應更為敏銳,而歐盟為建立數字資產框架所做的努力正在使銀行更容易接受其他國家的加密公司。
PitchBook數據顯示,到2023年為止,英國對數字資產公司的風險投資下降了94%至5500萬美元,而歐洲其他國家則增長了31%。加密公司正在轉向BCB Payments和Stripe等支付服務提供商,以維持在英國的業務運營。(彭博社)[2023/4/3 13:41:11]
因素3:公眾的認知也是另一重要影響因素。購買越多,需求越多,數字貨幣價格就越高。要得到這些數據些難度,付費的TwitterAPI可以解決這個問題,但因為窮,我更希望把這筆錢花到其他地方。我選擇的是redditmetrics.com,該網站可以統計Reddit所有子話題的歷史訂閱增長數據。下面則對Nem的子話題訂閱增長與新的歷史價格進行了比較。
幣安24小時凈流出約8.31億美元,創去年11月以來最大單日凈流出量:2月14日消息,Nansen數據顯示,加密交易所幣安在過去24小時內凈流出約8.31億美元,為自2022年11月最大單日凈流出量。投資者似乎受到了監管機構對Paxos發行的BUSD穩定幣的打擊,因此正在減少他們在該平臺上的持有量。
此外,數據顯示,幣安用戶在過去24小時內提取了約28億美元的數字資產,超過了同期的20億美元存款。(CoinDesk)[2023/2/14 12:05:22]
正如預期的那樣,訂閱的增長與價格趨勢變化有著高度的重合。
以上展示只是為了讓你對這一領域有一個初步的了解,并向你介紹我們正在試圖解決的問題。在我的GitHub上可以看到一個完整的EDA,接下來,我將介紹一個預測硬幣未來價格的模型的統計方法。
如何建立模型?
在本節中,我們將深入探討方法論。這里僅僅是每一步的總結,如果你想對代碼深入挖掘,請參閱我的GitHub庫。
1確定協整關系對
我們通過CryptocompareAPI獲得了12種主要數字貨幣的價格歷史數據。在我們對時間序列做任何事情之前,我們必須確保時間序列是固定的。為了滿足平穩性的要求,時間序列必須具有常數均值、常數方差和自相關常數。而在現實中,完美定態的時間序列是不存在的,但無需擔心,我們有迪基-福勒檢驗!
比特幣全網未確認交易數量為9144筆:金色財經報道,BTC.com數據顯示,目前比特幣全網未確認交易數量為9144筆,全網算力為257.07EH/s,24小時交易速率為3.14交易/s,目前全網難度為36.76 T,預測下次難度下調0.54%至36.96T,距離調整還剩1天。[2022/11/20 22:08:27]
擴展迪基-福勒檢驗是一個統計測試,可以測試一個自回歸模型是否存在單位根。測試采用自回歸模型,并通過不同的滯后值對信息因素進行優化。當中的零假設是時間序列可以用單位根表示。在統計學上,如果你的P值小于0.05,這意味著可以拒絕零假設。但是——再一次強調——對于特定問題,結果應該是可解釋和有意義的。事實證明,設定0.05的門檻,所有12種硬幣的歷史價格都不會通過定態測試,在這種情況下,我們要對時間時間序列定態化和重新進行測試。
差分化:這是用來對時間序列定態化的一種常用方法,可以消除趨勢和季節性。在本項目中,我們對連續觀測的差異進行了差分化。如果一個時間序列具有季節性因素,則滯后值應該是季節性的周期。在數字貨幣的例子中沒有明顯的季節性成分。下面的箱線圖表明,以太坊在一天24小時內每小時的價格平均值相對恒定。其方差不同,但沒有明顯的模式。而在對時間序列進行了滯后差分后,所有的12種貨幣都通過了迪基-福勒檢驗。
格蘭杰因果關系檢驗:這是一種統計假設檢驗,用于確定一個時間序列是否有助于預測另一個時間序列。在這里,我們用格蘭杰因果關系檢驗來確某一數字貨幣的價格滯后值是否可以用于預測其他硬幣的未來價值。
既然12個錢幣的歷史價格數據是定態的,我們構建了一個總的132組不同貨幣的數據對,每一個數據對都是某數字貨幣對應于其他數字貨幣的歷史價格,用于進行格蘭杰因果關系檢驗。檢驗的零假設是:每一個貨幣數據對中,后一種數據貨幣沒有對前一種數據產生影響,在測試之后后我們初步發現,達世幣H與比特幣現金之間相關性最強,但進一步的研究結果表明,這種強烈的相關性是由于來自韓國交易的激增。考慮到這不是一個正常的交易,因為這不是一個正常的情況下,我們選擇了XEM-IOT這一對相關性最強的貨幣對,在本項目中,我們將用IOT的歷史來對XEM的價格進行預測。
2.特征選擇
數據查詢。以下是分析的數據及其來源:
CryptocompareAPI:XEM和IOT的歷史價格,每小時;PytrendsAPI:GoogleNews對“Cryptocurrency”關鍵詞的搜索頻率;redditmetrics.com數據:對”Cyptocurrency”、“Mem”、“IOT”子話題訂閱量的增長PytrendsAPI:對“Nemwalletdownload“、“Iotawalletdownload”,“Nemprice”,Iotaprice”,Bitcoinprice”,“GPUformining”等Google關鍵詞的搜索頻率——這些關鍵詞基于Google關鍵詞工具挖掘。YahooFinancialAPI:AMD、NVIDIA兩大挖礦軍火商的股票價格
ElasticNet回歸、正則化:上述查詢數據可能存在關聯性,如在“Bitcoinprice”和“CryptoCurrency”可能包含類似Google搜索頻率信息,谷歌搜索頻率。使用類似的特性構建模型會造成冗余并影響預測結果。ElasticNet可將冗余預測系數縮小到零。
在本項目中,我們對上述13個特征變量用ElasticNet回歸正則化,其中因變量為XEM的歷史價格。經過算法處理后,最終剩下三個具有非零系數的預測因子。這些特性將用于構建最終模型。我同樣也用也試著用13個特征建立了一個模型,與使用選定的3個特征建立的模型相比,性能差異并不顯著。最終我選用了3個特征的模型。
3.建立模型
在本項目中,我們使用ARIMAX模型來預測XEM的未來價格。ARIMAX模型如同ARIMA模型通過自回歸和移動平均值進行預測,但ARIMAX可包含其他外生變量,在此我們使用的是之前選擇的3個外生變量。
數據預處理:我們之前已經提到了定態性和迪基-福勒檢驗的相關內容,在此不再展開。這些書在ElasticNet前已經標準化過了,我們只需進行差異化處理,并確保其通過了迪基-福勒檢驗。之后數據被清理并分成測試集和訓練集。
ACF&PACF:數據已經確定,我們需要1)確定時間序列是自回歸或是移動平均過程;2)確定我們需要在模型中使用自回歸和移動平均過程的順序。ACF可以回答第一個問題,也可以用于確定移動平均序列中的滯后階數。下圖為XEM歷史價格的ACF和PACF。
正如我們所見,這是一個自回歸過程,因為ACF沒有截止值。PACF在滯后滯后有一個截止值,這將是我們用于ARIMAX模型的參數。
ARIMAX:使用AR1和3個外生變量。下圖是與實際值比較的擬合值。
用擬合出的模型得出的XEM價格預測。下圖是基于XEM樣本對未來600步的預測值。
如我們預期,該模型在開始的表現更好,而隨著時間的推移,預測誤差也在不斷增加。在1-100步內,預測的均方誤差為0.039,而101-600步的均方誤差為0.119。
總結
我們用IOT的歷史價格以及對“NemPrice”的Google搜索量、“Nem”子條目的訂閱量增長建立ARIMAX模型來預測NEX的數字貨幣價格。在100小時以內,預測結果是可以接受的,超過100小時后就不能看了。
這是我的第一個數據科學項目,還有很大的改進空間。如果使用付費的Twitter數據或者使用不同的機器學習模型可能會顯著提高其性能,目前我會考慮提出一個能用于自動交易的交易信號算法,但摸摸我的錢包,我不禁流下了悲傷的淚水。
我希望你能像我喜歡寫這篇文章一樣喜歡這篇文章!如果你有任何想法,請留言讓我知道。
Tags:數字貨幣比特幣XEM十大數字貨幣交易所排名數字貨幣交易所官方網址數字貨幣詐騙案例視頻比特幣中國官網聯系方式40億比特幣能提現嗎比特幣最新價格行情走勢XEM價格XEM幣
世界上有一群人,互聯網對于他們來說就是提款機。是的,過去是,現在更是,因為電子貨幣的出現,他們提款的速度變得更瘋狂.
1900/1/1 0:00:00上一篇文章《又是核爆!仰天長嘆!》不僅被刪,而且被連根刪除,所以連回復“170904”也看不到了。算了,關于警察和潮蘚核爆,我我不說了,不說了……有人說,我說這些內容掉粉,這我承認.
1900/1/1 0:00:00編者按:這里是36氪推出的欄目,盤點當天國內外投融資動態。今日國內的焦點是小碼聯城獲得2.0億人民幣天使輪融資,海外的投融資關注重點則是Daimler收購ChauffeurPrivé.
1900/1/1 0:00:001.概覽 BitZ幣在研究院一直密切關注波卡生態及其PLO競拍,在波卡平行鏈競拍即將開始之前,我們把對波卡平行鏈競拍規則、競拍的經濟模型測算等研究成果向大家分享.
1900/1/1 0:00:00人類社會,已經經歷了四次工業革命。第一次工業革命,以蒸汽機、火車為代表,人類進入了蒸汽時代;第二次工業革命,以電力、汽車為代表的,人類進入電氣時代;第三次工業革命,以計算機、航空航天為代表,人類.
1900/1/1 0:00:00以太坊是一種基于區塊鏈技術的智能合約平臺,它于2015年由VitalikButerin等人開發.
1900/1/1 0:00:00