樸素貝葉斯分類器進行股價趨勢分類預測
原理
貝葉斯定理
模型思想
1、在風險識別中,貝葉斯模型本質上也是一種已知結果找原因的思維工具。
2、在風險決策中,利用貝葉斯模型的基本思想是充分利用先驗信息,將先驗分布和抽樣分布整合成后驗分布,從而利用后驗分布進行決策。如果有新的信息,則更新后驗分布,實現遞歸決策方案。從而得到最優策略,使得決策風險盡可能低。在概率統計的表述是:應用所觀察到的現象對有關概率分布的主觀判斷進行修正的標準方法。
3、在分類預測中,樸素貝葉斯的思想基礎是這樣的:對于給出的待分類項,求解在此項出現的條件下各個類別出現的概率,哪個最大,就認為此待分類項屬于哪個類別。
概率論基礎
要理解貝葉斯模型,必須先理解貝葉斯定理。貝葉斯定理實際上就是計算“條件概率”的公式。
聯合國報告:朝鮮黑客將加密貨幣和全球其他金融交易所作為目標:金色財經報道,據路透社獲取的一份未發表的聯合國報告,朝鮮在 2023 年繼續發展核武器并生產核裂變材料,并逃避聯合國旨在切斷平壤核計劃和彈道導彈計劃資金的制裁。報告表示,在 2022 年網絡盜竊達到創紀錄水平(估計價值 17 億美元)之后,朝鮮黑客繼續將網絡加密貨幣和全球其他金融交易所作為目標。報告的執行摘要寫道,朝鮮繼續進入國際金融體系并參與非法金融活動,加密貨幣、國防、能源和衛生領域的公司尤其成為目標,
據悉,該報告將于未來幾周內發布,這些監察員每年向聯合國安理會報告兩次,此前曾指責朝鮮利用網絡攻擊為其核計劃和導彈計劃提供資金。[2023/8/11 16:19:41]
條件概率
條件概率,是指在事件B發生的情況下,事件A發生的概率,用P(A|B)來表示。其公式為:
上式可轉化為:
觀點:美國需要改變對加密貨幣監管的態度:金色財經報道,《創智贏家》成名的Kevin O'Leary對美國政府處理加密貨幣監管的方式感到擔憂。他表示,聯邦政府不太關心政策,而更關心采取快速行動,而這又會損害創新。他表示,目前,在加密貨幣方面,政策就是美國所需要的。他評論說,政府不需要做任何花哨或特別的事情。它只需要實施正確的規則來確保該行業對所有人來說都是安全和健康的。
O'Leary指出,我并不是在尋求聯邦政府提供創新。我正在尋找他們提供政策。我們不需要他們來開發任何東西。我們要做的是授權多種穩定幣,所有這些穩定幣都由美元支持,并讓它們在市場上競爭。他還表示,他認為采取更多行動確保所有加密貨幣公司都使用清潔能源運行非常重要。如果加密貨幣公司繼續走過去幾年的道路,將遭受嚴重損失。[2023/7/1 22:11:20]
稱為乘法公式。
全概率公式
數據:比特幣NFT協議Ordinals昨日銘文鑄造量超19萬枚,創歷史新高:4月24日消息,據 Dune Analytics 數據顯示,由軟件工程師 Casey Rodarmor 推出的比特幣 NFT 協議 Ordinals 于 4 月 23 日單日銘文鑄造量超 19 萬枚,創歷史新高。其中文本類型的銘文數量為 190,202 枚,占比達 98.5%。基于比特幣 NFT 協議 Ordinals 鑄造的銘文總量已達 158 萬枚,迄今產生的總費用達到 181 枚 BTC。[2023/4/24 14:23:43]
設試驗E的樣本空間為S,A為E的事件,B1,B2,…,Bn為S的一個劃分,則全概率公式為:
模型公式
公式
通常,事件A在事件B(發生)的條件下的概率,與事件B在事件A的條件下的概率是不一樣的;然而,這兩者是有確定的關系,貝葉斯法則就是這種關系的陳述。
Coinbase:已完成Flare(FLR)空投分發:4月16日消息,Coinbase Asset在社交媒體宣布Coinbase已完成Flare(FLR)代幣空投分發,超過6.01億枚Flare(FLR)代幣被分發給符合條件的用戶,本次空投基于2020年12月12日Coinbase用戶持有的XRP余額分發(包括Coinbase交易所和Coinbase Pro賬戶)。目前,XRP交易在Coinbase平臺上仍處于暫停狀態。Coinbase首席法律官Paul Grewal此前表示只有Ripple與美國證券交易委員會訴訟裁決之后并獲得監管明確性,才能在該平臺上重新上市。[2023/4/16 14:06:59]
設試驗E的樣本空間為S,A為E的事件,B1,B2,…,Bn為S的一個完備事件組,則:
其中:P(Bi):Bi的先驗概率或邊緣概率。之所以稱為“先驗”是因為它不考慮A任何因素的影響。P(Bi|A):已知A發生后Bi的條件概率,即由于得知A的取值而被稱作Bi的后驗概率。P(A|Bi):已知Bi發生后A的條件概率,即由于得知Bi的取值而被稱作A的后驗概率。P(A):A的先驗概率或邊緣概率,也作標準化常量
Helio Protocol:已開始部署ankrBNB以取代原有aBNBc:12月12日消息,Helio Protocol表示,已開始部署ankrBNB以取代原有的aBNBc,將向在區塊高度23545403時在Helio Protocol中存有aBNBc的用戶提供可贖回的ankrBNB,此前已贖回aBNBc的用戶也可以進行贖回。用戶也可以選擇等待7-10天的時間直接接收BNB。[2022/12/12 21:39:43]
解析
根據貝葉斯公式:
當A為特征向量,Bi(i=1,2,…,n)為分類標簽時。貝葉斯模型就可以進行分類預測。例如,在對股價進行分類中,特征向量A可以是各種技術指標或K線量價特征。而Bi(i=1,2,3)對應于給定方向上的實際價格變動的事件,其有三個可能的選項:B1=-1“向下”,B2=0“不確定”,B3=1“向上”。我們就可以根據歷史數據來進行分類預測,而預測結果的可能性可以用P(Bi|A)表示,分類級別很簡單:P(Bi|A)越大,則屬于該類別的可能性也越大。該分類方法也被稱為樸素貝葉斯分類器
實踐
樸素貝葉斯模型在股票價格趨勢分類預測的應用
步驟
樸素貝葉斯分類器的具體步驟如下:
step1:設x={a1,a2,…,an}為一個待分類項,而每個a為x的一個特征屬性。
step2:有類別標簽集合C={y1,y2,…,ym}。
step3:根據貝葉斯公式,計算P(y1|x),P(y2|x),…,P(ym|x)。
step4:如果,P(yk|x)=max{P(y1|x),P(y2|x),…,P(ym|x。,則x被分到yk類別。
重點
關鍵就是如何計算第3步中的各個條件概率。
我們可以這么做:
step1:找到一個已知分類的待分類項集合,這個集合叫做訓練樣本集。
step2:統計得到在各類別下各個特征屬性的條件概率估計。即:
step3:如果各個特征屬性是條件獨立的,則根據貝葉斯定理有如下推導:
因為分母對于所有類別為常數,因為我們只要將分子最大化皆可。又因為各特征屬性是條件獨立的,所以有:
其中,1/N為常數。
因此,樸素貝葉斯分類器過程是利用樣本集統計出各特征屬性的條件概率以及分類標簽的概率。然后根據以上步驟對待分類項進行分類預測。
心得
可以看到,整個樸素貝葉斯分類分為三個階段:
第一階段——準備工作階段,這個階段的任務是為樸素貝葉斯分類做必要的準備,主要工作是根據具體情況確定特征屬性,并對每個特征屬性進行適當劃分,然后由人工對一部分待分類項進行分類,形成訓練樣本集合。這一階段的輸入是所有待分類數據,輸出是特征屬性和訓練樣本。這一階段是整個樸素貝葉斯分類中唯一需要人工完成的階段,其質量對整個過程將有重要影響,分類器的質量很大程度上由特征屬性、特征屬性劃分及訓練樣本質量決定。
第二階段——分類器訓練階段,這個階段的任務就是生成分類器,主要工作是計算每個類別在訓練樣本中的出現頻率及每個特征屬性劃分對每個類別的條件概率估計,并將結果記錄。其輸入是特征屬性和訓練樣本,輸出是分類器。這一階段是機械性階段,根據前面討論的公式可以由程序自動計算完成。
第三階段——應用階段。這個階段的任務是使用分類器對待分類項進行分類,其輸入是分類器和待分類項,輸出是待分類項與類別的映射關系。這一階段也是機械性階段,由程序完成。
應用
下面我們利用樸素貝葉斯模型對股票價格趨勢進行分類預測:
屬性劃分
對屬性的確定并對屬性進行適當劃分是非常重要的。這里為了簡單起見,我們利用當日的漲跌狀態、RSI指標、RSRS指標、CCI指標做為特征屬性。而實際價格趨勢為分類標簽。根據指標的常用方法對特征屬性進行劃分,其劃分如下表:
分類訓練
本文利用股市滬深300的所有成分股N天歷史數據作為訓練樣本。以當前天的下一交易日實際價格漲跌狀態為分類標簽進行分類器訓練。訓練樣本量為:3萬。
利用2018年5月1日之前的N天的樣本數據為訓練樣本,訓練結果如下表:
分類預測
預測2018年5月2日-5月15日這10個交易日價格漲跌趨勢。利用該段時間滬深300成分股的實際價格漲跌檢驗分類預測價格漲跌趨勢的準確率,如下表所示:
總結
簡單的利用貝葉斯模型對股價進行分類預測有一定的合理性。如果想要提高貝葉斯模型分類預測的準確性,我們可以從下面兩方面出發:
1、從貝葉斯模型的特征屬性出發,深入研究和挖掘更多有用的特征屬性,并合理地劃分每一個特征屬性的范圍。
2、選擇合適的訓練樣本集進行研究,可以按行業分類選擇具有相同趨勢的股票進行訓練及預測。
拓展
波動率估計
波動率模型,尤其是隨機波動率模型在金融領域有著廣泛的應用,這就使得模型的參數估計成為一個非常重要的問題。貝葉斯估計在隨機波動率模型上是十分普遍并應用廣泛的參數估計方法。
有興趣的同學可以查閱相關資料,利用貝葉斯估計方法對波動率模型進行參數估計。
來源:金色財經
Tags:INBBNBCOINcoinbasecoinbase中文版下載bnb能漲到一萬嗎TOSPcoincoinbase是正規平臺嗎
????莫愁前路無知己,投資路上有知音,各位幣友們,大家下午好,我是幣天王很高興在下午的時間點跟各位幣友們帶來天王對行情的分析.
1900/1/1 0:00:00wYFI擁有真正的商業邏輯及生態建設基礎,且隨著其自身的不斷演進而躋身主流,wYFI在以太坊鏈中運行的基于ERC20的標準令牌,是由YFI拆分而來的,其目的是改進目前YFI的一些弊端.
1900/1/1 0:00:00前言: 所謂最難忘的,恰恰是從來都不曾想起,卻永遠無法忘記,隨著年齡的增長,人總會變得越來越包容,不是沒了脾氣,而是很多事已經無法讓你生氣,有坐下來的素養,也有掀桌子的能力,似水流年.
1900/1/1 0:00:00備受矚目的澳大利亞區塊鏈明星項目DeCEX,率先實現了可用于交易NFT和提供DeFi服務的去中心化雙通縮協議,現將于本周六下午4點在官網開啟公售活動.
1900/1/1 0:00:00本周三,《福布斯》正式公布了“2021年全球區塊鏈50強”榜單,包括中國工商銀行在內,21家公司首次登榜亮相。與此同時,Facebook、谷歌、亞馬遜、花旗和萬事達等美國公司掉出榜單.
1900/1/1 0:00:0001 昨日文章內強調萊特幣即將突破下跌趨勢線,可以介入多單并且長期持有。因為消息面的利好晚間回調時萊特并未有所下跌,盤整23天后的突破一定不會到此結束;萊特幣是繼比特幣、以太坊后目前來看最有可能.
1900/1/1 0:00:00