原文標題:《硬核丨如何利用機器學習識別加密項目風險?》
撰文:PengtaiXu
翻譯:Sherrie
加密貨幣是一種存在于數字世界的交易媒介,依靠加密技術使交易安全。加密貨幣背后的技術允許用戶直接向他人發送貨幣,而不需要通過第三方,如銀行。為了進行這些交易,用戶需要設置一個數字錢包,而不需要提供身份證號碼或信用評分等個人細節,因此可以讓用戶偽匿名。
對于普通的加密貨幣用戶來說,這種匿名性可以讓他們放心,因為他們的個人信息或交易數據不會被黑客竊取。然而,這種交易匿名性的提高,也容易被犯罪分子濫用,進行洗錢、恐怖融資等非法活動。這種非法活動給區塊鏈錢包用戶以及加密貨幣實體都造成了巨大的損失。雖然金融行動特別工作組等監管機構已經在這些實體的監管中引入了標準化的指導方針,但由于每天都有大量的加密貨幣實體和交易發生,監控加密貨幣空間是一項具有挑戰性的任務。
法國金融市場管理局:未來幾年可能是 DeFi 行業的關鍵時期,將推出一個平衡的監管框架:6月27日消息,法國金融市場管理局(AMF)在發布的一份 DeFi 討論報告中表示,DeFi 當前處于發展初期階段,一方面可以推動創新,另一方面也給參與者帶來了風險,同時也給監管機構帶來更大的挑戰。未來幾年可能是 DeFi 行業的關鍵時期。
在法國,審慎監管局(ACPR)已經就 DeFi 監管提出了一些建議,并已提交咨詢。歐盟層面來看,歐盟委員會將不得不評估與加密資產市場中 DeFi 相關的發展,并評估在加密資產市場(MiCA)法規生效后對 DeFi 系統進行監管處理的必要性。國際機構和組織(如 IOSCO 和 FSB)開展的工作也將進一步明確向司法管轄區提出的有關 DeFi 監管處理的指導或建議。AMF 完全支持這些舉措,并打算增加與公共和私人利益相關者的接觸,以期形成一個平衡的監管框架,從長遠來看,這將有助于支持 DeFi 的健康發展。[2023/6/27 22:03:52]
解決方案
星巴克最新一批NFT系列未能售罄:4月21日消息,此前星巴克推出了NFT系列“First Store”,目前5000件NFT只賣出了4579枚。而在此之前,上一批NFT僅用時20分鐘就全部售罄。(the block)[2023/4/21 14:18:54]
圖片來源:?https://dribbble.com/shots/2723032-Needle-in-a-Haystack
因此,人們有興趣利用開源信息,例如新聞網站或社交媒體平臺,來識別可能的安全漏洞或非法活動。在與LynxAnalytics的合作中,我們已經致力于開發一個自動工具,以刮取開源信息,預測每篇新聞文章的風險分數,并標記出風險文章。這個工具將被整合到?Cylynx平臺?中,這是LynxAnalytics開發的一個工具,用于幫助監管機構通過使用各種信息源監控區塊鏈活動。
數據:Alameda資產接收錢包收到3000萬美元USDC,目前擁有1.67億美元資產:金色財經報道,Lookonchain監測數據顯示,Alameda資產接收錢包在7小時前從“Alameda Research 25”收到了3000萬美元的USDC。該錢包目前擁有1.67億美元資產,包括:1億枚BIT(價值4660萬美元),4100萬枚USDT,3180萬枚USDC,17177枚ETH(價值2400萬美元),460萬枚SUSHI(價值520萬美元)等。
今日早前,FTX代理律師Dietderich在聽證會上表示,FTX計劃出售賬面價值46億美元的非戰略性投資,這可能會給市場帶來巨大的拋售壓力。[2023/1/12 11:07:45]
開源信息的數據獲取
我們確定了3類開源數據,這些數據可以提供有價值的信息,幫助檢測加密貨幣領域的可疑活動。這些類別是:
趙長鵬:我們在印度看不到任何可行的業務:11月21日消息,Binance 創始人趙長鵬在周四的 Techcrunch Crypto 會議上表示,由于嚴格的稅收制度,印度目前不適合其加密貨幣交易平臺的商業環境,他解釋道:“Binance 進入了那些法規利于加密貨幣和商業的國家。”
趙長鵬援引印度激進的稅收環境表示:“如果對每筆交易都要征收 1% 的稅,就不會有那么多交易產生了。訂單簿類型的交易平臺不會有任何交易量。所以我們今天在印度看不到可行的業務。”
據悉,雖然對加密貨幣收入和交易征稅,但印度仍然沒有針對加密貨幣的監管框架。印度財政部長 Nirmala Sitharaman 此前表示,加密貨幣監管將是印度擔任 G20 主席國期間的重點議題之一,印度希望在與其他 G20 國家討論后建立一個由技術驅動的加密貨幣監管框架。[2022/11/21 7:52:53]
傳統的新聞網站,如谷歌新聞,它將報告重大的黑客事件。加密貨幣專用新聞網站,如Cryptonews和Cointelegraph,它們更有可能報道小型實體和小型安全事件的新聞。社交媒體網站,如Twitter和Reddit,在官方發布黑客新聞之前,加密貨幣所有者可能會在那里發布有關黑客的消息。
Aptos和谷歌云合作計劃推出加速器項目:金色財經報道,公鏈項目 Aptos 宣布與 Google Cloud 達成合作,Google Cloud 將為其部分驗證節點和其他服務提供支持。Aptos 區塊鏈也將被編入索引并加入 Google Cloud 的 BigQuery 服務。
此外,Google 和 Aptos 基金會將啟動加速器計劃,并在明年共同舉辦黑客馬拉松。[2022/11/11 12:46:43]
檢索文章和社交媒體帖子的內容,然后建立情緒分析模型。該模型為文章中提到的實體分配了一個風險活動的概率。
情緒分析模型
我們嘗試了四種不同的自然語言處理工具進行情緒分析,即VADER、Word2Vec、fastText和BERT模型。在通過選定的關鍵指標對這些模型進行評估后,RoBERTa模型表現最佳,被選為最終模型。
圖片來源:?https://www.codemotion.com/magazine/dev-hub/machine-learning-dev/bert-how-google-changed-nlp-and-how-to-benefit-from-this/
RoBERTa模型對新聞文章或社交媒體帖子的文本進行處理,并為特定文本分配一個風險分數。由于該文本在數據收集過程中已經被標記為實體,我們現在已經有了加密實體的相關風險指標。在后期,我們將多個文本的風險分數結合起來,給出一個實體的整體風險分數。
RoBERTa原本是一個使用神經網絡結構建立的情感分析模型,我們將最后一層與我們標注的風險分數進行映射,以適應風險評分的環境。為了提高模型在未來文本數據上的通用性,我們進行了幾種文本處理方法,即替換實體、刪除url和替換hash。然后我們使用這個表現最好的模型進行風險評分。
風險評分
現在,每篇文章都有一個相關的來源,一個風險概率和一個計數,指的是文章被轉發、分享或轉發的次數。為了將這些風險概率轉換為加密貨幣實體的單一風險得分,我們首先將文章的概率值縮放到0到100的范圍內,并獲得每個來源的加權平均值,結合文章的風險得分和計數。加權平均數用于對計數較高的文章給予更大的重視,因為份額數量很可能表明文章的相關性或重要性。
在計算出各來源的風險得分后,我們對各來源的風險得分進行加權求和,得到綜合得分,公式如下:
傳統的新聞來源被賦予了更高的權重,因為這些來源更有可能報道重大的安全漏洞。
該解決方案的有效性
我們在2020年1月1日至2020年10月30日的174個加密貨幣實體的名單上測試了我們的解決方案,并將結果與該時間段內的已知黑客案例進行了比較。我們發現,我們的風險評分方法表現相當出色,在37個已知的黑客案例中識別了32個。我們還分析了我們的解決方案對單個實體的有效性。下圖顯示了Binance從2020年1月1日至2020年10月30日的風險評分。虛線紅線代表已知的黑客案例。從圖中我們觀察到,我們的解決方案報告了5個已知黑客中的4個黑客的風險得分增加。也有幾個峰值與已知黑客案例不一致。然而,這并不構成一個主要問題,因為對我們的模型來說,更重要的是識別盡可能多的黑客,減少未識別的黑客數量。
有趣的發現
在風險評分過程中,我們注意到,與規模較小的實體相比,規模較大的實體的風險評分往往有較大比例的假陽性記錄。這是因為大型實體被談論得更多,因此會有更多的負面帖子和虛假謠言,從而導致更高的不準確率。
另一個值得強調的有趣趨勢是,圍繞著黑客攻擊通常有幾個明顯的高峰。這是由于不同數據源的反應時間不同。社交媒體網站Twitter和Reddit通常是第一個看到高風險事件發生時的高峰,因為用戶會發帖提出他們觀察到的異常情況,比如一個實體的網站在沒有事先通知用戶的情況下宕機。官方消息一般是在官方聲明之后,稍后才會發布。
局限性
我們發現,我們的解決方案有兩個潛在的局限性,首先是需要不斷地維護收集器。網站設計可能會隨著時間的推移而改變,這些網站的刮擦器需要更新,以確保相關信息仍能被檢索到,從而達到風險評分的目的。
第二個限制是,驗證一篇文章是否已被正確地標記為加密貨幣實體是具有挑戰性的。例如,一篇報道?Bancor?可疑活動的文章可能也會因為一個不相關的事件提到Binance。我們的解決方案會錯誤地將新聞標記為兩個實體,并將Binance標記為風險,即使它不是文本中的關鍵主題。然而,這并不是一個主要的限制,因為我們只使用新聞文章的標題和摘錄來進行風險評分,這通常只包含文章的關鍵信息。
結語
我們的項目讓監管機構可以輕松挖掘開源信息,更好地識別加密貨幣領域發生的風險事件。我們提供了一個分析文章并預測風險分數的語言模型,以及根據實體和來源信息匯總這些分數的方法。這些方法都被編織成一個可以端到端運行的自動化流水線。將該項目整合到Cylynx平臺中,將對其現有功能進行補充,并為監管機構識別高風險加密貨幣實體提供巨大的幫助。
Tags:加密貨幣EFIDEFDEFI加密貨幣是什么意思Metaegg DeFidefy幣是真是假DeFi Warrior
2021年,BTC價格穩健、ETH持續拉漲,牛市行情繼續!而且,基于對未來行情的持續看好,越來越多的用戶開始選擇挖礦.
1900/1/1 0:00:00正所謂跟對單,贏一單,跟對人,贏一生,不管你是合約還是現貨交易者,如果你還在虧損或者被套,那么你可以找到老師,帶你轉虧為贏不是難題.
1900/1/1 0:00:00老幣第7期:短期止跌,追空需謹慎 文/幣粉研究院 BTC: 昨天比特跌幅直達5000余點,早間開盤也是延續下跌,最低到了28800.
1900/1/1 0:00:00東哥論幣1.23午間比特幣行情分析與操作策略 順境也好,逆境也好,人生就是一場對種種困難的無盡無休的斗爭,一場以寡敵眾的斗爭.
1900/1/1 0:00:00大家好我是小匯, 今天是2021年1月22日,比特幣比特現金獨家行情解讀: BTC 4小時 在4小時上有說過幾個觀點,120均線是不能被跌穿,跌穿就會打開下跌空間.
1900/1/1 0:00:00穩定幣指幣價具有穩定性的加密貨幣,這是它與其他加密貨幣最本質的區別,在比特幣、以太坊等加密貨幣市場上,我們能看到一天內超30%的價格波動,這樣的價格變動使得它們不適合廣泛的日常支付和交易.
1900/1/1 0:00:00