背景介紹
我叫小明,是一個每天喜歡胡思亂想的打工人。
隨著年輕人的創業熱潮的到來,我有一種創業的沖動。經過長時間的探索,我現在萌生出了一個極具創造性的點子,如果以此為依據進行創業的話一定會引起熱潮。
首先,為了確定我的想法是不是獨一無二的,我必須先通過搜索引擎進行查詢。這里有一個我很在意的問題——我在搜索引擎里搜索了我的創意,瀏覽器會將我的創意直接發送給搜索引擎的服務器,如果我的創意確實是獨一無二的,那這樣直白的搜索方式一定會把我的創業完全暴露出來,這對我來說非常致命,我絕對不能讓任何人有竊取我創意的可能。
如何才能保證在不讓搜索引擎知道我具體要查詢什么東西的情況下獲得我想要的數據是我亟待解決的難題。
麥當娜“創造之母”NFT已募集309 ETH,將捐給三家婦女兒童慈善機構:金色財經報道,據社交媒體用戶 @Darthmadonna 透露,美國歌手麥當娜與知名 NFT 藝術家 Beeple 合作推出的 NFT 系列“創造之母”(Mother of Creation )已募集 309 ETH,約合625,592.50 美元。籌集的資金將用于 3 個慈善機構,即兒童之聲基金會、歡樂之城基金會和黑人媽媽救助計劃。創造之母是三個 NFT 的集合,分別是:自然之母、進化之母和技術之母,該系列中最昂貴的 NFT 是自然之母(Nature of Nature),售價達到 170.5 ETH。[2022/10/27 11:46:32]
簡單做法
我的第一個主意是將搜索引擎中所有的數據全部下載下來,將原來的在線查詢轉換成為本地查詢。這就意味著我不用將我的點子發送給服務器端,我就可以充分地保護好自己的隱私了。
2020“創業之星”大賽大數據和區塊鏈行業賽復賽即將開啟:據官方消息,火幣Labs將于8月2日-8月3日在杭州舉辦創新南山2020“創業之星”大賽大數據和區塊鏈行業賽復賽暨火幣Labs創業營訓練日活動。自大賽報名開始以來,已收到100+大數據和區塊鏈項目團隊報名參賽。
活動邀請了協同數據創始人胡博、華傲數據副總裁高路、法學博士后前火幣集團高級法律顧問季鳳建、杭州區研創始人火幣Labs孵化顧問陳軍、分布式資本總法律顧問孫銘、火幣大學顧問合伙人《小島區塊鏈》作者方軍、以及火暢空間創始人孫輝等。同時火幣Labs總經理袁瑞娟也將親臨現場,詳解火幣Labs全新創業生態如何為創業者賦能。[2020/8/1]
不過我還得考慮到另外一個問題,搜索引擎的服務器可是有pb級別的數據量,我下載下來就得花費我幾天的時間,另外我還得專門再去買幾塊大容量的硬盤,這對我來說實在是太過于昂貴。
分?桶
深圳南山科創局局長助力2020“創業之星”大賽大數據和區塊鏈行業賽啟動儀式:2020年7月2日15時,第十二屆中國深圳創新創業大賽南山區預選賽暨創新南山2020“創業之星”大賽大數據和區塊鏈行業賽啟動儀式盛大開啟。本次大賽由深圳市科技創新委員會和深圳市南山區人民政府聯合主辦,深圳市南山區科技創新局及深圳市南山區科技創業服務中心承辦,其中大數據和區塊鏈行業賽由火幣Labs執行。
深圳市南山區科技創新局局長劉石明在啟動儀式上致辭,并與火幣Labs總經理袁瑞娟以“為‘南山大數據和區塊鏈’創業生態加碼”主題對話。劉石明表示,今年是大賽第一年設置大數據和區塊鏈行業賽,一方面南山匯集眾多互聯網巨頭和專業人才,釋放出很多區塊鏈行業應用,南山也有很多正在做區塊鏈和準備做區塊鏈的企業;另一方面,區塊鏈的應用領域非常廣泛,比如電子發票、銀行貸款,政務服務等,在南山都有非常好的前景,因此大數據和區塊鏈的結合一定會成為亮點。
“希望本次比賽能夠吸納全世界各地的區塊鏈項目來到南山創業發展,通過南山政府數據開放、應用場景釋放及骨干龍頭企業釋放的資源,都將加速推動區塊鏈應用在南山的落地。”劉石明說到。[2020/7/2]
我換了一個想法,既然沒機會直接把搜索引擎的數據庫都給扒下來,我就試著扒下來一部分數據,然后我再本地查詢,這樣對我來說,準備的硬盤也可以少一點。
聲音 | 黃清華:“版權家”依托區塊鏈技術,確立“創作即確權的服務模式:12月13日,由中國廣播電影電視社會組織聯合會、河南省委宣傳部聯合主辦的2019年短視頻大會在鄭州召開,在短視頻創作與運營論壇上,安妮股份副總裁黃清華女士發表“短視頻版權保護與發展趨勢”的主題演講,黃清華表示:“自2016年以來,安妮股份就布局數字版權業務,公司旗下品牌“版權家”依托區塊鏈技術和大數據平臺,確立“創作即確權、使用即授權、發現即維權”的服務模式,提供以版權保護服務、版權大數據、版權授權交易、IP孵化開發的業務體系,能夠為短視頻創作者及機構提供優質的、有保障的版權保護服務“。[2019/12/16]
比如說,我本來想要查詢的數據是“小明是大帥哥”,這樣無疑就向搜索引擎公司暴露我是帥哥的隱私了,那我就可以換一種方式,我就查詢“大帥哥”,這樣我收到的數據雖然有很多都是我不想要的,但是里面卻會包含“小明是大帥哥”的搜索內容。這樣,我就將全部的數據庫下載換成了部分數據庫的下載。獲取部分數據庫內容以后我就可以本地再去查詢了。
動態 | 韓國7家主要交易所聯合簽署“創建健全加密貨幣生態系統的協議”:據Bitcoin消息,韓國7家主要的加密交易所聯合簽署“創建健全加密貨幣生態系統的協議”。各方同意采取信息共享、異常交易實時監控等聯合措施。據悉,7家交易所分別為:Upbit、Bithumb、Korbit、Coinone、Gopax、Coinplug(Cpdax)和Hanbitco。[2018/12/12]
這里用到了數據“分桶”的預處理技術,用于減少次要觀察誤差的影響,是一種將多個連續值分組為較少數量的“桶”的方法。
隱私性保護
分桶的做法雖然很好,但是無疑向數據庫泄露了部分隱私,比如“大帥哥”這個信息,雖然服務器沒有獲知“小明是大帥哥”這個隱私,但是無疑泄露了我對“大帥哥”相關信息比較感興趣,我不想為了保護我的具體隱私讓服務器產生其他的誤解。
我只能換一種方式,傳統的隱私查詢技術給了我一點提示。
▲?背景說明
傳統的隱私查詢技術對于數據保存結構有特殊的要求:首先數據庫得是公開的,即我可以隨時調取查看服務器里的任何數據;其次,在很多個服務器上都得部署完全相同的數據庫;再者,這些部署了數據庫的服務器互相之間不能溝通;最后,假設數據庫擁有n個數據X?、X?…?Xn,那么在數據庫中其存儲形式為一個n維向量。
▲?簡單技術方案
如果我現在需要的是數據Xi,那么其實我應該做的事情很簡單,就是自己生成一個n維向量,只在第i個位置放1,其余的所有位置都放0,很明顯的,這個時候我生成的這個向量和數據庫里的向量內積就可以獲得結果Xi。
但是這樣會存在一個問題,我如果直接將我的向量發送給服務器,他們明顯就知道我需要的是什么數據了,那我只能通過另外一種方式來保護我的隱私,將我的向量拆分。如果我把我生成的向量記為r,假設有k個服務器,注意這里k≥2,那么我只用將r拆分成為k個向量即可。更具體的,我可以拆分為:
然后將每個分量ri發送給一個服務器。然后服務器自己本地求內積,將結果發送給我,我收到k個結果后求異或就可以復原出Xi的值了。
通過算法描述,相信大家也能理解為什么服務器一定需要大于兩個,而且這些服務器之間還不能互相溝通。如果服務器之間互相可以溝通的話就可以復原出我的查詢r了。
這個算法有一個很致命的問題,就是我生成的查詢r其實是和服務器的數據大小一樣大的,如果服務器有幾千億的數據,我的r就得有幾千億維,并沒有降低網絡消耗,而且更糟糕是,我得生成很多份分量,而每個分量的大小都和數據庫一樣大,這種方式無疑比直接下載數據更加龐大。
▲?優化技術方案
因為巨大的傳輸量,我們現在可以對服務器的數據保存方式進行改進,原先的保存方式為向量,現在可以改進為矩陣,假設數據庫有25個數據,那么數據將會變成如下形式
我們此時生成的向量就可以從原來的25維縮減到5維,例如我們需要的數據是,在矩陣的第一行,那我們就可以生成查詢,此時服務器內積后會將第一行返回給我們。
同之前的方案,我們不能直接將查詢r發送給服務器,還是需要進行拆分,然后發送給服務器。同樣的流程過后我們就能第一行元素。這樣對每個服務器我們上傳的數據量為一個5維向量,下載量也同樣是一個五維向量,同時,對于每個服務器來說,他們并不知道我們最后拿到的是哪一行。
這個方案的數據總傳輸量為2k√n,這里的n為服務器擁有的總數據量,k為服務器個數,通常,只需要兩個服務器就能達到安全性的要求,故總傳輸量4√n。
在數據量大于16的情況下,這個策略的數據傳輸量已經小于直接傳輸整個數據庫的數據量了。
▲?再進階做法
我按照之前的想法在搜索引擎里查詢了一下我的創意,發現里面并沒有相關內容。我正準備慶幸沒有別人做了和我相同的事情的時候,我的朋友張三麻子和我說我用的搜索引擎查詢的結果可能不會很準,推薦了一個相關的收費網站給我,這個網站可以查詢到全球所有公司以及其具體業務模式。不過他們是按照查詢條數收費的,故不可能像搜索引擎那樣隨便讓我下載資源了。這個時候我的查詢數據需要隱私,同時他們的數據庫內容也需要隱私。
這個時候可以對之前的算法進行進一步升級,將服務器從2個擴展為4個,我同時發起行查詢和列查詢。比如我需要的數據,在矩陣里的第一行第三列,那么我就會進行第一行與第三列的查詢。行列查詢都分別拆分兩個分片,這樣總共有4種組合可能,四個服務器分別選取其中一種組合本地進行計算。這樣服務器便只會發送混淆后的一個元素回來,不會暴露自己的任何額外信息。
討論及總結
以上的算法有一個很關鍵的問題,即我知道我需要的數據是數據庫中的第幾個元素,但是通常情況下,這樣的查詢方式是不現實的。更為普遍的查詢方式為k-v查詢,即我依據某個k去數據庫查詢其對應的v。
例如,我去搜索引擎里搜索“我是大帥哥”,此時k就是“我是大帥哥”,百度返回的搜索結果就是其對應的v。如何將傳統的隱私查詢技術進行升級以配適現實生活中的實際場景仍需要進一步的探索。
數據安全是現在從個人到國家都非常重視的領域,如何將我們的隱私數據安全的使用起來也是我們一直以來努力的方向。
作者簡介
劉毅恒
來自趣鏈科技數據網格實驗室BitXMesh團隊,一個鮮為人知的程序員
根據WhaleAlert數據顯示,兩筆共10億枚XRP從Ripple?Escrow錢包解鎖,價值約10.54億美元.
1900/1/1 0:00:00原文標題:《加密技術的大規模采用可能會使加密技術走向中心化》作者|?Jo?lValenzuela 譯者|?Soraya 今年是加密貨幣終于開始成為主流的一年.
1900/1/1 0:00:00據U.Today消息,目前美國SEC已提交了另一份法律答復備忘錄,反對XRP持有者干預Ripple案.
1900/1/1 0:00:00可能你也注意到了,在跟智能合約交互時,你的事務會自動包含inputdata。在MyCrypto錢包界面,這些數據有個簡單的標簽:“Data”——它是做什么的呢?這篇文章就是從技術上解釋事務輸入數.
1900/1/1 0:00:00撰文:零火,Nekowarp創始人、中國二次元社區建設者歡迎來到2021年,這并不那么美好的疫情第二年,也是NFT崛起的一年。NFT在這一年如超新星爆炸一般的進入了我們所有人的視野之中.
1900/1/1 0:00:00Algorand發布了ALGOBuilder平臺1.0版本,將有助于企業和黑客馬拉松項目構建DApp.
1900/1/1 0:00:00