買以太坊 買以太坊
Ctrl+D 買以太坊
ads

區塊鏈:杭州區塊鏈國際周 | 清華大學交叉信息研究院助理院長徐葳:隱私計算助力數據成為生產要素_MPC

Author:

Time:1900/1/1 0:00:00

7月5日,杭州區塊鏈國際周分論壇順利開幕。此次論壇由算力智庫聯合巴比特、海南省大數據管理局、上海人工智能發展聯盟、長三角大數據產業合作聯席會議、新財富等共同舉辦,論壇匯聚了國內外近幾年來在隱私數據與安全計算領域專注耕耘的大廠、金融機構與科技企業重磅嘉賓與專家首次云集,共享數據應用思辯饕餮盛宴,同時,還頒發了2020隱私計算產業30強榜單。

在分論壇中,來自清華大學交叉信息研究院助理院長、副教授,華控清交CTO徐葳發表了題為《隱私計算助力數據成為生產要素》的主題演講,徐葳教授結合自身經歷,從技術角度分享了隱私計算技術如何能夠讓數據成為生產要素,讓生產要素的市場成為閉環的觀點。

以下為巴比特整理的演講全文:

數據是數字經濟的核心生產要素

數據是數字經濟的核心生產要素,這句話我在其它地方得花一些時間來解釋,講一講生產要素是什么,但是我相信在這個論壇上我沒有必要解釋。我想解釋的是數據從科學上來講有什么用,因為有用的東西才是一個生產要素。大家認為數據就是各種信息,實際上是

數據蘊含了信息,數據和信息不太一樣:你能夠看得懂的東西才是信息,看不懂的東西肯定不是信息,而數據有的時候你可以看懂,有的時候卻看不懂。

杭州乘坐地鐵新增數字人民幣支付方式:金色財經報道,據“杭州發布”微信公眾號消息,今日起杭州乘坐地鐵又增加了一種移動支付方式:自今天起,大家可以使用數字人民幣乘車碼乘坐地鐵,實現快速掃碼進出。這也是數字人民幣App首次在全國范圍內實現交通出行場景應用。[2023/5/31 11:50:37]

十多年前大家上網都會留下訪問日志,大家并沒有有覺得這些訪問日志有多少價值,因為那個時候分析手段不夠高明,直到Google這些企業分析了這些日志,廣告收入突然提升了,點擊率提升了,單次點擊費用也提升了,大家發現這個東西還可以這么做,所以才有了大數據這么一個行業,大數據和人工智能的算法幫助你挖掘數據、看懂數據,然后把數據轉化成為信息,所以數據的信息是靠加工來的。

加工完成以后大家覺得數據可以挖掘出信息了。信息還有一個特色,它是從理論上衡量企業的一個重要指標。比如說雖然我們沒有見過面,但是你到看我的照片,我說我是一個男的,這個不是廢話么,因為這句話的信息量非常小,并沒有讓你驚訝。那什么會讓你驚訝呢,就是造一個謠,雖然是虛假的信息,但是它讓你驚訝,讓你覺得信息量特別大,所以你就去點了,所以信息是讓你感覺到驚訝的,當然如果是真實的信息讓你驚訝,這個東西就有價值了。

大數據和人工智能能夠幫助你把數據轉化成為信息,但是這個信息你越不知道越好,比如別人的數據藏了什么你不知道的價值和信息,你就會認為它更加有價值,因為它隱藏了更多的信息。

杭州推出首個區塊鏈技術質檢聯盟平臺:10月12日,浙江中科院應用技術研究院下屬中科評測,聯合螞蟻鏈在杭州市推出了首個質檢聯盟平臺。該平臺利用區塊鏈技術將質檢報告上鏈,并用消費者可以讀懂的標簽形式呈現,預計未來一年將為5000多種商品提供區塊鏈認證標簽,幫助消費者快速做出最優選擇。(中國青年報)[2021/10/14 20:27:02]

因此,我們認為數據的價值會在流通中增加。數據的流通和信息流通是一樣的,是在流通中體現越來越多的價值。數據是有使用價值的,因此數據流通也不是一個零和游戲。數據在流通當中才能夠體現生產要素的真正價值,我們說到健全數據的生產要素由市場決定貢獻,由貢獻決定報酬的機制,什么叫做市場決定貢獻,你得有供需,有供需才能夠決定價格。但是大家也提到這么久了,數據怎樣流通,數據怎樣確權,但是數據本身和別的生產要素不一樣:第一,它可以復制,復制的成本特別低,所以可以無線的復制。第二,可以重復使用,可以多方使用,勞動力還是土地還是錢都沒有這個特性,第三個特性就是越用越多。所以,從這個角度來說,數據的物理性質和一般的生產要素不一樣,我們沒有辦法從一般的生產要素考慮數據流通的問題。

數據的隱私問題

從最簡單和最樸素的層面來講,這個數據對我的成本是多少錢,高于這個成本才可以賣給你,這個東西成本怎么定價,如說你說你想買我所有的銀行交易記錄,我可以賣給你,但是問題是我肯定不賣,因為我賣給你以后,你和我說你只不過想幫助我申請一張信用卡而已,但是誰知道你拿去干什么用了,因為你幫我申請了信用卡,這個數據可以無限的復制,我哪知道你把我的數據又復制給誰了?以及你把這個復制給其他人以后會怎樣傷害我。所以,對我來說我把數據給了你,我的成本就是所有可能看到數據的人所能夠做出來的所有傷害到我的事情之和,這就是我把數據給你的成本,這個成本聽起來就不可估量了,其實就相當于我就把命交給你了。但是買方可能不是這么想的,一個善意的買方覺得就是給你申請一個信用卡,你哪這么多的事兒,你怎么這么不放心,但是我就是不放心,因為數據的特性導致了你就是可以把它復制給無窮的人傷害我。所以,這個角度來說這筆買賣是沒有希望談成的,因為我的成本比你原本要付的高得多得多,從這個角度來說沒有辦法從市場供需進行定價,所以很難市場流通,這就是問題。

歐科云鏈OKLink收到杭州市局蕭山區分局刑偵大隊感謝信:今日,歐科云鏈OKLink收到來自杭州市局蕭山區分局刑偵大隊發來的感謝信,以感謝OKLink區塊鏈大數據分析工具鏈上天眼與區塊鏈瀏覽器產品對于打擊數字資產領域犯罪,維護國家金融安全做出的貢獻。

OKLink“鏈上天眼”旨在利用區塊鏈技術協助執法部門進行鏈上執法、打擊黑產、智慧助警等工作,持續拓展區塊鏈多元化應用場景,推進基于區塊鏈的新基建產業,為產業健康發展保駕護航。[2020/11/20 21:30:27]

這就直接導致了對社會產生的一些非常不好的副作用,社會上數據的生產者和數據的消費者往往不是同一個人,你得有一個ToC的東西,比如有一個網站、一個博客等等,這樣就有流量,有流量就有數據,但是這些人變不了現,但是數據的消費者肯定沒有數據,因為它不是ToC的,而且中間還有現在數據加工越來越復雜,數據加工的才有信息,你中間還有一堆人去替你整理數據、加工數據。

數據有一個社會化大生產的需求,但是現在因為對于數據交易價值和數據的泄露的擔憂,就影響了它形成這么一個閉環,所以影響了整個社會對數據的效率。當然,一些公司就很牛,比如說阿里、騰訊,他們自己打通了閉環,內部就有這個閉環,也有算法的人,也可以變現,也可以放貸,也有ToC的東西,但是不是社會化生產,是一家公司的壟斷。

所以大家問,如何交易數據,這是本次論壇非常重要的主題,也是大家都在討論的一個事兒,但是從我的角度來說,我認為如何交易數據這個問題本身就是一個偽命題,它無解,所以我們想到的是一個解決方案,就是我們能不能把數據具體承載的信息和計算價值區分開來,因為我拿到的數據真的不是為了拿眼睛看的,因為你看也看不出什么東西來,一定是用于計算的,用于一些算法來加工的。從大量的數據里提煉出來一點點信息,我們可能做到一個事情,就是數據可用不可見,我可以生成我想要的事情,但是我不讓你看到我具體的每一筆銀行交易的記錄,這樣可以避免因為被看見我的具體信息導致了各種各樣的恐慌,把所有成本加在你的頭上。

動態 | 杭州上線結合區塊鏈等技術的“工地智能復工系統”:針對工地在復工過程中遇到的“人員核查難”、“復工手續繁”、“訴求反饋慢”等問題,杭州市下城區文暉街道在區大數據局的全力支持下,借助區塊鏈、大數據技術,開發并上線全市首個“工地智能復工系統”,通過智慧賦能從技術手段保障企業落實防控主體責任,加速企業復工復產。(央廣網)[2020/2/21]

如果你沒就看到原來的數據,只是提取了計算價值,我們可以說這是一個數據的特定的用法和用量,我把這個數據用于這個計算,用一次是允許的,但是因為你不能拷貝我的數據,所以你下次用別的計算的時候還得求我,所以數據還是我的,這樣數據的責權利是分開的,我可以把數據的使用權給你,所有權不能給你,因為你不能復制。

我們認為數據交易如果你討論我怎樣把原始數據交易給別人,這個是來回糾纏,無解的,但是數據交易特定使用權,如果這個事情可以實現,那么它也許是解決了絕大多數的數據交易的需求,但是數據特定的使用權怎樣實現,隱私計算我們認為是現在階段看到的最現實的一些方案。

從目的上來看,數據保密技術為了讓除了我想給誰用,這是特定的使用目標,除了這個人之外,其他人都沒有看到,采取的手段就是把數據加密了,一定要藏起來,藏的好好的,用各種各樣奇怪的技術把秘鑰傳遞給數據的使用方,只有使用房能夠把這個數據解開看見,其他人不能,這個解開和明文數據一樣,但是確保別人有看見,目的是把數據藏起來,別給別人看見。但是隱私計算不一樣,隱私計算的核心是不信目標使用者,重點防的是我想把數據給誰和我要數據的那個人,重點防的不是第三方,重點防的是我那個數據使用方,為了實現這個目標,從這個技術實現上,隱私計算需要把數據加密的狀態下讓它能夠計算,不能用數據使用方解開,所以要加密計算,但是得出來的結果要和明文計算是一樣的,最終實現的價值是把數據用起來,而不是把數據藏起來,這是隱私計算和數據保密的區別,數據保密更像是一個保險項,隱私計算更像是一個通風櫥。

2018年杭州市政府工作報告中寫入區塊鏈 欲“打造區塊鏈之城”:根據21世紀經濟報道,全國首個區塊鏈產業園區落戶西溪谷互聯網金融小鎮,吸納螞蟻金服、網商銀行、支付寶等一批知名互聯網金融企業入駐;2018年杭州市政府工作報告中寫入區塊鏈,標志著區塊鏈的新技術將成為杭州支持的下一個重點;政府層面甚至提出了“打造區塊鏈之城”。[2018/4/4]

隱私計算一定是一個多技術的融合體

接下來給大家講一講技術上的事情,我是一個技術人員,最開始我們做隱私計算始于我在清華的一個研究項目,我是做大數據的,我認為大數據這個東西最難的是怎樣別人把數據給我,密碼學有非常巧妙和非常牛逼的理論叫做隱私計算,恰好解決了大數據的問題,但是這個理論早就有,七八十年代就有卻沒有人用,所以我們一定要做出來,我們一下子就跳到這個坑里,做了好幾年,因為太慢了,算法的實現很麻煩,它不是正常實現程序的思路。所以,我們怎樣能夠讓它提升效率,提升到我能夠接受大數據計算這么做的效率,我怎樣能夠把它定義的加法、乘法之類非常簡單的操作能夠綜合成一套完整的指令集和完整的函數庫,這些事情我們嘗試了很多種不同的隱私計算的協議。我們探索出來這樣一條路,我們覺得這種方法可能是可行的,就是我們孵化了一家公司,這家公司希望能夠把這一系列的成果變成可以用的技術。

在做這個平臺的時候,我們有一些新的體會,我們認為我們是從MPC開始考慮這個問題的,實際上隱私計算的種類有很多種,很多種MPC,MPC有不同的協議,隱私計算也有很多不同的技術,一定是融合的技術來解決問題導向的,不是技術驅動的,所以不是說我有這個技術一定要用這個技術解決什么問題,而是你有什么問題,它是一個綜合的解決方案,這個方案就有點像我非常喜歡數據庫的發展歷程。SQL是我從80年代初開始做的,當時覺得它很慢,也沒有太大用,但是SQL這么多年的發展,大家突然覺得發展速度快了,這是因為有用了各種各樣不同的算法和數據結構在一個數據庫中,每一種可以解決特定場景和特定技術的問題。

所以,到現在其實大家也不清晰數據庫到底有多少種數據結構和算法,隱私計算是一樣的,現在我們也開發了多種MPC的協議適合不同的數據,我們也開發了多種隱私計算的技術,包括聯邦學習、MPC、TE等等,我們集成在一個平臺上,我們希望的是一個程序、一個算法、一個接口適應了各種各樣不同的技術,未來我們會自動的優化到底你的場景中適合使用哪種技術,這樣是多種技術的有機結合的平臺,而不是單一的技術,這是我們在開發和部署、落地這些項目的時候一個最大的感悟。

我們有不同的計算引擎、不同的技術,上面有面向客戶的需求,需求是多種多樣的,客戶信任模型也是越來越不一樣的,當然應用場景更加不一樣,所以在不同的應用場景下,我們應該有什么樣的模塊,這些模塊能夠靈活的組合,適應不同的場景和不同的需求和客戶不斷變化的需求,這是我們認為這一類技術走向產品最核心的要點。

比如說給大家舉個例子,我認為所有的東西越快越好,天下武功唯快不破,怎樣能夠算的更快、怎樣算的更加有可擴展性,我們做了可擴展的計算平臺,比如說左邊這些都是不同的數據源,然后我們在上面聯合做一個查詢,這個查詢用了很多的計算服務器,但是也是一個集群,這些集群我們是橫向擴展的,你需要更多的算力,我們只需要添加服務器就可以了,最終暴露出密文數據結果,這些計算平臺從來沒有看到任何的明文數據。但是繼承了大數據平臺中的可擴展性,不光和明文對接,在密文上實現了可擴展的密文計算框架,所以我們可以跑任意吞吐量的計算,我們可以做大數據的共享開放,政府各個部門之間的數據不打通了,主要是責權利不明,當然政府數據開放肯定是好事情,我們通過這樣的平臺,大家可以在數據用法用量安全可靠的情況下進行這樣的計算,類似的場景在金融、在醫療、在教育、在電子政務、在能源都有很多類似應用,我們認為平臺是最重要的,一個可擴展、可模塊化、可以定制化的平臺是非常重要的,這個平臺里可以集成多種技術。

總結來講,沒有一種單一的技術能解決了一切的問題,在現實中來看,隱私計算一定是一個多技術的融合體,它是一個完整的平臺,這個平臺可以丁志偉各種各樣的事情,通過這樣的平臺,最大的價值是我們八通了數據這種生產要素,在社會化大生產中的閉環,能夠讓不同方消除對數據隱私的不必要的擔憂,讓數據真正的流通起來,讓數據的定價變得更加明確,不是給原始的數據定價,而是給數據的使用權定價,因此我們認為隱私計算技術這一類的技術是能夠讓數據成為生產要素,讓生產要素的市場成為閉環的目前最現實的道路。

今天我的匯報到這里,謝謝大家!

Tags:區塊鏈MPCINKLINK國內區塊鏈公司前十排名SMPC幣Baby Starlink DogeTronLink官網版下載

比特幣最新價格
數字貨幣:數字貨幣監管當體現“中國之治”_數字金融

作者?CECBC區塊鏈專委會特聘專家、中國政法大學商學院教授?胡繼曄據報道,近日,我國法定數字貨幣研發的進展引起社會普遍關注.

1900/1/1 0:00:00
ROW:加密期權交易所Sparrow完成350萬美元A輪融資 BitMEX母公司領投_PAR

據TheBlock6月23日消息,加密貨幣期權交易平臺Sparrow已在A輪融資中籌集了350萬美元資金.

1900/1/1 0:00:00
區塊鏈:研究:一年中什么時候買入BTC才能賺錢?_加密貨幣

投資有兩大重要的決定性因素,一是選標的,二是擇時。如果已經確定要投資BTC了,選擇什么時候入場,什么時候出場就是需要投資者仔細考量的。比如選擇入場時間就非常重要.

1900/1/1 0:00:00
APP:北京市發布區塊鏈發展三年行動計劃,目標建成四個“高地”_區塊鏈存證

區塊鏈賦能實體經濟為大勢所趨,脫虛務實成為該計劃的主基調。6月30日,北京市人民政府辦公廳發布印發《北京市區塊鏈創新發展行動計劃(2020—2022年)》的通知.

1900/1/1 0:00:00
TRA:走進真實礦工 | 那些年,礦工遇到的「坑」_CARCADE

今天這期「走進真實礦工」文章主要將向大家介紹聯合挖礦以及礦機托管可能會遇到的一些「坑」,以及該如何躲避.

1900/1/1 0:00:00
穩定幣:巴比特專欄丨美聯儲主席對數字貨幣的觀點會如何影響Libra?_CBD Coin

在上周的美國國會眾議院金融服務委員會的一次聽證會上,委員會的成員就美國的貨幣政策和經濟現狀向美聯儲主席鮑威爾提出了一系列的問題。在這些提問當中,有一個問題是關于數字美元的.

1900/1/1 0:00:00
ads