中新經(jīng)緯8月2日電 題:大數(shù)據(jù)如何共享?
作者 黃益平 北京大學(xué)國家發(fā)展研究院教授、副院長,北大數(shù)字金融研究中心主任
導(dǎo)語:對數(shù)據(jù)要素不能簡單地套用傳統(tǒng)生產(chǎn)要素的治理方法,實(shí)現(xiàn)大數(shù)據(jù)共享,也應(yīng)主要通過分享大數(shù)據(jù)分析的結(jié)果,而不是分享原始數(shù)據(jù)本身。
【資料圖】
2022年4月,我在博鰲亞洲論壇期間主持了一場關(guān)于數(shù)字經(jīng)濟(jì)的討論,在會上博鰲亞洲論壇副理事長、中方首席代表,中國金融學(xué)會會長周小川提出用安全算法手段克服國際間數(shù)據(jù)難以完全自由流動的矛盾,借用他的話,可以理解為“數(shù)據(jù)不出境,但分析結(jié)果可以出境”。這個思路對我有很大的啟示,當(dāng)前歐美國家正積極推動國際數(shù)字貿(mào)易規(guī)則的制訂,提出了數(shù)據(jù)跨境自由流動的主張。但這對包括中國在內(nèi)的其它一些國家來說構(gòu)成了挑戰(zhàn),如果基于國家安全等考慮做不到數(shù)據(jù)自由流動,就可能會對這些國家參與國際數(shù)字貿(mào)易形成制約。周小川的思路為化解這個矛盾提供了一個解決方案,就是用分析結(jié)果的流動替代原始數(shù)據(jù)的流動。這個思路也打開了我對國內(nèi)大數(shù)據(jù)共享問題的思考空間。
“數(shù)據(jù)是數(shù)字經(jīng)濟(jì)時代的石油”,現(xiàn)實(shí)中大數(shù)據(jù)應(yīng)用的成功案例已經(jīng)非常多,包括產(chǎn)品的精準(zhǔn)營銷、服務(wù)的個性化方案以及信用風(fēng)險的有效評估等。大數(shù)據(jù)分析可以幫助提高經(jīng)濟(jì)效率,改善用戶體驗(yàn),擴(kuò)大經(jīng)營規(guī)模,促進(jìn)經(jīng)濟(jì)與社會的創(chuàng)新與發(fā)展。大數(shù)據(jù)已經(jīng)成為當(dāng)前經(jīng)濟(jì)中十分重要的生產(chǎn)要素。到目前為止,大數(shù)據(jù)多是在大科技平臺上產(chǎn)生的,因而大科技公司是大數(shù)據(jù)分析的主要實(shí)踐者。但如果大數(shù)據(jù)可以共享,大數(shù)據(jù)分析的紅利就會更大??赡芫褪浅鲇谶@個考慮,最近幾年政府在一些領(lǐng)域推動數(shù)據(jù)共享。設(shè)立幾家大數(shù)據(jù)征信公司的目的,應(yīng)該就是為了讓更多的商業(yè)銀行利用大數(shù)據(jù)信用風(fēng)險評估的手段。
但作為特殊的生產(chǎn)要素,并非所有的大數(shù)據(jù)都是可以拿出來共享的。在這個前提下如何達(dá)成數(shù)據(jù)共享的效果,確實(shí)需要做創(chuàng)新性的思考。討論數(shù)據(jù)共享,首先要面對數(shù)據(jù)權(quán)屬的問題,即數(shù)據(jù)歸誰所有?傳統(tǒng)生產(chǎn)要素如資本和土地的有效利用都是基于一個前提,就是清晰地界定產(chǎn)權(quán)。但這個做法很難簡單地套用到大數(shù)據(jù),直接的原因是一些大數(shù)據(jù)的權(quán)屬很難被清晰地界定。比如用戶在平臺上點(diǎn)外賣、看短視頻的數(shù)據(jù),既包含個人的一些信息,但同時也有平臺支持的線上活動。顯然,在這個實(shí)例中,要在用戶和平臺之間劃清楚數(shù)據(jù)的所有權(quán)界線,難度非常大。一個合理的解決方案是涉及個人特性的數(shù)據(jù)歸個人所有,用戶在平臺上活動留下的數(shù)字足跡可以歸個人和平臺共同擁有,與個人基本上沒有關(guān)系的數(shù)據(jù)則可以歸平臺所有。
在現(xiàn)實(shí)生活中,數(shù)據(jù)確權(quán)還面臨一個挑戰(zhàn),就是要在權(quán)益保護(hù)與使用效率之間取得一個平衡。中國和歐盟的實(shí)踐提供了兩個對應(yīng)的典型案例。過去中國缺乏有效的數(shù)據(jù)治理政策,既沒有確權(quán),保護(hù)也不足。這樣,一方面,利用大數(shù)據(jù)分析的創(chuàng)新活動十分活躍,但另一方面,各種違規(guī)、違法的行為也十分普遍。因此,最近幾年政府采取了許多措施,加大數(shù)據(jù)保護(hù)的力度。歐盟在數(shù)據(jù)保護(hù)方面一直做得比較早、也比較好,美中不足是由于限制比較多,基于大數(shù)據(jù)分析的經(jīng)濟(jì)創(chuàng)新相對不活躍。因此,數(shù)據(jù)治理特別是確權(quán)需要秉承一個原則,就是既要保護(hù)權(quán)益,也要支持創(chuàng)新。對數(shù)據(jù)確權(quán)要特別重視平臺的貢獻(xiàn)和權(quán)益。
討論數(shù)據(jù)共享還要面對適合性的問題,什么數(shù)據(jù)可以共享、什么數(shù)據(jù)不能共享?從原則上說,起碼有三類數(shù)據(jù)不能共享:一是個人隱私,二是商業(yè)機(jī)密,三是國家安全。個人的姓名、年齡、性別、教育水平、家庭住址、聯(lián)系方式等均屬于個人隱私,應(yīng)該明確歸屬于個人所有,當(dāng)然也不能輕易分享。業(yè)內(nèi)常見的做法是對行為與交易數(shù)據(jù)做脫敏處理,分析師無法追溯到具體的個人或者人群。同樣,如果事關(guān)商業(yè)機(jī)密和國家安全,數(shù)據(jù)也不能隨便披露。就這些大的原則達(dá)成共識并不難,難的是在執(zhí)行過程中如何把握。以國家安全為例,如果范圍劃得寬泛一些,那也許可以認(rèn)定絕大部分?jǐn)?shù)據(jù)都有一定的敏感性,即便像公眾打車、叫外賣甚至看短視頻這樣的數(shù)據(jù),也不排除能分析出一些人群行為方式的變化。所以,如何恰當(dāng)?shù)匕盐者@個度,同樣是一個極大的考驗(yàn)。如果標(biāo)準(zhǔn)設(shè)定得不夠嚴(yán)格,可能會造成不少隱患。但如果標(biāo)準(zhǔn)卡得太嚴(yán),大數(shù)據(jù)分析也就無從做起。
討論數(shù)據(jù)共享,最后需要回答的問題是,如何共享?大數(shù)據(jù)其實(shí)有非常適合共享的特點(diǎn),就是可以無限制地復(fù)制。這是數(shù)據(jù)要素與傳統(tǒng)生產(chǎn)要素的一個根本差別,無論是資本還是土地,如果已經(jīng)有一家企業(yè)在使用,別的企業(yè)就無法同時使用。但大數(shù)據(jù)不一樣,如果需要,一套數(shù)據(jù)可以供無數(shù)家企業(yè)同時使用,或許這也正是大數(shù)據(jù)分析能夠產(chǎn)生超常回報的原因。但這個優(yōu)點(diǎn)也會引發(fā)一個缺點(diǎn),就是數(shù)據(jù)的擁有者如何保證購買者不會復(fù)制數(shù)據(jù)給其他人使用,如果不能保證,那么擁有者也就只能出售一次,大數(shù)據(jù)共享所產(chǎn)生的回報很難完全內(nèi)部化。這樣,擁有者就很難有足夠的激勵和資源去從事費(fèi)時費(fèi)力的搜集、清理和分析工作。大數(shù)據(jù)若沒了生產(chǎn),共享也就無從談起。
但在現(xiàn)實(shí)生活中已經(jīng)有公共數(shù)據(jù)共享的實(shí)例。所謂公共數(shù)據(jù),主要是指由公共部門積累的大量靜態(tài)數(shù)據(jù),典型的例子是稅收、社保、司法甚至水電等數(shù)據(jù)。這些數(shù)據(jù)已經(jīng)形成,也不需要相關(guān)部門再做額外的投入。目前一些地區(qū)通過建立地方性的數(shù)據(jù)平臺,整合已有的公共數(shù)據(jù),支持商業(yè)銀行的信用風(fēng)險評估,為中小企業(yè)提供貸款,取得了不錯的效果。廣東省、浙江省、蘇州市和淄博市等嘗試建立的平臺形態(tài)不同,主導(dǎo)機(jī)構(gòu)也不一樣,甚至覆蓋的數(shù)據(jù)也有很大的差別,但這些實(shí)踐有一個共同的地方,就是向商業(yè)銀行共享公共數(shù)據(jù),支持普惠金融業(yè)務(wù)。
特別需要指出的是,即便是這類共享公共數(shù)據(jù)的平臺,其實(shí)也沒有共享原始數(shù)據(jù)。平臺的功能只是提供一個接口,讓獲得授權(quán)的銀行算法工具進(jìn)入不同的公共數(shù)據(jù)庫進(jìn)行運(yùn)算,獲得結(jié)果。換句話說,這些金融信息服務(wù)平臺所做的,實(shí)質(zhì)上就是周小川所提出的思路,“原始數(shù)據(jù)不出系統(tǒng),但分析結(jié)果可以出系統(tǒng)”?!肮矓?shù)據(jù)”不能出系統(tǒng),有權(quán)益的考慮,也有安全的考慮。但這個理由對于大科技平臺上的大數(shù)據(jù)則更加突出。因?yàn)榇蠖鄶?shù)公共數(shù)據(jù)是靜態(tài)的,什么時候交過多少稅、交過多少水電費(fèi),在系統(tǒng)內(nèi)使用,還是在系統(tǒng)外使用,差異不大。但大數(shù)據(jù)是動態(tài)的,如果分割之后離開系統(tǒng),可能就很難產(chǎn)生同樣的大數(shù)據(jù)分析功效。
最近有一種觀點(diǎn),既然大數(shù)據(jù)是一種新的生產(chǎn)要素,既重要、又敏感,因此最好能由政府部門或者國有企業(yè)掌握。這種想法有一定的合理性,因?yàn)樵诂F(xiàn)實(shí)中,民營企業(yè)在數(shù)據(jù)處理方面的不合規(guī)、不合法行為確實(shí)非常多。當(dāng)然,幾乎所有的大科技公司都是民營企業(yè),這也是事實(shí)。但解決合規(guī)合法問題的有效途徑是加強(qiáng)監(jiān)管,而不是把數(shù)據(jù)集中到國有部門。數(shù)據(jù)如何才能集中到國有部門,這個技術(shù)問題就不好解決。即便能,國有部門行為的合規(guī)性比較高,但創(chuàng)新性卻普遍比較低,這樣大數(shù)據(jù)分析的活力也就喪失了。最佳甚至唯一的解決方案是加強(qiáng)對民營大科技公司的監(jiān)管,事實(shí)上,最近兩年,數(shù)據(jù)保護(hù)的法律、制度頻頻出臺,大科技公司的數(shù)據(jù)保護(hù)意識已經(jīng)大大加強(qiáng)。即便學(xué)者從事學(xué)術(shù)研究,獲取數(shù)據(jù)的難度也明顯提高了。
總之,千萬不要套用傳統(tǒng)生產(chǎn)要素的管理方法去管理數(shù)據(jù)生產(chǎn)要素。無論是確權(quán),還是共享,都需要適應(yīng)數(shù)據(jù)特性的思路,根本目的是在保護(hù)相關(guān)方權(quán)益和發(fā)揮大數(shù)據(jù)效用之間取得平衡。大數(shù)據(jù)共享是一個值得向往和努力的方向,但在實(shí)施中要避免簡單粗暴的做法,尤其不能只是把數(shù)據(jù)分享給大家。事實(shí)上很多原始數(shù)據(jù)是不能拿出來的,這其中有個人隱私、商業(yè)機(jī)密和國家安全等方面的考慮,也是因?yàn)閿?shù)據(jù)復(fù)制的成本非常低,更重要的是很多數(shù)據(jù)一旦離開其原生的平臺系統(tǒng),其價值就會大打折扣甚至變得一分不值。所以,推動共享的合理做法是建立數(shù)據(jù)共享平臺,需要使用大數(shù)據(jù)的機(jī)構(gòu)可以通過平臺提供的接入口,利用大科技平臺的原始數(shù)據(jù)進(jìn)行運(yùn)算,然后輸出結(jié)果,即“原始數(shù)據(jù)不出系統(tǒng),運(yùn)算結(jié)果出系統(tǒng)”。這就是我從周小川在博鰲亞洲論壇提出的思路獲得的啟示。(中新經(jīng)緯APP)
本文由中新經(jīng)緯研究院選編,因選編產(chǎn)生的作品中新經(jīng)緯版權(quán)所有,未經(jīng)書面授權(quán),任何單位及個人不得轉(zhuǎn)載、摘編或以其它方式使用。選編內(nèi)容涉及的觀點(diǎn)僅代表原作者,不代表中新經(jīng)緯觀點(diǎn)。
責(zé)任編輯:宋亞芬
【承澤觀察·平臺經(jīng)濟(jì)40評之二十五】沈艷:推行算法審計(jì)大有可為
【承澤觀察·平臺經(jīng)濟(jì)40評之二十四】張俊妮:主動提升算法透明度有利于平臺企業(yè)可持續(xù)發(fā)展
【承澤觀察·平臺經(jīng)濟(jì)40評之二十三】余昌華:數(shù)字經(jīng)濟(jì)提升了投資效率嗎?