21世紀經濟報道記者 尤為 廣州報道
數據已成為一種全新的生產要素,于國家和企業而言都將是新的經濟增長點。而目前,數據要素市場還處于初期發展階段,企業如何抓住機遇在未來市場中占有一席之地、激發數據要素市場面臨哪些困境……圍繞這些問題,廣州芳禾數據有限公司CTO、信息安全博士李明接受了21世紀經濟報道記者的專訪。
“合規之于數據要素市場,就像行車時的安全帶?!崩蠲髟趯TL中多次談到“安全”與“合規”。他認為這是當下數據要素市場最受關注的兩個問題,也是數據產品在數據交易所上架時的重要步驟。
他還表示,數據能否被安全合規利用是數據要素市場快速發展的關鍵。為此,芳禾數據在國家杰出青年科學基金獲得者、國務院學位委員會網絡空間安全學科評議組成員、暨南大學副校長翁健教授團隊的指導下,聯合研發了數據安全與隱私計算平臺,目前已通過中國信通院、中國金融認證中心CFCA等第三方權威測評,助力政府、企業等客戶解決數據流通過程中的安全和隱私保護問題,釋放數據要素價值,產生了良好的經濟和社會效益。芳禾數據通過精進對數據應用場景的理解,以“技術+應用”雙輪驅動,一定能走得更長遠!
廣州芳禾數據有限公司CTO、信息安全博士李明 受訪者供圖
成立國家數據局,數據要素的管理鏈路、發展鏈路將更加清晰
《21世紀》:最近中央剛剛宣布成立了專門負責數據要素市場相關工作的數據局,請談談成立國家數據局對數據要素市場的影響?
李明:國家數據局對整個數據要素市場的發展意義深遠。
國家在將數據定位為一種關鍵生產要素后,制定了許多頂層政策,包括“數據二十條”等,明確提出要加快推進數據要素行業、促進數據要素市場化配置,但這更多是指導性的思想,更多可實施性流程還沒完全明確。此前沒有全面統籌數據要素這樣的一個國家級部門,每個省都有自己的數據管理局,比如廣東省政務數據服務管理局、海南省大數據管理局等,這些部門往上匯報的對象包括發改委、網信辦等等。現在有了國家數據局,大家都能夠清晰地知道哪個部門進行統籌,哪些單位負責實施,地方的數據要素部門也有了最重要的對接對象。這也意味著,數據要素的管理鏈路和發展鏈路將越來越清晰。這個意義是非常深遠的。
《21世紀》:你覺得數據要素市場的前景如何?
李明:非常好。最近很火的ChatGPT,就是一個數據要素原料支撐起來的大語言模型。未來會有更多類似在不同領域的大模型,都需要更多、更好的數據,而數據要素市場則是專門提供數據原料的場所,所以數據要素市場的想象空間足夠大,這也是芳禾數據不斷在數據要素行業增加核心研發投入的原因。
我們可以想象,隨著未來對數據的依賴程度越來越高,數據會成為每個人身上非常重要的資源。就像我們滿足了衣食住行物資需求后,會開始有更高層次的精神需求。對數據的需求是一樣的道理,但數據要素本身又不一樣。比如和土地要素相比,土地不能搬走,土地上建樓后也難以重復再建,使得土地要素的管理機制是清晰的,管理成本也沒那么高。而數據要素就不一樣了,它可以被無限復制、傳播和擴展。這就導致數據要素面臨更大的挑戰,也意味著需要投入更多的人力、更多的資源,才能發展好數據要素市場。
《21世紀》:如何激發數據要素市場的活力?
李明:按照國家的政策,鼓勵場內外相結合的數據交易,培育壯大場內交易,而目前只有很少部分交易是在數據交易所完成的,有大量的數據交易還處在灰色地帶。激發數據要素市場的活力,就需要將“灰色地帶”的數據交易逐步引導到“場內外合規地帶”,數據商參與的積極性也會越來越高。數據要素市場的盤活需要我們多方都處于一種良性循環,而非一廂情愿。
《21世紀》:現在在數據交易所上架數據產品,最重要的步驟是什么?
李明:目前,交易所上架數據產品,每個省都有各自的一套流程。以廣東省為例,數據產品入場交易前需要經過最重要的一個步驟,就是合規審核。廣東率先成立了全國首個數據合規委員會,負責數據產品的合規會審。委員會的委員包括來自法律、技術、財務等不同領域的專家。審查項包括登記主體是否涉及違法違規、企業背景、數據授權鏈路是否清晰、數據使用范圍是否明確等等。只有經過合規委員會的評審之后,數據產品才能上架廣州數據交易所。為了確保數據資產登記的合規性,登記主體要做好數據產品的內部安全機制建設、服務流通建設以及管理制度建設,這也在促進企業在規范其數據產品運營方面更加合理有效。
現在數據要素行業最需要關注的是合規
《21世紀》:你認為目前在數據要素市場發展的過程中哪些問題是需要重點關注?
李明:現在數據要素行業最需要關注的是安全合規。安全合規對于數據要素市場的重要性,就像行車時的安全帶。我們都知道安全帶是每位車主的生命帶,安全合規對于數據要素行業也是同樣的道理。我們都很希望數據要素能夠作為國家的重要支柱型產業,推動國家數字經濟的高質量發展,像踩油門一樣直往前沖,但顯然不能沒有安全合規作為數據要素行業的“安全帶”。
《21世紀》:能否談一談對數據合規的理解?
李明:“數據二十條”提出“三權分置”的數據產權制度框架,分為持有權、加工使用權和產品運營權。數據合規也是圍繞這三個方面來實施,包括采集持有要合規、存儲過程要合規、加工使用要合規、產品運營要合規、安全保障體系要規范,這些都是數據產品運營的基本要求。
舉例來講,有些用戶的個人數據被應用服務提供商進行商業化使用,但用戶個人是沒有得到收益的,這是因為整個確權和加工使用的權益政策還有待完善。未來可能的模式是,我們大量的個人數據,都可以有償地提供出去,但在主體使用這些數據的時候,會有健全的技術和政策機制來確保服務提供商在使用我們個人數據的時候,明確場景、明確權益分配、明確邊界范圍等等,做到一事一授權或者是前置預授權。
《21世紀》:芳禾數據在數據要素市場中的角色定位是什么?
李明:按照國家在“數據二十條”中關于數據要素行業的定義,芳禾數據屬于數據商的身份。數據商也分方向領域,有專門提供數據,就像數據礦主一樣;有專門提供數據技術服務,具有專業的數據加工處理能力,比如利用隱私計算技術對數據進行加工處理,芳禾就屬于這類型的數據商。
實際上,公司的重要使命是幫助客戶搭建安全合規的多源數據服務通道,完成數據治理、數據標準、數據質量校驗等步驟,把高價值的數據產品呈現給客戶,解決供應端和需求端之間的銜接問題,滿足客戶提質增效的目的。
《21世紀》:芳禾數據未來的長期發展方向和目標是什么?
李明:芳禾數據的定位是基于隱私計算的數據融合應用服務商。早在2014年,芳禾數據就為政府、行業提供了許多數據服務報告和系統平臺,通過匯聚多源數據來提供數據分析決策服務,過程中我們積累了大量的數據服務經驗。
當前,數據要素行業還處在初期階段,基礎機制還處于探索建設中。芳禾數據全力參與其中,就是想要成為數據要素行業的先行者。為此,我們會不斷地深化技術服務能力,緊密貼近客戶對數據應用的需求,通過提供底層基礎技術和上層服務應用來為客戶解決實際問題。
希望借著國家關于數據要素基礎制度建設這股春風,能把公司持續積累的數據服務能力充分發揮出來,在未來數據要素市場占有一席之地。
數據不能被安全利用制約數據要素市場的發展
《21世紀》:制約數據要素市場發展的因素有哪些?
李明:第一個制約因素是企業將數據進行安全利用的能力程度?,F階段強調的安全不同于以往的網絡安全。以前強調更多的是指防火墻、鏈路安全、加密存儲等流通存儲安全,現在更加強調數據融合利用中的安全,即大家常說的“原始數據不出域、數據可用不可見、可控可計量”。
工信部等十六部門在《關于促進數據安全產業發展的指導意見》中明確提出要加強基于隱私計算技術的數據流通應用。目前來看,隱私計算技術的應用程度是影響數據要素市場發展的關鍵。一是大部分的企業還沒有投入足夠的成本來支持隱私計算技術的應用,也就無法發揮其自身的數據要素價值。二是隱私計算技術本身也存在需要突破和解決的問題,目前需要根據業務和場景解決某些環節的數據利用問題來適配相應的解決方案。為此,芳禾數據先后承擔了國家重點研發計劃項目、國家自然科學基金重點項目等專門針對數據安全與隱私計算的重大國家級省部級項目,不斷攻關和優化隱私計算底層技術,促進數據要素的共享共用。上個月,芳禾數據有幸獲評了由OpenMPC和獵云網聯合發布的“2022年度隱私計算最具潛力企業TOP10”,是廣州本土唯一的一家上榜企業。我們相信公司在基于隱私計算技術這條道路上會越扎越深、越走越寬,支撐中國海量數據要素寶藏的價值釋放。
第二個制約因素沒有足夠多的數據源,導致數據產品很少。其實每個企業都有大量的數據,但企業還缺少安全可對外提供數據產品的能力,同時市場上也缺少對數據進行加工處理的服務提供商。為了解決這個問題,芳禾數據提供多源數據接入、數據治理、數據融合建模、數據產品合規、數據資產化等數據能力,幫助更多的企業把數據加工成數據產品,讓更多的數據在數據要素市場上流通。
《21世紀》:如何把關和提高數據產品的質量?
李明:作為一家數據服務公司來說,芳禾數據是將數據質量定義為公司的生命線。因此在數據質量方面,我們有一套基于自研平臺搭建的數據質量管理流程。
首先,是前期對接數據源進行有效的篩選,建立分類評級制度。芳禾數據會校驗每家數據源的數據質量。一般情況下,由于數據源不愿意配合校驗數據。因為校驗數據需要把數據提供出來,如果對方不采購數據了,不僅白白增加工作量,還面臨數據泄露的風險。為此,芳禾數據還自主設計了一套數據源質量安全校驗的流程和方法,并將這套流程申請了專利。
其次,考慮到一家數據源很難支撐一個指標的全局覆蓋,芳禾數據不會出于成本考慮只使用一家數據源,而是考慮多源數據融合來提供服務。通過拉通多方數據源為客戶的一個指標服務,讓客戶對數據的結果更信任。
最后,我們建立了數據標準化以及輸出校驗機制,會對提供出去的數據結果進行統一再處理。