基于LDA模子與政策找九宮格空間東西的中國數據主權政策研討_中國網
中國網/中國成長門戶網訊 數據主權是指一個國度對其政權管轄范圍內的收集舉措措施、數據主體、數據行動和數據資本及相干數據產物具有天生、傳佈、治理、把持、應用和維護的主導權,其正在成為數字時期國度主權的主要構成部門。美國、歐盟和中國等國度和地域均熟悉到數據資本所具有的計謀價值,積極展開數據主權計謀安排。由于技巧才能和經濟成長狀態分歧等原因,列國采取了差別化的數據主權政策。
數據主權政策對于保護國度平安、保證國度好處具有主要感化,近年來惹起學術界較為普遍的追蹤關心。有的學者從國度主體的視角提出了數據主權概念,也有學者從組織和小我主體的視角界定了數據主權內在。冉從敬定性總結了數據主權計謀安排的全球態勢。鄭琳等闡釋了國度數據主權概念,并回納剖析了歐美數據主權計謀。但是,已有研討重要經由過程定性回納方式從國度微觀層面分析數據主權計謀的特色,但缺少關于數據主權政策文本內在和特征的定量剖析。本文采用政策文天職析方式研討我國數據主權政策,應用LDA(Latent Dirichlet Allocation)主題模子和政策東西定量剖析中1對1講授國數據主權政策的演變、態勢,基于此與全球數據主權政策停止國際比擬并提出對策與提出。這一研討既拓展了政策文本小樹屋剖析方式的利用範疇,將其利用于數據主權範疇的政策剖析,也為優化design我國數據主權政策供給方式論領導。
數據主權政策研討的剖析框架構建與design
研討方式與框架維度
本文從政策東西的角度動身,應用LDA主題模子對中國2010—2022年的數據主權相干政策停止剖析與量化。本文樹立了數據主權政策東西的剖析框架(圖1)。對政策文本停止統計剖析,繚繞政策時光、政策機構和政策類型分布睜開,探討數據主權政策的演變經過歷程、機構分布和政策效率。供應型、周遭的狀況型和需求型政策東西分類法在既有研討中最為罕見,本文采用此種政策東西的維度劃分對數據主權政策停止編碼剖析。應用LDA主題模子發掘數據主權政策文本中的焦點主題詞,并停止可視化展現。
數據起源及編碼
本文選用“北年夜寶貝在線數據庫”作為數據主權相干政策文本的搜集起源,以“數據主權”“數據平安”“數據跨境”“國度平安”等要害詞搭配組合停止全文檢索,挑選“中心律例”政策文件作為剖析文本,合計搜集45份政策文件(表1展現了部門數據主權政策文本)。對歸入樣本的45份中心律例政策文件停止摘錄和編碼(部門數據主權政策文件內在的事務編碼情形見表2),以便更清楚地標注分歧政策與詳細條目中包括的政策東西,將非構造化的文本數據停止轉換用于定量剖析。
數據主權政策總體情形
政策時光演變分布
依據政策文本的發布時光統計成果,中國數據主權相干政策始于2012年5月工信部發布的《internet行業“十二五”成長計劃》;“數據主權”這一名詞初次呈現在2015年國務院印發的《增進年夜數據成長舉動綱領》,指出應“加強收集空間數據主權維護才能,保護國度平安,有用晉陞國度競爭力”。但是,早在2010年曾經開端呈現internet主權的概念。數據主權政策發布多少數字在2016年和2021年迎來了2次年夜幅晉陞(圖2)。聯合年夜數據、云盤算和區塊鏈等新技巧的呈現與疾速成長,將數據主權政策演變劃分為4個階段。
internet主權階段(2010—2013年)。2010年,國務院消息辦公室發布《中國internet狀態》白皮書,指出“中華國民共和國境內的internet屬于中國主權管轄范圍,中國的internet主權應遭到尊敬和保護”。中國慢慢完美internet法令律例,積極推進internet基本舉措措施扶植,加大力度對internet的治理和監管,確保internet平安,推進internet財產成長。
信息主權階段(2014—2015年)。2014年7月16日,習近平主席在巴西國會頒發題為《弘揚傳統友愛共譜一起配合新篇》演講,誇大每一個國度在信息範疇的主權權益都不該遭到侵略。這一階段,相干政策誇大加大力度信息自立可控,扶植信息基本舉措措施,推動信息平安技巧和尺度的研發,晉陞中國在信息主權範疇的現實管控才能和國際話語權。
收集空間主權階段(2015—2018年)。2015年7月公佈實行的《中華國民共和國國度平安法》初次明白了收集空間主權的概念。在2017年3月發布的《收集空間國際一起配合計謀》中將“果斷保護中國收集主權、平安和成長好處”作為中國介入收集空間國際一起配合的計謀目的之一。2018年5月,在國度internet信息辦公室發布的《數字中國扶植成長陳述(2017年)》中,將“保護收集主權”作為數字中國扶植面對的情勢和盡力標的目的。這一階段,相干政策誇大加大力度收集平安維護、樹立收集主權治理機制、推動收集空間管理等,以確保國度在收集空間中有權力和才能維護國度平安和保護國度好處。
數據主權階段(2019年至今)。2019年7月,《加大力度產業internet平安任務的領導看法》指出,根據產業門類範疇、數據類型、數據價值等樹立產業internet數據分級分類治理軌制,展開主要數據出境平安評價和監測。2020年9月,中國倡議《全球數據平安建議》,呼吁列國未經他法律王法公法律答應不得直接向企業或小我調取位于他國的數據。2021年9月開端實施的《中華國民共和國數據平安法》規則,保護數據平安,應該保持總體國度平安不雅,樹立健全數據平安管理系統,進步數據平安保證才能;同年,《中華國民共和國小我信息維護法》也對小我信息的跨境活動、數據當地化存儲及域外效率做出了相干規則。這一階段,相干政策誇大樹立數據分級分類軌制、明白數據出境平安評價請求、推動數據維護才能認證機制等,以確保數據在跨境活動經過歷程中獲得有用維護和合規應用。
綜上,中國的數據主權計謀經過的事況了“internet主權—信息主權—收集空間主權—數據主權”的演變,全體政策特色為以平安為綱,推進定例立制,增進數佔有序活動,加大力度數據跨境活動經過歷程和出境后的風險評價和監管。
政策發文機構分布
政策發文機構可以或許反應出各政策律例的效率級別。國務院、產業和信息化部、商務部、全國人年夜常委會等合計33個機構介入數據主權政策制訂,表3展現了發布政策的焦點機構分布情形。我國數據主權政策有結合發布和零丁發布2種情勢;45份中心律例共享空間政策文件中,8份為結合發布,37份為零丁發布,零丁發布占比82.2%。
基于統計成果可知,發布政策文件較多的機構順次為國務院、產業和信息化部、商務部;結合發文的重要為國度成長和改造委員會、產業和信息化部。政策發布焦點主體共有5個,占比15.2%,非焦點主體共有28個,占比84.8%,各政策主體在全體分布上較為疏散。總體來看,介入數據主權政策制訂的主體浩繁,但焦點主體的發文多少數字占比54.2%,較為集中。全體浮現出以國務院、產業和信息化部、商務部、全國人年夜常委會、國度internet信息辦公室為五年夜中間發文的構造特征(表3)。
政策類型分布
政策發布所采用的文品種型因政策性質和目的的分歧而有所差別,由此招致了分歧政策的效率分歧。本文所搜集的政策樣本中,數據主權政策采用了9種分歧的情勢停止發布,包含計劃、看法、計劃、法令、告訴、綱領和措施等,展示出情勢多樣性(表4)。此中,計劃、看法和計劃在政策文本中占比擬高,這闡明現有政策中相干部分提出的看法和處置看法較多;而針對性更強、更詳細的措施在全體政策分布中較少;全國人年夜及其常務委員會共公佈4項法令。
數據主權政策二維剖析
政策東西是政策主體為完成政策目的而采取的詳細辦法和手腕,本文依據已有研討從需求型、周遭的狀況型和供應型3個方面構建了數據主權政策東西剖析維度,經由過程政策東西辨認出政策實行的主要道路和保證辦法,并基于LDA主題模子停止政策主題剖析,提醒了政策的焦點內在的事務和重要目的,以期為國度進一個步驟優化完美數據主權政策制訂供給決議計劃參考。
斟酌到一個政策剖析單位能夠同時利用多種政策東西,是以本文用于剖析的政策東西多少數字之和跨越編碼單位總數。從政策東西利用類型來看,我國數據主權政策對政策東西的利用較為周全,需求型、周遭的狀況型、供應型政策東西分辨占比21.6%、59.6%、18.8%(圖3)。此中,周遭的狀況型政策東西較為常用,需求型和供應型政策東西利用頻率次之。我國采用多種政策東西配合推進數據跨境平安活動和數據主權維護。
政策東西維度的實證剖析
需求型政策東西,旨在引進各方氣力停止交通與一起配合,積極展開數據平安治理、跨境活動和國際一起配合規定等試點,凸起主要範疇和要害環節,從而增進數據平安有序活動(表5)。需求型數據主權政策東西以試點示范和國際一起配合為主,側重于經由過程試點示范和國際一起配合等成長形式先行先試,積聚數據平安治理和數據主權維護有用經歷并推行普及于全社會,重視領導社會氣力介入,展開宣揚推行,從而推進行業規范成長、進步數據主權維護認識。
周遭的狀況型政策東西,旨在經由過程優化各主體、各環節實行的周遭的狀況前提、政策導向、尺度規范和問責機制等領導和監管各主體采取更積極的數據平安治理和數據主權維護辦法(表6)。全體而言,周遭的狀況型政策東西占比跨越對折,作為一種直接調控手腕遭到政策主體的喜愛。律例管束是常用方式,跟著新技巧的成長,數據範圍不竭擴展,國際數據主威望脅等題目日益凸顯,需求加大力度規制積極應對域外效率等題目。尺度規范、平安規范、保證辦法和審查評價是領導新興數字財產規范成長、保證數據平安有序活動等正在慢慢完美的政策文件,包含跨境暢通原則、平安評價和保證機制等。戰略性辦法對政策系統起到彌補感化。以後常識產權政策東西利用較少,是數據主權政策中的顯明空缺點。
供應型政策東西,旨在為各主體的數據平安治理、數據主權維護、信息基本舉措措施扶植、技巧研發、人才培育、兼顧和諧等供給各類資本支撐(表7)。在供應型政策東西中,信息基本舉措措施扶植、技巧支撐和組織扶植占比擬高。跟著年夜數據、云盤算和區塊鏈等新技巧的呈現,信息化舉措措施成為數字經濟成長的主要基本前提。《中華國民共和國公民經濟和社會成長第十四個五年計劃和2035年前景目的綱領》和《中華國民共和國收集平安法》均提出要樹立健全要害信息基本舉措措施維護系統。技巧支撐是保證數據平安活動的主要氣力,應經由過程開闢焦點技巧構建平安靠得住的數據暢通周遭的狀況。在組織扶植的兼顧和諧下,信息基本舉措措施扶植和技巧支撐相反相成,為數據平安活動和數據主權維護供給連續動力。以後人才支撐和資金支撐政策東西應講授場地用較少,分辨為6.67%和8.89%。資金支撐具有定向性上風,人才培育則具有持久效益,應恰當增添這兩個政策東西的利用。
政策主題維度的實證剖析
LDA主題模子主題數與分歧性剖析
LDA主題模子可用于發掘大批文本的潛伏主題特征。它是一種無監視的、非構造化的概率模子,應用了單詞共現具有語義聯繫關係的紀律,無需事後設置字典或主題種別便可發明文檔語料庫中的潛伏主題,削減了研討者客觀判定對主題分類的影響。本文將每個編碼單位視為一個文檔,選擇主題分歧性目標模子用于鑒定最優主題多少數字,若分歧性處于較高程度,模子的主題構造將加倍穩固。本文選用“哈工年夜停用詞表”對文檔停止文本預處置(中文分詞、往停用詞),主題數與分歧性成果如圖4所示。經由過程主題評價,本文選用3作為主題個數,并應用pyLDAvis算法對LDA主題模子成果停止可視化剖析與展現。
詞云可視化
圖5展現了基于LDA主題模子發掘出的數據主權政策的主題詞袋(bag of words)。依據LDA主題模子可視化成果,以後數據主權政策分為3類:數據平安與小我信息維護;數據跨境與國際一起配合;數據平安評價與數據出境。
數據平安與小我信息維護(圖5a)。推進扶植周全數據平安維護系統,包含完美數據分級分類軌制和小我信息受權應用軌制。為構成數據資本匯集共享、數據活動平安有序的數據要素良性成長格式,應妥當處置國度平安、數據跨境暢通和小我隱私維護三者的關系。
數據跨境與國際一起配合(圖5b)。明白數據平安法在域外的實用效率,進一個步驟健全數據跨境暢通規范,實行數據跨境傳輸與平安管控試點。摸索參加區域性國際數據跨境暢通規定制訂,增進構成數據跨境暢通的全球協同機制,強化中國同世界其他國度和地域之間的平安協作與信息資本共享。
數據平安評價與數據出境(圖5c)。健全數據分級分類治理軌制和數據出境平安審查機制。確保數據在出境前可以或許停止周全的事前評價、連續監視和風險自評價,有用辨認和防范數據出境帶來的平安風險,維護國度和小我的敏感信息。摸索數據維護才能認證機制design,為數據出境供給客不雅和可托的評價尺度,確保數據的符合法規性、平安性和可控性。
綜上,中國數據小樹屋主權政策重要應用了周遭的狀況型政策東西,輔之需求型和供應型政策東西,推進數據跨境平安活動和數據主權維護。政策文本內在的事務浮現出“數據平安與小我信息維護”“數據跨境與國際一起配合”“數據平安評價與數據出境”三年夜主題特征。我國陸續制訂了《中華國民共和國小我信息維護法》《中華國民共和國數據平安法》等法令,出臺了《數據出境平安評價措施》等一系列規章軌制,履行嚴厲數據出境和信息維護治理形式,確保我國數據主權得以維護。
啟發與提出
本文在對數據主權範疇政策停止剖析的基本上,對我國數據跨境平安活動與數據主權維護提出4條政策提出。
積極主導和介入國際規定制訂,樹立互信機制,進步國際話語權。積極主導和扶植性介入制訂、完美數字時期的國際規定和尺度,與更普遍的國度樹立多種情勢的數據一起配合平臺,就數據基本舉措措施扶植、數據資本開闢應用、數據平安保證等方面停止技巧支撐和才能扶植,增進數據互聯互通和共享共贏。推進與其他國度或地域在數據維護程度、尺度、規范等方面的一起配合會商,爭奪更多分歧看法和共鳴,完成數據維護尺度和規范的彼此承認或互惠恰當性。
優化數據出境平安評價流程,進步評價效力和正確性。樹立以風險為導向的數據分類治理軌制,對分歧類型和品級的數據采取差別化的管控辦法,加大力度數據平安評價的尺度制訂和實行,明白數據平安評價的請求和領導,確保數據出境經過歷程中的平安性和可托性。應用進步前輩技巧手腕進步數據出境平安評價的效力和正確性。例如,可以經由過程引進人工智能和年夜數據剖析技巧等主動化評價流程,疾速辨認高風險的數據出境行動,以進步評價成果的正確性和靠得住性。
完美小我信息出境尺度合同模版,進步合規運營的效力。《小我信息出境尺度合同措施》于2023年6月1日起實施,旨在確保小我信息符合法規、平安、有序地跨境傳輸。經由過程應用尺度合同模板,我國可以或許經由過程《小我信息出境尺度合同措施》付與的法令束縛力來將境內的管轄權“延長”至境外,到達必定“境內法域外實用”的後果,完成數據跨境活動維護。將來,可以將尺度合同模板停止模塊化拓展,依據組織、企業或小我的營業需求,制訂更多可以選擇的模塊,以下降相干實體合規運營本錢,進步效力。
強化數據平安法治保證,構筑數據主權防地。以總體國度平安不雅為領導,完美保證數據平安的法令律例,強化數據平安管理系統。明白數據平安的法令義務,維護要害數據基本舉措措施;樹立數據平安風險評價和應急呼應機制;展開數據主權與平安宣揚教導,進步全平易近數據平安認識和才能;推進國際一起配合,加大力度與其他國度和地域在數據平安法令律例方面的交通和互鑒,配合增進國際數據平安尺度制訂,晉陞中國在全球數據管理中的話語權和影響力。
(作者:喬晗、徐君如,中國迷信院年夜學經濟與治理學院 中國迷信院年夜學數字經濟監測猜測預警與政策仿真教導部哲學社會迷信試驗室。《中國迷信院院刊》供稿)