生成式人工智能的風險與治理——以ChatGPT為例

文 |?西南政法大學經濟法學院?馬羽男

以ChatGPT為代表的生成式人工智能在創造社會福利的同時,也帶來了諸多風險。因此,當務之急是結合我國生成式人工智能發展狀況,厘清其應用價值與潛在風險之間的關系,以便在不影響應用發展的前提下有效化解風險。

生成式人工智能的運行機理主要分為三個階段,也就是機器學習和人工標記的準備階段、運用算法對數據進行處理以求出處理后結果的運算階段、數據運算產出成品向社會輸出并產生影響的生成階段。當前,生成式人工智能最突出的風險就是在準備階段的數據合規風險、運算階段的算法偏見風險以及生成階段的知識產權風險。

準備階段的數據合規風險。我國當前的數據合規體系是建立在《網絡安全法》《數據安全法》《個人信息保護法》之上的,要求數據處理者在處理過程中采取必要措施以保障基本的數據安全、網絡安全和個人信息安全。基于我國的法律框架,生成式人工智能的數據合規風險主要體現在三個方面:數據來源合規風險、數據使用合規風險、數據的準確性風險。首先是數據來源合規風險。以 ChatGPT為代表的生成式人工智能,初始階段往往要采集大量數據以供其訓練。基于此,可能會面臨如下問題:一是收集個人信息用戶是否同意;二是收集使用已公開的信息是否在“合理范圍”;三是收集的樣本受到版權保護,進行訓練時可否被認定為“合理使用”。其次是數據使用合規風險。一方面是數據泄露風險。用戶會將個人信息、商業信息甚至商業機密等傳輸給ChatGPT。分析ChatGPT運行機理不難發現,在迭代訓練中,它也會使用用戶輸入的信息和交互信息。因此,如何保證這些數據的安全是一個很大的難題。另一方面是用戶行使個人信息刪除權比較困難。雖然?OpenAI的隱私協議中規定了用戶對其個人信息享有相關的權利,但是鑒于要求生成式人工智能系統刪除數據的復雜特性,開發者能否實現對個人信息的真實刪除,從而達到符合法規的要求還存在較大的不確定性。最后是數據的準確性風險。因為在 ChatGPT訓練的早期,被投入到數據中的內容是由開發人員從網絡中獲得和選擇的,因此就有可能出現因為數據的缺失或錯誤等情況而致使所生成內容的不準確。

運行階段的算法偏見風險。以“人工標注”為輔助的“機器學習”,通過二者的結合,提高了生成式人工智能的智能化與精確性。但是,這也使得算法偏見的概率急劇增加。這種結合方法比傳統的機器學習方法更能體現人的主觀判斷和偏好,這是由于人們將自己的偏好信息加入到機器學習的模型中,從而增加了人們的偏見,并且這種偏見很難被追蹤和防范。在對 ChatGPT的運作方式進行分析后發現,算法偏見主要表現為兩方面:其一,由于接收到的數據需要人工標注,因此在理解過程中存在著一定的誤差。其二,對數據進行加工,當 ChatGPT對數據進行加工得出結論后,由于原始結果與大眾期望不一致,需要對之進行修正,但這一過程同樣會產生一定程度的算法偏見。

生成階段的知識產權風險。生成式人工智能的興起,對眾多產業提出了新的挑戰,而最具沖擊之處,在于在生成階段對知識產權領域所構成的挑戰。因為生成式人工智能具有高度的智能化,所以在運算過程中,與之前的人工智能系統相比,其知識產權的歸屬發生了顛覆性的變化。ChatGPT是一種生成式人工智能,它在處理和分析數據方面遠遠強于分析式人工智能,其內容生成過程主要包括內容自動化編纂、智能化修整加工、多模態轉換、創意生成等,直接影響著出版的內容生產模式和內容供應模式。盡管ChatGPT的創造者中包含一些自然人的創作因素,從某種意義上來說,更符合作品的構成要件,但這種由生成式人工智能所創造的作品能否被賦權,仍然存在爭論,并且具體的賦權認定標準研究還處于空白狀態。因此,知識產權風險成為生成式人工智能無法規避的第三大風險。

針對上述生成式人工智能三個方面的風險,建議采取以下三種應對策略來化解風險。

強化生成式人工智能企業的數據合規建設。生成式人工智能的發展不能只重能力和效率而忽視安全,相關企業應當利用良好的數據合規體系來保障數據安全。企業數據合規建設可以通過三個措施強化。其一,確立數據合規原則。其原則主要有四點,分別是合法合規原則、告知同意原則、正當目的原則、最小必要原則。其二,建立數據合規的多元技術機制。首先是宏觀層面的行業標準要統一。各行業的主管部門,應該帶頭建立一個數據版本的“新華辭典”,讓數據編碼、制式等保持一致,確保數據的來源、內容和處理邏輯能夠被“反事實驗證”。其次是中觀層面的內外審查體系。在內部設立數據合規專門機構,負責企業日常的數據合規處理,在外部引入第三方審查機制,對企業數據合規進行審計和倫理審查。最后是微觀層面的倫理規范。將倫理規范與原則以法律形式嵌入到技術應用的行為邏輯中去,使之能夠因勢而為。其三,完善數據合規相關法律。首先是完善立法,在立法層面加快出臺數據、人工智能方面的基本法,以作為企業數據合規法律方面的頂層指導。其次是執法完善,盡快明確各部門的執法權限,避免“多頭治理”產生“九龍治水”的局面。最后是完善司法,完善電子證據制度,保障權利人的相關訴權。

技管結合矯正生成式人工智能的算法偏見。這主要包含兩個措施。其一,針對生成式人工智能機器學習過程中所出現的先天性算法偏見,應當調整相關算法模型的學習路徑,遵守相關規范和技術標準,在生成式人工智能投入市場前應當進行實質審查。鑒于生成式人工智能的特征,可將其糾偏工作分為兩個方面:一方面,采用算法程序編譯預防機器學習中可能存在的先天偏見;另一方面,設置人工標注的標準,提高從業人員的執業水平以應對人工標注的算法偏見。其二,針對生成式人工智能的自我學習而得出的后天性算法偏見,應當通過建立敏捷化、自動化、全流程的監管體系來消除偏見。首先,實現對算法技術的自動化監管。針對機器學習和人工標注實現自動化監管,每當出現算法偏見時暫停輸出結果,返回查找問題根源。其次,建立多元主體監管模式。行政主體、平臺、行業協會、企業自身多方主體參與監管。最后,落實全流程敏捷的監管機制。對生成式人工智能產出結論的全過程進行監管,切實降低由于算法偏見導致錯誤結論的概率,有效推進可信算法體系的構建。

采用有限保護模式,以防范生成式人工智能作品在知識產權方面的風險。相較于傳統的人工智能技術,生成式人工智能的創新之處在于其擁有一定程度的自我認知,并且參與了輸出結果的加工和創造。如果基于其自我認知,而將其所有成果都進行保護,那么未來可能會出現生成式人工智能公司手握“創作霸權”的局面。但從商業角度而言,生成式人工智能公司耗費大量金錢和技術資本打造高度智能的人工智能程序,如果對該程序衍生的“作品”完全不予保護,也有違公平。因此,對于ChatGPT生成物的知識產權屬性,現階段應該根據其技術運行模式、參與程度、創新程度等進行綜合評判,對其產品的知識產權采用有所區分的有限保護模式。等到未來生成式人工智能發展到一定階段,深入了解其運行機制時,再確定具體的知識產權保護模式。

以ChatGPT為代表的生成式人工智能方興未艾,它所帶來的法律風險,很多都應在既有法律框架內妥善應對。面對風險和問題,不能因為產業有風險和理論有爭議,就限制生成式人工智能發展。這需要采取“法律+技術”的融合治理來營造一個好的市場環境,保障生成式人工智能市場茁壯成長。

【本文系國家社科基金一般項目“個人信息的競爭法保護疑難問題研究”(23BFX186)階段性成果】

(來源:中國社會科學網)

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/web/23699.shtml
繁體地址,請注明出處:http://hk.pswp.cn/web/23699.shtml
英文地址,請注明出處:http://en.pswp.cn/web/23699.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

0606 作業

#include <stdio.h> #include <string.h>typedef struct usr{char unm[21];char pwd[21]; }user;int main(int argc, const char *argv[]) {FILE* userfilefopen("./user_tible.txt","r");printf("輸入username:");user u;scanf(&qu…

人工智能在腫瘤預后預測中的最新研究進展|頂刊精析·24-06-07

小羅碎碎念 今天要分享的文獻主題&#xff0c;大家一定非常熟悉&#xff0c;因為絕大多數AI4cancer的文章都會提到它——預后預測&#xff0c;所以今天的文獻主題是——人工智能腫瘤預后預測。 在正式開始分享之前&#xff0c;我想先帶著大家梳理兩個問題。解決了以下兩個問…

Chrome 自動執行 JS 腳本 | Tampermonkey 插件

文章目錄 第 1 步:安裝插件 Tampermonkey第 2 步:固定到工具欄第 3 步:在網站上啟用 Tampermonkey第 4 步:查看效果第 5 步:調試 JS 代碼?? 背景:有個網站,每次進去都要點 3 次才能把相關頁面展開。而且,頁面經常會自己刷新,導致展開的頁面又收回去了。【這一天天的…

【Python】實現極致:克服PyInstaller打包挑戰,解決libpython3.10.so.1.0庫丟失難題

【Python】實現極致&#xff1a;克服PyInstaller打包挑戰&#xff0c;解決libpython3.10.so.1.0庫丟失難題 大家好 我是寸鐵&#x1f44a; 總結了一篇【Python】實現極致&#xff1a;克服PyInstaller打包挑戰&#xff0c;解決libpython3.10.so.1.0庫丟失難題? 喜歡的小伙伴可以…

MFC設置窗口在Z軸上的位置

函數原型&#xff1a; BOOL CWnd::SetWindowPos(const CWnd* pWndInsertAfter, int x, int y, int cx, int cy, UINT nFlags);返回值&#xff1a; 如果函數成功&#xff0c;則返回非零值&#xff1b;否則返回0。 參數&#xff1a; pWndInsertAfter&#xff1a;標識了在Z軸次…

ai智能全自動批量剪輯軟件神器,讓視頻創作變得簡單!

隨著科技的飛速發展&#xff0c;人工智能技術在各個領域都取得了突破。在視頻制作領域&#xff0c;AI智能全自動批量剪輯軟件神器的出現&#xff0c;為視頻創作者帶來了前所未有的便利。接下來咱們詳細介紹這款軟件的特點和優勢&#xff0c;以及它如何讓視頻創作變得更加簡單。…

【網絡安全的神秘世界】Kali安裝中文輸入法

&#x1f31d;博客主頁&#xff1a;泥菩薩 &#x1f496;專欄&#xff1a;Linux探索之旅 | 網絡安全的神秘世界 | 專接本 今天就手把手教你如何在kali中安裝和配置輸入法 首先&#xff0c;打開終端&#xff0c;輸入下面這行代碼&#xff1a; # sudo apt install ibus ibus-pi…

【機器學習】Python與深度學習的完美結合——深度學習在醫學影像診斷中的驚人表現

&#x1f525; 個人主頁&#xff1a;空白詩 文章目錄 一、引言二、深度學習在醫學影像診斷中的突破1. 技術原理2. 實際應用3. 性能表現 三、深度學習在醫學影像診斷中的驚人表現1. 提高疾病診斷準確率2. 輔助制定治療方案 四、深度學習對醫療行業的影響和推動作用 一、引言 隨著…

網絡安全領域六大頂級會議介紹:含會議介紹、會議地址及會議時間和截稿日期

**引言&#xff1a;**從事網絡安全工作&#xff0c;以下六個頂會必須要知道&#xff0c;很多安全的前沿技術都會在如下會議中產生與公開&#xff0c;如下會議發表論文大部分可以公開下載。這些會議不僅是學術研究人員展示最新研究成果的平臺&#xff0c;也是行業專家進行面對面…

Flutter_Android上架GooglePlay_問題

上架GooglePlay權限問題 問題描述 REQUEST_INSTALL_PACKAGES 權限問題解決方式 方式1 找到所有使用該權限的庫修改刪除該權限引用 方式2 打開項目 ~/andoird/app/src/main/AndroidMainfest.xml 添加文本<uses-permission android:name"android.permission.REQUES…

2024.6.06總結1103

今天去導員那領了三方&#xff0c;當導員問我是哪個地區時&#xff0c;我回答是武漢&#xff0c;當她問我是哪個公司時&#xff0c;我回答是華為。導員一定&#xff0c;愣了一下&#xff0c;隨即給我豎起了一個大拇指。 可能&#xff0c;她是很震驚吧&#xff0c;畢竟&#xff…

基于springboot的中小企業人事管理系統源碼數據庫

隨著科學技術的飛速發展&#xff0c;社會的方方面面、各行各業都在努力與現代的先進技術接軌&#xff0c;通過科技手段來提高自身的優勢&#xff0c;中小企業人事管理系統當然也不能排除在外。中小企業人事管理系統是以實際運用為開發背景&#xff0c;運用軟件工程原理和開發方…

[洛谷] 刷題棧 隊列

目錄 1.后綴表達式 2.表達式括號匹配 3.表達式求值 4.表達式的轉換 5.機器翻譯 1.后綴表達式 后綴表達式 - 洛谷 #include<iostream> #include<cstdio> using namespace std;int stk[100]; // 用于存儲操作數的棧 int index 0; // 棧頂索引int main() {c…

C++開發基礎之初探CUDA計算環境搭建

一、前言 項目中有使用到CUDA計算的相關內容。但是在早期CUDA計算環境搭建的過程中&#xff0c;并不是非常順利&#xff0c;編寫此篇文章記錄下。對于剛剛開始研究的你可能會有一定的幫助。 二、環境搭建 搭建 CUDA 計算環境涉及到幾個關鍵步驟&#xff0c;包括安裝適當的 C…

【SCSS】use的詳細使用規則

目錄 use加載成員選擇命名空間私有成員配置使用 Mixin重新賦值變量 use 從其他 Sass 樣式表中加載 mixins、函數和變量&#xff0c;并將來自多個樣式表的 CSS 組合在一起。use加載的樣式表被稱為“模塊”。 加載成員 // src/_corners.scss $radius: 3px;mixin rounded {bord…

Hive面試問題

1.hive如何自定義函數 2.hive優化 3.hive數據傾斜 1.數據傾斜的表現 數據傾斜是由于數據分布不均勻&#xff0c;造成數據大量的集中到一點&#xff0c;造成數據熱點的現象。 主要表現&#xff1a;任務進度長時間維持在 99%或者 100%的附近&#xff0c;查看任務監控頁面Yarn(808…

分析示例 | Simufact焊接工藝仿真變形精確預測汽車結構

導語 焊接是汽車制造過程中一個關鍵環節&#xff0c;白車身、發動機、底盤和變速箱等都離不開焊接工藝的應用&#xff0c;主要涉及氣保焊、電阻點焊、激光焊、電子束焊等多種焊接工藝。由于汽車車型眾多、成形結構復雜、汽車制造質量、效率、成本等方面的綜合要求。如何高效、…

杰理AC632N提升edr的hid傳輸速率, 安卓絕對坐標觸摸點被識別成鼠標的修改方法

第一個問題: 首先修改edr的hid傳輸速率.修改你的板級配置,里面的一個地方給注釋掉了,請打開那個注釋就能提升edr的hid傳輸效率了 第二個問題: 修改632n系別把觸摸板的hid報告描述符識別成鼠標點,修改如下: 注釋掉上面的pnp,改成下面的

element plus的容器組件

element-plus的容器組件主要有el-container,el-aside,el-header,el-main,el-footer,后面4個組件其父組件必須是el-container。 el-container采用flex布局&#xff0c;如果其子元素包含el-header或el-footer時會采用垂直布局&#xff0c;否則會采用水平布局&#xff0c;可設置其…

LeetCode|938. Range Sum of BST

. 序言 開啟python刷題時代&#xff0c;主要也是為了面試。 . 題目 Given the root node of a binary search tree and two integers low and high, return the sum of values of all nodes with a value in the inclusive range [low, high]. Example 1: Input: root …