科技云報道:從數據到生成式AI,是該重新思考風險的時候了

科技云報道原創。

OpenAI“宮斗”大戲即將塵埃落定。

自首席執行官Sam Altman突然被董事會宣布遭解雇、董事長兼總裁Greg Brockman辭職;緊接著OpenAI員工以辭職威脅董事會要求Altman回歸;再到OpenAI董事會更換成員、Altman回歸OpenAI。

表面上看,這似乎是一場針對一家獨領風騷的技術初創公司控制權的爭奪戰,但從種種跡象來看,此次“宮斗”的導火索,更多應源自對AI未來發展理念的分歧:一派扛著“加速主義”旗幟,希望AI在技術精英的帶領下加速前進改造世界;另一邊則是以利他主義理論為根基、力求讓AI在人類控制下發展的保守派別。
在這里插入圖片描述
從創造栩栩如生的藝術到如同真人般的精度模仿人類語言,生成式AI正在改寫創新和自動化的規則。

AI大模型訓練的高耗能、AI對語言情感和倫理道德的把握程度、AI對假消息和公眾輿論的操縱、生成式AI在人類創新創造中的角色……在生成式AI加速奔跑的今天,有些問題依然值得我們細細思考。

AI大模型成下一個 安全新戰場

今年三月,三星電子剛剛在企業內部引入ChatGPT服務不久,就發生了三起機密數據泄露事件。部分員工將涉及半導體生產的機密代碼與內部會議信息輸入ChatGPT端口,導致這些敏感資料被上傳至美國服務器,極可能已經泄漏。事件發生后,三星迅速采取措施約束員工使用ChatGPT的場景和行為,也引發了行業對于這類大模型技術帶來的數據隱私和安全問題的討論。

客觀而言,在互聯網時代,任何向云端上傳數據的行為都具有潛在的安全風險。云計算剛剛興起的時代,就有很多企業擔憂敏感數據被云服務商泄露,拒絕將其上傳至云端。

時至今日,仍有大批企業在本地存儲隱私數據來增強安全性,云服務商仍然沒有完全贏得企業的信任。

而生成式AI的熱潮則令這一問題雪上加霜。一方面,由于大模型訓練、運營所需的成本極為高昂,極少有企業能夠負擔巨大的投資而在本地建設自有大模型服務。

另一方面,由云服務商提供的大模型服務在訓練和交互時需要海量數據,尤其是特定領域的數據。大模型掌握的領域數據越多,特別是與企業研發、運營相關的數據越多,輸出的效果往往越令人滿意。

例如,企業開發人員使用AI代碼輔助生成工具時,一般需要上傳企業已有的代碼庫,使大模型給出更精準的代碼預測結果;企業營銷人員將過往的營銷材料輸入大模型,就可以自動生成高質量的營銷內容,提升工作效率。

為此,企業和研究機構往往會收集包括用戶生成內容的文本、圖像等數據,這些原始訓練數據中可能含有用戶的敏感隱私信息。

如果數據采集不當、存在偏見或標簽錯誤、數據被投毒,都有可能導致大模型產生錯誤輸出、存在歧視或其他負面影響,同時數據在應用的過程中,也要面臨數據泄露、隱私曝光等風險,這既存在法律風險,也會引發公眾對AI的信任危機。

另外,提供大模型服務的云廠商一般會同時服務眾多客戶,而大模型在獲得各個企業的數據后,如何將這些數據充分隔離在每個客戶的服務范圍之內,就成為了困擾云廠商與企業的一大難題。

一旦數據的隔離失敗,從甲客戶獲得的數據就可能被用在對乙客戶給出的交互回答中,造成數據泄露。

如果企業上傳的大量隱私機密數據未能得到充分保護,惡意攻擊者或者云廠商內部的惡意人士就可能利用軟件漏洞或職權獲取這些信息,攫取不當利益的同時,也對企業造成了無可估量的傷害。

考慮到大模型所需的訓練和交互數據數量龐大,遠遠超過以往企業上傳到云端的規模,這種風險相比過去也有數量級的增長。

目前,生成式AI已經展現前所未有的智能化水平,由此將占據企業的IT關鍵位置,而就此重要性帶來的受攻擊頻度,也將使得生成式AI成為云計算、大數據、物聯網、移動互聯網之后的一個全新的安全戰場。

與此同時,大模型技術也將會在多個方面幫助提升網絡安全運維效率,在更深層次改變網絡安全格局的基礎。

有些人士還認為,生成式AI將進一步擴大貧困差距,加深數字鴻溝。生成式AI作為新興的AI技術,需要基于大量的數據與巨大的計算能力,這就意味著生成式AI只能在技術先進的國家和地區普及開來,并被少數經濟體所掌控。

數字貧困差距進一步擴大,科技弱勢地區的話語權被忽視,其潛在的風險就是發達經濟體的價值觀廣泛傳播,數字鴻溝也會不可逆地加深。

用技術對抗技術用魔法打敗魔法

隨著大模型時代的到來,其強大能力也為安全防護技術的變革提供了新的思路。“用AI的力量來對抗AI”已經成為一個熱點方向。

事實上,對抗攻防思路并不是模型安全的專屬。早在上個十年,面對種種安全威脅,人工智能領域就逐步形成了“以攻測防——以攻促防——攻防一體化”的安全理念,通過模擬各類攻擊場景,不斷探索模型和系統的弱點,以此推動算法和工程端的防御能力加強。

只不過,以往安全防護主要依賴機器學習算法模型,這需要大量專業數據知識積累,且面臨知識盲區和小樣本冷啟動不及時的問題。利用大模型技術,可以實現更智能化的安全防控。

當前,生成式AI面臨的安全問題可以分為三級。初級問題是技術攻擊問題,也就是網絡攻擊、漏洞攻擊、數據攻擊問題,特別是提供給大模型不好的數據或污染它的訓練數據,可能會導致結果出錯。這類問題相對比較好解決。

比較難解決的是中級問題,主要涉及內容安全。例如大模型可以成為人們很好的幫手,也能成為壞人的工具。它可以幫一個水平不怎么樣的黑客寫更好的攻擊代碼、詐騙郵件。

如何讓它的內容更加可控?如何防止AI大模型不作惡?這已經超越了技術范疇。盡管現在有人為大模型做了內置的所謂“安全護欄”,但它很容易遭到注入攻擊或算法攻擊。

從高級問題來看,大模型可以把人類所有知識融會貫通,再來和人類做交流、做提示。但當AI的能力超越人類后,還能不能甘于做人類的工具,這些技術帶來的挑戰最終還要靠技術來解決,技術自身會不斷進化,不能因為未來還沒有發生的問題就不發展相關技術。

從產業界現狀來看,AI安全與否如何評測,目前尚缺乏一套易用和標準化的評測工具和規則。

這也是大模型防御中能夠補充的另一方面,通過大模型技術學習風險知識和標準規則來提升AI對于風險的認知理解能力,以實現用大模型對抗大模型來進行極速防御和快速冷啟動的目的。

面對大模型下的網絡安全挑戰,需要企業、安全團隊和監管機構等共同努力來應對。

首先,加強大模型的訓練和管理。通過采用更加有效的數據增強和處理技術,減少大模型的過擬合和梯度爆炸等問題,提高模型的魯棒性和可靠性。同時,對大模型的訓練和管理也需要加強監管和審計,確保數據的隱私和安全。

其次,研發新型安全防御技術。針對大模型的攻擊手段不斷變化和更新,需要研發新型的安全防御技術來應對。例如,可以利用人工智能技術來檢測和防御惡意代碼和網絡釣魚攻擊等。

以文本安全為例,大模型可以基于安全標準規則、風險領域知識和歷史風險樣本進行訓練,提升模型對于風險標準和內容的理解力,從而實現對風險檢測能力的提升。

也采用大模型生成能力結合安全知識圖譜,來構造攻擊樣本持續迭代優化檢測模型。

第三,強化數據安全保護。除了要關注大模型在互聯網上的攻防對抗,大模型本身的安全和隱私問題同樣引發了擔憂。

針對大模型的訓練和使用過程中可能存在的數據安全問題,需要采取一系列的隱私保護技術。例如,使用同態加密、差分隱私、安全多方計算、模型水印和指紋等多種技術來保護數據的隱私和安全。

第四,加強監管和法律保護。技術立法往往落后于技術發展的步伐,缺少法規和條例的引導和規制,越來越多使用生成式AI的公司發現其系統運行的安全性受到很大挑戰。

面對大模型下的網絡安全挑戰,也需要監管機構和法律機構加強管理和監管。例如,政府監管機構要通過政策立法對生成式AI的設計、演進進行有效引導、統籌管理。

制定的政策框架需要與各國的立法和監管背景保持一致,并且要隨AI技術更迭而更新,不斷提高現有法規的適用度。在監管的同時給予AI創新的自由度,協同創造出更高質量的內容。

生成式AI是非常復雜的問題,倫理、數據、訓練等領域的復雜度都是前所未有的,是一個新領域,也是擺在所有人面前的一個命題。

從科技企業的發展史看,在新技術發展的前期,不同路線、理念的參與者往往能夠團結協作,共同為了科技普及而合作前進。

但當科技普及已經發生,關于商業化、實現路徑的種種理念差異,卻可能走上不同的道路。在AI普及和深度應用的前夜里,或許,關于未來技術應該如何普及、如何監管的理念與路徑之爭,才剛剛拉開帷幕。

面對未來的安全發展趨勢和挑戰,企業更應該攜起手來,共同建立可度量的安全體系,為應對智能化時代的攻防新趨勢,打造內在自適應的“安全免疫力”。

【關于科技云報道】

專注于原創的企業級內容行家——科技云報道。成立于2015年,是前沿企業級IT領域Top10媒體。獲工信部權威認可,可信云、全球云計算大會官方指定傳播媒體之一。深入原創報道云計算、大數據、人工智能、區塊鏈等領域。

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/news/214825.shtml
繁體地址,請注明出處:http://hk.pswp.cn/news/214825.shtml
英文地址,請注明出處:http://en.pswp.cn/news/214825.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

深入解析Java中的String:特點、重要方法及源碼分析

Java的String類是Java語言中最常用的類之一。 作為一位Java高級工程師,了解String類的特性和方法對于編寫高效和優化的Java代碼至關重要。在這篇技術博客中,我們將深入探討String類的特點,介紹其中一些重要的方法,并分析其源碼以獲…

java--LocalDate、LocalTime、LocalDateTime、ZoneId、Instant

1.為什么要學習JDK8新增的時間 LocalDate:代表本地日期(年、月、日、星期) LocalTime:代表本地時間(時、分、秒、納秒) LocalDateTime:代表本地日期、時間(年、月、日、星期、時、分、秒、納秒) 它們獲取對象的方案 2.LocalDate的常用API(…

Android的開機logo生成

生成可用的uboot和kernel的logo圖片 可以通過命令轉換BMP格式的圖片 ### 將 png 轉為顏色深度為8bit的的bmp圖片。jpeg使用jpegtopnm ### pngtopnm logo.png | ppmquant 31 | ppmtobmp -bpp 8 > logo.bmp然后就可以使用新圖替換舊圖片,在kernel目錄下的logo.bmp…

【精選】 VulnHub (超詳細解題過程)

🍬 博主介紹👨?🎓 博主介紹:大家好,我是 hacker-routing ,很高興認識大家~ ?主攻領域:【滲透領域】【應急響應】 【python】 【VulnHub靶場復現】【面試分析】 🎉點贊?評論?收藏…

C# 任務的異常和延續處理

寫在前面 當Task在執行過程中出現異常或被取消等例外的情況時,為了讓執行流程能夠繼續進行,可以使用延續方法實現這種鏈式處理;還可以針對前置任務不同的執行結果,選擇執行不同的延續分支方法。子任務執行過程中的任何異常都會被…

線程安全的哈希表ConcurrentHashMap

1. HashTable 不推薦使用,無腦給各種方法加鎖 2.ConcurrentHashMap 多線程下推薦使用 鎖粒度控制 HashTable直接在方法上加synchronized,相當于對哈希表對象加鎖,一個哈希表只有一把鎖。多線程環境下,無論線程如何操作哈希表…

深入理解Dubbo-3.高級功能剖析和原理解析

👏作者簡介:大家好,我是愛吃芝士的土豆倪,24屆校招生Java選手,很高興認識大家📕系列專欄:Spring源碼、JUC源碼、Kafka原理、分布式技術原理🔥如果感覺博主的文章還不錯的話&#xff…

利用貝葉斯超參數優化,提升模型效果更科學(附Python代碼)

超參數優化在大多數機器學習流水線中已成為必不可少的一步,而貝葉斯優化則是最為廣為人知的一種“學習”超參數優化方法。 超參數優化的任務旨在幫助選擇學習算法中成本(或目標)函數的一組最佳參數。這些參數可以是數據驅動的(例…

【UE5】初識MetaHuman 創建虛擬角色

步驟 在UE5工程中啟用“Quixel Bridge”插件 打開“Quixel Bridge” 點擊“MetaHumans-》MetaHuman Presets UE5” 點擊“START MHC” 在彈出的網頁中選擇一個虛幻引擎版本,然后點擊“啟動 MetaHuman Creator” 等待一段時間后,在如下頁面點擊選擇一個人…

Apipost版IDEA插件:Apipost-Helper

Apipost-Helper是由Apipost推出的IDEA插件,寫完接口可以進行快速調試,且支持搜索接口、根據method跳轉接口,還支持生成標準的API文檔,注意:這些操作都可以在代碼編輯器內獨立完成,非常好用!這里…

Tair(2):Tair安裝部署

1 安裝相關依賴庫 yum install -y gcc gcc-c make m4 libtool boost-devel zlib-devel openssl-devel libcurl-devel yum:是yellowdog updater modified 的縮寫,Linux中的包管理工具gcc:一開始稱為GNU C Compiler,也就是一個C編…

N皇后,回溯【java】

問題描述 八皇后問題是十九世紀著名的數學家高斯于1850年提出的。 問題是:在88的棋盤上擺放八個皇后,使其不能互相攻擊,即任意兩個皇后都不能處于同一行、同一列或同一斜線上。可以把八皇后問題擴展到n皇后問題,即在nn的棋盤上擺…

管理類聯考——數學——真題篇——按知識分類——幾何

文章目錄 2023真題(2023-07)-幾何-解析幾何-最值真題(2023-10)-幾何-立體幾何-正方體:體積: V = a 3 V=a^3 V

AX和A(T)X的區別是?

目錄 1.快速了解的例子: (1)假設所有節點的初始特征都是[1, 0, 0] ,那么AX的結果是: (2) 的結果是: (3) 總結: 2.計算結構系數的例子 (1&#xff09…

day45-46-Vue+ElementUI實現學生管理

VueElementUI實現學生管理 代碼: qiushiju/java2313_vue_elementui_crud (gitee.com) 一、思考 考慮需求(登錄,查詢全部,基本增刪改查,分頁,搜索,批量) 設計數據庫搭建項目 后端…

2024美賽備戰2--模型建立(*****必看****)

建模 美賽涉及的建模知識范圍非常廣且深,縱觀美賽真題不難發現,很多的模型 都是讀研或者讀博的時候才會真正深入開始研究,因此,對于做建模的同學來說, 是無法在賽前吃透大量模型的。推薦本科生分兩個步驟去有效準備比賽…

【S32DS RTD實戰】-1.3-S32K3工程生成S19,BIN,Hex文件,以及Post-build steps的妙用

目錄 1 方法一:逐個生成Motorola S-record(s19,srec…),Intel HEX,Bin文件 1.1 生成Motorola S-record(s19,srec…)文件 1.2 生成Intel HEX文件 1.3 生成Bin文件 2 …

python的Streamlit庫的text_input組件

text_input 常用的輸入組件,這里注意記錄一下具體的參數,方便使用 函數簽名 st.text_input(label, value"", max_charsNone, keyNone, type"default", helpNone, autocompleteNone, on_changeNone, argsNone, kwargsNone, *, pla…

【LeetCode】414. 第三大的數

414. 第三大的數 難度:簡單 題目 給你一個非空數組,返回此數組中 第三大的數 。如果不存在,則返回數組中最大的數。 示例 1: 輸入:[3, 2, 1] 輸出:1 解釋:第三大的數是 1 。示例 2&#xf…

計算機服務器中了mkp勒索病毒怎么辦,mkp勒索病毒解密數據恢復

網絡技術的不斷發展,也為網絡安全帶來了威脅,近期云天數據恢復中心的工程師陸續接到很多企業的求助,在本月,很多企業的計算機服務器遭到了mkp勒索病毒攻擊,導致企業計算機系統癱瘓,無法正常工作&#xff0c…