當ChatGPT能寫詩、Sora會拍電影、AI主播24小時帶貨時,一場關于“AI說什么”的隱形戰爭,正在算法與監管的夾縫中悄然爆發。
從DeepSeek的沖擊到多模態技術的祛魅,AIGC正在重塑內容創作的邊界。但同時,諸多質疑也正在發聲:如何在技術狂飆的賽道上守住底線?如何在用戶體驗與內容安全之間找到平衡?
AI“自由”邊界:沒有硝煙的戰爭??
近期,在一場名為《智潮AI·創見未來》的AIGC創業者沙龍上,網易易盾AIGC產品負責人陳諶的分享,為我們揭開了這一復雜命題的答案。
AIGC的崛起正在引領數實融合的新時代,多模態技術的成熟、AI Agent的崛起,讓人工智能從單一的工具進化為具備復雜推理能力的智能體。然而,技術的飛速發展也帶來了新的挑戰:生成內容的倫理風險、歷史虛無主義的傳播、科技倫理的邊界模糊……這些問題正在成為行業無法回避的痛點。
正如陳諶所言,AIGC的“下半場”已經到來。大模型的快思考和慢思考逐步找到應用場景,各種垂類商業場景的逐漸清晰成熟,讓競爭更加激烈,而多模態和視頻領域的技術祛魅則讓市場回歸理性。與此同時,AI Agent的高速發展正在改變內容生成的邏輯——從簡單的文本生成到復雜的任務規劃,從短期記憶到長期信息存儲,再到調用外部API獲取信息,這些能力正在重新定義AIGC的邊界。
?備案不是終點,而是風控的起點?
在AIGC的狂飆突進中,政策與監管始終是行業的壓艙石。從《生成合成類算法備案》到《生成式人工智能服務安全基本要求》,從網絡安全法到數據安全法,國內的監管框架正在逐步完善。備案要求覆蓋了從語料標注規則到模型輸出內容的全流程,甚至連語料來源的準入規則都成為評估的重點。?
“備案的核心并非單個模型,而是整個業務鏈路。無論是開源模型的調整,還是接口服務的調用,只要涉及境內公眾服務,都需要如實備案”,陳諶表示:“在AIGC的內容生成中,風險無處不在。用戶輸入的問題可能涉及敏感話題,模型生成的內容可能偏離事實,甚至可能觸碰倫理底線。如何在用戶體驗與內容安全之間找到平衡?網易易盾的答案是:從輸入到輸出的全鏈路把控”。
??在輸入端,通過實時交互審核,對用戶輸入進行精準布控,同時對用戶輸入的語氣和語義進行分類,判斷其是否屬于質疑、陳述或誹謗。
??在輸出端,則通過事實檢索增強和安全圍欄策略,確保生成內容符合事實、價值觀正確。
網易易盾的布控原則:根據模型回復能力,定向布控,放出優質回答,防控劣質回答;先嚴后松,隨著模型能力的提升逐步調整策略。這種動態調整機制,既保證了內容安全,也為用戶體驗留出了空間。
技術狂飆中的理性之光
網易易盾所探索的AIGC內容安全服務,不僅是一套技術方案,更是一種對行業責任的深刻踐行。從模型測評到策略磨合,再到常態迭代,網易易盾通過細化至三級標簽的機器審核、人工標注和藍軍測試,在服務了上百家大模型企業的實戰經驗中,不斷優化風控能力。
在國家主權、科技倫理、社會主義價值觀等核心議題上,內容生成必須守住底線;而在用戶體驗與商業價值的探索中,企業需要找到創新的突破口。網易易盾認為:AIGC的未來不僅是技術的競爭、倫理與合規的較量,更是AI與AI的對抗。
AIGC的浪潮不可阻擋,但技術的狂飆需要理性的方向盤。網易易盾的探索表明,合規并非創新的桎梏,而是通向未來的橋梁。只有在守住底線的同時擁抱創新,企業才能在這場技術變革中立于不敗之地。正如陳諶所言:“在AIGC的浪潮中,我們既是技術的推動者,也是倫理的守護者“。