文心大模型及百度大模型內容安全平臺齊獲信通院大模型安全認證

近日,文心大模型與百度大模型內容安全平臺——紅線大模型雙雙榮獲中國信息通信研究院泰爾認證中心頒發的“大規模預訓練模型(文本生成功能)安全認證證書”,且二者的認證級別皆“增強級”的最高級別。

1.png
大規模預訓練模型(文本生成功能)安全認證證書

本次認證基于《電信和互聯網大規模預訓練模型安全評測指標和方法》(TLC 073-2024),此標準由中國信息通信研究院牽頭制定,旨在為大規模預訓練模型提供安全評測的風險項、指標和方法,系統地評估大模型在59種內容安全風險中的表現。認證分為“基礎級”和“增強級”兩個層級,適用于大規模預訓練模型研發、使用和運營機構,全面客觀地衡量大規模預訓練模型因自身技術局限或遭濫用和惡意使用而帶來的國家安全、公共安全、倫理安全和行業安全風險,可在研發完畢測試、上線前使用以及進行算法備案前使用。其中,百度大模型內容安全平臺——紅線大模型在網絡安全、內容安全、隱私數據安全、模型安全、模型幻覺抑制等諸多評測項目中均表現優異,榮獲此次測評中“增強級”的最高級別認證。

大模型作為新質生產力,在千行百業中展現出強大創新潛力。然而,其技術特性帶來的安全風險也正引發全球關注。在大模型推理場景中,用戶輸入內容與模型生成內容中存在的涉政、涉黃、不良價值觀、違法犯罪等風險已被人們所熟知。更為嚴峻的是,OWASP大模型TOP10脆弱性風險揭示了代碼攻擊、提示詞注入、多輪越獄等高級攻擊手段的威脅。這些攻擊方式利用大模型的語言理解能力,通過精心設計的輸入來繞過安全機制,實現惡意目的。此外,針對接口的AIGC盜爬、以消耗算力為目的的資源侵占攻擊等,也對模型的穩定運營構成了直接且持續的威脅。這標志著,通用大模型的安全防線必須從內容過濾,延伸至對模型認知過程的深度防護。

基于大模型安全護欄建設的理念,百度大模型內容安全平臺正式更名為百度大模型安全護欄。其核心在于通過構建專屬的安全紅線大模型,大幅降低模型拒答率,并支持風險問題的正向引導和糾偏,為行業提供了一套系統性的大模型安全解決方案。針對大模型推理服務場景存在的模型濫用、算力消耗、隱私泄露、內容違規等風險,百度大模型安全護欄提供接入成本低、一站式的大模型輸入、輸出安全護欄服務:

2.png
百度大模型安全護欄

內容安全檢測:構建多模態內容安全檢測大模型與風險代答模型,精準理解用戶意圖,并針對風險提問進行錯誤糾偏與正向引導,在守住內容安全“生命線”基礎上,同時又徹底告別“一刀切”式拒答的僵硬模式。

3.png
百度大模型安全護欄——功能框架

高級攻擊檢測:圍繞OWASP TOP 10中攻擊模式,構建惡意意圖與惡意形式檢測的大語言模型,支持識別目標劫持、反向抑制、肯定前綴、角色扮演、提示詞泄露、混淆編碼等多種高級攻擊類型。

4.png
百度大模型安全護欄——高級攻擊檢測
??

敏感信息檢測:建設豐富的敏感信息檢測能力,包含姓名、身份證號碼、手機號碼、護照號碼、駕駛證號碼、住址、郵件地址等數十種個人敏感信息,并提供脫敏能力,避免敏感信息輸出導致的輿情風險。

網址安全檢測:基于百度豐富的網址黑庫數據積累,構建數據爬取與規則檢測引擎,提供假冒網站、虛假中獎、虛假金融證券、詐騙網站、色情網站、博彩網站等違規網站檢測能力,避免用戶通過對話將違規網站投毒到模型中,也避免模型輸出對于違規網站信息進行解讀的內容。

5.png
百度大模型安全護欄——網址安全檢測

算力消耗檢測:建設完備的規則引擎,針對誘導模型生成長token的提問請求進行監控及攔截,同時支持檢測異常IP、異常聚集行為等違規接口調用請求,保障模型資源不被惡意消耗而影響正常用戶使用。

百度安全始終積極探索大模型內容安全領域的各種挑戰,致力于建設更加安全與健康的大模型發展生態,保障大模型在廣泛應用中的安全性和可信度,助力大模型在為企業創造價值的同時,保障個人隱私和信息安全。并提供更加智能、人性化的服務,與產業各方共同努力,攜手千行百業建立起覆蓋全生命周期的安全防護體系,為開源大模型實現普惠發展、為社會帶來更大價值。

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/diannao/89910.shtml
繁體地址,請注明出處:http://hk.pswp.cn/diannao/89910.shtml
英文地址,請注明出處:http://en.pswp.cn/diannao/89910.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

香港服務器查詢緩存禁用-性能優化關鍵技術解析

在香港服務器運維過程中,查詢緩存禁用是提升數據庫性能的關鍵操作。本文將深入解析禁用查詢緩存的原理、操作步驟、適用場景及注意事項,幫助管理員優化MySQL服務器配置,解決高并發環境下的性能瓶頸問題。香港服務器查詢緩存禁用-性能優化關鍵…

深度學習圖像分類數據集—七種動物識別分類

該數據集為圖像分類數據集,適用于ResNet、VGG等卷積神經網絡,SENet、CBAM等注意力機制相關算法,Vision Transformer等Transformer相關算法。 數據集信息介紹:七種動物識別分類:[Chinese_Merganser, panda, Sika_Deer, …

ubuntu22桌面版中文輸入法 fcitx5

不要去 ubuntu software 下載 fcitx5 快捷鍵用不了 直接 sudo apt install fcitx5 \ fcitx5-chinese-addons \ fcitx5-frontend-gtk4 fcitx5-frontend-gtk3 fcitx5-frontend-gtk2 \ fcitx5-frontend-qt5不要在fcitx5里面設置快捷鍵,有些應用可能無法生效 在設置里全…

推客系統小程序終極指南:從0到1構建自動裂變增長引擎,實現業績10倍增長!

📌 前言:為什么傳統營銷越來越難做?在流量紅利消失的今天,企業普遍面臨三大增長困境:獲客成本飆升:電商、教育等行業單客成本突破500元,ROI持續走低用戶粘性差:90%的活動用戶只參與一…

【數據結構】排序算法:歸并與堆

歸并排序:分治策略的經典實現 算法原理 歸并排序采用分治法策略,包含三個關鍵步驟: 分解:遞歸地將數組分成兩半 解決:對子數組進行排序 合并:將兩個有序子數組合并為一個有序數組 C語言實現 #includ…

機器學習-CatBoost

參考書籍:《機器學習-公式推導和代碼實現》 官方文檔提供的原生接口代碼參考書籍的P187~P188 簡介 全稱是Categorical Boosting,由俄羅斯搜索引擎巨頭Yandex于2017年提出。突出的優勢是在于可以高效地處理數據中的類別特征 ML中對類別特征…

MPLS 多協議標簽交換

前言: 多協議標簽交換MPLS(Multiprotocol Label Switching)是一種IP(Internet Protocol)骨干網技術。MPLS在無連接的IP網絡上引入面向連接的標簽交換概念,將第三層路由技術和第二層交換技術相結合&#xf…

CTF Web PHP弱類型比較與布爾值判斷

題目源碼與注釋 <?php show_source("index.php"); // 顯示自身源碼&#xff0c;方便分析 include("flag.php"); // 包含flag變量 $a $_GET[a]; // 獲取GET參數a&#xff0c;抑制報錯// 關鍵判斷 if($a 0 and $a){echo $flag; …

AntV G6動態連線

完整代碼如下 <!DOCTYPE html> <html lang="zh-CN"> <head><meta charset="UTF-8"><meta name="viewport" content="width=device-width, initial-scale=1.0"><title>AntV G6 動態連線</titl…

puppeteerSharp html轉pdf

部屬到linux 上報錯&#xff1a; Failed to launch browser! /wwwroots/xxx/Chrome/Linux-138.0.7204.92/chrome-linux64/chrome: error while loading shared libraries: libatk-1.0.so.0: cannot open shared object file: No such file or directory 問題服務包缺少依賴&…

springBoot接口層時間參數JSON序列化問題,兼容處理

背景&#xff1a;解決前端傳入時間參數格式不固定場景&#xff0c;避免接收參數報錯時間格式不能序列化。一、概述在 Java 后端開發中&#xff0c;處理 JSON 數據時&#xff0c;經常需要對日期時間字段進行反序列化。Java 中常用的日期時間類型是 java.time.LocalDateTime&…

List、Set、Map三者之間的關系

1、數據結構與核心特性接口數據結構順序性唯一性鍵值對null 元素List動態數組/鏈表有序&#xff08;插入順序&#xff09;允許重復否允許多個 nullSet哈希表 / 紅黑樹無序&#xff08;HashSet&#xff09;有序&#xff08;LinkedHashSet/TreeSet&#xff09;不允許重復否僅 Has…

進程控制----進程終止

一、進程終止的核心場景正常終止&#xff08;代碼完整運行完畢&#xff09;成功&#xff1a;進程執行到main函數結束或調用exit()&#xff0c;返回退出碼 0&#xff08;約定為執行成功&#xff09;。失敗&#xff1a;代碼執行完畢但結果異常&#xff0c;返回非零退出碼&#xf…

Milvus docker-compose 部署

文章目錄 前言Milvus docker-compose 部署1. 下載2. 修改配置3. 啟動4. 測試 前言 如果您覺得有用的話&#xff0c;記得給博主點個贊&#xff0c;評論&#xff0c;收藏一鍵三連啊&#xff0c;寫作不易啊^ _ ^。 ??而且聽說點贊的人每天的運氣都不會太差&#xff0c;實在白嫖的…

EveryThing搜索具體路徑下文件中的內容

1.打開EveryThing 2.點擊搜索&#xff0c;選擇高級搜索 3.選擇需要搜索的文件的路徑以及文件中需要包含的內容 4.之后就可以搜索到對應的目標文件

【算法】寬度優先遍歷BFS

二叉樹的寬搜 429、N叉樹的層序遍歷 題解 BFS核心思想 二叉樹的寬搜一般都是借助隊列來實現的&#xff0c;實現的原理為首先將根節點進行放入隊列中&#xff0c;然后將根節點進行彈出的時候&#xff0c;將這個節點的孩子節點進行放入隊列中&#xff0c;然后繼續彈出隊頭的元…

【STM32】通用定時器基本原理

STM32 通用定時器基本原理&#xff08;基于 STM32F1&#xff09;參考資料&#xff1a;STM32F1xx官方資料&#xff1a;《STM32中文參考手冊V10》-第14章通用定時器STM32 定時器分類 STM32F103 系列共有三類定時器&#xff1a;&#x1f50e; 通用定時器&#xff08;TIM2~TIM5&…

【Go語言-Day 14】深入解析 map:創建、增刪改查與“鍵是否存在”的奧秘

Langchain系列文章目錄 01-玩轉LangChain&#xff1a;從模型調用到Prompt模板與輸出解析的完整指南 02-玩轉 LangChain Memory 模塊&#xff1a;四種記憶類型詳解及應用場景全覆蓋 03-全面掌握 LangChain&#xff1a;從核心鏈條構建到動態任務分配的實戰指南 04-玩轉 LangChai…

Vue腳手架搭建項目+基礎知識

1. 使用腳手架創建項目1.1 準備工作winR&#xff0c;在彈出的數據框中輸入cmd&#xff0c;數據命令查看node以及npm版本 下載vue cli1.2 創建項目1.2.1 創建一個英文目錄文件夾&#xff0c;cmd打開命令命令提示符1.2.2 vue ui命令打開控制臺1.2.3 創建項目創建成功1.3 項目結構…

微信小程序下單頁—地址列表頁—新增地址頁 頁面交互

新增地址流程&#xff1a; 下單頁 → 地址列表頁 (1次跳轉)地址列表頁 → 新增地址頁 (1次跳轉)保存地址 → 返回地址列表頁 (1次返回&#xff0c;自動刷新列表) 選擇地址流程&#xff1a; 地址列表頁 → 選中地址 → 返回下單頁 (1次返回) 更換地址&#xff1a; 下單頁 → 地址…