多模態大語言模型arxiv論文略讀(四十七)

請添加圖片描述

AdaShield: Safeguarding Multimodal Large Language Models from Structure-based Attack via Adaptive Shield Prompting

?? 論文標題:AdaShield: Safeguarding Multimodal Large Language Models from Structure-based Attack via Adaptive Shield Prompting
?? 論文作者:Yu Wang, Xiaogeng Liu, Yu Li, Muhao Chen, Chaowei Xiao
?? 研究機構: Peking University、University of Wisconsin–Madison、International Digital Economy Academy、University of California, Davis
?? 問題背景:多模態大語言模型(Multimodal Large Language Models, MLLMs)在視覺-語言推理能力方面取得了顯著進展,但這些模型也面臨著新的安全威脅,特別是結構化越獄攻擊(structure-based jailbreak attacks)。這些攻擊通過在圖像中嵌入惡意內容,誤導MLLMs生成有害響應,從而繞過模型的安全機制。
?? 研究動機:為了應對結構化越獄攻擊,研究團隊提出了一種新的防御框架——自適應屏蔽提示(Adaptive Shield Prompting, AdaShield)。該框架通過在模型輸入前添加防御提示,無需微調MLLMs或訓練額外模塊,即可有效防御結構化越獄攻擊,同時保持模型在標準良性任務上的性能。
?? 方法簡介:研究團隊首先設計了一個靜態防御提示(AdaShield-Static, AdaShield-S),該提示能夠有效防御結構化越獄攻擊。為進一步提高防御效果,團隊引入了一個自適應自動優化框架(AdaShield-Adaptive, AdaShield-A),該框架通過目標MLLM和防御者模型(Defender)的對話交互,自動優化防御提示,生成多樣化的防御提示池,以適應不同的攻擊場景。
?? 實驗設計:研究團隊在兩個標準的結構化越獄攻擊數據集(FigStep和QR)上進行了實驗,驗證了AdaShield-A的有效性。實驗結果表明,AdaShield-A不僅能夠有效防御結構化越獄攻擊,而且不會影響模型在標準良性任務上的性能。

Eyes Closed, Safety On: Protecting Multimodal LLMs via Image-to-Text Transformation

?? 論文標題:Eyes Closed, Safety On: Protecting Multimodal LLMs via Image-to-Text Transformation
?? 論文作者:Yunhao Gou, Kai Chen, Zhili Liu, Lanqing Hong, Hang Xu, Zhenguo Li, Dit-Yan Yeung, James T. Kwok, Yu Zhang
?? 研究機構: Southern University of Science and Technology, Hong Kong University of Science and Technology, Huawei Noah’s Ark Lab
?? 問題背景:多模態大型語言模型(Multimodal Large Language Models, MLLMs)在多種任務中展現了強大的推理能力。然而,與傳統的大型語言模型(LLMs)相比,MLLMs更容易受到越獄攻擊。盡管MLLMs能夠檢測到不安全的響應,但研究發現,引入圖像特征可以輕松繞過MLLMs的安全機制。
?? 研究動機:現有的研究已經揭示了圖像特征可以顯著削弱MLLMs的安全機制。為了進一步理解這些威脅,并探索其背后的原因,研究團隊全面分析了MLLMs在引入圖像特征后的安全評估能力,旨在為未來的安全防護提供有價值的見解和方法。
?? 方法簡介:研究團隊提出了一種名為ECSO(Eyes Closed, Safety On)的新型無訓練保護方法,該方法利用MLLMs的內在安全意識,通過將不安全的圖像轉換為文本,激活預對齊LLMs的內在安全機制,從而生成更安全的響應。ECSO首先利用MLLMs的安全意識評估其自身響應的安全性,一旦檢測到不安全的初始響應,ECSO會將圖像輸入轉換為文本,減少MLLMs到(僅文本)LLMs,然后在沒有圖像的情況下生成安全響應。
?? 實驗設計:研究團隊在五個最先進的MLLMs上進行了實驗,包括LLaVA-1.5-7B、ShareGPT4V-7B、mPLUG-OWL2-7B、Qwen-VL-Chat和InternLM-XComposer。實驗在MM-SafetyBench和VLSafe數據集上進行,評估了ECSO在不同惡意內容(如非法活動、仇恨言論、惡意軟件生成等)下的表現。實驗結果表明,ECSO顯著提高了模型的安全性,例如在MM-SafetyBench (SD+OCR)上提高了37.6%,在VLSafe上提高了71.3%,同時保持了模型在常見任務上的性能。此外,ECSO還可以作為數據引擎,生成監督微調(SFT)數據,用于MLLMs的對齊,而無需額外的人工干預。

MM1: Methods, Analysis & Insights from Multimodal LLM Pre-training

?? 論文標題:MM1: Methods, Analysis & Insights from Multimodal LLM Pre-training
?? 論文作者:Brandon McKinzie, Zhe Gan, Jean-Philippe Fauconnier, Sam Dodge, Bowen Zhang, Philipp Dufter, Dhruti Shah, Xianzhi Du, Futang Peng, Floris Weers, Anton Belyi, Haotian Zhang, Karanjeet Singh, Doug Kang, Ankur Jain, Hongyu Hè, Max Schwarzer, Tom Gunter, Xiang Kong, Aonan Zhang, Jianyu Wang, Chong Wang, Nan Du, Tao Lei, Sam Wiseman, Guoli Yin, Mark Lee, Zirui Wang, Ruoming Pang, Peter Grasch, Alexander Toshev, Yinfei Yang
?? 研究機構: Apple
?? 問題背景:近年來,多模態大語言模型(MLLMs)在語言建模和圖像理解方面取得了顯著進展。這些模型通過大規模的圖像-文本數據和計算資源,實現了高性能的多模態任務處理。然而,關于這些模型的具體構建過程,尤其是多模態預訓練的細節,公開的信息較少。本研究旨在通過詳細的實驗和分析,提供構建高性能MLLMs的設計原則和教訓。
?? 研究動機:現有的多模態大語言模型(MLLMs)在透明度上存在不足,大多數模型要么完全封閉,要么開放但缺乏詳細的構建過程描述。為了推動該領域的研究,本研究詳細記錄了MLLMs的構建過程,并通過廣泛的實驗和分析,總結了構建高性能MLLMs的關鍵設計原則。
?? 方法簡介:研究團隊通過小規模的實驗,對模型架構決策和預訓練數據選擇進行了廣泛的消融實驗。實驗涉及了圖像編碼器、視覺-語言連接器和預訓練數據的混合比例等多個方面。研究發現,圖像分辨率、視覺編碼器的損失和容量對模型性能影響最大,而視覺-語言連接器的設計影響相對較小。此外,研究還探討了不同類型的預訓練數據(圖像-標題、交錯圖像-文本和純文本數據)對模型性能的影響。
?? 實驗設計:實驗在多個公開數據集上進行,包括COCO Captioning、NoCaps、TextCaps、VQAv2、TextVQA、VizWiz、GQA和OK-VQA等。實驗設計了不同條件下的零樣本和少樣本性能評估,以全面評估模型在不同任務上的表現。研究發現,交錯圖像-文本數據對少樣本和純文本任務性能提升顯著,而圖像-標題數據對零樣本任務性能提升明顯。此外,研究還發現,純文本數據有助于保持模型的語言理解能力。

A Comprehensive Study of Multimodal Large Language Models for Image Quality Assessment

?? 論文標題:A Comprehensive Study of Multimodal Large Language Models for Image Quality Assessment
?? 論文作者:Tianhe Wu, Kede Ma, Jie Liang, Yujiu Yang, Lei Zhang
?? 研究機構: Tsinghua University、City University of Hong Kong、OPPO Research Institute、The Hong Kong Polytechnic University
?? 問題背景:多模態大語言模型(Multimodal Large Language Models, MLLMs)在視覺理解和推理方面取得了顯著進展,但其作為圖像質量評估(Image Quality Assessment, IQA)的強大、靈活、可解釋和文本驅動模型的潛力尚未得到充分探索。IQA旨在開發計算模型以預測圖像質量,這些模型應能模擬人類視覺系統(HVS)的感知。
?? 研究動機:盡管MLLMs在視覺任務中表現出色,但它們在IQA中的應用仍面臨挑戰,尤其是在細粒度質量區分和多圖像質量分析方面。本研究旨在通過系統地評估不同的提示系統,探索MLLMs在IQA中的表現,以期為未來的模型優化提供指導。
?? 方法簡介:研究團隊設計了九種提示系統,結合了心理物理學中的標準化測試程序(單刺激、雙刺激和多刺激方法)和自然語言處理中的流行提示策略(標準提示、上下文提示和鏈式思維提示)。此外,研究團隊還提出了一種困難樣本選擇方法,以進一步挑戰MLLMs,該方法考慮了樣本的多樣性和不確定性。
?? 實驗設計:實驗在全參考(Full-Reference, FR)和無參考(No-Reference, NR)場景下進行,使用了三個開源和一個閉源的MLLMs。實驗評估了多個圖像質量屬性,包括結構和紋理失真、幾何變換和顏色差異。實驗結果表明,閉源的GPT-4V在人類感知的圖像質量評估中表現較為合理,但在細粒度質量區分和多圖像質量分析方面仍有不足。

Optimizing Language Augmentation for Multilingual Large Language Models: A Case Study on Korean

?? 論文標題:Optimizing Language Augmentation for Multilingual Large Language Models: A Case Study on Korean
?? 論文作者:ChangSu Choi, Yongbin Jeong, Seoyoon Park, InHo Won, HyeonSeok Lim, SangMin Kim, Yejee Kang, Chanhyuk Yoon, Jaewan Park, Yiseul Lee, HyeJin Lee, Younggyun Hahm, Hansaem Kim, KyungTae Lim
?? 研究機構: SeoulTech、Yonsei University、Teddysum、KISTI
?? 問題背景:大型語言模型(LLMs)通過預訓練來預測后續詞匯,但其擴展需要大量的計算資源。盡管許多大型科技公司和研究機構已經開發了多語言LLMs(MLLMs)以滿足當前需求,但資源較少的語言(LRLs)仍然被忽視。例如,Llama2模型雖然支持28種語言,但用于韓語的數據僅占0.06%。這導致了韓語在詞匯表達和語義理解上的顯著挑戰。
?? 研究動機:為了提高LRLs的性能,研究團隊提出了三種策略:擴展LRLs的詞匯量以增強表達能力;使用雙語數據進行預訓練以對齊高資源和低資源語言;構建高質量的小規模指令數據集并進行指令調優以增強LRLs的實用性。研究旨在通過這些策略提升韓語在Llama2模型中的表現。
?? 方法簡介:研究團隊首先擴展了Llama2的韓語詞匯量,然后使用韓英雙語語料庫進行預訓練,最后基于韓語LIMA數據集進行指令調優。通過這些方法,研究團隊構建了Bllossom模型,旨在提高韓語在多種任務中的性能。
?? 實驗設計:實驗使用了Llama2模型,并在八個任務上進行了定量評估,包括自然語言推理(NLI)、語義文本相似度(STS)、主題分類(YNAT)等。此外,還進行了基于人類評價和GPT4的定性評估。實驗結果表明,Bllossom模型在定性分析中優于其他韓語單語模型,性能提升從1.8%到8%不等。

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/diannao/81139.shtml
繁體地址,請注明出處:http://hk.pswp.cn/diannao/81139.shtml
英文地址,請注明出處:http://en.pswp.cn/diannao/81139.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

美的人形機器人即將投入實際應用

國內家電巨頭美的集團近日公布了其自主研發的人形機器人的具體落地計劃。根據公司披露的信息,這款機器人將于5月在湖北荊州的洗衣機工廠率先投入使用,承擔設備運維、質量檢測和物料搬運等工作任務。預計今年下半年,該機器人還將進入美的線下門…

從零開始搭建你的個人博客:使用 GitHub Pages 免費部署靜態網站

🌐 從零開始搭建你的個人博客:使用 GitHub Pages 免費部署靜態網站 在互聯網時代,擁有一個屬于自己的網站不僅是一種展示方式,更是一種技術能力的體現。今天我們將一步步學習如何通過 GitHub Pages 搭建一個免費的個人博客或簡歷…

canvas動畫:點隨機運動 距離內自動連接成線 鼠標移動自動吸附附近的點

思路/實現步驟 創建canvas元素 獲取canvas的上下文ctx 初始化點的信息(數量、初始坐標、移動方向、移動速度、大小、顏色) 繪制點 繪制點之間的連線 點有規律的動起來 動畫循環 鼠標移動相關邏輯 點鼠標之間連線 鼠標吸附邏輯 添加配置項 重繪…

2025年4月AI科技領域周報(4.21-4.27):大模型生態加速演進 通用AI開啟產業融合新范式

2025年4月AI科技領域周報(4.21-4.27):大模型生態加速演進 通用AI開啟產業融合新范式 一、本周熱點回顧1. OpenAI發布全球首款通用AI芯片「GPT-NPU」 重塑AI算力架構2. 谷歌DeepMind發布醫療AI系統「Med-Pathfinder」 實現全科室智能診斷3. 微…

【Bash】可以請您解釋性地說明一下“2>1”這個語法嗎?

Qwen3-235B 當然可以!我們一步步拆解 2>&1 的含義,用生活化的例子來理解它: 🧠 前提知識:三個“水流通道” 在 Linux/Unix 系統中,程序運行時有三種默認的“水流通道”: 標準輸入&…

MAC如何安裝多版本jdk(以8,11,17為例)

MAC如何安裝多版本jdk(以8,11,17為例)_mac安裝jdk17-CSDN博客

Nginx核心

一、概述 Nginx一個具有高性能的【HTTP】和【反向代理】的【WEB服務器】,同時也是一個電子郵件代理服務器。正向代理服務的是客戶端(比如VPN),反向代理服務的是服務端。Nginx是多進程的,有一個Master進程控制多個Worke…

綜合開發-手機APP遠程控制PLC1500柱燈的亮滅

要通過 ??Unity3D?? 開發的手機 App 控制 ??電氣柜上面的柱燈,需要WIFI模塊作為橋梁,按照以下步驟實現: ??1. 硬件準備(硬件部分)?? ??所需材料?? ??ESP32開發板??(如ESP32-WROOM-32&a…

五款提效工具

1. 億可達 核心功能:通過“觸發器動作”模式,實現任務自動執行(如郵件轉發、評論回復、數據同步)。 適用場景:自動同步Notion項目到滴答清單生成待辦事項 優勢:節省重復操作時間,減少人為錯誤&a…

Docker化HBase排錯實錄:從Master hflush啟動失敗到Snappy算法未支持解決

前言 在容器化時代,使用 Docker 部署像 HBase 這樣復雜的分布式系統也比較方便。社區也提供了許多方便的 HBase Docker 鏡像,沒有找到官方的 apache的,但有包含許多大數據工具的 harisekhon/hbase 或用于學習目的的 bigdatauniversity/hbase…

windows遠程服務器數據庫的搭建和遠程訪問(Mysql忘記密碼通過Navicat連接記錄解密密碼)

服務器數據庫的搭建和遠程訪問 mysql數據庫安裝(詳細) window安裝mysql詳細流程 路程:重設MySQL5密碼,發現遠程服務器原本有一個MySQL5,嘗試在服務器本地建立連接被拒絕,因為不知道密碼。 (1…

每日c/c++題 備戰藍橋杯(P1093 [NOIP 2007 普及組] 獎學金)

洛谷P1093 [NOIP 2007 普及組] 獎學金 詳解題解 題目背景與要求 題目鏈接:P1093 獎學金 核心任務:根據學生三科總分評選前5名獎學金獲得者,需按特定規則排序輸出。 排序規則(按優先級從高到低): 總分降…

openEuler 22.03 安裝 Nginx,支持離線安裝

目錄 一、環境檢查1.1 必要環境檢查1.2 在線安裝(有網絡)1.3 離線安裝(無網絡) 二、下載Nginx2.1 在線下載2.2 離線下載 三、安裝Nginx四、開機自啟服務五、開放防火墻端口六、常用命令 一、環境檢查 1.1 必要環境檢查 # 查看 g…

基于深度學習的圖像壓縮技術(二)

接上篇:基于深度學習的圖像壓縮技術(一)-CSDN博客 3 基于生成對抗神經網絡的圖像壓縮技術 生成對抗網絡是一種先進的無監督學習算法,由Goodfellow等人在2014 年首次提出,其核心思想源于博弈論。 生成對抗網絡在圖像壓…

TCP和UDP的數據傳輸+區別

目錄 一、數據傳輸過程 1.1 TCP字節流服務圖 1.2 UDP數據報服務圖 二、tcp與udp的區別 1.連接方式 2.可靠性 3.傳輸效率 4.有序性 5.流量控制和擁塞控制 6.應用場景 7.首部長度 三、tcp與udp能不能使用同一個端口號? 四、同一個協議&#xf…

基于ssm的校園舊書交易交換平臺(源碼+文檔)

項目簡介 校園舊書交易交換平臺的主要使用者分為: 前臺功能:用戶進入系統可以對首頁、書籍信息、校園公告、個人中心、后臺管理等功能進行操作; 后臺主要是管理員,管理員功能包括主頁、個人中心、學生管理、發布人管理、書籍分類…

虛假安全補丁攻擊WooCommerce管理員以劫持網站

一場大規模釣魚攻擊正針對WooCommerce用戶,通過偽造安全警報誘使他們下載所謂的"關鍵補丁",實則為植入WordPress后門的惡意程序。 惡意插件植入 根據Patchstack研究人員發現,上當受騙的用戶在下載更新時,實際上安裝的…

《冰雪傳奇點卡版》:第二大陸介紹!

一、第二大陸:高階資源與實力驗證的核心戰場 1. 準入條件與地圖分布 進入門檻: 基礎要求:角色需達到四轉(需消耗50萬元寶完成轉生任務),部分地圖需額外滿足神魔點數(如黑暗之森需神魔全2&#…

信創系統圖形界面開發指南:技術選擇與實踐詳解

信創系統圖形界面開發指南:技術選擇與實踐詳解 🧑 博主簡介:CSDN博客專家、CSDN平臺優質創作者,高級開發工程師,數學專業,10年以上C/C, C#, Java等多種編程語言開發經驗,擁有高級工程師證書&…

【人臉去遮擋前沿】三階段級聯引導學習如何突破真實場景遮擋難題?

一、現實痛點:當人臉被遮擋,AI “認臉” 有多難? 你是否遇到過這樣的場景? 中考體育測試:2025 年天津泰達街中考考場要求考生 “臉部無遮擋” 才能通過人臉識別入場,戴口罩、帽子的學生需現場調整發型。智能門鎖:奇景光電在 CES 2025 推出的 WiseEye 掌靜脈模塊,通過掌…