Overview
- 多模態大模型關于RLHF的代表性文章
- 一、LLaVA-RLHF
- 二、RLHF-V
- 三、SILKIE
多模態大模型關于RLHF的代表性文章
一、LLaVA-RLHF
題目: ALIGNING LARGE MULTIMODAL MODELS WITH FACTUALLY AUGMENTED RLHF
機構:UC伯克利
論文: https://arxiv.org/pdf/2309.14525.pdf
代碼:https://llava-rlhf.github.io/
任務:
特點:
方法:
前置相關工作:
二、RLHF-V
題目:RLHF-V: Towards Trustworthy MLLMs via Behavior Alignment from Fine-grained Correctional Human Feedback
機構:清華,新加坡國立
論文?