LLaVA的PT+SFT訓練_llava sft-CSDN博客文章瀏覽閱讀379次。這個階段,使用8個A100(80G)訓練LLaVA-v1.5-13B大約需要20h。全量微調,非lora跑不起來啊,以前一直用swift,llama-factory這種框架式的代碼庫,但用原作者開源的代碼也是有很多好處的。在這個階段,使用 8 個 A100(80G)訓練 LLaVA-v1.5-13B 大約需要 5.5 小時。檢測目錄代碼:missing_cnt為0,說明目錄沒問題。_llava sfthttps://liguandong.blog.csdn.net/article/details/139532254?spm=1001.2014.3001.5502