1?初步介紹?XComposer2
?相關知識
浦語·靈筆2
?是基于?書生·浦語2
?大語言模型研發的突破性的圖文多模態大模型,具有非凡的圖文寫作和圖像理解能力,在多種應用場景表現出色,總結起來其具有:
- 自由指令輸入的圖文寫作能力:?
浦語·靈筆2
?可以理解自由形式的圖文指令輸入,包括大綱、文章細節要求、參考圖片等,為用戶打造圖文并貌的專屬文章。生成的文章文采斐然,圖文相得益彰,提供沉浸式的閱讀體驗。 - 準確的圖文問題解答能力:
浦語·靈筆2
?具有海量圖文知識,可以準確的回復各種圖文問答難題,在識別、感知、細節描述、視覺推理等能力上表現驚人。 - 杰出的綜合能力:?
浦語·靈筆2-7B
?基于?書生·浦語2-7B
?模型,在13項多模態評測中大幅領先同量級多模態模型,在其中6項評測中超過?GPT-4V
?和?Gemini Pro
。
2?配置基礎環境(開啟 50% A100 權限后才可開啟此章節)
InternStudio
選用?50% A100
?進行開發,只有在開發機停機的時候可以調整。這個功能還是挺贊的
進入開發機,啟動?conda
?環境:
conda activate demo # 補充環境包 pip install timm==0.4.12 sentencepiece==0.1.99 markdown2==2.4.10 xlsxwriter==3.1.2 gradio==4.13.0 modelscope==1.9.5
下載?InternLM-XComposer 倉庫?相關的代碼資源:
cd /root/demo git clone https://gitee.com/internlm/InternLM-XComposer.git # git clone https://github.com/internlm/InternLM-XComposer.git cd /root/demo/InternLM-XComposer git checkout f31220eddca2cf6246ee2ddf8e375a40457ff626
在?terminal
?中輸入指令,構造軟鏈接快捷訪問方式:
ln -s /root/share/new_models/Shanghai_AI_Laboratory/internlm-xcomposer2-7b /root/models/internlm-xcomposer2-7b ln -s /root/share/new_models/Shanghai_AI_Laboratory/internlm-xcomposer2-vl-7b /root/models/internlm-xcomposer2-vl-7b
3?圖文寫作實戰
繼續輸入指令,用于啟動?InternLM-XComposer
:
cd /root/demo/InternLM-XComposer python /root/demo/InternLM-XComposer/examples/gradio_demo_composition.py \ --code_path /root/models/internlm-xcomposer2-7b \ --private \ --num_gpus 1 \ --port 6006
待程序運行的同時,對端口環境配置本地?PowerShell
?。使用快捷鍵組合?Windows + R
(Windows 即開始菜單鍵)打開指令界面,(Mac 用戶打開終端即可)并輸入命令,按下回車鍵:
打開 PowerShell 后,先查詢端口,再根據端口鍵入命令 (例如圖中端口示例為 33838):
# 從本地使用 ssh 連接 studio 端口 # 將下方端口號 38374 替換成自己的端口號 ssh -CNg -L 6006:127.0.0.1:6006 root@ssh.intern-ai.org.cn -p 33838
再復制下方的密碼,輸入到?password
?中,直接回車:
最終保持在如下效果即可:
打開?http://127.0.0.1:6006?實踐效果如下圖所示:能夠圖文寫作效果還是挺驚艷的