這篇文章介紹一下PPTAgent,一個從文檔自動生成演示文稿的創新系統。該系統從人類的展示創作方法中汲取靈感,采用兩步流程來確保卓越的整體質量。此外,本文還介紹了PPTEval
,這是一個綜合評估框架,可以跨多個維度評估演示文稿。
ppt agengt
部署使用
為了快速測試,可以使用resource/test/test_(pdf|template)
中的示例來節省預處理時間。
建議及要求
類別 | 詳情 |
---|---|
LLM推薦語言模型 | 語言模型:70B+非推理模型(Qwen2.5-72B-Instruct),用于生成任務。 視覺模型:7B+參數(Qwen2-VL-7B-Instruct),用于字幕任務。 |
系統需求 | 在Linux和macOS上測試,不支持Windows。 至少8GB RAM,建議使用CUDA或MPS支持以獲得更好的性能。 所需依賴項:LibreOffice、poppler-utils (conda: poppler)和NodeJS。 |
Docker部署
使用遠程服務器時,請確保8088
和9297
兩個端口都被轉發。
docker pull forceless/pptagent
docker run -dt --gpus all --ipc=host --name pptagent \-e OPENAI_API_KEY='your_key' \-p 9297:9297 \-p 8088:8088 \-v $HOME:/root \forceless/pptagent
在本地運行
安裝指南
pip install git+https://github.com/icip-cas/PPTAgent.git
pip install git+https://github.com/Force1ess/python-pptx
服務端
在pptagent_ui/backend.py中初始化你的模型:
llms.language_model = LLM(model="Qwen2.5-72B-Instruct-GPTQ-Int4",api_base="http://124.16.138.143:7812/v1"
)
llms.vision = LLM(model="gpt-4o-2024-08-06")
啟動前端
注意:后端API端點在src/main.js中配置為axios.defaults.baseURL
cd pptagent_ui
npm install
npm run serve
有關程序化生成的詳細信息,請參閱pptagent_ui/backend.py:ppt_gen和test/test_pptgen.py。
項目結構📂
PPTAgent/
├── pptagent/
│ ├── apis.py # API and CodeExecutor
│ ├── llms.py # LLM services initialization
│ ├── presentation.py & shapes.py # Parse PowerPoint files
│ ├── induct.py # Presentation analysis (Stage Ⅰ)
│ ├── pptgen.py # Presentation generation (Stage Ⅱ)
│ ├── layout.py # Definition of the layout in pptxs
│ ├── document.py # Parse and organize markdown document
├── pptagent_ui/ # UI for PPTAgent
| ├── src/ # Frontend source code
│ ├── backend.py # Backend server
├── roles/ # Role definitions in PPTAgent
├── prompts/ # Project prompts
特點?
- 動態內容生成:創建無縫集成文本和圖像的幻燈片
- 智能參考學習:利用現有的演示文稿,而不需要手動注釋
- 綜合質量評估:通過多個質量指標評估演示文稿
案例研究💡
- Iphone 16 Pro
- Build Effective Agents
PTAgent🤖
PPTAgent
遵循兩個階段的方法:
- 分析階段:從參考報告中的模式中提取和學習
- 生成階段:開發有結構的輪廓并制作視覺上有凝聚力的幻燈片
我們系統的工作流程如下圖所示:
github 倉庫地址 :https://github.com/icip-cas/PPTAgent