PPTAgent:一款開源免費生成和評估幻燈片的項目

這篇文章介紹一下PPTAgent,一個從文檔自動生成演示文稿的創新系統。該系統從人類的展示創作方法中汲取靈感,采用兩步流程來確保卓越的整體質量。此外,本文還介紹了PPTEval,這是一個綜合評估框架,可以跨多個維度評估演示文稿。

ppt agengt

部署使用

為了快速測試,可以使用resource/test/test_(pdf|template)中的示例來節省預處理時間。

建議及要求

類別詳情
LLM推薦語言模型語言模型:70B+非推理模型(Qwen2.5-72B-Instruct),用于生成任務。
視覺模型:7B+參數(Qwen2-VL-7B-Instruct),用于字幕任務。
系統需求在Linux和macOS上測試,不支持Windows。
至少8GB RAM,建議使用CUDA或MPS支持以獲得更好的性能。
所需依賴項:LibreOffice、poppler-utils (conda: poppler)和NodeJS。

Docker部署

使用遠程服務器時,請確保80889297兩個端口都被轉發。

docker pull forceless/pptagent
docker run -dt --gpus all --ipc=host --name pptagent \-e OPENAI_API_KEY='your_key' \-p 9297:9297 \-p 8088:8088 \-v $HOME:/root \forceless/pptagent

在本地運行

安裝指南

pip install git+https://github.com/icip-cas/PPTAgent.git
pip install git+https://github.com/Force1ess/python-pptx

服務端

在pptagent_ui/backend.py中初始化你的模型:

llms.language_model = LLM(model="Qwen2.5-72B-Instruct-GPTQ-Int4",api_base="http://124.16.138.143:7812/v1"
)
llms.vision = LLM(model="gpt-4o-2024-08-06")

啟動前端

注意:后端API端點在src/main.js中配置為axios.defaults.baseURL

cd pptagent_ui
npm install
npm run serve

有關程序化生成的詳細信息,請參閱pptagent_ui/backend.py:ppt_gen和test/test_pptgen.py。

項目結構📂

PPTAgent/
├── pptagent/
│   ├── apis.py                     # API and CodeExecutor
│   ├── llms.py                     # LLM services initialization
│   ├── presentation.py & shapes.py # Parse PowerPoint files
│   ├── induct.py                   # Presentation analysis (Stage Ⅰ)
│   ├── pptgen.py                   # Presentation generation (Stage Ⅱ)
│   ├── layout.py                   # Definition of the layout in pptxs
│   ├── document.py                 # Parse and organize markdown document
├── pptagent_ui/                    # UI for PPTAgent
|   ├── src/                        # Frontend source code
│   ├── backend.py                  # Backend server
├── roles/                          # Role definitions in PPTAgent
├── prompts/                        # Project prompts

特點?

  • 動態內容生成:創建無縫集成文本和圖像的幻燈片
  • 智能參考學習:利用現有的演示文稿,而不需要手動注釋
  • 綜合質量評估:通過多個質量指標評估演示文稿

案例研究💡

  • Iphone 16 Pro
    在這里插入圖片描述
  • Build Effective Agents
  • 在這里插入圖片描述

PTAgent🤖

PPTAgent遵循兩個階段的方法:

  • 分析階段:從參考報告中的模式中提取和學習
  • 生成階段:開發有結構的輪廓并制作視覺上有凝聚力的幻燈片
    我們系統的工作流程如下圖所示:
    在這里插入圖片描述
    github 倉庫地址 :https://github.com/icip-cas/PPTAgent

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/pingmian/75673.shtml
繁體地址,請注明出處:http://hk.pswp.cn/pingmian/75673.shtml
英文地址,請注明出處:http://en.pswp.cn/pingmian/75673.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

谷歌開源單個 GPU 可運行的Gemma 3 模型,27B 超越 671B 參數的 DeepSeek

自從 DeepSeek 把訓練成本打下來之后,各個模型廠家現在不再堆參數進行模型的能力對比。而是轉向了訓練成本優化方面,且還要保證模型能力不減反增的效果。包括使用較少的模型參數,降低 GPU 使用數量,降低模型內存占用等等技術手段。…

回歸預測 | Matlab實現NRBO-Transformer-LSTM多輸入單輸出回歸預測

回歸預測 | Matlab實現NRBO-Transformer-LSTM多輸入單輸出回歸預測 目錄 回歸預測 | Matlab實現NRBO-Transformer-LSTM多輸入單輸出回歸預測預測效果基本介紹程序設計參考資料 預測效果 基本介紹 1.【JCR一區級】Matlab實現NRBO-Transformer-LSTM多輸入單輸出回歸預測&#xf…

Photoshop 2025 Mac中文Ps圖像編輯

Photoshop 2025 Mac中文Ps圖像編輯 文章目錄 Photoshop 2025 Mac中文Ps圖像編輯一、介紹二、效果三、下載 一、介紹 Adobe Photoshop 2025 Mac版集成了多種強大的圖像編輯、處理和創作功能。①強化了Adobe Sensei AI的應用,通過智能摳圖、自動修復、圖像生成等功能…

7. 記憶(Memory)機制:讓AI擁有“短期記憶”與“長期記憶”

引言:當AI學會"記住你" 2025年某銀行智能客服因無法記住用戶身份,每次對話都要求重復驗證,引發大量投訴。引入LangChain 記憶系統后,客戶滿意度提升62%。本文將基于MemorySaver與FAISS本地存儲,教你構建符合…

【Python使用】嘿馬云課堂web完整實戰項目第3篇:增加數據,修改數據【附代碼文檔】

教程總體簡介:項目概述 項目背景 項目的功能構架 項目的技術架構 CMS 什么是CMS CMS需求分析與工程搭建 靜態門戶工程搭建 SSI服務端包含技術 頁面預覽開發 4 添加“頁面預覽”鏈接 頁面發布 需求分析 技術方案 測試 環境搭建 數據字典 服務端 前端 數據模型 頁面原…

論文筆記(七十五)Auto-Encoding Variational Bayes

Auto-Encoding Variational Bayes 文章概括摘要1 引言2 方法2.1 問題場景2.2 變分下界2.3 SGVB估計器與AEVB算法2.4 重參數化技巧 3 示例:變分自編碼器(Variational Auto-Encoder)4 相關工作5 實驗6 結論7 未來工作 文章概括 引用&#xff1…

Python3 學習筆記

Python3 簡介 | 菜鳥教程 一 Python3 簡介 Python 是一個高層次的結合了解釋性、編譯性、互動性和面向對象的腳本語言。 Python 的設計具有很強的可讀性,相比其他語言經常使用英文關鍵字,其他語言的一些標點符號,它具有比其他語言更有特色…

Java實現N皇后問題的雙路徑探索:遞歸回溯與迭代回溯算法詳解

N皇后問題要求在NN的棋盤上放置N個皇后,使得她們無法互相攻擊。本文提供遞歸和循環迭代兩種解法,并通過圖示解釋核心邏輯。 一、算法核心思想 使用回溯法逐行放置皇后,通過沖突檢測保證每行、每列、對角線上只有一個皇后。發現無效路徑時回退…

前端判斷值相等的方法和區別

1. (寬松相等) 在比較之前會進行類型轉換 可能導致一些意外的結果 0 // true 0 0 // true false 0 // true null undefined // true [1,2,3]1,2,3 // true2. (嚴格相等) 不進行類型轉換 類型和值都必須相同 0 // false 0 0 // false false 0 /…

Socket編程UDP

Socket編程UDP 1、V1版本——EchoServer2、網絡命令2.1、ping2.2、netstat2.3、pidof 3、驗證UDP——Windows作為client訪問Linux4、V2版本——DictServer5、V3版本——簡單聊天室 1、V1版本——EchoServer 首先給出EchoServer目錄結構:服務器的類我們實現在UdpServ…

輔助查詢是根據查詢到的文檔片段再去生成新的查詢問題

💡 輔助查詢是怎么來的? 它是基于你當前查詢(query)檢索到的某個文檔片段(chunk_result),再去“反推”出新的相關問題(utility queries),這些問題的作用是&a…

2025 年 4 月補丁星期二預測:微軟將推出更多 AI 安全功能

微軟正在繼續構建其 AI 網絡安全戰略,并于本月宣布在 Microsoft Security Copilot 中引入新代理。 他們引入了用于網絡釣魚分類的代理、用于數據丟失預防和內部風險管理的警報分類、條件訪問優化、漏洞修復和威脅情報簡報。 這些代理的目標是不斷從這些不同學科中…

【LLM系列】1.大模型簡介

1. 基礎 1.1 如何權衡模型的復雜度和性能? ├── a. 模型架構選擇 │ ├── 簡化架構 │ │ └── 選擇較小的網絡層數和寬度,降低復雜度; │ │ 可使用高性能基礎模型如 Transformers 作為起點,根據需求縮放模型。 │ └──…

【leetcode】記錄與查找:哈希表的題型分析

前言 🌟🌟本期講解關于力扣的幾篇題解的詳細介紹~~~ 🌈感興趣的小伙伴看一看小編主頁:GGBondlctrl-CSDN博客 🔥 你的點贊就是小編不斷更新的最大動力 🎆那么廢話不…

優選算法的妙思之流:分治——快排專題

專欄:算法的魔法世界 個人主頁:手握風云 目錄 一、快速排序 二、例題講解 2.1. 顏色分類 2.2. 排序數組 2.3. 數組中的第K個最大元素 2.4. 庫存管理 III 一、快速排序 分治,簡單理解為“分而治之”,將一個大問題劃分為若干個…

二叉樹的ACM板子(自用)

package 二叉樹的中序遍歷;import java.util.*;// 定義二叉樹節點 class TreeNode {int val; // 節點值TreeNode left; // 左子節點TreeNode right; // 右子節點// 構造函數TreeNode(int x) {val x;} }public class DMain {// 構建二叉樹(層序遍歷方式&…

Linux常用命令詳解:從基礎到進階

目錄 一、引言 二、文件處理相關命令 (一)grep指令 (二)zip/unzip指令 ?編輯 (三)tar指令 (四)find指令 三、系統管理相關命令 (一)shutdown指…

Qt多線程從基礎到性能優化

一、為什么需要多線程開發 現代應用程序的性能需求 CPU多核架構的有效利用 復雜任務的解耦與響應式界面保持 二、Qt線程創建四大方式 1. 繼承QThread重寫run() class WorkerThread : public QThread {void run() override {// 耗時操作qDebug() << "Thread ID…

【java】在 Java 中,獲取一個類的`Class`對象有多種方式

在 Java 中&#xff0c;獲取一個類的Class對象有多種方式。Class對象代表了 Java 中的一個類或接口的運行時類信息&#xff0c;可以用于反射操作。以下是獲取Class對象的幾種常見方法&#xff1a; 1.使用.class屬性 每個類都有一個.class屬性&#xff0c;可以直接獲取該類的Cl…

什么是RPC通信

RPC&#xff08;Remote Procedure Call&#xff0c;遠程過程調用&#xff09;通信是一種允許程序像調用本地函數一樣調用遠程服務器上函數的通信技術。它簡化了分布式系統中的網絡交互&#xff0c;隱藏了底層網絡通信的復雜性&#xff0c;使開發者能夠專注于業務邏輯。 一、RPC…