官方網站:Towhee | Home - Towhee
Towhee?是一個尖端框架,旨在通過使用基于大型語言模型 (LLM) 的管道編排來簡化非結構化數據的處理。它具有獨特的優勢,可以從各種非結構化數據類型(包括冗長的文本、圖像、音頻和視頻文件)中提取寶貴的見解。利用生成式 AI 和 SOTA 深度學習模型的功能,Towhee 能夠將這些未處理的數據轉換為特定格式,例如文本、圖像或嵌入。然后,可以有效地將這些內容加載到適當的存儲系統中,例如矢量數據庫。開發人員最初可以使用用戶友好的 Pythonic APU 構建直觀的數據處理管道原型,然后針對生產環境進行優化。
🎨 多模態:Towhee 能夠處理多種數據類型。無論是圖像數據、視頻剪輯、文本、音頻文件,甚至是分子結構,Towhee 都可以處理它們。
📃 LLM 流水線編排:Towhee 提供了適應不同大型語言模型 (LLM) 的靈活性。此外,它還允許在本地托管開源大型模型。此外,Towhee 還提供及時管理和知識檢索等功能,使與這些 LLM 的交互更加高效和有效。
🎓 豐富的運營商:Towhee 在五個領域提供廣泛的即用型先進模型:CV、NLP、多模態、音頻和醫療。擁有 BERT 和 CLIP 等 140 多種模型,以及視頻解碼、音頻切片、幀采樣和降維等豐富功能,有助于高效構建數據處理流水線。
🔌 預構建的 ETL 管道:Towhee 提供現成的 ETL(提取、轉換、加載)管道,用于檢索增強生成、文本圖像搜索和視頻復制檢測等常見任務。這意味著您無需成為 AI 專家即可使用這些功能構建應用程序。 ?? 高性能后端:利用 Triton 推理服務器的強大功能,Towhee 可以使用 TensorRT、Pytorch 和 ONNX 等平臺加速 CPU 和 GPU 上的模型服務。此外,只需幾行代碼即可將 Python 管道轉換為高性能 docker 容器,從而實現高效的部署和擴展。
🐍 Pythonic API:Towhee 包含一個 Pythonic 方法鏈 API,用于描述自定義數據處理管道。我們還支持架構,這使得處理非結構化數據就像處理表格數據一樣簡單。