從文本生成到數據增強:探索 AI 前沿的開源套件 | 開源專題 No.44

picture

Significant-Gravitas/AutoGPT

Stars: 150.4k License: MIT

picture

AutoGPT 是開源 AI 代理生態系統的核心工具包。它采用模塊化和可擴展的框架,使您能夠專注于以下方面:

  • 構建 - 為驚人之作打下基礎。
  • 測試 - 將您的代理調整到完美狀態。
  • 查看 - 觀察進展成果呈現出來。

AutoGPT 始終處于 AI 創新前沿,并提供了開源生態系統中冠軍代碼庫所需功能。
在我們目前進行基準測試的所有 Agent 中,AutoGPT 得分最高。

langchain-ai/langchain

Stars: 61.3k License: MIT

LangChain 是一個用于通過組合性構建 LLMs 應用程序的庫。

  • LLMs 和 Prompts:包括 prompt 管理、prompt 優化、所有 LLM 的通用接口以及與 LLMs 一起使用的常見工具。
  • Chains:超越單個 LLM 調用,涉及到多次調用 (無論是對 LLM 還是其他實用工具)。LangChain 為鏈提供了標準接口、許多與其他工具集成的功能,并提供了常見應用程序的端到端鏈示例。
  • 數據增強生成:數據增強生成涉及特定類型的鏈首先與外部數據源進行交互,獲取在生成步驟中使用的數據。例如長文本摘要和針對特定數據源進行問答等。
  • Agents:代理機制使得 LLMS 可以決策采取哪些行動,執行該操作并觀察結果,然后重復此過程直至完成。LangChain 提供了代理機制的標準界面,多種可選代理模型和完整示例。
  • Memory:內存指持久保存 chain/agent 調度之間狀態信息。Langchain 提供內存方案標準接口,同時也有大量相關代碼示例
  • Evaluation:[BETA] 使用傳統評估方法很難評估產生式模型。一種新穎方式是利用語言模型自身來做這項評估。LangChain 提供了一些輔助這種方式的 prompt/chain

karpathy/nanoGPT

Stars: 25.2k License: MIT

picture

nanoGPT 是一個用于訓練/微調中型 GPT 的最簡單、最快速的存儲庫。它是 minGPT 的重寫,注重實踐而非教育。該項目仍在積極開發中,但目前文件 train.py 可以在 OpenWebText 上復現運行時間約為4天,在一臺 8XA100 40GB 節點上進行訓練,并且能夠復制出 GPT-2 (124M) 模型。代碼本身很簡潔易懂:train.py 只有大約 300 行樣板化訓練循環代碼和 model.py 只有大約 300 行 GPT 模型定義,可選擇從 OpenAI 加載 GTP-2 的權重。這就是全部。

  • 訓練/微調中等規模的語言生成模型
  • 簡單易讀:由于代碼十分簡潔,因此非常容易根據個人需求進行修改。
  • 快速高效:在適當硬件資源下,能夠在較短時間內完成對不同數據集大小及網絡結構參數設置下的語言生成任務。

mindsdb/mindsdb

Stars: 18.4k License: GPL-3.0

picture

MindsDB 是一個開源項目,它的主要功能是將任何 AI/ML 模型連接到任何數據源。該項目提供以下核心優勢和關鍵特點:

  • Hook AI 模型在觀察到新數據時自動運行,并將輸出插入我們的任何集成中。
  • 從我們支持的 130 多個數據源中包含的數據自動訓練和微調 AI 模型。
  • 可以使用演示環境來嘗試 MindsDB 并使用最常見用例的樣本數據。
  • 提供了安裝指南以及完整文檔、社區支持等資源。

guidance-ai/guidance

Stars: 12.7k License: MIT

picture

Guidance 是一個強大的工具,可以讓您更有效地掌控現代語言模型,無論您是開發者、設計師還是跨職能團隊。它允許您以一種簡單直觀的語法,基于 Handlebars 模板,實現文本生成、提示和邏輯控制的混合,產生清晰和易于理解的輸出結構。它支持Jupyter/VSCode筆記本中的實時流式處理,可用于快速開發和測試復雜的模板和生成。此外,Guidance 還提供了模型加速功能,可在處理多個生成或 LLM(大型語言模型)控制流語句時顯著提高推理性能,從而提供更快的結果。
Guidance 具有以下主要特點:

  • 簡單、直觀的語法,基于 Handlebars 模板。
  • 豐富的輸出結構,包括多個生成、選擇、條件、工具使用等。
  • 在 Jupyter/VSCode 筆記本中的實時流式處理,提高了模板開發效率。
  • 智能的基于種子的生成緩存,優化了生成速度。
  • 支持基于角色的聊天模型(如 ChatGPT )的輕松集成。
  • 與 Hugging Face 模型的輕松集成,包括提供模型加速、邊界優化和正則表達式模式引導等功能。
  • Guidance 的目標是使文本生成和模型控制更加靈活、高效,為開發者和團隊提供更多自由度和便利性。它適用于多種用途,包括自然語言生成、文本處理和實時流式處理。

無論您是初學者還是經驗豐富的開發者,Guidance都能為您的項目帶來便利和效率,是一個值得嘗試的開源工具。

openai/evals

Stars: 12.3k License: NOASSERTION

OpenAI Evals 是一個用于評估 LLMs (大型語言模型) 或使用 LLMs 作為組件構建的系統的框架。它還包括一個具有挑戰性 evals 的開源注冊表。Evals 現在支持通過 Completion Function Protocol 評估任何系統,包括 prompt chains 或 tool-using agents 的行為。通過 Evals,我們旨在盡可能簡單地構建 eval,并編寫盡量少的代碼。“Eval” 是用于評估系統行為質量的任務。

  • 支持運行和創建 evals
  • 提供了現有 eval 模板以及如何運行已存在 eval 的指南
  • 可以自定義實施特定邏輯來進行個性化 eval 邏輯

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:
http://www.pswp.cn/news/166578.shtml
繁體地址,請注明出處:http://hk.pswp.cn/news/166578.shtml
英文地址,請注明出處:http://en.pswp.cn/news/166578.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

【Mybatis源碼】反射 - MetaClass

前面我們介紹了Reflector類,Reflector主要完成了Class類中Setter、Getter方法的封裝,可以使用屬性獲取對應的Getter、Setter方法完成方法的調用,同時也可以判斷屬性是否存在,是否存在Getter、Setter方法。 使用Reflector解決了訪問Class類中屬性的問題,但是如果屬性是成員…

HandBrake 1.7 近日發布

導讀HandBrake 1.7 近日發布,作為這個開源、免費和跨平臺視頻轉碼器應用程序的重大更新,適用于 GNU/Linux、macOS 和 Windows 系統。 在 HandBrake 1.6 發布近一年后,HandBrake 1.7 版本為 Linux 用戶提供了許多好處,包括視頻摘要…

C語言第二十八彈--輸入一個非負整數,返回組成它的數字之和

C語言求輸入一個非負整數&#xff0c;返回組成它的數字之和 方法一、遞歸法 思路&#xff1a;設計一個初始條件&#xff0c;通過遞歸獲取非負整數的個位&#xff0c;不斷接近遞歸條件即可。 #define _CRT_SECURE_NO_WARNINGS #include <stdio.h>int DigitSum(int n) {…

PGZ-SBV系列項目介紹、技術選型、技術優勢(AIO內部版)All-In-One

前情提示 項目孵化于2014年,內部正式發行于2015.隨著業務需求,部分內部高級功能逐步對外開放支持多行業(保險、金融、餐飲、旅游、電商、直播等等),多架構,支持AI集成,支持協同,只要你想到的均可集成、均已內置高安全,高可用,多技術解決方案包含av版本、gf低代碼版、…

ubuntu22.04 arrch64版在線安裝maven

腳本 if type -p mvn; thenecho "maven has been installed."elsecd /home/zenglgwget https://dlcdn.apache.org/maven/maven-3/3.9.5/binaries/apache-maven-3.9.5-bin.tar.gz --no-check-certificatetar vxf apache-maven-3.9.5-bin.tar.gz rm -rf /usr/local/mav…

springboot+vue基本微信小程序的劇本殺游戲設計與實現

項目介紹 首先,論文一開始便是清楚的論述了小程序的研究內容。其次,剖析系統需求分析,弄明白“做什么”,分析包括業務分析和業務流程的分析以及用例分析,更進一步明確系統的需求。然后在明白了小程序的需求基礎上需要進一步地設計系統,主要包羅軟件架構模式、整體功能模塊、數…

通過內網穿透本地MariaDB數據庫,實現在公網環境下使用navicat圖形化工具

公網遠程連接MariaDB數據庫【cpolar內網穿透】 文章目錄 公網遠程連接MariaDB數據庫【cpolar內網穿透】1. 配置MariaDB數據庫1.1 安裝MariaDB數據庫1.2 測試局域網內遠程連接 2. 內網穿透2.1 創建隧道映射2.2 測試隨機地址公網遠程訪問3. 配置固定TCP端口地址3.1 保留一個固定的…

微信小程序 修改默認單選,多選按鈕樣式

微信小程序 修改默認單選&#xff0c;多選按鈕樣式 1.在微信開發者文檔中復制一份單選或者多選的代碼 <!--pages/index3/index.wxml--> <radio-group bindchange"radioChange"><label class"weui-cell weui-check__label" style"dis…

小程序:project.config.json / project.private.config.json / 項目配置文件 /拉取代碼產生沖突 / 如何解決

一、理解project.config.json / project.private.config.json project.config.json 文件是項目的配置文件&#xff0c;它包含了關于小程序的一些基本信息&#xff0c;例如小程序的名稱、App ID、開發者信息以及頁面路徑等。這個文件一般不會被提交到版本控制系統中&#xff0c;…

cartographer_ros使用

首先根據官方指導安裝cartographer。然后創建ros工作空間并拉取 cartographer_ros 代碼 mkdir -p carto_ws/src cd carto_ws/src catkin_init_workspace git clone https://github.com/cartographer-project/cartographer_ros.git現在需要安裝cartographer_ros依賴項。首先&a…

微信小程序使用騰訊地圖實現地點搜索并且隨著地圖的滑動加載滑動到區域的地點,本文地點使用醫院關鍵詞作為搜索地點

實現效果如下 1.頁面加載時&#xff0c;根據getLocation方法獲取用戶當前經緯度獲取20條醫院位置信息 2.頁面滑動時&#xff0c;根據滑動到的經緯度再次獲取20條醫院位置信息 獲取到的醫院位置信息 實現方法如下 1.在.wxml中添加觸發滑動的方法bindregiοnchange“onMapRegio…

【Spring集成MyBatis】核心配置文件

文章目錄 1. typeHandlers標簽2. plugins標簽通過PageHelper的API獲取分頁的信息 1. typeHandlers標簽 可以重寫類型處理器&#xff0c;或創建類型處理器來處理不支持/非標準的類型。選擇性地將它映射到一個JDBC類型&#xff1a;如Java中的Date類型&#xff0c;將其存放到數據…

docker安裝以及idea訪問docker

其他目錄&#xff1a; docker 安裝環境&#xff08;有空更新&#xff09; url “” docker 打包java包&#xff0c;并運行&#xff08;有空更新&#xff09; url “” docker 打包vue &#xff08;有空更新&#xff09; url “” docker 多服務 &#xff08;有空更新&#xff…

2023年亞太杯數學建模A題水果采摘機器人的圖像識別功能(matlab 部分代碼)

對于1-4問針對的是附錄1 中的數據 clc; close all; clear; % 圖像文件夾路徑 folder_path E:/新建文件夾/yatai/Attachment/Attachment 1/; % 圖像文件列表 image_files dir(fullfile(folder_path, *.jpg)); % 假設所有圖片都是jpg格式% 解析文件名中的數字&#xff0c;并轉…

機器學習探索計劃——數據集劃分

文章目錄 導包手寫數據劃分函數使用sklearn內置的劃分數據函數stratifyy理解舉例 導包 import numpy as np from matplotlib import pyplot as plt from sklearn.datasets import make_blobs手寫數據劃分函數 x, y make_blobs(n_samples 300,n_features 2,centers 3,clus…

Java設計模式系列:單例設計模式

Java設計模式系列&#xff1a;單例設計模式 介紹 所謂類的單例設計模式&#xff0c;就是采取一定的方法保證在整個的軟件系統中&#xff0c;對某個類只能存在一個對象實例&#xff0c;并且該類只提供一個取得其對象實例的方法&#xff08;靜態方法&#xff09; 比如 Hiberna…

循環隊列的幾種實現方式

基于數組來實現循環隊列的幾種方式 使用 usedSize使用 標志位空出一個位置 方式一 usedSize 0 是則表示當前數組為空 usedSize 數組的長度 則表示當前數組滿了方式二 使用一個標記 flag 來判斷當前隊列是空還是滿 如果 flag false 則說明隊列為空 如果 flag true 則說…

leetcode:495. 提莫攻擊

一、題目 鏈接&#xff1a;495. 提莫攻擊 - 力扣&#xff08;LeetCode&#xff09; 函數原型&#xff1a;int findPoisonedDuration(int* timeSeries, int timeSeriesSize, int duration) 二、思路 遍歷數組timeSeries&#xff0c;如果 元素值duration < 下一元素值 &#x…

GO語言實現txt文本多行合并為一行

windows系統txt文件 input.txt多行合并為一行 package mainimport ("fmt""io/ioutil""strings" )func main() {content, err : ioutil.ReadFile("E:\\gin_demo\\demo30DNF\\youhua\\input.txt")if err ! nil {fmt.Println("Err…

OpenCV快速入門:圖像分析——傅里葉變換、積分圖像

文章目錄 前言一、傅里葉變換1.1 離散傅里葉變換1.1.1 離散傅里葉變換原理1.1.2 離散傅里葉變換公式1.1.3 代碼實現1.1.4 cv2.dft 函數解析 1.2 傅里葉變換進行卷積1.2.1 傅里葉變換卷積原理1.2.2 傅里葉變換卷積公式1.2.3 代碼實現1.2.4 cv2.mulSpectrums 函數解析 1.3 離散余…