列舉開源的模型和推理框架

當然可以!下面是一個系統性的列表,按 開源大模型(LLM)推理框架 兩大類列出,并配上簡要說明。


🧠 一、開源大語言模型(LLMs)

名稱發布者語言能力模型大小特點
LLaMA 2 / 3Meta英文強,少量多語7B/13B/70B非商業使用需申請;社區生態廣泛
Qwen / Qwen1.5阿里云通義千問中文強,兼顧英文0.5B ~ 72B中文能力極強,Qwen1.5 開源,支持多模態
Baichuan 2百川智能中文優化7B / 13B商業/研究可用,API 接口友好
InternLM / InternLM2商湯 + 上交中文優,推理快7B / 20BInternLM2 引入 MoE,推理效率高
Yi01.AI(王慧文)中文 + 英文6B / 34BYi-34B 是當前頂級中文模型之一
Mistral / MixtralMistral.ai(法國)英語主導7B / 12.9B (MoE)極高性價比,推理快,非常熱門
GemmaGoogle英語強2B / 7B使用 Apache 2 許可,研究友好
Phi-2 / Phi-3微軟小模型2.7B / 4.2B教育、推理快,適合嵌入式
OpenChat / ChatGLM3OpenBMB / 智譜AI中文對話優化6B / 32BChatGLM 系列開源生態良好

?? 二、主流開源推理框架(Inference Engines)

名稱語言/實現支持硬件特點
vLLMPython / CUDA / TritonGPU(A10、A100、4090 等)高并發低延遲,生產級部署首選
llama.cppC++CPU / Apple M 系列 / GPU輕量、支持量化 .gguf 格式,能跑在樹莓派上
OllamaRust / C++ 封裝CPU / M 系列 GPUllama.cpp 的高級封裝,一行命令啟動
TGI (Text Generation Inference)HuggingFaceGPUTransformers 官方部署工具,支持 Batching、CUDA
FasterTransformerNVIDIAGPU強調 Transformer 高效并行,支持 INT8/FP16
TensorRT-LLMNVIDIAGPU (A100/H100)超高性能推理,適合部署 LLaMA-3 等模型
MLC LLMTVM 項目CPU / GPU / iOS / Android編譯到瀏覽器、iPhone、本地設備
DeepSpeed-MIIMicrosoftGPU深度優化并行推理(基于 DeepSpeed)
Exllama / Exllamav2C++/CUDAGPU適用于量化模型(4-bit 推理超快)
ctransformersPython 綁定 llama.cppCPU / GPU在 Python 中直接跑 gguf 模型,適合小項目

📌 補充:工具生態

工具用途
transformersHuggingFace 模型加載和訓練工具
AutoGPTQGPTQ 量化工具,適配 vLLM、Transformers
text-generation-webuiWebUI 管理/測試各種本地模型(支持 gguf / HF 模型)
LMDeploy商湯開發的 LLM 部署工具,支持 InternLM 系列
LangChain / LlamaIndex構建基于 LLM 的 RAG 檢索系統

? 你可以根據用途選擇:

你要做什么?推薦模型 + 推理框架
本地跑中文對話Qwen1.5 + Ollama / llama.cpp
服務器部署并發服務LLaMA3/Qwen + vLLM
快速試驗不同模型text-generation-webui + GGUF 模型
移動端部署MLC LLM + Phi-2 / Tiny LLM
精準控制上下文 / Token 利用率vLLM(PagedAttention 優化)

如果你告訴我你電腦或服務器的配置(CPU/GPU/內存),我可以給你推薦最適合你機器的模型+框架組合。是否需要?

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/diannao/86994.shtml
繁體地址,請注明出處:http://hk.pswp.cn/diannao/86994.shtml
英文地址,請注明出處:http://en.pswp.cn/diannao/86994.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

深入講解一下 Nomic AI 的 GPT4All 這個項目

我們來深入講解一下 Nomic AI 的 GPT4All 這個項目。 這是一個非常優秀和流行的開源項目,我會從**“它是什么”、“為什么它很重要”、“項目架構和源碼結構”以及“如何使用”**這幾個方面為你全面剖析。 一、項目概述 (Project Overview) 簡單來說,…

力扣HOT100之技巧:287. 尋找重復數

這道題真的是中等題嗎?我請問呢??我怎么覺得是困難題呢? 這道題的思路太難想了,想不出來,直接去看的這位大佬的題解,寫得很清楚。 這道題可以將其轉化為環形鏈表問題,可是為什么只要…

QT log4qt 無法生成日志到中文的路徑中的解決方案

一.使用log4qt時,應用程序安裝在帶有中文路徑下,導致無法生成日志到安裝目錄中? 問題描述:如下的配置文件,log4j.appender.File.File 后面跟隨的路徑是當前路徑,你可能覺得自己的日志能夠生成在當前路徑中,如果你試著用自己的程序雙擊啟動一個文件時,你會發現日志生成在…

讓 Deepseek 寫電器電費計算器小程序

微信小程序版電費計算器 以下是一個去掉"電器名稱"后的微信小程序電費計算器代碼,包含所有必要文件: 1. app.json (全局配置) {"pages": ["pages/index/index"],"window": {"backgroundColor": &q…

第二部分-靜態路由實驗

目錄 一、什么是路由? 1.1.定義 1.2.路由作用 1.3.路由類型 1.3.1.直連路由 1.3.2.靜態路由 1.3.3.動態路由 1.3.4.路由表 1.5.路由器的匹配原則 1.6.路由配置 1.6.1.靜態路由配置 1.6.2.動態路由配置 二、實驗 2.1.靜態路由 2.1.1.實驗拓撲 2.1.2.實驗過程 2.2.缺省…

Could not initialize Logback logging from classpath:logback-spring.xml

jdk21、springboot 3.2.12啟動報錯找不到logback.xml Logging system failed to initialize using configuration from classpath:logback-spring.xml java.lang.IllegalStateException: Could not initialize Logback logging from classpath:logback-spring.xmlat org.sprin…

NORA:一個用于具身任務的小型開源通才視覺-語言-動作模型

25年4月來自新加坡技術和設計大學的論文“NORA: a Small Open-Sourced Generalist Vision Language Action Model for Embodied Tasks”。 現有的視覺-語言-動作 (VLA) 模型在零樣本場景中展現出優異的性能,展現出令人印象深刻的任務執行和推理能力。然而&#xff…

在Ubuntu中使用Apache2部署項目

1. 安裝Apache2 sudo apt update sudo apt install apache2 -y安裝完成后,Apache會自動啟動,通過瀏覽器訪問 http://服務器IP 應看到默認的Apache歡迎頁。 2. 配置防火墻(UFW) sudo ufw allow Apache # 允許Apache通過防火墻 …

【QT系統相關】QT文件

目錄 1. Qt 文件概述 2. 輸入輸出設備類 3 文件讀寫類 讀取文件內容 寫文件 實現一個簡單的記事本 4. 文件和目錄信息類 QT專欄:QT_uyeonashi的博客-CSDN博客 1. Qt 文件概述 文件操作是應用程序必不可少的部分。Qt 作為一個通用開發庫,提供了跨…

愛普生RX8111CE實時時鐘模塊在汽車防盜系統中的應用

在汽車智能化與電子化的發展浪潮中,汽車防盜系統是現代汽車安全的重要組成部分,其核心功能是通過監測車輛狀態并及時發出警報來防止車輛被盜或被非法操作。愛普生RX8111CE實時時鐘模塊憑借其高精度、低功耗和豐富的功能,能夠為汽車防盜系統提…

SQL注入攻擊原理與防御全解析

目錄 一、引言 二、SQL 注入原理 2.1 SQL 注入的概念 2.2 SQL 注入產生的原因 2.3 SQL 注入的本質 2.4 SQL 注入的關鍵點 三、SQL 注入的實現方法 3.1 常見的 SQL 注入場景 3.2 不同類型的 SQL 注入方式 3.3 SQL 注入的一般流程 四、SQL 注入的危害 4.1 數據泄露 …

寫實交互數字人:賦能消防知識科普,點亮智能交互講解新未來

在數字化浪潮席卷全球的今日,科技創新以前所未有的速度重塑著我們的生活方式與產業格局。消防知識科普,作為守護生命財產安全的關鍵防線,也亟待借力新興技術實現變革與突破。深聲科技以其行業領先的 2D 寫實交互數字人技術,為消防…

用 HTML、CSS 和 JavaScript 實現五子棋人機對戰游戲

引言 在 Web 開發的世界里,通過 HTML、CSS 和 JavaScript 可以創造出各種各樣有趣的互動游戲。今天,我們將深入探討如何實現一個簡單而又富有挑戰性的五子棋人機對戰游戲。這個游戲不僅能讓你重溫經典的五子棋玩法,還能通過 AI 對戰功能給你…

【QT】自動更新庫QSimpleUpdater使用實例封裝

【QT】自動更新庫QSimpleUpdater使用實例封裝 QSimpleUpdater 庫信號介紹appcastDownloaded 信號downloadFinished信號概括 參數介紹 實例編寫 QSimpleUpdater 庫 QSimpleUpdater是一個用于QT的開源自動更新庫,它可以幫助開發者實現應用程序的版本檢查和自動更新功…

Nginx、CDN、 DNS的關系解析

文章目錄 Nginx 與 CDN 的關系1. 角色定位2. 協作方式3. 自建 CDN vs. 第三方 CDN Nginx 與 DNS 的關系1. 角色定位2. 協作方式3. 性能優化 CDN 與 DNS 的關系1. 角色定位2. 協作方式3. 高級 DNS 技術 三者結合的典型架構總結 Nginx、CDN 和 DNS 是現代網絡架構中的三個關鍵組件…

PH熱榜 | 2025-06-13

1. Flowstep 標語:借助人工智能,瞬間設計出美觀的用戶界面。 介紹:Flowstep 是您的 AI 設計助手,將簡單的文字提示轉化為用戶界面設計、線框圖和流程圖。它能加速您的工作流程,讓您輕松迭代,內置建議幫助…

Spectacular AI Gemini2 跑通實時建圖

參考鏈接:Spectacular AI 硬件設備 gemini2 測試了gemini335沒成功 修改record.cpp 倉庫鏈接:sdk 讀取Timu_cam ros2 run tf2_ros tf2_echo imu坐標系(加速度計和陀螺儀都可以,兩者變換為單位陣)camera_rgb_optic…

簡析MDM在餐飲設備中的部署與應用

引言:科技驅動餐飲運營升級 在競爭激烈的餐飲行業,科技已成為提升服務質量和運營效率的關鍵。從自助點餐機、數字菜單牌,到移動收銀系統,智能設備已經深入餐廳的日常運營。然而,隨著設備數量和種類的增加,…

RocketMQ總結

深入理解RocketMQ三高架構設計 高性能 順序寫磁盤 mmap 零拷貝異步刷盤 刷盤策略可配置輕量網絡協議 長連接復用 高可用 主從復制機制、controller、dledger集群NameServer 多副本無狀態客戶端自動切換 Broker消息刷盤機制保障可靠性 高可擴展性 Broker 水平擴展Consu…

vue3+tdesign實現明暗主題切換

很多項目中有些會涉及到明暗主題切換的功能,今天就來梳理一下有關這方面的具體實現步驟和使用到的方法,本篇文章使用到的組件是tdesign,利用部分案例,主要闡述明暗主題切換的技術原理和實現步驟,僅供參考。 目錄 一、…