[國產大模型簡單使用介紹] 開源與免費API

個人博客:Sekyoro的博客小屋
個人網站:Proanimer的個人網站
隨著大模型技術蓬勃發展和開源社區越來越活躍,國內的大模型也如雨后春筍一般.這時,一些就會問了,有了llama3,Mistral還有Gemma等等,國外大廠接連發力,一些開源社區也會有一些不錯的模型,國內怎么比?對一個人使用,ollama或者gpt4all直接本地使用,對于一個組,使用1panel+ollama+maxKBHome · 1Panel-dev/MaxKB Wiki (github.com)部署在內網 也成了最佳搭配. 國內大模型怎么比?

我想說的是,確實. 國內廠商也紛紛意識到了這些問題,這些大模型彷佛一夜之間成了garbage,因為一個人根本沒有必要同時使用多個功能類似的大模型,除非搞多Agent工作流,也就是給一個任務,任務分步驟的讓多個大模型解決,這些大模型之間還能互相協作. 當然,這方面還需要繼續發展.

但不可否認的是,國內大模型能力貌似并沒有超過國外大廠,此外審查力度不能說更寬松, 國內大模型根據一些報告已經達到了200多個,有高校研究所的,也就大廠的. 這些大模型比來比去, 現在看來已經意義不大的,對于它們來說,目前能否找到好的場景和建立良好的社區,才是能實現盈利的第一步,沒有大廠背書的模型,等著開源然后期待在社區中煥發第二春吧.

國內商用目前最出名效果也最好的應該是GLM4了,可惜不開源,我目前對于不開源的模型不太感興趣,一個是目前API價格還沒有完全打下來,沒有必要支付這些,如果真要付錢為啥不用GPT4呢? 說到付錢,可以考慮OpenRouter,Azure等平臺使用GPT4.

image-20240522120523939

所以對于國內大模型來說,我會首選開源,其次免費API的模型.

后者作為開發者來說非常方便,直接調用就是(但是可能限制比較大),不需要自己搞個VPS部署,即使硬件要求不高.

OpenSource

下面介紹幾個國內開源大模型,主要用途就是跟ollama搭配進行部署本地,不過我猜測這些模型應該進行過國內特色微調,所以不要過于期待比較diverse的結果.

通義千問

QwenLM/Qwen: The official repo of Qwen (通義千問) chat & pretrained large language model proposed by Alibaba Cloud. (github.com)

阿里旗下的,目前開源的最大110B,非常不錯.

ChatGLM3

清華的THUDM/ChatGLM3: ChatGLM3 series: Open Bilingual Chat LLMs | 開源雙語對話語言模型 (github.com),目前有商用的GLM4,但是ollama截止目前貌似沒有支持.

零一萬物

yi (ollama.com)

開源最大的34B,勉強能用.

DeepSeek-V2

DeepSeek | 深度求索

模型開源/閉源總分中文推理中文語言
gpt-4-1106-preview閉源8.017.738.29
DeepSeek-V2 Chat (RL)開源7.917.458.36
erniebot-4.0-202404 (文心一言)閉源7.897.618.17
DeepSeek-V2 Chat (SFT)開源7.747.308.17
gpt-4-0613閉源7.537.477.59
erniebot-4.0-202312 (文心一言)閉源7.366.847.88
moonshot-v1-32k-202404 (月之暗面)閉源7.226.428.02
Qwen1.5-72B-Chat (通義千問)開源7.196.457.93
DeepSeek-67B-Chat開源6.435.757.11
Yi-34B-Chat (零一萬物)開源6.124.867.38
gpt-3.5-turbo-0613閉源6.085.356.71
DeepSeek-V2-Lite 16B Chat開源6.014.717.32

這是一個強大的專家混合(MoE)語言模型,具有訓練經濟、推理高效的特點。它由 236B 個參數組成,其中 21B 個參數用于激活每個標記。與 DeepSeek 67B 相比,DeepSeek-V2 性能更強,同時節省了 42.5% 的訓練成本,減少了 93.3% 的 KV 緩存,最大生成吞吐量提高到 5.76 倍。

訊飛星火

訊飛星火開源-13B

在iFlytekSpark-13B中,使用Rotary Embedding作為位置編碼方法,GELU作為激活函數,其中layer_num為40,head_num為40,hidden_size為5120,ffn_hidden_size為28672

說真的,上面這些大模型吹來吹去,一般來說參數量一樣的情況下真的有差別嗎? 使用的時候不必太糾結.

免費API

主要得益于大模型如過街老鼠,哦不對,雨后春筍,實在太多,對于大廠來說又無法完全盈利. 一般主打AI大模型的公司可能并不會開源或者非常低的價格提供API服務,但是一些大廠可能就不一樣了.

百度有ERNIE和千帆兩款大模型,文心大模型ERNIEKit旗艦版 - ERNIE 3.0介紹 | 百度AI開放平臺 (baidu.com)

img

目前ERNIE可以免費了,而阿里的Qwen也降價至0.0005/1K tokens. 對于開發者還是很友好的. 比如你如果害怕瘋狂調用、IP頻繁改變被OpenAI ban掉,那也可以考慮使用國產的大模型API.

在線服務

如果自己部署缺硬件性能也嫌麻煩,除了Poe之外,國內的大模型很多也都支持在線問答了,比如Kimi,GLM等.

參考資料

  1. Chat with Open Large Language Models (lmsys.org)
  2. 大概是最全的開源大模型LLM盤點了吧! - 知乎 (zhihu.com)
  3. CLiB中文大模型能力評測榜單(持續更新) - 知乎 (zhihu.com)

如有疑問,歡迎各位交流!

服務器配置
寶塔:寶塔服務器面板,一鍵全能部署及管理
云服務器:阿里云服務器
Vultr服務器
GPU服務器:Vast.ai

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/web/15391.shtml
繁體地址,請注明出處:http://hk.pswp.cn/web/15391.shtml
英文地址,請注明出處:http://en.pswp.cn/web/15391.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

下雨!大水蟻引發的水文!看比賽咯,曼聯VS曼城——早讀(逆天打工人爬取熱門微信文章解讀)

嘮嘮嗑 水一水 引言Python 代碼結尾 引言 今天星期六 大小周 一個等了很久的雙休 昨天晚上真的是嚇到我了 漫天的小飛蟲 我一開始還以為是一兩只 沒想到那些小飛蟲 從陽臺不斷飛進來 在山卡拉下面租房子 也是太恐怖了 來個特寫 他們也就一個晚上的時間 成蟲 天氣合適 長翅…

大語言模型發展歷史

大語言模型的發展歷史可以追溯到自然語言處理(NLP)和機器學習早期的探索,但真正快速發展起來是在深度學習技術興起之后。以下是大語言模型發展的一個簡要歷史概述: 早期階段(20世紀50-90年代): …

網絡拓撲—DNS服務搭建

文章目錄 DNS服務搭建網絡拓撲配置網絡DNSPC 安裝DNS服務配置DNS服務創建正向查找區域創建反向查找區域創建子域名 PC機DNS域名解析 DNS服務搭建 網絡拓撲 為了節省我的U盤空間,沒有用路由器,所以搭建的環境只要在同網段即可。 //交換機不用考慮 DNS&a…

MiniCPM-Llama3-V-2_5-int4

MiniCPM-Llama3-V-2_5-int4大模型部署使用環境: python3.8cuda11.8其它要求,按照安裝文檔要求下載即可 我是在算力平臺用4090跑的, GPU 顯存(8GB)可以部署推理 int4 量化版本,如果推理非量化版本需要更高顯…

云部署最簡單python web

最近在玩云主機,考慮將簡單的web應用裝上去,通過廣域網訪問一下,代碼很簡單,所以新手幾乎不會碰到什么問題。 from flask import Flaskapp Flask(__name__)app.route(/) def hello_world():return Hello, World!app.route(/gree…

2024洗地機哪個牌子好?洗地機十大品牌

洗地機在不同家庭環境中都能發揮其獨特的優勢,無論是大面積的地板還是狹小的角落,都能輕松應對。 對于有孩子或寵物的家庭,地面上經常會有各種雜物和污漬,洗地機強大的吸力和深度清潔功能,可以迅速清理掉這些臟東西&a…

數理邏輯:1、預備知識

17.1 命題和聯結詞 ? 命題:可以判定真假的陳述句。(則悖論,祈使句,疑問句都不是命題) ? 原子命題:不能被分割為更小的命題的命題 例如: 2既是素數又是偶數 可以由$p: 2 是素數,…

DNS的服務與部署(2)

1、dns的安裝及開啟 dnf install bind.x86_64 -y #安裝 #Berkeley Internet Name Domain (BIND) systemctl enable --now named #啟用dns服務,服務名稱叫named firewall-cmd --permanent --add-servicedns #火墻設置 firewall-cmd --reload …

基于SSH的母嬰用品銷售管理系統帶萬字文檔

文章目錄 母嬰商城系統一、項目演示二、項目介紹三、系統部分功能截圖四、萬字論文參考五、部分代碼展示六、底部獲取項目源碼和萬字論文參考(9.9¥帶走) 母嬰商城系統 一、項目演示 母嬰商城系統 二、項目介紹 基于SSH的母嬰商城系統 系統…

Tina-Linux -- 3. LVGL測試

參考韋東山 – Tina_Linux_圖形系統_開發指南 Tina-linux lvgl 配置 環境配置 進入Tina-SDK根目錄 source build/envsetup.sh lunch XXX平臺名稱 make menuconfigLVGL Gui --->Littlevgl --->< > lv_demo<*> lv_examples &#xff08;lvgl官方demo&#…

【區塊鏈】fisco節點運維 更新ing

基于已完成的區塊鏈系統與管理平臺搭建工作&#xff0c;開展區塊鏈節點的加入與退出運維工作&#xff0c;具體內容如下 以下只是舉例子講 如果有其他修改沒舉例出來可以留言 私信 主要以比賽出題的形式講 區塊鏈節點輸出等級為警告級&#xff0c;并設置日志存儲閾值為100MB并…

主機與VMware虛擬機共享文件夾

虛擬機M --> 設置 --> 選項 --> 共享文件夾 虛擬機里的共享文件夾需要掛載 sudo mount -t fuse.vmhgfs-fuse .host:/ /mnt/hgfs -o allow_other from 主機與VMware虛擬機共享文件夾&#xff1a;解決虛擬機找不到共享文件夾問題 - 知乎

C++實現的代碼行數統計器

代碼在GitHubMaolinYe/CodeCounter: C20實現的代碼統計器&#xff0c;代碼量小于100行&#xff0c;可以統計目錄下所有代碼文件的行數 (github.com) 前段時間到處面試找實習&#xff0c;有技術負責人的負責人問我C寫過多少行&#xff0c;5萬還是10萬&#xff0c;用來評估熟練度…

Capture One Studio for Mac:打造完美影像的利器

對于攝影師而言&#xff0c;每一次按下快門都是一次對完美影像的追求。而Capture One Studio for Mac正是這樣一款能夠幫助你實現這一追求的利器。 Capture One Studio for Mac v16.4.2.1中文直裝版下載 首先&#xff0c;Capture One Studio for Mac擁有出色的圖像處理能力。它…

從零起航,Python編程全攻略

新書上架~&#x1f447;全國包郵奧~ python實用小工具開發教程http://pythontoolsteach.com/3 歡迎關注我&#x1f446;&#xff0c;收藏下次不迷路┗|&#xff40;O′|┛ 嗷~~ 目錄 一、Python入門之旅 二、Python進階之道 三、Python爬蟲實戰 四、Python數據分析利器 五…

kind: Telemetry

訪問日志 訪問日志提供了一種從單個工作負載實例的角度監控和理解行為的方法。 Istio 能夠以一組可配置的格式為服務流量生成訪問日志&#xff0c; 使操作員可以完全控制日志記錄的方式、內容、時間和地點。 有關更多信息&#xff0c;請參閱獲取 Envoy 的訪問日志。 https:/…

TS+elementUI的表格做form校驗寫法(手機/郵箱號驗證)

1.form表單寫法 <template><div style"height:100%;width:100%;position:relative"><el-dialog title"編輯" :visible.sync"dialogVisible" width15% :close-on-click-modalfalse><el-form :model"form" :rule…

模塊化程序設計(函數的定義、調用、參數傳遞、局部變量、全局變量)

函數的引入&#xff1a; 我們曾經學習了程序設計中的三種基本控制結構&#xff08;順序、分支、循環&#xff09;。用它們可以組成任何程序。但在應用中&#xff0c;還經常用到子程序結構。 通常&#xff0c;在程序設計中&#xff0c;我們會發現一些程序段在程序的不同地方反復…

[python]當你認為python字符串的strip()或replace()不能刪除空格或者換行符的時候,看這里

str "123 abc\r\n" 當你調用 str.strip() 或 str.replace("\n","")之后&#xff0c;發現空格或換行符還存在&#xff0c; 是因為strip()和replace()沒有改變str本身的值&#xff0c;需要這樣重新賦值&#xff1a; str str.strip() ...

RabbitMQ 發布訂閱

RabbitMQ 發布訂閱視頻學習地址&#xff1a; 簡單模式下RabbitMQ 發布者發布消息 消費者消費消息 Publist/Subscribe 發布訂閱 在 RabbitMQ 中&#xff0c;發布訂閱模式是一種消息傳遞方式&#xff0c;其中發送者&#xff08;發布者&#xff09;不會將消息直接發送到特 定的…