可商用,可離線運行,可API接口調用的開源AI數字人項目Heygem,喂飯級安裝教程

前言

Hygem 效果圖

image-20250430132003307

Heygem 是一款開源項目,致力于發揮你電腦硬件的全部潛力,讓你無需依賴云端,也能在本地高效運行各類開源AI數字人模型。無論是 AI 語音對話、虛擬主播,還是數字人驅動引擎,Heygem 通過底層性能調度與資源管理優化,帶來輕量、易用、強大的本地 AI 體驗。

特點:

  • 可商用:但用戶量超過10萬或年營收達1000萬美元以上的企業需簽署商業許可協議。
  • 可以斷網使用:程中要下載Docker服務和客戶端,需要聯網,安裝后可斷網使用。
  • 支持Windows和Linux桌面系統,不支持Mac系統。
  • 支持本地Api接口調用,可見文末補充模塊。

Hygem 部署教程

一、準備工作:檢查自己的電腦配置

? 硬盤空間要求

  • 【必須】C盤:用于存儲服務鏡像文件,建議至少預留 100GB 空間。如果空間不足,可以在安裝 Docker 后指定其他盤符,但部分情況可能強制使用 C 盤。
  • 【必須】D盤:必須存在!用于存儲數字人素材和作品數據,建議預留 30GB 以上空間。

? 系統要求

  • 操作系統需為 Windows 10(版本號 19042.1526) 或更高。

? 推薦配置(建議越高越好)

硬件推薦配置
CPUIntel i5-13400F(或同等性能)
內存至少 32GB(低于32G容易報錯)
顯卡NVIDIA RTX 4070(RTX 30/40 系列優先)

💡 小編實測配置:12700 + RTX 3070,運行效果良好!

? 顯卡驅動要求

  • 必須使用 NVIDIA 獨立顯卡,并確保驅動為最新版。
  • NVIDIA的50系顯卡正在適配中。
  • 暫不支持 AMD 顯卡。

二、開始安裝,跟著我的步驟一步一步來

這里面的步驟

第一步:安裝Node.js(數字人軟件界面基礎)
1、前往官網下載安裝最新版 Node.js:

🔗 Node.js 官網

https://nodejs.org/zh-cn

image-20250429160626795

2、下載并安裝

下載完成之后,雙擊安裝

image-20250429160742790

tips:過程全程點擊“Next”即可。

3、驗證安裝是否成功

使用CMD打開命令提示符,輸入以下命令查詢

node -v

安裝成功截圖:

image-20250429203951167


第二步:安裝 WSL 環境(Docker運行的基礎)

wsl的意思是Windows 子系統 Linux,在windows上運行linux虛擬機;

1. 檢查并安裝 WSL

檢查是否安裝打開命令行,輸入:

wsl --list --verbose
若已安裝

image-20250429204751380

可跳過至“第三步:安裝 Docker Desktop”

若未安裝

會提示:“適用于 Linux 的 Windows 子系統沒有已安裝的分發”輸入以下命令開始安裝:

更新wsl環境,可能會遇到網絡問題,看下面

wsl --update

安裝wsl,默認會自動選擇ubuntu系統

wsl --install
2. WSL 安裝失敗解決方案(網絡問題)

如遇到報錯,可嘗試修改 hosts 文件:

路徑:C:\Windows\System32\drivers\etc\hosts

添加以下內容至末尾并保存:

185.199.108.133 raw.githubusercontent.com

image-20250429204448023

然后重新運行相關命令。


第三步:安裝 Docker Desktop(Heygem運行基礎)
  • 前往官網下載安裝包: 🔗 Docker 官網

🔍 **提示:**若無法訪問 Docker 官網,可從文末資料包下載。

image-20250429210000802

image-20250429210022251

image-20250429210057248

安裝成功界面:

image-20250429210121115


第四步:安裝Heygem需要的dokcer鏡像, AI 數字人服務端
1. 下載源碼

GitHub 地址:
🔗 https://github.com/GuijiAI/HeyGem.ai

🔍 **提示:**若無法訪問 GitHub 官網,可從文末資料包下載源碼。

2.配置Docker 加速鏡像(提高下載速度)

點擊 Docker 設置 → Docker Engine,替換為以下內容:

image-20250422145633294

{"builder": {"gc": {"defaultKeepStorage": "20GB","enabled": true}},"experimental": false,"registry-mirrors": ["https://docker-0.unsee.tech","https://docker-cf.registry.cyou","https://docker.1panel.live"]
}

修改后點擊 Apply & Restart,等待鏡像拉取完成。

3. 拉取heygem鏡像
  1. 進入項目 /deploy 目錄,找到 docker-compose.yml 文件;

    image-20250429231242811

  2. 地址欄輸入 cmd 打開命令行,執行以下命令:

image-20250429231101210

docker-compose up -d

image-20250429231202952

?? 說明:

  • 此操作約需 70GB 流量,建議連接穩定 WiFi和有線網絡;
  • 安裝時間可能在半小時以上,視網速而定。(小編安裝了2小時)
  • 為了方便大家下載文末資料包中小編已經提取了所有的docker

成功截圖:

image-20250421201936617


image-20250429235102687

🔍 **提示:**這3個Docker鏡像,可從文末資料包下載。

第五步:安裝Heygem, AI 數字人客戶端

服務端成功運行后,接下來安裝客戶端與 AI 數字人“面對面”交流。

1. 下載客戶端

🔗 HeyGem 官方 Releases 下載頁

選擇最新版本的 HeyGem-x.x.x-setup.exe

image-20250429233015612

image-20250429233029939

2. 安裝并運行

雙擊安裝包完成安裝,桌面會生成快捷方式:

客戶端圖標


三、使用

使用前需要打開docker(雙擊打開就行,無需其他操作),然后再啟動HeyGem,就能愉快的使用了

image-20250429233145596

四、補充:

本地Api調用

Docker 啟動后會在本地暴露幾個端口,通過http://127.0.0.1可以調用。

具體代碼可以參考

  • src/main/service/model.js
  • src/main/service/video.js
  • src/main/service/voice.js
模特訓練
  1. 將視頻分離為靜音視頻 + 音頻

  2. 音頻放到

    D:\heygem_data\voice\data
    

    D:\heygem_data\voice\data是與guiji2025/fish-speech-ziming服務約定的,可以在docker-compose中修改

  3. 調用

    http://127.0.0.1:18180/v1/preprocess_and_tran
    

    接口

    參數示例:

    {
    "format": ".wav",
    "reference_audio": "xxxxxx/xxxxx.wav",
    "lang": "zh"
    }
    

    返回示例:

    {
    "asr_format_audio_url": "xxxx/x/xxx/xxx.wav",
    "reference_audio_text": "xxxxxxxxxxxx"
    }
    

    記錄下返回結果后續音頻合成需要用到

音頻合成

接口:http://127.0.0.1:18180/v1/invoke

// 請求參數
{"speaker": "{uuid}", // 一個UUID保持唯一即可"text": "xxxxxxxxxx", // 需要合成的文本內容"format": "wav", // 固定傳參"topP": 0.7, // 固定傳參"max_new_tokens": 1024, // 固定傳參"chunk_length": 100, // 固定傳參"repetition_penalty": 1.2, // 固定傳"temperature": 0.7, // 固定傳參"need_asr": false, // 固定傳參"streaming": false, // 固定傳參"is_fixed_seed": 0, // 固定傳參"is_norm": 0, // 固定傳參"reference_audio": "{voice.asr_format_audio_url}", // 上一步“模特訓練”的返回值"reference_text": "{voice.reference_audio_text}" // 上一步“模特訓練”的返回值
}
視頻合成
  • 合成接口:http://127.0.0.1:8383/easy/submit

    // 請求參數
    {"audio_url": "{audioPath}", // 音頻路徑"video_url": "{videoPath}", // 視頻路徑"code": "{uuid}", // 唯一key"chaofen": 0, // 固定值"watermark_switch": 0, // 固定值"pn": 1 // 固定值
    }
    
  • 進度查詢:http://127.0.0.1:8383/easy/query?code=${taskCode}

    get 請求,參數taskCode是上面合成接口入參中的code

更詳細的說明請參見: https://github.com/GuijiAI/HeyGem.ai/blob/main/README_zh.md#%E5%BC%80%E6%94%BE-api

🔖 資料包獲取

為方便大家部署體驗,這里提供一份完整的資料包。

防止鏈接被和諧,建議先保存后使用

下載鏈接

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/pingmian/78864.shtml
繁體地址,請注明出處:http://hk.pswp.cn/pingmian/78864.shtml
英文地址,請注明出處:http://en.pswp.cn/pingmian/78864.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

三個概念:DataBinding,Dependency Property 與DataTemplate

WPF 核心概念詳解:DataBinding、Dependency Property 和 DataTemplate 1. DataBinding (數據綁定) 基本概念 DataBinding 是 WPF 的核心機制,用于在 UI 元素和數據源之間建立自動同步關系。 關鍵特性 雙向綁定:數據變化自動反映到 UI&…

C語言教程(二十六):C 語言內存管理詳解

一、C 語言內存區域劃分 在 C 語言程序運行時,內存主要分為以下幾個區域: 1.1 棧區(Stack) 特點:由編譯器自動分配和釋放,主要存儲函數的局部變量、函數參數、返回地址等。棧區的內存分配和釋放是按照后進先出(LIFO)的原則進行的,速度快。示例: #include <stdio.…

騰訊云服務器性能提升全棧指南(2025版)

騰訊云服務器性能提升全棧指南&#xff08;2025版&#xff09; 一、硬件選型與資源優化 1. 實例規格精準匹配 騰訊云服務器提供計算型CVM、內存型MEM、大數據型Hadoop等12種實例類型。根據業務特性選擇&#xff1a; ? 高并發Web應用&#xff1a;推薦SA3實例&#xff0…

決策樹在電信客戶流失分析中的實戰應用

在當今數據驅動的時代&#xff0c;數據分析和機器學習技術在各行業的應用愈發廣泛。電信行業面臨著激烈的競爭&#xff0c;客戶流失問題成為影響企業發展的關鍵因素之一。如何準確預測客戶是否會流失&#xff0c;并采取相應措施挽留客戶&#xff0c;是電信企業關注的重點。決策…

【HCIA】VRRP

前言 二層交換機為了破環發明了堆疊&#xff0c;把幾臺實際的交換機視作一個虛擬的交換機&#xff0c;實現了鏈路的復用和環路的破壞。那么對應到三層的路由器&#xff0c;我們有 VRRP&#xff08;Virtual Router Redundancy Protocol&#xff09;&#xff0c;它可以讓路由器分…

第15講:基礎柱狀圖與分組柱狀圖美化指南

目錄 ?? 一、為什么要關注柱狀圖的“美化”? ?? 二、基礎柱狀圖的構建邏輯(以 ggplot2 為例) ?? 三、美化細節全面升級 ? 1. 自定義配色與透明度 ? 2. 添加數值標簽 ? 3. 設置 y 軸刻度與坐標軸美學 ????? 四、分組柱狀圖(Grouped Bar Plot) ?? 五…

SV 仿真的常識

文章目錄 SV對verilog的擴展&#x1f4d8; 標準文檔名稱&#xff1a; 從SV到仿真通用過程解讀實例解讀 SV的仿真過程并行仿真顆粒度SV仿真調度調度區域 SV對verilog的擴展 SystemVerilog 和 Verilog 的語法標準由 **IEEE&#xff08;美國電氣和電子工程師協會&#xff09;**制…

蘇德戰爭前期蘇聯損失慘重(馬井堂)

蘇德戰爭前期&#xff08;1941年6月22日德國發動“巴巴羅薩行動”至1941年底至1942年初&#xff09;是蘇聯在二戰中損失最慘重的階段之一。以下是主要方面的損失概述&#xff1a; ?一、軍事損失? ?人員傷亡與俘虜? 至1941年底&#xff0c;蘇軍傷亡約?300萬人?&#xff…

聯邦學習的收斂性分析(全設備參與,不同本地訓練輪次)

聯邦學習的收斂性分析 在聯邦學習中,我們的目標是分析全局模型的收斂性,考慮設備異構性(不同用戶的本地訓練輪次不同)和數據異質性(用戶數據分布不均勻)。以下推導從全局模型更新開始,逐步引入假設并推導期望損失的遞減關系,最終給出收斂性結論。 1. 全局模型更新與泰…

多線程爬蟲中實現線程安全的MySQL連接池

多線程爬蟲中實現線程安全的MySQL連接池 在日常開發中&#xff0c;數據庫操作頻繁建立/關閉連接會帶來性能損耗&#xff0c;尤其在多線程場景中更容易出現連接復用、阻塞等問題。因此&#xff0c;本文介紹如何使用 Python 封裝一個 線程安全的 MySQL 連接池&#xff0c;并通過…

HTML:常用標簽(元素)匯總

文章目錄 一、標簽分類1、塊標簽與行標簽 二、排版標簽三、文本標簽1、常用2、不常用 四、圖片標簽五、超鏈接1、跳轉頁面2、跳轉文件或下載文件3、跳轉到錨點4、喚起本地應用 六、列表七、表格八、表單九、框架十、HTML實體十一、全局屬性十二、meta元信息 一、標簽分類 1、塊…

20250430在ubuntu14.04.6系統上完成編譯NanoPi NEO開發板的FriendlyCore系統【嚴重不推薦,屬于沒苦硬吃】

【開始編譯SDK之前需要更新源】 rootrootubuntu:~/friendlywrt-h3$ sudo apt update 【這兩個目錄你在ubuntu14.04.6系統上貌似git clone異常了】 Y:\friendlywrt-h3\out\wireguard Y:\friendlywrt-h3\kernel\exfat-nofuse 【需要單線程編譯文件系統&#xff0c;原因不明】 Y:…

【AI論文】CipherBank:通過密碼學挑戰探索LLM推理能力的邊界

摘要&#xff1a;大型語言模型&#xff08;LLMs&#xff09;已經展現出非凡的能力&#xff0c;尤其是最近在推理方面的進步&#xff0c;如o1和o3&#xff0c;推動了人工智能的發展。盡管在數學和編碼方面取得了令人印象深刻的成就&#xff0c;但在需要密碼學專業知識的領域&…

藝術與科技的雙向奔赴——高一鑫榮獲加州聯合表彰

2025年4月20日,在由M.A.D公司協辦的“智藝相融,共赴價值巔峰”(Academic and Artistic Fusion Tribute to the Summit of Value)主題發布會上,音樂教育與科技融合領域的代表人物高一鑫,因其在數字音樂教育與中美文化交流方面的杰出貢獻,榮獲了圣蓋博市議員Jorge Herrera和爾灣市…

【深度學習的靈魂】圖片布局生成模型LayoutPrompt(1)

&#x1f308; 個人主頁&#xff1a;十二月的貓-CSDN博客 &#x1f525; 系列專欄&#xff1a; &#x1f3c0;《深度學習理論直覺三十講》_十二月的貓的博客-CSDN博客 &#x1f4aa;&#x1f3fb; 十二月的寒冬阻擋不了春天的腳步&#xff0c;十二點的黑夜遮蔽不住黎明的曙光 目…

Compose筆記(二十)--TextField

這一節主要了解一下Compose的TextField,TextField 是一個用于接收用戶文本輸入的 UI 組件,允許用戶通過鍵盤輸入、編輯或刪除文本。簡單用法總結如下: API value&#xff1a;當前輸入的文本內容。 onValueChange 含義&#xff1a;當用戶輸入文本時觸發的回調函數&#xff0c;參…

在Linux虛擬機下使用vscode,#include無法跳轉問題

總結&#xff1a;需要通過Linux指令來添加編譯器和壓縮文件&#xff0c;解壓&#xff0c;這樣獲得的編譯器會具有可執行權限類似于 -rwxr-xr-x 1 user user 12345 Apr 26 14:22 myscript.sh 如果你直接從window中拖入文件到Linux文件下&#xff0c;你需要自己來再度開啟可編譯…

ArcGIS+GPT:多領域地理分析與決策新方案

技術點目錄 AI大模型應用ArcGIS工作流程及功能prompt的使用技巧AI助力工作流程AI助力數據讀取AI助力數據編輯與處理AI助力空間分析AI助力遙感分析AI助力二次開發AI助力科研繪圖ArcGISAI綜合應用了解更多 ——————————————————————————————————…

基礎術語說明

車間&#xff1a;工廠內集中進行加工或裝配的獨立空間&#xff0c;配備設備、工具及人員&#xff0c;是生產活動的核心載體。 比如裝配車間、總裝車間、油漆車間等 生產線&#xff1a;以流水作業形式將原材料轉化為成品的設備與人員的組合系統&#xff0c;強調連續性和效率。…

Splunk 使用Role 實現數據隔離

很多人知道 Splunk 有很多自帶的Role, 今天我就要說說定制化的Role: 1: 在創建新role 的界面: 2: 在如下的界面,可以定制allow index name: 3: 創建好新Role 后,在SAML 添加新的group 的時候,就可以看到Role 給某個group: 4: 這樣一個特定組的人來申請Splunk 權限,就可…