提示:文章寫完后,目錄可以自動生成,如何生成可參考右邊的幫助文檔
文章目錄
- 前言
- 一、配置
- 二、報錯
- 總結
前言
大型語言模型(LLM)面臨的挑戰:高能耗、高內存需求、部署門檻高。
微軟提出 BitNet 架構,旨在實現低功耗、低延遲、高效率的推理。( https://pypi.org/project/bitnet/ )BitNet架構
BitNet b1.58 2B4T:首個開源、原生訓練的 1-bit LLM,參數量達 20 億[1]。
【1】 Ma, S., Wang, H., Dong, L., Huang, S., Wang, H., et.al., 2023. “BitNet b1.58 2B4T Technical Report.” arXiv preprint,
arXiv:2504.12285. 2025
BitLinear 層:替代傳統的 nn.Linear 層,支持三值權重(-1, 0, +1),實現 1.58-bit 精度。( 支持原生1.58bit訓練,而不是量化后1.58bit)
激活量化:采用 8-bit 整數量化,形成 W1.58A8 配置。
Transformer 架構優化:引入平方 ReLU 激活函數、旋轉位置嵌入(RoPE)和 subln 歸一化,確保低位訓練穩定性。
提示:以下是本篇文章正文內容,下面案例可供參考
一、配置
不加源(極慢)
pip install bitnet
使用阿里源(快)
pip install -i https://mirrors.aliyun.com/pypi/simple bitnet
使用清華源(慢)
pip install -i https://pypi.tuna.tsinghua.edu.cn/simple bitnet
二、報錯
OSError: [WinError 5] 拒絕訪問。: 'd:\\anaconda\\envs\\myenv-cvrp\\scripts\\tqdm.exe'
錯誤是因為在卸載或安裝 tqdm 包時,Python 沒有足夠的權限來操作相關的文件。
使用 --user 參數安裝 如果你希望只對當前用戶安裝,可以嘗試使用 --user 選項,這將安裝包到用戶目錄中,避免涉及到系統級別的權限問題:
pip install --user -i https://mirrors.aliyun.com/pypi/simple bitnet