1.前言
Mamba是近年來在深度學習領域出現的一種新型結構,特別是在處理長序列數據方面表現優異。在本文中,我將介紹如何在 Linux 系統上安裝并配置 mamba_ssm 虛擬環境。由于官方指定mamba_ssm適用于 PyTorch 版本高于 1.12 且 CUDA 版本大于 11.6 的環境。本示例中,我們使用的是 Python 3.8、PyTorch 2.2.2 和 CUDA 11.8,此外,我們還將安裝 mamba_ssm 1.1.3 和 causal-conv 1.1.3。
由于官方給出的whl文件僅支持Linux系統,因此本文也是基于LInux系統的操作!!!
2.準備工作
-
操作系統:Linux 系統(以Ubuntu為例)
-
PyTorch 版本:2.2.2
-
CUDA 版本:11.8
-
Python 版本:3.8
-
mamba_ssm:1.1.3
-
causal-conv:1.1.3
3.安裝流程
3.1. 創建虛擬環境
首先,我們需要創建一個虛擬環境來安裝依賴包。我們將使用 Python 3.8 創建環境,并命名為 Mamba_py38。
conda create -n Mamba_py38 python=3.8
激活新創建的虛擬環境:
conda activate Mamba_py38
3.2. 安裝 GPU 版本的 PyTorch
接下來,我們將安裝適用于 CUDA 11.8 的 PyTorch 2.2.2 版本。可以去Pytorch官方網站中復制安裝指令。(過程可能有點慢,安裝不成功可以多嘗試幾次)
conda install pytorch==2.2.2 torchvision==0.17.2 torchaudio==2.2.2 pytorch-cuda=11.8 -c pytorch -c nvidia
3.3. 安裝 mamba_ssm 和 causal-conv
由于這兩個包直接pip install安裝不能實現,我們將下載它們的 .whl 文件,并使用 pip 離線安裝。
步驟:
3.3.1.下載 mamba_ssm 和 causal-conv 的 .whl 文件(不想下載的也可以私信我,直接發你whl文件)。
-
訪問 mamba_ssm release page 和 causal-conv release page,這里我選擇的都是1.1.3的版本,注意一定要保證這兩個包的版本一致!!!

-
選擇與你的環境兼容的 .whl 文件,這里我的環境中裝的是Python 3.8、PyTorch 2.2.2 和 CUDA 11.8。


3.3.2.使用 pip 離線安裝這兩個包:
首先要在終端進入到兩個whl文件所在的路徑,比如現在兩文件的目錄是:/home/zp/mfb/app_app/。
我需要在終端輸入:cd mfb/app_app/

接著就分別安裝:pip install +文件名
pip install causal_conv1d-1.1.3+cu118torch2.2cxx11abiFALSE-cp38-cp38-linux_x86_64.whl
和
pip install mamba_ssm-1.1.3+cu118torch2.2cxx11abiFALSE-cp38-cp38-linux_x86_64.whl
4. 安裝必要的包
我們還需要安裝一些常用的 Python 庫,確保我們的開發環境中具備繪圖、數據處理等功能。以下是所需包及其版本(都已經驗證過與環境適配):
pip install matplotlib==3.7.0
pip install numpy==1.24.3
pip install pandas==1.2.0
pip install tensorboard==2.14.0
pip install einops==0.8.1
5.總結
通過上述步驟,已經成功創建了一個可以使用Mamba的虛擬環境。
# 測試
from causal_conv1d import causal_conv1d_fn, causal_conv1d_updatefrom mamba_ssm.ops.triton.selective_state_update import selective_state_update
有時間會更新安裝視頻,敬請期待!
撰寫不易,喜歡的話,贊同收藏點贊支持下吧!
有問題私信或評論,看到會第一時間回復!
關注我,持續更新科研學習過程中遇到的問題!