千呼萬喚始出來!在?DeepSeek 開源周?的第五天,今日正式收官!在大模型訓練中,每個epoch都在與存儲系統進行光速競賽——數據加載延遲會扭曲計算時空,KVCache訪問瓶頸將引發推理坍縮。DeepSeek開源的?3FS文件系統(Fire-Flyer文件系統第三個F代表File),一種利用現代SSD和RDMA網絡的全部帶寬的并行文件系統;正用「存儲相對論」重構AI基礎設施的時空連續性。Smallpond,基于3FS和DuckDB構建的輕量級數據處理框架。
3FS并行文件系統
技術革命:3FS的四大維度突破
1. 存算分離架構的終極形態
-
光子引擎:基于RDMA網絡實現零拷貝數據直通,單邊操作占比超92%
-
時空折疊:三維數據分層(熱/溫/冷數據)動態調度,NVMe SSD吞吐利用率達98%
-
強一致性保障:CRAQ協議實現微秒級跨節點一致性,比傳統Raft快15倍
2. 性能暴力美學
-
180節點集群:6.6 TiB/s聚合讀取帶寬,相當于每秒傳輸3部4K《阿凡達》
-
推理加速:單節點KVCache峰值40 GiB/s,可支撐百萬QPS的向量檢索
-
GraySort基準:25節點3.66 TiB/min排序吞吐,比Hadoop快17倍
全場景性能實測
1. 峰值吞吐量
180節點集群壓測?實現?6.6 TiB/s聚合讀取吞吐:
-
存儲節點:180個,每節點配備2×200Gbps InfiniBand網卡及16塊14TiB NVMe SSD。
-
客戶端節點:500+個,每節點配置1×200Gbps InfiniBand網卡。
-
場景:大塊數據讀取測試,伴隨訓練任務產生的背景流量。
2. GraySort基準
-
集群配置:
-
25個存儲節點(每節點2個NUMA域,2×400Gbps網卡)。
-
50個計算節點(192物理核心,2.2 TiB內存,1×200Gbps網卡)。
-
-
結果:在?30分14秒?內完成?110.5 TiB數據排序(8192個分區),平均吞吐達?3.66 TiB/分鐘。
3. KVCache性能
-
讀取吞吐:單客戶端峰值達?40 GiB/s。
-
垃圾回收(GC)效率:在推理過程中展示高IOPS的GC操作性能。
快速開始
從 GitHub 克隆 3FS 倉庫:
git?clone?https://github.com/deepseek-ai/3fs
當?deepseek-ai/3fs?克隆到本地文件系統后,運行以下命令來檢出子模塊:
cd 3fs
git submodule update --init --recursive
./patches/apply.sh
根據Ubuntu版本安裝所需的依賴項:
# for Ubuntu 20.04.
apt install cmake libuv1-dev liblz4-dev liblzma-dev libdouble-conversion-dev libprocps-dev libdwarf-dev libunwind-dev \ libaio-dev libgflags-dev libgoogle-glog-dev libgtest-dev libgmock-dev clang-format-14 clang-14 clang-tidy-14 lld-14 \ libgoogle-perftools-dev google-perftools libssl-dev ccache libclang-rt-14-dev gcc-10 g++-10 libboost1.71-all-dev
# for Ubuntu 22.04.
apt install cmake libuv1-dev liblz4-dev liblzma-dev libdouble-conversion-dev libprocps-dev libdwarf-dev libunwind-dev \libaio-dev libgflags-dev libgoogle-glog-dev libgtest-dev libgmock-dev clang-format-14 clang-14 clang-tidy-14 lld-14 \ libgoogle-perftools-dev google-perftools libssl-dev ccache gcc-12 g++-12 libboost-all-dev
確保安裝了libfuse 3.16.1或更新版本,FoundationDB 7.1或更新版本,以及Rust工具鏈。
在構建目錄中構建3FS:
cmake -S . -B build -DCMAKE_CXX_COMPILER=clang++-14 -DCMAKE_C_COMPILER=clang-14 -DCMAKE_BUILD_TYPE=RelWithDebInfo -DCMAKE_EXPORT_COMPILE_COMMANDS=ON
cmake --build build -j 32
Smallpond輕量級數據處理框架
Smallpond?是基于?3FS 并行文件系統?和?DuckDB?構建的輕量級數據處理框架,專為 AI 數據流水線設計,致力于簡化海量數據的處理與分析流程。其核心目標是提供?聲明式編程接口?和?極致性能優化,覆蓋從數據預處理到模型推理的全場景需求。
性能亮點
-
1TB 數據排序:37 秒完成(比 Apache Spark 快?83 倍)
-
ANN 向量檢索:單節點 9.8 億向量/秒
-
流水線延遲:亞毫秒級動態反向壓力控制
應用場景
-
訓練數據預處理:TB 級數據清洗/特征工程加速
-
推理結果后處理:實時向量檢索與聚合分析
-
模型監控:流式日志分析與異常檢測
快速開始???????
# Download example data
wget https://duckdb.org/data/prices.parquetimport smallpond
# Initialize session
sp = smallpond.init()
# Load data
df = sp.read_parquet("prices.parquet")
# Process data
df = df.repartition(3, hash_by="ticker")
df = sp.partial_sql("SELECT ticker, min(price), max(price) FROM {0} GROUP BY ticker", df)
# Save results
df.write_parquet("output/")
# Show results
print(df.to_pandas())
OpenCSG 社區開源加速計劃
作為OpenCSG社區的一部分,我們一直致力于為開發者提供優質的開源資源。此次DeepSeek的3FS和Smallpond項目已同步到OpenCSG社區,歡迎大家訪問并使用該項目。
3FS項目原始GitHub地址:
https://github.com/deepseek-ai/3FS
Smallpond項目原始GitHub地址:
https://github.com/deepseek-ai/smallpond
OpenCSG社區同步的3FS項目地址:
https://opencsg.com/codes/deepseek-ai/deepseek-3FS
OpenCSG社區同步的 Smallpond項目地址:
https://opencsg.com/codes/deepseek-ai/smallpond
如果您遇到網絡問題無法快速訪問GitHub,可以通過我們的服務輕松同步該項目,確保不受網絡限制影響。
OpenCSG為您提供了DeepSeek R1和V3系列模型的萬兆網絡高速下載服務,幫助您快速獲取所需模型,避免因文件過大造成下載困難。
DeepSeek R1下載:
https://opencsg.com/models/DeepseekAI/DeepSeek-R1?
DeepSeek V3下載:
https://opencsg.com/models/deepseek-ai/DeepSeek-V3
同時,我們還提供了各種蒸餾版、量化版,您可以訪問我們的awesome DeepSeek合集來找到最適合的模型版本。
awesome-deepseek-r1-collection:
https://opencsg.com/collections/85/?
awesome-deepseek-v3-collection:
https://opencsg.com/collections/86/?
awesome-deepseek-Janus-collection:
https://opencsg.com/collections/87/
開源狂歡 繼續期待
OpenAI 社區與您同行?🤝
OpenAI 社區?將繼續關注并為您帶來 DeepSeek 的最新開源成果,讓我們共同期待更多激動人心的技術創新!
DeepSeek開源周匯總???????
DeepSeek開源周,連更5天,終于收官。
-
Day 1: FlashMLA?🔥 自研 MLA 架構,H800 算力榨干!
-
Day 2: DeepEP?🚀 首個 MoE 訓練/推理 EP 通信庫,All-to-All 加速!
-
Day 3: DeepGEMM?💡 通用矩陣乘法庫,300 行代碼解鎖 V3/R1 性能秘籍!
-
Day 4: 連開三源!?🌊 雙向流水線并行 DualPipe、MoE 負載均衡 EPLB,性能分析數據一網打盡!
-
Day 5: 3FS & Smallpond?🏞? 高效分布式文件系統 + 數據處理框架,數據處理更輕松!
DeepSeek 這波操作,夠 Open!