DeepSeek 在開源周第五天發布了 3FS(Fire-Flyer File System),這是一個專為充分利用現代 SSD 和 RDMA網絡帶寬而設計的并行文件系統,具備驚人的數據訪問性能,為深度學習等數據密集型應用提供了強大的支持。
IT之家附上開源地址:https://github.com/deepseek-ai/3FS。
基于 3FS 的數據處理框架 Smallpond:https://github.com/deepseek-ai/smallpond。
![[URL]a67c8d9a9dca2dce3d8f3ca7f5f1d4d3.jpg](/d/file/202502/a67c8d9a9dca2dce3d8f3ca7f5f1d4d3.jpg)
3FS 性能亮點
集群高吞吐:在 180 節點集群中,3FS 實現了高達 6.6 TiB/s 的聚合讀取吞吐量。
基準測試優異:在 25 節點集群的 GraySort 基準測試中,3FS 達到了 3.66 TiB / min 的吞吐量。
單節點高性能:每個客戶端節點的 KVCache 查找峰值吞吐量超過 40 GiB/s。
架構先進:3FS 采用去中心化架構,并具備強一致性語義。
3FS 應用場景
3FS (Fire-Flyer File System) 是一款高性能的分布式文件系統,旨在解決 AI 訓練和推理工作負載帶來的挑戰,利用現代 SSD 和 RDMA 網絡提供共享存儲層,簡化分布式應用程序的開發。
其核心優勢在于高性能、強一致性和易用性,能夠有效支持各種 AI 工作負載,包括數據準備、數據加載、檢查點設置和推理緩存。
3FS 在 DeepSeek 的 V3 / R1 版本中得到廣泛應用,涵蓋了訓練數據預處理、數據集加載、檢查點保存 / 重新加載、嵌入向量搜索以及推理過程中的 KVCache 查找等關鍵環節。
Smallpond
此外,DeepSeek 還開源了基于 3FS 的數據處理框架 Smallpond,是一款構建于 DuckDB 和 3FS 之上的輕量級數據處理框架。它擁有高性能數據處理能力,可擴展至 PB 級數據集,并且操作簡便,無需長期運行的服務。
文章內容僅供閱讀,不構成投資建議,請謹慎對待。投資者據此操作,風險自擔。
海報生成中...
海藝AI的模型系統在國際市場上廣受好評,目前站內累計模型數超過80萬個,涵蓋寫實、二次元、插畫、設計、攝影、風格化圖像等多類型應用場景,基本覆蓋所有主流創作風格。
IDC今日發布的《全球智能家居清潔機器人設備市場季度跟蹤報告,2025年第二季度》顯示,上半年全球智能家居清潔機器人市場出貨1,2萬臺,同比增長33%,顯示出品類強勁的市場需求。