DeepSeek?今年早些時候憑借其?R1 AI?模型備受廣泛關注。據《The Information》報道,R2?模型的工作似乎因?H20?處理器而停滯不前。
DeepSeek尚未透露其R2?模型的具體上市時間。
DeepSeek?使用?5?萬塊?Hopper GPU(包括?3?萬塊?H20、1?萬塊?H800?和?1?萬塊?H100)組成的龐大集群來訓練其?R1?模型。
目前尚不清楚?R2?是否已經完成了全面的預訓練工作。
《The Information》報道稱,DeepSeek?團隊一直在深入研究開發 R2?模型,但 CEO 梁文鋒對其性能尚不滿意。團隊仍在內部努力提升性能。
據《The Information》報道,如果?DeepSeek?即將推出的?R2?模型其性能超過目前市面上的開放替代模型,預計使用量將激增,超出中國云平臺的處理能力。
據稱,大多數依賴早期R1?模型的組織都使用H20?來運行該模型,而這款處理器已經被美國限制,目前出現了供應短缺的局面。
經@大單網 查詢,目前 DeepSeek 相關的招投標項目達 1000 + 個。