今年新春,DeepSeek可以說是AI界最火爆的話題。
筆者2月9日從鵬城實驗室獲悉,為了進一步降低國內AI開發者參與門檻,鵬城實驗室支持建設的開源社區OpenI啟智社區作為“中國算力網開源開放試驗場”,已在乙巳蛇年春節期間及時通過“大模型基地”上線DeepSeek系列模型,包括“自然語言處理”的DeepSeek-V3和DeepSeek-R1-Distill-Qwen、DeepSeek-R1-Distill-Llama系列不同參數模型,以及“計算機視覺”的DeepSeek-CV系列模型。
據悉,開發者無需進行復雜繁瑣的配置,可直接基于已上線的模型和社區提供的算力資源、一站式AI開發環境自行開展模型驗證和測試,體驗DeepSeek模型的強大功能。
中國算力網(China Computing NET,C²NET)是利用新一代通信、網絡技術實現國家大型算力高速互聯,構建資源方便接入、任務統一調度且具有可持續發展運營模式和機制的數字經濟基礎設施,由鵬城實驗室牽頭建設,正不斷推動國內自主算力資源邁入“全民共享”時代。
據OpenI啟智社區相關負責人介紹,依托中國算力網卓越的算力調度與智能分配能力,OpenI啟智社區現已成功部署DeepSeek-R1“滿血版”(671B),且已適配英偉達GPU資源,并積極攜手全國各地的算力中心合作伙伴,共同開放更多經過深度適配的普惠自主算力資源,包括華為的NPU、天數智芯的GPGPU、海光的DCU以及燧原的GCU等,為廣大開發者提供更加豐富的選擇。
值得一提的是,在鵬城實驗室與華為昇思MindSpore及華為昇騰團隊的通力協作下,OpenI啟智社區已完成DeepSeek部分模型在昇騰NPU 910A、910B上的適配工作,這些模型現已能在MindSpore與PyTorch框架上順暢運行,并已通過OpenI啟智社區開源開放。
同時,“中國算力網開源開放試驗場”合作伙伴也將于近期完成兩個版本模型的部署。借助中國算力網,OpenI啟智社區將硬件資源高效整合,形成“算力云際池化”模式,旨在幫助開發者在使用DeepSeek模型時實現計算效率的大幅提升。
為方便各界基于910A計算資源本地部署或通過華為云ModelArts平臺部署DeepSeek模型(PyTorch/MindSpore框架),OpenI啟智社區開源了部署方法,供給類昇騰用戶參考和快速上手。
如果說中國算力網為國內AI發展提供了“燃料”,那么開源生態則是點燃AI技術突破的“火花”。
自OpenI啟智社區上線DeepSeek后,蛇年春節期間,系列蒸餾模型被社區開發者體部署體驗超過兩萬次,社區累計為開發者提供了上萬卡時高性能計算資源體驗DeepSeek。
OpenI啟智社區相關負責人表示,下一步,在開源開放試驗場的基礎上,OpenI啟智社區將通過中國算力網云際協同機制,將DeepSeek系列模型一鍵進行分發部署到各地算力中心,支撐算力中心基于本地算力形成特色化模型服務能力。
從“算力自主”到“普惠共贏”,中國科技界積極探索科技創新的新路徑。據介紹,通過共享資源、協同創新,中國算力網將致力于構建一個更加開放、包容、共贏的科技生態,為推動全球科技進步貢獻力量。(圖片:鵬城實驗室)