
本網(wǎng)訊(查睿)DeepSeek一路“狂飆”的同時,AI大模型業(yè)內(nèi)逐漸進入“拉力賽”。
DeepSeek熱度持續(xù)席卷全球,短短一周內(nèi),微軟Azure、英偉達等海外科技巨頭,以及國內(nèi)阿里云、華為云、騰訊云、百度云等云廠商均宣布上線DeepSeek大模型,并以“零代碼”“超低價”等優(yōu)惠吸引更多用戶。
2025年以來,DeepSeek陸續(xù)開源大語言模型V3、推理模型R1和多模態(tài)模型Janus Pro,因其高性能、低成本等優(yōu)勢,率先受到海外市場關(guān)注。作為OpenAI的“金主”之一,微軟CEO納德拉在1月29日大贊DeepSeek的創(chuàng)新之處,同時也為微軟自身拉了一波廣告:DeepSeek-R1模型可通過微軟的AI平臺Azure AI Foundry和GitHub獲取,并承諾未來將在搭載Copilot+的電腦上運行。
1月30日,英偉達也緊隨其后,宣布英偉達的開發(fā)者網(wǎng)站已將DeepSeek-R1模型納入“最受歡迎的模型”欄目,可在NVIDIA NIM微服務(wù)預(yù)覽版上使用。NVIDIA NIM是NVIDIA AI企業(yè)版服務(wù)的一部分,為跨云、數(shù)據(jù)中心和工作站的自托管GPU加速推理微服務(wù)提供容器,用于預(yù)訓(xùn)練和自定義AI 模型。
很快,國內(nèi)各大互聯(lián)網(wǎng)云服務(wù)商開始爭相接入DeepSeek系列模型,并拿出“真金白銀”相互競爭。
2月3日,阿里云宣布,阿里云PAI Model Gallery支持云上一鍵部署DeepSeek-V3和R1模型。在該平臺上,用戶可以零代碼實現(xiàn)從訓(xùn)練到部署再到推理的全過程,簡化模型開發(fā)流程,為開發(fā)者和企業(yè)用戶帶來了更快、更高效、更便捷的AI開發(fā)和應(yīng)用體驗。
同一天內(nèi),百度智能云千帆平臺也正式上架DeepSeek-R1和V3模型,推出了超低價格方案,還可享受限時免費服務(wù),登錄百度智能云千帆ModelBuilder即可快速體驗。同時,百度還融入自身大模型技術(shù),比如將DeepSeek模型融合千帆推理鏈路,集成百度獨家內(nèi)容安全算子,實現(xiàn)模型安全增強保障。
記者了解到,包括華為云、騰訊云、360數(shù)字安全、云軸科技ZStack等多家國內(nèi)AI公司已接入DeepSeek模型,相當于DeepSeek模型幾乎成了主流AI云平臺服務(wù)的標配。
DeepSeek一路“狂飆”的同時,AI大模型業(yè)內(nèi)逐漸進入“拉力賽”。
1月29日,阿里通義千問上線旗艦級模型Qwen2.5-Max,采用超大規(guī)模MoE(混合專家)架構(gòu),基于超過20萬億token(詞元)的預(yù)訓(xùn)練數(shù)據(jù)。阿里團隊表示,該模型均展現(xiàn)出與DeepSeek V3、GPT-4和Claude-3.5-Sonnet比肩,甚至領(lǐng)先的性能。隨著后訓(xùn)練技術(shù)的不斷進步,下一個版本將有望達到更高水平。
2月1日,OpenAI上線o3-mini,這是OpenAI首款支持開發(fā)者需求功能的小型推理模型,具備低成本、低延遲優(yōu)勢,并支持函數(shù)調(diào)用、流式傳輸、結(jié)構(gòu)化輸出等功能,還支持與搜索功能結(jié)合,能夠提供最新答案并鏈接至相關(guān)網(wǎng)絡(luò)資源。經(jīng)過部分開發(fā)者的測試后發(fā)現(xiàn),OpenAI o3-mini性能與DeepSeek R1相比沒有明顯優(yōu)勢,部分環(huán)節(jié)仍被R1反超。