本網訊(查睿)DeepSeek一路“狂飆”的同時,AI大模型業內逐漸進入“拉力賽”。
DeepSeek熱度持續席卷全球,短短一周內,微軟Azure、英偉達等海外科技巨頭,以及國內阿里云、華為云、騰訊云、百度云等云廠商均宣布上線DeepSeek大模型,并以“零代碼”“超低價”等優惠吸引更多用戶。
2025年以來,DeepSeek陸續開源大語言模型V3、推理模型R1和多模態模型Janus Pro,因其高性能、低成本等優勢,率先受到海外市場關注。作為OpenAI的“金主”之一,微軟CEO納德拉在1月29日大贊DeepSeek的創新之處,同時也為微軟自身拉了一波廣告:DeepSeek-R1模型可通過微軟的AI平臺Azure AI Foundry和GitHub獲取,并承諾未來將在搭載Copilot+的電腦上運行。
1月30日,英偉達也緊隨其后,宣布英偉達的開發者網站已將DeepSeek-R1模型納入“最受歡迎的模型”欄目,可在NVIDIA NIM微服務預覽版上使用。NVIDIA NIM是NVIDIA AI企業版服務的一部分,為跨云、數據中心和工作站的自托管GPU加速推理微服務提供容器,用于預訓練和自定義AI 模型。
很快,國內各大互聯網云服務商開始爭相接入DeepSeek系列模型,并拿出“真金白銀”相互競爭。
2月3日,阿里云宣布,阿里云PAI Model Gallery支持云上一鍵部署DeepSeek-V3和R1模型。在該平臺上,用戶可以零代碼實現從訓練到部署再到推理的全過程,簡化模型開發流程,為開發者和企業用戶帶來了更快、更高效、更便捷的AI開發和應用體驗。
同一天內,百度智能云千帆平臺也正式上架DeepSeek-R1和V3模型,推出了超低價格方案,還可享受限時免費服務,登錄百度智能云千帆ModelBuilder即可快速體驗。同時,百度還融入自身大模型技術,比如將DeepSeek模型融合千帆推理鏈路,集成百度獨家內容安全算子,實現模型安全增強保障。
記者了解到,包括華為云、騰訊云、360數字安全、云軸科技ZStack等多家國內AI公司已接入DeepSeek模型,相當于DeepSeek模型幾乎成了主流AI云平臺服務的標配。
DeepSeek一路“狂飆”的同時,AI大模型業內逐漸進入“拉力賽”。
1月29日,阿里通義千問上線旗艦級模型Qwen2.5-Max,采用超大規模MoE(混合專家)架構,基于超過20萬億token(詞元)的預訓練數據。阿里團隊表示,該模型均展現出與DeepSeek V3、GPT-4和Claude-3.5-Sonnet比肩,甚至領先的性能。隨著后訓練技術的不斷進步,下一個版本將有望達到更高水平。
2月1日,OpenAI上線o3-mini,這是OpenAI首款支持開發者需求功能的小型推理模型,具備低成本、低延遲優勢,并支持函數調用、流式傳輸、結構化輸出等功能,還支持與搜索功能結合,能夠提供最新答案并鏈接至相關網絡資源。經過部分開發者的測試后發現,OpenAI o3-mini性能與DeepSeek R1相比沒有明顯優勢,部分環節仍被R1反超。
鄂ICP備2020021375號-2
網絡傳播視聽節目許可證(0107190)
備案號:42010602003527
今日湖北網版權所有
技術支持:湖北報網新聞傳媒有限公司
舉報電話:027-88568010
運維監督:13307199555