{首页主词},&

地方頻道：

您的當前位置：首頁>科技

DeepSeek之后！又一國產開源大模型接入國家級平臺

2025-03-11 10:42:56 來源：極目新聞

3月10日，科技圈迎來一則重磅消息：國家超算互聯網平臺正式接入了阿里巴巴的通義千問大模型，并對外提供千問QwQ-32B API服務！用戶還能免費獲得100萬tokens的體驗額度，可以說是給廣大開發者和AI愛好者送上了一份“科技大禮包”。

千問QwQ-32B，堪稱阿里通義團隊新推出的“推理小巨人”。在數學、代碼和通用能力等多項權威評測中，它的表現絲毫不遜色于“滿血版”671B的DeepSeek-R1，且超越了o1-mini和同尺寸的R1蒸餾模型。值得一提的是，千問QwQ-32B一經發布，便迅速登頂全球最大AI開源社區HuggingFace的趨勢榜，成為當下炙手可熱的開源大模型。

DeepSeek和通義系列模型的成功，不僅打破了美國在AI領域的技術壟斷，還為中國AI贏得了國際認可。

堅定開源路線，與DeepSeek并列開源雙雄

阿里通義團隊的“開源宇宙”也在不斷擴張。截至目前，他們已經開源了千問Qwen大語言模型和萬相Wan視覺生成模型兩大系列，共計200余款模型，覆蓋從0.5B到110B的全尺寸范圍。這些模型不僅在Chatbot Arena、司南OpenCompass等權威榜單上屢次斬獲“全球開源冠軍”和“國產模型冠軍”，還衍生出了超過10萬個模型，成功超越了Meta公司的Llama系列，登頂全球開源大模型的巔峰。

高盛集團預測，AI的廣泛應用將為中國GDP帶來20至30個基點的增長。此外，DeepSeek的開源策略被外媒譽為“人工智能的DeepSeek時刻”，標志著中國AI技術正深刻改變全球創新格局。

自2023年8月首開國內大廠開源大模型先河以來，阿里云已開源Qwen、Qwen1.5、Qwen2、Qwen2.5等4代模型系列，覆蓋從0.5B到110B等“全尺寸”，視覺、語音等“全模態”，總計將通義千問家族超200款模型的研究成果貢獻給了開源社區，也為開發者提供最廣泛的模型選擇。這體現了中國極客們最深沉的愛——開源精神和信息普惠。

在全球主流AI開源社區Hugging Face上，千問系列衍生模型數突破10萬，成為全球最大開源模型，持續領先美國Llama等其他開源模型。千問也是支持語種最多的開源模型，不少小語種模型還是當地語言體系中最好的大模型。而OpenAI 的GPT系列等頂級模型并不開源，因此無法下載用于此類研究。

押注“AI+云計算”，帶動股價累計漲超80%

在這一輪AI推理模型技術浪潮中，千問Qwen模型是產學研各界的共同選擇。

此前爆火的DeepSeek公司基于R1推理模型蒸餾了6個模型開源給社區，其中有4個模型來自Qwen；著名AI科學家李飛飛團隊用較少的資源和數據訓練出的s1推理模型同樣以Qwen模型為基礎模型。國內外開發者認為，以上模型取得的良好成績跟基礎模型的強大性能有很大關系。

“阿里云將把促進中國大模型生態的繁榮作為首要目標，向大模型創業公司提供全方位的服務，包括最強大的智能算力和開發工具，并在資金和商業化探索方面提供充分支持。”2023年7月，阿里云CTO周靖人在上海世界人工智能大會發表演講時表示。

《南華早報》此前報道稱，阿里通義千問Qwen模型使斯坦福、伯克利復刻低成本DeepSeek成為可能。《南華早報》認為，阿里巴巴模型的能力再次證明，中國正在縮小與美國領先企業的人工智能差距，而基于阿里Qwen開源開放的路線，研究人員越來越多地利用阿里巴巴的技術來降低AI訓練成本。

2月以來，阿里繼續重注云計算和AI，吳泳銘宣布未來三年將投入超過3800億元，用于建設云和AI硬件基礎設施，總額超過去十年的總和。阿里股價因持續加碼云計算和AI迎來一路飆漲，自1月13日以每股77.35港元的價格啟動以來，到吳泳銘宣布3800億計劃時（2月24日）達到140.90港元的新高點，累計漲超82.1%。

阿里云方面表示，希望通過開源，讓海量中小企業和AI開發者更早、更快地用上通義千問，推動大模型技術的普惠和應用的落地，促進中國大模型生態建設。

目前，通義系列大模型在技術創新和行業應用上均位居大模型行業前列，中國一汽、聯想、微博、攜程、喜馬拉雅、三得利（中國）等30萬企業客戶已經接入通義大模型。

上一篇: 竹山縣“智慧農村”經濟社會效益凸顯
下一篇: 黃籽油菜高油積累“密碼”揭示