
3月10日,科技圈迎來一則重磅消息:國家超算互聯網平臺正式接入了阿里巴巴的通義千問大模型,并對外提供千問QwQ-32B API服務!用戶還能免費獲得100萬tokens的體驗額度,可以說是給廣大開發者和AI愛好者送上了一份“科技大禮包”。
千問QwQ-32B,堪稱阿里通義團隊新推出的“推理小巨人”。在數學、代碼和通用能力等多項權威評測中,它的表現絲毫不遜色于“滿血版”671B的DeepSeek-R1,且超越了o1-mini和同尺寸的R1蒸餾模型。值得一提的是,千問QwQ-32B一經發布,便迅速登頂全球最大AI開源社區HuggingFace的趨勢榜,成為當下炙手可熱的開源大模型。
DeepSeek和通義系列模型的成功,不僅打破了美國在AI領域的技術壟斷,還為中國AI贏得了國際認可。
堅定開源路線,與DeepSeek并列開源雙雄
阿里通義團隊的“開源宇宙”也在不斷擴張。截至目前,他們已經開源了千問Qwen大語言模型和萬相Wan視覺生成模型兩大系列,共計200余款模型,覆蓋從0.5B到110B的全尺寸范圍。這些模型不僅在Chatbot Arena、司南OpenCompass等權威榜單上屢次斬獲“全球開源冠軍”和“國產模型冠軍”,還衍生出了超過10萬個模型,成功超越了Meta公司的Llama系列,登頂全球開源大模型的巔峰。
高盛集團預測,AI的廣泛應用將為中國GDP帶來20至30個基點的增長。此外,DeepSeek的開源策略被外媒譽為“人工智能的DeepSeek時刻”,標志著中國AI技術正深刻改變全球創新格局。
自2023年8月首開國內大廠開源大模型先河以來,阿里云已開源Qwen、Qwen1.5、Qwen2、Qwen2.5等4代模型系列,覆蓋從0.5B到110B等“全尺寸”,視覺、語音等“全模態”,總計將通義千問家族超200款模型的研究成果貢獻給了開源社區,也為開發者提供最廣泛的模型選擇。這體現了中國極客們最深沉的愛——開源精神和信息普惠。
在全球主流AI開源社區Hugging Face上,千問系列衍生模型數突破10萬,成為全球最大開源模型,持續領先美國Llama等其他開源模型。千問也是支持語種最多的開源模型,不少小語種模型還是當地語言體系中最好的大模型。而OpenAI 的GPT系列等頂級模型并不開源,因此無法下載用于此類研究。
押注“AI+云計算”,帶動股價累計漲超80%
在這一輪AI推理模型技術浪潮中,千問Qwen模型是產學研各界的共同選擇。
此前爆火的DeepSeek公司基于R1推理模型蒸餾了6個模型開源給社區,其中有4個模型來自Qwen;著名AI科學家李飛飛團隊用較少的資源和數據訓練出的s1推理模型同樣以Qwen模型為基礎模型。國內外開發者認為,以上模型取得的良好成績跟基礎模型的強大性能有很大關系。
“阿里云將把促進中國大模型生態的繁榮作為首要目標,向大模型創業公司提供全方位的服務,包括最強大的智能算力和開發工具,并在資金和商業化探索方面提供充分支持。”2023年7月,阿里云CTO周靖人在上海世界人工智能大會發表演講時表示。
《南華早報》此前報道稱,阿里通義千問Qwen模型使斯坦福、伯克利復刻低成本DeepSeek成為可能。《南華早報》認為,阿里巴巴模型的能力再次證明,中國正在縮小與美國領先企業的人工智能差距,而基于阿里Qwen開源開放的路線,研究人員越來越多地利用阿里巴巴的技術來降低AI訓練成本。
2月以來,阿里繼續重注云計算和AI,吳泳銘宣布未來三年將投入超過3800億元,用于建設云和AI硬件基礎設施,總額超過去十年的總和。阿里股價因持續加碼云計算和AI迎來一路飆漲,自1月13日以每股77.35港元的價格啟動以來,到吳泳銘宣布3800億計劃時(2月24日)達到140.90港元的新高點,累計漲超82.1%。
阿里云方面表示,希望通過開源,讓海量中小企業和AI開發者更早、更快地用上通義千問,推動大模型技術的普惠和應用的落地,促進中國大模型生態建設。
目前,通義系列大模型在技術創新和行業應用上均位居大模型行業前列,中國一汽、聯想、微博、攜程、喜馬拉雅、三得利(中國)等30萬企業客戶已經接入通義大模型。