
一、DeepSeek是干什么的?
DeepSeek是一家專注于人工智能技術的創新型公司,其相關產品在全球 AI 圈引發震動。
DeepSeek 的背景和基本信息:
DeepSeek 全稱杭州深度求索人工智能基礎技術研究有限公司,成立于 2023 年 7 月 17 日,由知名量化資管巨頭幻方量化創立。
主要從事工程和技術研究和試驗發展,涵蓋技術開發、咨詢、轉讓等服務,還包括軟件開發、計算機系統服務、人工智能應用軟件開發等業務。
DeepSeek 的主要產品:
DeepSeek LLM:2024 年 1 月 5 日發布,包含 670 億參數,在 2 萬億 token 的數據集上訓練,涵蓋中英文。開源了 DeepSeek LLM 7B/67B Base 和 Chat 版本,67B Base 在推理、編碼等方面超越 Llama2 70B Base,67B Chat 在編碼、數學方面出色,中文表現超越 GPT-3.5。
DeepSeek Coder:由一系列代碼語言模型組成,在 2 萬億 token 上訓練,包含 87% 代碼和 13% 中英文自然語言,模型尺寸從 1B 到 33B 版本不等,在多種編程語言和基準測試中達到開源代碼模型先進性能。
DeepSeek-V2:2024 年 5 月開源的第二代 MoE 大模型,有 2360 億參數,中文綜合能力在眾多開源模型中最強,英文綜合能力與 LLaMA3-70B 處于同一梯隊,訓練效率高,計算量僅為 Meta Llama 3 70B 的 1/5、GPT-4 的 1/20。
DeepSeek-R1:2025 年 1 月 20 日正式發布,在數學、代碼、自然語言推理等任務上性能比肩 OpenAI o1 正式版,1 月 24 日在國外大模型排名 Arena 上基準測試升至全類別大模型第三,在風格控制類模型分類中與 OpenAI o1 并列第一。
二、DeepSeek 震動全球 AI 圈的原因?
一是技術創新
強化學習的成功應用:DeepSeek R1 模型通過強化學習讓模型自主進化出復雜的推理能力,在歷史上幾乎沒有團隊能夠成功地將強化學習技術很好地應用于大規模模型并實現大規模訓練,這一技術提高了訓練效率,減少了對昂貴計算資源的依賴。
低成本高性能:與 OpenAI 的 o1 相比,DeepSeek 模型的百萬 token 輸入成本和輸出成本降低至數十分之一,以極低成本和少量芯片實現了與 OpenAI 等巨頭相媲美的性能,挑戰了 “唯有科技巨頭才能研發尖端 AI” 的行業共識。
開源戰略:將核心模型開源,如 DeepSeek-V2、DeepSeek-V3 等都進行了開源,還將代碼向開發者開源,并公開技術細節,構建了開發者生態,為全球 AI 開發者提供了新的選擇和思路,在巨頭壟斷的流量體系外開辟了另一條增長曲線。
二是應用表現出色
登頂下載榜:其應用在 2025 年 1 月 27 日登頂 15 個國家和地區的蘋果應用商店免費 APP 下載排行榜,2 月 2 日攀升至 140 個國家的蘋果 App Store 下載排行榜首位,并在美國的 Android Play Store 中同樣占據榜首位置。
多領域優勢:DeepSeek 在自然語言處理方面,對中文的理解和表達更自然細膩;其 DeepSeek Coder 能幫助程序員寫代碼、優化代碼和查 Bug;還集成了 AI 搜索功能,能從互聯網獲取更真實、靠譜的信息,在多個應用領域展現出了強大的競爭力。
三、杭州六小龍
除了DeepSeek,杭州還有五家很牛的AI企業,合稱“杭州六小龍”:
宇樹科技:2016 年成立,專注四足機器人技術。產品如 H1 機器人在 2025 年央視春晚上亮相,2023 年在全球四足機器人市場銷量占比接近 70%。
游戲科學:2014 年成立,總部位于深圳和杭州,專注高性能游戲引擎技術。憑借《黑神話:悟空》迅速崛起,在 Steam 平臺上的總收入突破 10 億美元大關。
云深處科技:2017 年成立,專注具身智能技術。“絕影” 系列機器人優勢顯著,“絕影 X30” 在新加坡電力隧道巡檢,2023 年在全球四足機器人市場營收占比 11%,排名前五。
強腦科技:2018 年成立,專注腦機接口技術。是全球唯二融資超過 2 億美元的腦機接口公司,產品實現全球首個便攜式高精度腦機接口產品 10 萬臺量產。
群核科技:2011 年成立,是全球領先的云設計軟件平臺和 SaaS 服務提供商,專注 3D 云設計和空間智能技術。核心產品 “酷家樂” 是全球領先的 3D 空間設計平臺,服務覆蓋超 200 個國家和地區,總注冊用戶數超 5100 萬,合作品牌企業近 4 萬家。
四、“杭州現象”
筆者尊稱為“杭州現象”。是指杭州在科技等領域展現出的獨特發展態勢和成果,與杭州六小龍的崛起密切相關:
科技創新引領:以游戲科學、宇樹科技等為代表的杭州六小龍,在 AI、機器人、游戲引擎等前沿技術領域取得顯著突破,如宇樹科技的四足機器人亮相春晚,游戲科學的《黑神話:悟空》引發全球關注,展示了杭州在科技創新方面的強大實力,吸引了全球目光,成為杭州科技發展的新名片。
產業集群效應:杭州六小龍的發展帶動了上下游相關產業的協同發展,形成了一定的產業集群效應。例如在 AI 領域,圍繞大語言模型的研發,吸引了數據標注、算法優化、應用開發等相關企業集聚,促進了人才、技術、資金等要素的快速流動和整合,提升了杭州整體產業的競爭力。
人才吸引力增強:這些創新型企業的發展吸引了大量國內外優秀科技人才匯聚杭州。以深度求索為例,其專注于 AI 大語言模型研發,吸引了眾多 AI 領域的頂尖人才,為企業發展注入強大動力,同時也提升了杭州在全球科技人才市場的知名度和吸引力,形成了人才與產業相互促進的良性循環。
品牌影響力提升:杭州六小龍在各自領域的成功,提升了杭州作為科技創新城市的品牌形象。使杭州在全球科技產業版圖中占據了重要位置,吸引了更多的國際合作機會和投資,進一步推動了杭州經濟社會的發展,為杭州贏得了 “中國創新之都” 的美譽,成為中國乃至全球科技創新的重要引領者。
近期,深度求索引發三個方面的討論:
一是對國有科研系統的重新思考。
人才競爭壓力:DeepSeek 等企業憑借高薪、股權等靈活的激勵機制,吸引了包括部分從中科院流出的青年科研骨干,導致中科院在人才儲備和科研團隊穩定性方面面臨一定挑戰,一定程度上削弱了中科院的持續研發能力。
科研成果關注度沖擊:DeepSeek 以市場為導向,推出的產品能夠快速獲得用戶和市場的關注,相比之下,中科院的科研成果多集中在基礎研究和理論層面,在短期內可能難以獲得像 DeepSeek 產品那樣廣泛的社會關注和影響力,這可能會在一定程度上影響中科院在公眾認知中的形象和地位。
資源競爭加劇:在數據和算力資源方面,DeepSeek 通過商業合作等方式能夠獲取大量私有數據和專有算力,而中科院多依賴公開數據集和公共超算資源,在資源獲取和利用上相對受限,在與 DeepSeek 等企業競爭科研資源時可能面臨更大壓力。
二是減少大規模超算中心的需求。DeepSeek 構建跨硬件平臺的 “技術聯邦”,實現全模型開源矩陣,讓 AMD、昇騰、海光等硬件突破英偉達 CUDA 生態壁壘。如昇騰 910B 采用 DeepSeek 優化架構后能效比提升 41%,海光 DCU 延遲降低 27%,這使企業在選擇硬件時不再局限于英偉達,降低了對特定高性能硬件的依賴,減少了為匹配這類硬件而建設大規模超算中心的需求。
三是對中國高等教育的評價。DeepSeek 項目團隊平均年齡不到 30 歲,他們在自然語言處理、機器學習等核心技術上實現了多項突破,部分指標甚至超越了國際頂尖水平。在項目推進過程中,這些年輕工程師展現出了極強的學習能力和創新精神,不僅快速消化吸收了國際前沿技術,還在此基礎上進行了大量原創性改進,證明了中國高等教育培養出的人才具備良好的創新思維和學習能力,能夠緊跟國際前沿技術發展趨勢,并實現自主創新。
五、深圳人的思考
深圳已經在反思“杭州現象”。尋找這種差距。
一是產業生態方面
節奏過快:深圳整體社會運轉節奏快,人才和資本都追求快速出成績和回報。對于像游戲科學開發《黑神話:悟空》這種需要長期投入、慢工出細活的項目,在深圳可能會面臨人才流失、資本壓力等問題,難以獲得足夠的耐心和支持。
產業聚焦單一:深圳以科技創新、硬件制造、電子信息為主導,產業聚焦在通信、芯片、新能源等領域,對于 AI、游戲等領域的重視程度相對較低。相比之下,杭州在電商、互聯網服務的基礎上,形成了更具多樣性的產業生態,為不同類型的創新企業提供了發展空間。
二是政策扶持方面
缺乏針對性:深圳政府長期支持制造業升級、跨境貿易和國際化布局,政策和資本更傾向于硬件研發和產業鏈整合等 “硬核” 項目,對于文化創意、AI 軟件等領域的扶持政策相對較少。而杭州為支持動漫游戲產業,每年有專項資金投入,并且對相關企業提供保姆式服務,從資金到生活各方面解決企業的后顧之憂。
資源分配不均:在深圳,政府資源和關注更多集中在像華為、大疆這樣的硬科技巨頭,初創的中小創新企業難以獲得足夠的重視和支持。杭州則對各類創新企業一視同仁,為 “杭州六小龍” 這樣的初創企業提供了良好的發展環境。
三是人才吸引方面
高校資源劣勢:與杭州所在的長三角地區相比,深圳的高校資源相對匱乏,缺乏頂尖高校為科技創新提供源源不斷的人才支持和科研成果轉化。杭州有浙江大學等高校,為 “杭州六小龍” 提供了大量專業人才和技術支持,還能形成產學研協同創新的良好氛圍。
生活成本因素:深圳房價較高,生活成本相對較大,對于一些初創企業的員工來說,經濟壓力較大。而杭州房價相對較低,生活節奏相對較慢,能夠讓人才更安心地投入到工作中,對于吸引和留住人才具有一定優勢。
當然,武漢更需要思考。