原创出品 | 「子弹财经」旗下「创业最前线」
作者 | 白华
编辑 | 闪电
美编 | 邢静
审核 | 颂文
近日,北京市市长殷勇时隔一年再次调研智谱华章与银河通用机器人,这或许是北京AI产业格局的一次“官宣”。一个在数字世界写代码,一个在物理世界造具身身体。两家企业技术路径不同,却共同指向同一个终点:通用人工智能(AGI)。
殷勇在智谱听取了新一代旗舰大模型GLM-5.2的技术汇报,随后又察看了银河通用人形机器人在真实场景中的全自主作业和网球对打互动。
他强调,北京拥有全国最为丰富的人工智能创新资源,正着力将人工智能打造为下一个万亿级产业集群。海淀区目前已集聚2000余家人工智能相关企业和330余家具身智能机器人相关企业,基本形成了从基础大模型到具身智能的全产业链条。
而智谱与银河通用,正是这条产业链上两个最具标志性的“龙头”,一个代表“数字大脑”路径,一个代表“物理身体”路径。它们的平行崛起,揭示了中国AI从单点竞争走向系统竞争的关键跃迁。
1、两种创业方式 同一个AGI终点
2023年5月,北京银河通用机器人在海淀注册成立。创始人兼CTO王鹤,刚满三十岁。他是清华大学本科、斯坦福大学博士,师从美国三院院士Leonidas J. Guibas教授,博士毕业后回国加入北京大学计算机学院前沿计算研究中心,担任研究员、博士生导师。
王鹤的研究方向从一开始就踩在技术前沿上,始终聚焦具身智能与通用机器人模型。在斯坦福期间,他提出的NOCS(标准化物体坐标空间)模型改写了机器人抓取能力的发展轨迹。回国后,他在北大创立了中国第一个以“具身”命名的实验室——具身感知与交互实验室(EPIC Lab),开始了从学术研究到产业化的探索。
在团队构建上,银河通用走了一条少有人走的路,不盲目堆人头,而是以“精兵强将”策略,汇聚了来自清华、北大、北航等顶尖院校的科研骨干,以及微软亚洲研究院等知名机构的行业专家,覆盖具身大模型、仿生结构设计、运动控制、计算机视觉等核心领域。
有投资人在接受采访时评价:“这是一支由中国最顶尖90后科研与工程力量组成的队伍,在具身智能的赛道上,他们有资格与世界任何一支团队正面竞争。”
创业之初,银河通用没有选择行业普遍追捧的“轻量化、快迭代”路线,而是选择了啃最硬的骨头。
“我们不追求机器人会做100件事,而是让它把10件事做到工业级标准。”王鹤在多个场合反复强调这一逻辑。这一判断根植于他对技术落地节奏的深刻理解,当整个行业都在追逐社交媒体上的demo爆款时,真正的护城河在于能否让机器人在真实产线上24小时不间断地真干活。
从融资节奏来看,资本市场对这一策略给出了明确的正反馈。三年时间,银河通用成长为中国累计融资额、估值最高的具身智能企业。2026年3月完成的新一轮融资中,由国家人工智能产业投资基金领投,这是国家大基金三期首次投资具身智能企业,被市场解读为“具身大模型国家队”正式确立。
银河通用攻克具身智能核心壁垒,是人工智能深耕物理世界、持续突破的标杆。
另一家企业智谱,成立于2019年,创始团队几乎全部出自清华大学计算机系知识工程实验室(KEG)。创始人兼首席科学家唐杰教授,是国内最早启动通用大模型产业化的学者之一。2026年1月,智谱以116.2港元/股的发行价在港交所上市,半年后股价累计涨幅近20倍,市值一度突破1.07万亿港元,成为国内首家迈入“万亿俱乐部”的大模型企业。
(图 / 摄图网,基于VRF协议)
智谱的创业路径是一条典型的“数字大脑”进化路线:从清华大学KEG实验室的技术成果转化起步,到开源GLM系列大模型,再到构建“Token经济—长程任务—企业级应用”的商业闭环。
2026年6月17日,智谱上线并开源新一代旗舰大模型GLM-5.2。该模型主攻“长程任务”,让AI不再只做即时问答,而能像人一样连续工作数小时、自主跑完一个完整的大型工程。在全球百万用户参与盲测的Code Arena榜单上,GLM-5.2位列全球可用模型第一。特斯拉CEO马斯克与唐杰就此在社交媒体上的隔空对话,更是将这场技术叙事推向了全球视野。
财报显示,2025年智谱开放平台及API营收占比从15.5%提升至26.3%,企业级智能体营收占比从15.2%提升至22.9%。在2026年一季度,智谱API调用定价提升83%,调用量反而增长400%,供不应求。
银河通用与智谱站在AGI的两条岔路口上,一个用代码构建数字世界的智能,一个用钢铁和电机再造物理世界的智能。两条路径看似平行,却在一个更深层的结构上紧密耦合。
2、技术跃迁 从“控制机器”到“理解世界”
2026年央视春晚的贺岁微电影中,一个轮式双臂机器人完成了盘核桃、捡玻璃碎片、叠衣服、串烤肠等一系列高难度操作。这个机器人名为Galbot,驱动它的是银河通用自研的“银河星脑”(AstraBrain),全球首个集成“大脑-小脑-神经控制”于一模的端到端具身大模型。
要知道,过去传统机器人系统采用“感知-规划-控制”三级分离架构,每一层由不同团队用不同技术路线完成,延迟和误差逐层累积。银河星脑则将这三层打通为一条神经网络,从多模态感知到实时反馈控制全链路端到端训练,实现了“边看、边想、边做”的实时决策。
在“世界-动作模型”(World-Action Model, WAM)这一核心技术路线上,银河通用走在了全球最前沿。
早在2025年,银河通用团队在计算机视觉顶会ICCV上首次提出WAM概念,它将Google的VLA(视觉-语言-动作模型)与OpenAI Sora代表的世界模型两条技术路线统一起来。而这一技术路线的战略判断,与全球顶尖科技企业对具身智能终局的思考不谋而合。英伟达研究科学家Jim Fan在2026年接受采访时直言:WAM是“robotics endgame”(机器人技术的终局)。
在“专”的层面,银河通用打出了两记全球首创的重拳。
一是全球首个全自主人形机器人与真人网球对抗系统。2026年3月,一段人形机器人在网球场上与真人选手连续对拉的视频在全球科技圈刷屏。机器人在毫秒级内完成来球感知、轨迹预判、跑位调整和挥拍击球的全闭环。
特斯拉对于这段视频,海外业内顶尖人士集体给出极高评价:特斯拉CEO马斯克在Twitter上直呼“Insane”;AI知名评论员Andrej Karpathy 发表评论表示惊叹,一度“怀疑”视频是由AI生成;AI评论员Andrew Kang 更是直言,AlphaGo时刻已经到来!这些评论足以印证本次具身智能突破的划时代价值。
AI研究者Andrej Karpathy第一次看到视频时,认为这是AI视频生成软件制作的假视频,他无法相信机器人的运动已经真实到这种程度。
背后的算法核心是银河通用提出的LATENT算法。它通过构建“运动技能空间”与隐空间动作屏障,让机器人从不完美的人类动作数据中自主学习高动态技能,而不是依赖远程遥控或预编程。
二是灵巧手“转笔”,全球唯一实现从仿真到真机迁移的高精度灵巧操作。英伟达早在2023年就在仿真器中展示了灵巧手转笔,但一直无法在真实世界中复现。银河通用提出的灵巧手神经动力学模型(DexNDM),通过在仿真器中构建逼真的碰撞模型,再用真实数据训练“灵巧手世界模型”弥合虚实差距,最终在全球范围内首次实现了真实机器人的手指转笔。
2026年4月,银河通用推出了AstraBrain WAM 0.5,全球首次实现虚实共融、人机混合、质量参差、有无动作标签数据的统一有效利用。同期发布的通用小脑AstraBrain-WBC 0.5,基于2万小时人类动作数据训练,在全身闭环控制与实时指令跟随方面达到行业领先水平。
从“AlphaGo时刻”到“ChatGPT时刻”,数字AI用了十年走完从专到通的路。而具身智能正以加速度进行同样的演进。
王鹤的判断是:当预训练模型在人类无需专门后训练就能完成的技能上达到70%到80%成功率时,具身智能的“ChatGPT时刻”就会到来。
如果技术突破是银河通用的“上半场”,那么商业化落地就是它正在书写的“下半场”。
2026年6月25日,新京报披露了一个里程碑事件:银河通用Galbot S1具身智能重载机器人已在宁德时代量产线上7×24小时工作超过3个月,这是全球首次实现人形机器人在新能源智能制造生产场景的“常态化自主作业”。
Galbot S1以双臂50公斤级重载能力、纯视觉柔性定位与360度全向避障为核心优势,在宁德时代产线上承担模组与电池包生产环节的物料转运等长程自主任务。它采用纯视觉方案,无需依赖二维码或反光板定位,即可在复杂工厂环境中完成操作,这意味着它真正具备了对非结构化环境的适应能力。
与宁德时代的合作只是工业落地的起点。截至目前,银河通用的工业人形机器人已进入宁德时代、博世集团、西门子、丰田汽车、现代汽车、北汽集团、上汽集团、极氪汽车、长城汽车等制造企业的真实生产线,累计订单达数千台。
在零售领域,银河通用同样跑通了规模化的路径。搭载银河星脑的机器人已在近40家智慧零售药店和170家“银河太空舱”零售店中实现7×24小时自主卖货运营,覆盖全国多个城市核心商圈。
医疗领域是银河通用的第三个主战场,公司与四川大学华西第二医院合作共建具身智能医疗机器人研发平台,探索机器人在医疗康养场景中的应用。
回看银河通用的商业化策略,一条清晰的路径是:它并不追风口、抢量产规模,而是面对终端客户,银河通用执行严选科技策略,对SR(系统需求)要求极其严,每个场景都经过技术可行性、工程可交付性与商业可持续性的三重验证。
公司不追求"万物皆可做",而是聚焦三大场景,在工业场景用高难度命题锤炼技术壁垒;零售场景在动态环境中检验机器人的通用性与泛化能力;医疗康养场景将已验证的技术框架向长尾市场渐进延展。这套路径的背后有一个核心判断,量产数量从来不是定义技术成功的唯一标尺。
具身智能的历史性拐点已经到来,机器人正在从“执行工具”进化为“自主系统”。
3、结尾
如果将AGI看作一个完整的智能系统,智谱提供的是数字世界的AI,让模型学会理解语言、规划任务、推理逻辑;银河通用提供的是物理世界的AI,让机器人学会感知物理世界、精细操作、自主运动。
智谱的商业模式建立在“Token经济”之上:每一次API调用、每一次模型推理,都在将智能转化为可计量的经济价值。而银河通用的商业逻辑建立在“物理经济”之上:每一台部署在产线上的机器人,都在直接创造物理世界的生产效率。
两种经济模式并非孤立,而是互为前提。未来的通用机器人需要“大脑”来理解和规划任务,也需要“身体”来执行和反馈。
北京AI产业的“双龙头”格局,不是在同一个赛道里选冠军,而是在两条赛道里各有一个“决策龙头”。从清华KEG实验室的代码到港股万亿市值,北大EPIC Lab的仿真到宁德时代产线上的真机,从实验室到万亿市场,从论文到产线,中国AI正在形成一个全球罕见的“数字+物理”双轨并行的产业闭环。
北京市市长殷勇在调研时强调,要“统筹推进基础大模型与具身智能协同攻关,聚焦关键领域集中突破,筑牢软硬件技术底座”。
这句话点出了北京AI产业布局的结构性优势。全国最丰富的人工智能创新资源、最具活力的产业生态、最坚实的新型基础设施,这些要素的叠加,让北京成为全球少数同时布局“数字智能”与“物理智能”两大AGI路径的城市之一。
海淀区2000多家人工智能企业和330多家具身智能企业,构成了一个多层次、多梯队的创新矩阵。而智谱与银河通用,就是这个矩阵中最耀眼的双子星。