从春晚舞台到全球赛场:中国人形机器人,到底走到了哪一步?
解读 2026 春晚四家国人形机器人企业(宇树、魔法原子、松延动力、银河通用)的节目亮点、全栈技术、集群/仿生/具身大模型原理及与海外对比与产业化路线。
前言
2026年央视春节联欢晚会创下春晚历史上机器人参与规模的新纪录,共有宇树科技、魔法原子、松延动力、银河通用四家核心国产人形机器人企业,携超200台机器人深度融入四大核心节目,覆盖武术、小品、歌舞、微电影全品类,全方位展现了中国人形机器人产业的技术突破与商业化落地能力。以下为各企业的详细拆解:
一、宇树科技(Unitree Robotics)
1. 春晚节目表现
作为春晚“三朝元老”,宇树科技是武术节目《武BOT》的核心技术方,携20余台H2、G1系列人形机器人,与河南塔沟武术学校学员同台,完成全球首次全自主人形机器人集群武术表演。

节目中实现了3米弹射空翻、单脚连续空翻、蹬墙后空翻、Airflare大回旋七周半、4m/s集群快速跑位等高难度动作,同时完成挥剑、耍双节棍、醉拳等武术招式,集群动作同步误差小于0.1秒,全程零失误完成直播演出;同时在义乌分会场以“齐天大圣”造型机器人刷屏全网。

2. 公司核心业务与实力
- 企业基础:2016年成立,总部位于杭州,国家级专精特新“小巨人”企业,全球足式机器人绝对龙头,四足机器人全球市占率超69.75%;2025年人形机器人出货量超5500台,位列全球第一。
- 技术壁垒:实现从电机、减速器、控制器、运动控制算法到具身大模型的全栈自研,核心部件自研率超95%,国产化率超85%,累计拥有180余项授权专利。
- 商业化落地:产品矩阵覆盖四足机器人Go/B2系列、人形机器人H/G/R三大系列,售价从3.99万元到65万元不等,已落地工业巡检、电力作业、科研教育、应急救援等场景;2024年营收突破10亿元,C轮融资后估值超120亿元,已完成IPO辅导,拟登陆科创板。
3. 节目核心技术实现原理
(0)概述
- 硬件底层:主力机型H2全身自由度从19个提升至31个(单臂7个、单腿6个、3自由度腰部、2自由度颈部),动作精度达毫米级;自研内转子永磁同步电机扭矩密度达180Nm/kg,伺服响应速度0.001秒级,单臂峰值负载达21kg,支撑高爆发武术动作;搭载自研128线激光雷达与全新灵巧手,实现武术道具的稳定抓持与快速更换。
- 算法与集群控制:采用模型预测控制(MPC)+深度强化学习融合框架,机器人在仿真环境中完成上亿次动作迭代,自主习得复杂武术技巧与平衡控制;自研高并发集群控制系统与AI融合定位算法,通过3D激光雷达每秒上百次扫描舞台环境,实现无外部定位的全自主协同,攻克长序列表演的运动误差累计难题;依托5G专网+边缘计算,将集群指令传输延迟压缩至毫秒级,保障动作同步性。
- 直播容错机制:搭载全自主容错系统,机器人实时监测自身状态,跑偏后可快速归位;主控节点故障时0.3秒内切换备用主机,并有备用机器人待命,保障直播零失误。
《武BOT》节目中,机器人的所有动作可拆解为三大核心技术模块,每个模块都对应着全球性的技术难题,我们逐一拆解:
(1)单机极限武术动作:从“能站稳”到“会打拳”的核心突破
节目里做了什么:机器人完成了弹射空翻、Airflare大回旋、双节棍挥舞、醉拳倒地起身等连专业武术演员都需要长期训练的动作,甚至在3米弹射落地后,能瞬间调整平衡,无缝衔接下一个武术招式。
核心难点:这类高爆发动作的核心挑战,是机器人在重心剧烈变化、全身关节高速联动时,始终保持平衡,同时精准控制每一个动作的力度、角度和节奏——哪怕一个关节的扭矩输出偏差0.1%,就会导致机器人摔倒、表演失败。
底层实现原理:
-
硬件底座:“肌肉骨骼”的极致性能
主力机型H2全身自由度从19个提升至31个(单臂7个、单腿6个、3自由度腰部、2自由度颈部),相当于给机器人装上了能精准控制的“全身关节”;自研内转子永磁同步电机,扭矩密度达180Nm/kg,伺服响应速度达到0.001秒级,比人类神经反射速度快100倍,单臂峰值负载达21kg,能支撑高爆发的空翻、挥棍动作。
通俗类比:这就像给武术运动员装上了反应速度快100倍、力量控制精准到克的肌肉,既能爆发出空翻的爆发力,又能精准控制双节棍的轨迹,不伤到自己和搭档。
-
算法核心:“肌肉记忆”的AI训练
采用模型预测控制(MPC)+深度强化学习的融合框架,这是机器人能完成复杂武术动作的核心。
通俗解释:团队先在数字仿真世界里,给机器人搭建了1:1的虚拟舞台,让AI控制的机器人在里面完成上亿次的动作训练——就像武术运动员在武馆里反复练习,摔倒了就调整参数重新来,最终让机器人自主习得复杂武术技巧和平衡控制能力。
其中,MPC算法相当于“实时教练”,每秒会对上百次机器人的重心、速度、关节状态进行预判,提前调整每个关节的扭矩输出,确保机器人在空翻、落地的全过程中,重心始终落在安全区间;而深度强化学习训练出的“肌肉记忆”,能让机器人在舞台地面有轻微打滑、重心出现偏差时,瞬间自主调整动作,就像武术运动员临场应变一样。
-
道具操作:“手眼协同”的精准控制
机器人能稳定挥舞双节棍、长剑,核心在于搭载了自研128线激光雷达+视觉相机,配合全新灵巧手,每秒对道具的位置、自身的姿态进行上百次扫描校准,实现道具的稳定抓持与轨迹控制,确保双节棍的挥舞轨迹精准贴合武术动作设计,不会出现甩飞、节奏错位的问题。
(2)20余台机器人集群协同:从“单机跳”到“群体演”的全球突破
节目里做了什么:20余台机器人在没有外部定位设备的情况下,完成了4m/s高速跑位、复杂队形变换、与真人演员的实时对练,全程没有出现碰撞、跑偏,动作同步误差小于0.1秒,实现了全球首次全自主人形机器人集群武术表演。
核心难点:传统机器人集群表演,大多依赖舞台地面的二维码、外部动捕设备进行定位,相当于“开了外挂”;而宇树的机器人全程只靠自身机载传感器,在高速运动、舞台灯光复杂、真人演员动态移动的环境下,实现精准定位和协同,还要解决长序列表演中,每台机器人的动作误差累计问题——一旦一台机器人慢了0.05秒,整个集群的表演就会乱套。
底层实现原理:
-
全自主定位:不依赖外挂的“环境感知”
自研AI融合定位算法,通过机器人自带的3D激光雷达,每秒上百次扫描舞台环境,实时构建三维地图,同时匹配预存的舞台模型,计算出自身在舞台上的精准位置,定位精度达到毫米级,完全不需要外部动捕、二维码等辅助设备。
通俗类比:这就像你蒙着眼睛,但是你脑子里时刻知道自己在房间里的位置以及周围的情况,就能在熟悉的房间里精准走到指定位置,而且跑步前进也不会撞墙,精度还能达到毫米级。
-
高并发集群控制:零误差的“团队指挥”
自研分布式集群控制系统,采用“统一时间基准+分布式轨迹规划”架构:首先通过5G专网+边缘计算,给所有机器人同步一个精准到微秒级的统一时间轴,确保每台机器人的动作“在同一个节拍上”,指令传输延迟压缩至毫秒级;
同时,主控系统只给机器人下发“目标位置、动作节拍”的核心指令,每台机器人自主规划自己的跑位路径、动作执行细节,还能实时感知周边机器人的位置,动态调整自己的路线,避免碰撞;哪怕某台机器人出现轻微跑偏,也能在0.2秒内自主调整归位,不影响整个集群的表演。
-
误差消除:长序列表演的“防跑偏机制”
团队针对长序列武术表演,设计了“分段闭环校准”机制:把整个3分钟的节目,拆解成数十个关键动作节点,每完成一个节点的动作,所有机器人都会自动校准自身位置、动作节奏,把累计的误差清零,确保从节目开头到结尾,同步精度始终保持在0.1秒以内。
(3)直播零失误:国家级舞台的“容错保障”
节目里做了什么:在春晚全球直播的高压场景下,20余台机器人全程零失误,没有出现一台故障、摔倒,完美完成表演。
底层实现原理:
搭载了全自主容错系统,每台机器人都会实时监测自身的电机温度、关节状态、电池电量、定位精度,一旦出现轻微异常,会自动调整动作参数,优先保障平衡和核心动作执行;如果出现主控节点故障,会在0.3秒内自动切换备用主机,同时舞台侧方还有待命的备用机器人,可在节目间隙无缝替换故障设备,彻底杜绝直播事故。
4. 国内外技术对比
| 维度 | 核心优势 | 现存差距 |
|---|---|---|
| 运动性能 | 高动态运动控制能力全球领先,完成了波士顿动力Atlas尚未实现的连续花式翻桌跑酷、集群协同武术表演等动作,单机极限动作参数跻身全球第一梯队 | 在工业场景的长期稳定作业能力、复杂非结构化环境的泛化能力上,与波士顿动力、Agility Robotics仍有一定差距 |
| 量产能力 | 2025年出货量远超特斯拉Optimus(小批量测试阶段)、波士顿动力Atlas(非量产),是全球唯一实现高性能人形机器人万台级量产规划的企业 | - |
| 成本与供应链 | 整机成本仅为Atlas的千分之一、Optimus的约1/3,核心部件成本仅为进口产品的1/10,全栈自研供应链摆脱海外技术依赖 | - |
| 智能能力 | - | 具身大模型的通用任务处理能力,相较于特斯拉Optimus的端到端大模型仍有提升空间 |
5. 未来发展方向
- 2026年目标人形机器人出货量1万-2万台,持续扩大全球市场份额;
- 深化工业巡检、电力作业、应急救援等B端场景的规模化落地,实现单台机器人替代3人工作量;
- 持续迭代具身智能大模型,提升机器人的通用任务处理能力与自主决策能力;
- 推进消费级人形机器人的普及,以低价产品打开C端市场。
二、魔法原子(MagicLab)
1. 春晚节目表现
作为春晚智能机器人战略合作伙伴,魔法原子是本届春晚首家亮相的机器人企业。主会场歌曲《智造未来》中,携6台MagicBot Z1高动态小人形机器人、2台MagicBot Gen1全尺寸人形机器人,与易烊千玺、陈小春等艺人同台,完成360°托马斯回旋、侧空翻、同步舞蹈等高难度动作;宜宾分会场,上百台MagicDog四足机器人以“熊猫”造型完成全球首次百台级四足机器人公开舞台同步演绎;同时在贺岁短片中完成捞面、送餐等生活化操作。


2. 公司核心业务与实力
- 企业基础:2024年1月成立,总部无锡,由追觅科技孵化,核心研发人员占比超70%;成立两年完成多轮融资,累计融资超5亿元,估值达35亿元。
- 技术壁垒:核心硬件自研率超90%,覆盖关节模组、灵巧手、伺服电机、谐波减速器等23类核心部件,自研关节峰值扭矩最高达525N·m,跻身行业第一梯队;软件层面打造“原子万象”具身智能大模型,采用“大脑+小脑”双模架构。
- 商业化落地:产品矩阵包括人形机器人MagicBot Gen1/Z1、四足机器人MagicDog系列,覆盖工业巡检、商业服务、家庭陪伴、文旅演艺、教育娱乐等场景,已在27个国家建立本地化团队。
3. 节目核心技术实现原理
魔法原子在春晚的表演,覆盖了“高动态街舞、百台级集群同步、生活化精细操作”三大完全不同的技术方向,我们逐一拆解每个动作的实现逻辑:
(0)概述
- 硬件底层:MagicBot Z1奔跑速度突破4m/s,搭载自研高功率密度关节模组,支撑高动态舞蹈与空翻动作;Gen1全尺寸人形机器人双臂最大负载达50kg,搭载自研6自由度灵巧手,实现捞面、端餐等精细操作。
- 集群控制:采用分布式集群控制系统,通过时间同步算法与多智能体轨迹规划,实现上百台四足机器人的毫秒级动作同步,同步误差小于0.01秒;通过纯视觉SLAM定位,实现无外部辅助的自主编队与动态避障。
- 智能算法:“原子万象”具身大模型采用快慢双模协同架构,“大脑”负责任务规划与场景理解,“小脑”负责实时运动控制与平衡调节,通过数百万条工业场景真实数据训练,实现任务的自主泛化。
(1)主会场街舞表演:托马斯全旋与同步舞蹈的技术突破
节目里做了什么:6台MagicBot Z1小人形机器人,与真人艺人同台完成了360°托马斯回旋、侧空翻、连续街舞动作,同时与音乐节拍、艺人动作完美同步,转身、摆臂、重心迁移全程连贯流畅,多机动作同步误差小于0.01秒。
核心难点:托马斯全旋这类街舞动作,需要机器人在单臂支撑全身重量的同时,完成腰部、腿部的高速圆周摆动,重心全程在快速变化,对关节的负载能力、扭矩控制精度、平衡调节速度提出了极致要求;同时多机协同舞蹈,需要每台机器人的每一个动作,都精准贴合音乐节拍,差0.01秒就会出现“抢拍、慢拍”的问题。
底层实现原理:
-
硬件支撑:高功率密度的“关节心脏”
MagicBot Z1搭载了自研的高功率密度一体化关节模组,在小尺寸机身内实现了超高扭矩输出,奔跑速度突破4m/s,单臂能稳定支撑整机8kg的重量,同时完成高速摆动,这是实现托马斯全旋的物理基础。
团队针对街舞动作的高频次、高负载特性,优化了关节的散热结构与电流管理策略,确保机器人在连续3分钟的高动态舞蹈中,不会因为关节过热触发保护机制,保证动作全程稳定输出。
-
平衡控制:动态重心的实时调节
采用零力矩点(ZMP)平衡控制算法,配合全身力控技术,在托马斯全旋的全过程中,每秒数百次计算机器人的重心位置、支撑区域,实时调整手臂、腰部、腿部的关节角度和扭矩输出,确保重心始终落在支撑臂的安全范围内,不会出现侧翻、摔倒的问题。
通俗类比:这就像你单臂撑在地上做圆周摆腿,大脑需要全程感知自己的重心,随时调整手臂的发力、腰腹的扭转、腿部的摆动,确保自己不会摔倒——而机器人的“大脑”,每秒能做数百次这样的调整,精度比人类高上千倍。
-
节拍同步:零误差的“音乐卡点”
团队给所有机器人搭建了统一的高精度时间同步系统,以音乐的音频波形为基准,把每一个舞蹈动作都精准对应到音乐的节拍点上,每台机器人的动作启动时间、执行时长,都精准锁定到毫秒级,确保6台机器人的动作完全同步,与艺人的表演、音乐的节奏完美契合。
(2)宜宾分会场:百台熊猫机器狗的集群表演
节目里做了什么:上百台MagicDog四足机器人,以熊猫造型亮相,在宜宾分会场的城市广场上,完成了奔跑、列阵、队形变换、同步舞蹈,甚至实现了自然的歪头、点头等拟人化动作,全程动作整齐划一,没有出现一台掉队、碰撞。
核心难点:百台级四足机器人的户外集群表演,核心挑战有三个:一是户外广场地面不平整、灯光环境复杂,机器人的自主定位难度远高于室内舞台;二是百台机器人的动作同步,需要解决大规模集群的指令传输延迟、误差累计问题;三是熊猫外皮包裹后,机身散热空间被压缩,需要解决高负载连续运行的稳定性问题。
底层实现原理:
-
分布式集群控制系统:百台机器人的“统一指挥”
采用“主站+分布式从站”的集群控制架构,主站系统只负责下发整体的表演序列、队形变换指令,每台机器狗自主完成动作执行、路径规划、定位校准;通过时间敏感网络(TSN)技术,给所有机器人同步统一的时间基准,确保百台机器人的动作启动时间误差小于0.01秒,实现“整齐划一”的表演效果。
-
纯视觉SLAM定位:户外场景的精准导航
每台机器狗都搭载了双目视觉相机+IMU惯性测量单元,通过纯视觉SLAM技术,实时构建户外场景的三维地图,匹配自身位置,同时感知周边其他机器人的位置,动态调整行进路线,避免碰撞;哪怕户外地面不平整、出现轻微打滑,也能自主调整步态,快速回到预定位置,完成队形变换。
-
散热与功率优化:外皮包裹下的稳定运行
针对熊猫外皮压缩散热空间的问题,团队优化了整机的电流管理与功率控制策略,在不影响动作表现力的前提下,降低了连续运动状态下的关节发热量,同时优化了机身的散热结构,确保机器人在长达数分钟的连续表演中,不会因为过热触发保护,稳定完成所有动作。
(3)贺岁短片:捞面、倒酒的精细操作
节目里做了什么:MagicBot Gen1全尺寸人形机器人,在短片中完成了捞面、端餐、倒酒等生活化操作,面条捞取、汤汁倾倒的力度控制精准,没有出现洒漏、面条断裂的问题。
核心难点:这类精细操作的核心挑战,是机器人对柔性物体(面条)、易碎容器(碗、酒杯)的力控精度——力度太大,会夹断面条、捏碎杯子;力度太小,会夹不住面条、端不稳碗;同时还要精准控制倾倒的角度和速度,确保汤汁、酒水不会洒漏。
底层实现原理:
-
6自由度灵巧手:微米级的力控精度
Gen1搭载了自研6自由度灵巧手,指尖搭载了高精度力传感器,力控精度达到0.5N,能精准感知抓取物体的反馈力度,实现“柔性抓取”——捞面条时,能精准控制指尖的夹持力,既牢牢夹住面条,又不会把面条夹断;端碗时,能根据碗的重量、重心变化,实时调整手臂的姿态,确保碗始终保持水平,汤汁不会洒漏。
-
“大脑+小脑”双架构:从任务规划到精准执行
自研的“原子万象”具身智能大模型,采用“大脑+小脑”的快慢双模协同架构:“大脑”负责任务规划与场景理解,比如接收到“捞面”的指令后,会自动拆解成“移动到锅前-张开手-伸入锅中-夹住面条-抬起-放入碗中”的分步动作;“小脑”负责实时运动控制与力控调节,在每一步动作执行中,实时调整手臂的位置、指尖的力度,应对面条的柔性变化、碗的重量变化,确保任务精准完成。
4. 国内外技术对比
| 维度 | 核心优势 | 现存差距 |
|---|---|---|
| 集群协同 | 多机协同群控能力全球领先,完成全球首次百台级四足机器人公开舞台同步表演,分布式控制技术跻身行业第一梯队 | - |
| 产品性价比 | 依托追觅科技的供应链优势,实现高自研率下的极致成本控制,产品性价比远超海外同级别产品 | - |
| 落地速度 | 成立仅两年即实现多场景商业化落地,落地速度行业领先 | 全尺寸人形机器人的长期稳定运行能力、复杂场景的泛化能力,相较于宇树科技、波士顿动力仍有差距 |
| 智能能力 | - | 具身大模型的训练数据量与通用能力,相较于银河通用、特斯拉仍有提升空间 |
5. 未来发展方向
- 2026年工业场景计划千台级规模部署,在追觅工厂等场景落地物料搬运、点胶检测等工序;
- 加速无人咖啡、无人药房等零售解决方案的推广,目标1-2年覆盖全球10000家门店;
- 推进四足机器人导盲犬项目“光引001”的落地,切入助残普惠场景;
- 持续拓展海外市场,提升全球化营收占比。
三、松延动力(Noetix Robotics)
1. 春晚节目表现
作为春晚仿生人形机器人独家合作伙伴,松延动力携5款机器人参演小品《奶奶的最爱》,成为首个登上春晚语言类节目的机器人企业。其中1:1复刻蔡明的仿生机器人,以近乎真人的面部神态、口型同步、微表情动作,与真人演员完成对戏;同时4台双足人形机器人完成端茶、互动等生活化动作。

2. 公司核心业务与实力
- 企业基础:2023年9月成立,总部北京,创始团队来自清华、浙大;2025年一年内完成5轮融资,估值约20亿元。
- 技术壁垒:核心技术覆盖仿生人脸驱动、多模态交互大模型、双足运动控制,是国内少数实现仿生人形机器人批量生产的企业;自研D2P数字人映射技术,实现虚拟数字人到实体机器人的精准映射。
- 商业化落地:构建了N系列、E系列、轮式机器人W1、“小布米”系列的产品矩阵;旗下万元级消费级双足机器人“小布米”(定价9998元),2025年10月发售即斩获数千台订单,是全球首款万元级消费级双足人形机器人,产品已落地商业导览、教育科研、家庭陪伴等场景。
3. 节目核心技术实现原理
松延动力在小品中的表演,核心分为两大技术方向,也是仿生人形机器人最核心的两个难题:“长得像、演得真”的仿生交互,以及**“走得稳、做得准”的生活化动作**,我们逐一拆解:
(0)概述
- 仿生人脸核心技术:通过铂金硅胶添加高分子材料,提升面部拉伸自然度与耐久性;采用高紧凑型驱动设计,在仿生人脸内部集成32-40个微型电机,实现表情、口型、眼神的精准控制;自研D2P数字人映射技术,将虚拟数字人的表情、口型数据,实时映射到真实机器人的电机转角上,实现语音与口型的1:1同步。
- 多模态交互:自研多模态交互大模型,实现语音、表情、眼神、肢体动作的协同表达,比如对话时的呼吸起伏、颈部与手臂的配合动作,大幅提升拟人交互体验。
- 运动控制:自研双足运动控制算法,实现机器人在家庭场景的稳定行走、端茶、搀扶等高精度动作,适配非结构化的家庭环境。
(1)蔡明仿生机器人:真人级复刻与实时对戏的核心技术
节目里做了什么:1:1复刻蔡明老师的仿生机器人,在小品中与真人演员完成实时对戏,说话时口型与台词完全同步,同时配合台词做出眨眼、微笑、撇嘴、头部微动作等真人级微表情,甚至能根据对手演员的台词,实时做出对应的神态反馈,仿真度极高,在后台被多位演员误认成真人。
核心难点:语言类节目对仿生机器人的要求,远高于歌舞表演——不仅要“长得像”,更要“演得真”:口型要与台词1:1同步,差一帧就会出现“对口型穿帮”;微表情要贴合人物情绪,僵硬一点就会显得很“假”;同时还要在狭小的人脸空间内,放下足够多的驱动电机,还要保证上镜效果,团队甚至需要把仿生人头整体缩小30%,对结构设计提出了极致挑战。
底层实现原理:
-
仿生人脸硬件:真人级的“皮肤与肌肉”
首先在外观上,团队通过3D扫描,1:1复刻了蔡明老师的面部轮廓、五官细节,采用添加了高分子材料的铂金硅胶制作仿生皮肤,不仅在视觉上无限接近真人皮肤的质感,还提升了皮肤的拉伸自然度与耐久性,在做出表情时,皮肤的拉伸、褶皱都与真人完全一致,不会出现“塑料感”。
最核心的突破,是高紧凑型驱动设计:团队在缩小30%的仿生人脸内部,集成了32个微型驱动电机,分别对应人脸的眉、眼、口、鼻等核心表情区域,相当于给机器人装上了“人工面部肌肉”,每个电机都能精准控制对应区域的皮肤位移,实现微笑、撇嘴、眨眼、抬眉等数十种真人微表情,最小动作幅度可达0.1毫米,完全还原真人的面部神态。
-
D2P数字人映射技术:口型与表情的1:1同步
这是实现真人级对戏的核心技术,自研的D2P(数字人到物理人)映射技术,能把虚拟数字人的表情、口型数据,实时、精准地映射到实体机器人的电机上。
通俗解释:团队先提前采集了蔡明老师说台词时的面部动作、口型变化数据,制作了1:1的虚拟数字人;当机器人需要说台词时,系统会先把语音台词转化为虚拟数字人的口型、表情动作,再通过D2P技术,把这些动作转化为32个微型电机的转动角度、速度指令,实时驱动电机动作,最终实现语音与口型的1:1同步,表情与台词情绪的完美契合,哪怕是台词里的气口、重音,都能对应到口型的细微变化上。
-
多模态交互大模型:实时对戏的“灵性反馈”
自研多模态交互大模型,能实时识别对手演员的台词、语气、甚至面部表情,快速理解对话语境,输出对应的台词、表情和肢体动作;同时还能实现语音、表情、眼神、肢体动作的协同表达,比如说话时配合自然的头部转动、呼吸起伏,甚至是说话间隙的眼神互动,完全还原真人对话的状态,彻底摆脱了传统机器人“念台词”的僵硬感。
(2)“小布米”双足机器人:家庭场景的生活化动作
节目里做了什么:4台“小布米”消费级双足机器人,在小品中完成了稳定行走、端茶、敬礼、与演员互动挥手等动作,在客厅的非结构化环境中,全程行走稳定,端茶时没有出现洒漏,动作流畅自然。
核心难点:消费级双足机器人,受限于成本和尺寸,硬件性能无法和工业级大机型相比,要在家庭的瓷砖、地毯等不同地面上,实现稳定行走,还要完成端茶等精细操作,对算法的轻量化、平衡控制能力提出了极高要求。
底层实现原理:
-
轻量化双足运动控制算法:小机身的稳定行走
“小布米”身高94厘米,体重仅12公斤,全身21个自由度,团队针对小尺寸双足机器人,自研了轻量化的模型预测控制算法,能在算力有限的主控芯片上,实现每秒上百次的步态规划与平衡调节,在瓷砖、地毯等不同地面上,都能自主调整步幅、步速和关节角度,实现稳定行走,哪怕被轻微触碰,也能快速调整重心,不会摔倒。
-
力控抓取:端茶不洒的精细操作
机器人的手部搭载了微型力传感器,端茶时,能精准控制夹持杯子的力度,既牢牢握住杯子,又不会捏碎纸杯;同时在行走过程中,手臂会实时调整姿态,抵消行走带来的晃动,确保杯子始终保持水平,杯里的水不会洒漏,完美适配家庭场景的服务需求。
4. 国内外技术对比
| 维度 | 核心优势 | 现存差距 |
|---|---|---|
| 仿生交互 | 仿生人脸的高集成度驱动技术、多模态情感交互能力处于国内第一梯队,打破了海外企业在高端仿生机器人领域的垄断 | 高动态运动控制能力,相较于宇树科技、波士顿动力有明显差距 |
| 消费级普及 | 率先实现消费级双足机器人的万元级定价,打开了C端市场的普及路径,差异化避开工业赛道红海竞争,商业化落地速度领先 | 工业场景的落地能力与技术积累,弱于银河通用、魔法原子 |
| 量产能力 | 实现了仿生人形机器人的批量生产,量产能力远超海外同类型高端仿生产品 | - |
5. 未来发展方向
- 持续深化仿生人形机器人的技术迭代,推动产品在商业导览、康养陪护场景的规模化落地;
- 推进消费级机器人“小布米”的量产与普及,拓展教育娱乐、家庭陪伴C端市场;
- 深化与高校、科研院所的合作,推动人形机器人教学平台的落地;
- 持续优化成本,推动人形机器人进入普通家庭。
四、银河通用(GALBOT)
1. 春晚节目表现
作为春晚指定具身大模型机器人,银河通用在贺岁微电影《我最难忘的今宵》中,携Galbot G1轮式双臂机器人亮相,与沈腾、马丽搭档,完成盘核桃、捡玻璃碎片、叠衣服、货架取物、串烤肠等生活化任务,实现了春晚舞台首次无预设脚本的机器人自主决策作业,无需提前编程,即可根据场景实时完成任务规划与执行。
2. 公司核心业务与实力
- 企业基础:2023年5月成立,总部北京,由北大王鹤博士、前ABB高管姚腾洲联合创立,核心成员来自华为天才少年计划、百度、微软等企业;2025年12月完成超3亿美元融资,估值达30亿美元。
- 技术壁垒:国内极少数实现“百亿数据集—具身大模型—机器人本体—场景规模化落地”全链条闭环的企业;自研“银河星脑AstraBrain”具身大模型体系,首创虚实结合的训练范式,构建了百亿级机器人干活数据集,是全球具身机器人大模型数据量最大的公司之一。
- 商业化落地:产品主打Galbot系列轮式双臂通用机器人,采用“轮式底盘+折叠腿”复合结构,已实现千台级规模化落地,覆盖工业制造、智慧零售、医疗康养、城市服务等六大领域,合作客户包括宁德时代、德国博世、丰田汽车、北汽、宣武医院等龙头企业,2025年工业订单突破千台,创下具身智能领域商业化订单纪录。
3. 节目核心技术实现原理(通俗专业版)
银河通用的表演,和其他三家企业最大的区别,是完全没有预设的固定脚本——其他机器人的表演,哪怕动作再复杂,也是提前编排好的固定程序;而银河通用的机器人,是根据现场场景和任务指令,自主思考、自主规划、自主执行,这也是具身智能最核心的能力。我们以节目中几个典型任务为例,拆解其底层实现原理:
概述
- 具身大模型核心:首创“合成仿真数据为主、真机采集数据为辅”的虚实结合训练管线,解决了全球机器人干活数据匮乏的行业难题;自研GraspVLA、GroceryVLA、NavFoM等端到端具身大模型,对透明、高光、不规则物体的抓取成功率稳定在95%以上,实现了任务的自主规划、动态避障、长程导航。
- 硬件架构:采用“轮式底盘+折叠腿+双臂”的复合结构,兼顾高速移动与越障能力,身高173cm、臂展190cm、升降行程65cm,双臂最大负载达50kg,搭载自研6自由度灵巧手,实现毫米级精细操作。
- 一体化控制系统:采用“大脑-小脑-神经控制”一体化系统,“大脑”(具身大模型)负责场景理解与任务规划,“小脑”负责运动控制与平衡调节,“神经控制”负责关节的实时伺服响应,实现端到端的任务执行,无需预设脚本。
核心任务逻辑:无脚本自主作业的全链路流程
不管是盘核桃、捡玻璃碎片,还是叠衣服、串烤肠,机器人执行所有任务,都遵循着**“感知-决策-执行-反馈优化”**的端到端全链路,这也是它能实现无脚本作业的核心,我们逐层拆解:
第一步:感知——“看懂”眼前的场景和物体
节目里的挑战:机器人需要识别出核桃、玻璃碎片、衣服、烤肠、签子等完全不同的物体,尤其是透明的玻璃碎片,在浅色桌面上几乎“隐形”,传统视觉系统很容易识别失败;同时还要适应舞台复杂的灯光变化,准确判断每个物体的位置、形状、大小、材质。
底层实现原理:
- 机器人搭载了多模态感知系统,包括双目深度相机、激光雷达、触觉传感器,能同时获取场景的视觉、深度、触觉信息;
- 自研的视觉大模型,在训练阶段见过了数十亿张真实场景图片,能精准识别上万种日常物体,哪怕是形状不规则的碎玻璃、褶皱的衣服,也能快速识别并分割出物体轮廓;
- 针对透明物体识别的行业难题,团队通过仿真环境生成了海量的透明物体数据——不同厚度、不同碎裂形状、不同光照条件下的玻璃碎片,让机器人在虚拟世界中“见过”各种可能的透明形态,理解了透明物体的反光、折射规律,最终实现对玻璃碎片的识别成功率稳定在99%以上,哪怕是只有几毫米的玻璃渣,也能精准定位。
第二步:决策——“想清楚”任务该怎么做
节目里的挑战:比如“捡玻璃碎片”这个任务,没有提前编程告诉机器人“先捡大的、再捡小的,用夹子夹,放到垃圾桶里”,机器人需要自主理解任务目标,把大任务拆解成可执行的小步骤,还要应对突发情况——比如玻璃碎片滚到了桌子底下,要自主规划路线,调整手臂姿态去捡。
底层实现原理:
-
核心是自研的“银河星脑AstraBrain”具身大模型,它就像机器人的“大脑”,通过百亿级的机器人操作数据训练,已经学会了上千种日常任务的执行逻辑,能根据任务指令,自主拆解动作步骤。
通俗类比:就像你让一个人“把地上的玻璃碎片捡干净”,他不用你一步步教,就会自己去找垃圾桶、拿工具,先捡大块再捡小块,还会注意不被划伤——银河通用的具身大模型,就是让机器人具备了这样的自主思考能力。
-
针对春晚的场景,团队还对大模型进行了轻量化微调,让它能快速适配舞台场景,针对不同任务快速输出最优的动作规划,同时具备容错能力——如果第一次捡玻璃没夹住,会自主调整夹子的开合角度、夹持位置,重新尝试,直到任务完成。
第三步:执行——“精准完成”精细操作
节目里的挑战:不同任务对操作的要求完全不同:盘核桃需要双手配合,力度既要足够转动核桃,又不能捏碎;串烤肠需要精准把烤肠穿到签子上,偏差1毫米就会穿歪;叠衣服需要抓住衣服的边角,精准完成折叠动作,这些都对机器人的动作精度、力控能力提出了极高要求。
底层实现原理:
-
硬件基础:灵活又精准的“手臂和手”
Galbot G1采用“轮式底盘+折叠腿+双臂”的复合结构,双臂最大负载达50kg,重复定位精度可达±0.02毫米,比头发丝还细;搭载自研6自由度灵巧手,指尖配备高精度力传感器,力控精度可达0.3N,既能实现串烤肠的毫米级精准定位,又能实现盘核桃、叠衣服的柔性力控。
-
“大脑-小脑-神经”一体化控制系统
采用三级控制架构,实现端到端的精准执行:“大脑”(具身大模型)输出任务规划和动作指令;“小脑”(运动控制算法)负责把指令拆解成每个关节的转动角度、扭矩参数,实时调节手臂的运动轨迹和力度;“神经控制”(伺服系统)负责0.001秒级的实时响应,确保每个关节都精准执行指令,最终实现任务的完美执行。
-
虚实结合的训练范式:让机器人提前“练会”所有动作
团队首创“合成仿真数据为主、真机采集数据为辅”的训练管线,解决了全球机器人干活数据匮乏的行业难题。通俗解释:在数字仿真世界里,生成了数百万种不同大小、材质、形状的虚拟物体,还有各种不同的场景,让机器人在虚拟世界里完成上千亿次的操作训练,练出了一套适应性极强的“通用操作能力”;再用少量真实世界的数据做微调,就能让机器人在真实场景里,轻松完成各种没见过的任务,这也是它能在春晚舞台上,无脚本完成多种生活化任务的核心原因。
4. 国内外技术对比
| 维度 | 核心优势 | 现存差距 |
|---|---|---|
| 场景落地 | 具身大模型的场景落地能力全球领先,实现了全球首个百台级机器人7×24小时自主运营的零售店,工业、零售场景的规模化落地能力,远超特斯拉Optimus、波士顿动力等海外企业 | 双足人形机器人的高动态运动控制能力,相较于宇树科技、波士顿动力有差距 |
| 技术创新 | 首创的虚实结合训练范式,解决了全球机器人干活数据匮乏的行业难题,具身大模型的操作泛化能力跻身全球第一梯队 | 消费级市场的布局与产品,相较于松延动力较为滞后 |
| 工业能力 | 轮式双臂机器人的重载操作、精细操作能力处于行业第一梯队,已获得头部制造企业的千台级订单,商业化落地规模全球领先 | - |
5. 未来发展方向
-
2026年加大“银河太空舱”无人零售解决方案在全国的推广力度,实现千店级规模部署;
-
深化与宁德时代、博世等工业客户的合作,扩大工业场景的千台级部署规模;
-
持续迭代具身大模型,提升机器人的通用任务泛化能力,拓展医疗康养、城市服务等场景;
-
推进IPO进程,提升资本市场影响力,巩固具身智能领域的龙头地位。

整体总结
2026年春晚的机器人表演,并非单纯的舞台炫技,而是中国人形机器人产业的一次国家级路演。四家企业分别在高动态运动控制、多机集群协同、仿生情感交互、具身智能落地四大核心方向,展现了中国在人形机器人领域从跟跑到并跑、部分领域领跑的产业格局。
相较于海外企业聚焦实验室参数、军事场景、长期测试的技术路线,中国企业更注重场景落地、成本控制、规模化量产,形成了差异化的竞争优势,推动人形机器人从实验室走向工业、商业、家庭等真实场景,2026年也被业内视为人形机器人规模化应用的元年。
從春晚舞臺到全球賽場:中國人形機器人,到底走到了哪一步?
解讀 2026 春晚四家國人形機器人企業(宇樹、魔法原子、松延動力、銀河通用)的節目亮點、全棧技術、集群/仿生/具身大模型原理及與海外對比與產業化路線。
來源:https://blog.csdn.net/2403_87969572/article/details/158260101
抓取時間(ISO本地):2026-05-18 05:17:38
前言
2026年央視春節聯歡晚會創下春晚歷史上機器人參與規模的新紀錄,共有宇樹科技、魔法原子、松延動力、銀河通用四家核心國產人形機器人企業,攜超200臺機器人深度融入四大核心節目,覆蓋武術、小品、歌舞、微電影全品類,全方位展現了中國人形機器人產業的技術突破與商業化落地能力。以下為各企業的詳細拆解:
一、宇樹科技(Unitree Robotics)
1. 春晚節目表現
作為春晚“三朝元老”,宇樹科技是武術節目《武BOT》的核心技術方,攜20餘臺H2、G1系列人形機器人,與河南塔溝武術學校學員同臺,完成全球首次全自主人形機器人叢集武術表演。

節目中實現了3米彈射空翻、單腳連續空翻、蹬牆後空翻、Airflare大回旋七週半、4m/s叢集快速跑位等高難度動作,同時完成揮劍、耍雙節棍、醉拳等武術招式,叢集動作同步誤差小於0.1秒,全程零失誤完成直播演出;同時在義烏分會場以“齊天大聖”造型機器人刷屏全網。

2. 公司核心業務與實力
- 企業基礎:2016年成立,總部位於杭州,國家級專精特新“小巨人”企業,全球足式機器人絕對龍頭,四足機器人全球市佔率超69.75%;2025年人形機器人出貨量超5500臺,位列全球第一。
- 技術壁壘:實現從電機、減速器、控制器、運動控制演算法到具身大模型的全棧自研,核心部件自研率超95%,國產化率超85%,累計擁有180餘項授權專利。
- 商業化落地:產品矩陣覆蓋四足機器人Go/B2系列、人形機器人H/G/R三大系列,售價從3.99萬元到65萬元不等,已落地工業巡檢、電力作業、科研教育、應急救援等場景;2024年營收突破10億元,C輪融資後估值超120億元,已完成IPO輔導,擬登陸科創板。
3. 節目核心技術實現原理
(0)概述
- 硬體底層:主力機型H2全身自由度從19個提升至31個(單臂7個、單腿6個、3自由度腰部、2自由度頸部),動作精度達毫米級;自研內轉子永磁同步電機扭矩密度達180Nm/kg,伺服響應速度0.001秒級,單臂峰值負載達21kg,支撐高爆發武術動作;搭載自研128線鐳射雷達與全新靈巧手,實現武術道具的穩定抓持與快速更換。
- 演算法與叢集控制:採用模型預測控制(MPC)+深度強化學習融合框架,機器人在模擬環境中完成上億次動作迭代,自主習得複雜武術技巧與平衡控制;自研高併發叢集控制系統與AI融合定位演算法,透過3D鐳射雷達每秒上百次掃描舞臺環境,實現無外部定位的全自主協同,攻克長序列表演的運動誤差累計難題;依託5G專網+邊緣計算,將叢集指令傳輸延遲壓縮至毫秒級,保障動作同步性。
- 直播容錯機制:搭載全自主容錯系統,機器人實時監測自身狀態,跑偏後可快速歸位;主控節點故障時0.3秒內切換備用主機,並有備用機器人待命,保障直播零失誤。
《武BOT》節目中,機器人的所有動作可拆解為三大核心技術模組,每個模組都對應著全球性的技術難題,我們逐一拆解:
(1)單機極限武術動作:從“能站穩”到“會打拳”的核心突破
節目裡做了什麼:機器人完成了彈射空翻、Airflare大回旋、雙節棍揮舞、醉拳倒地起身等連專業武術演員都需要長期訓練的動作,甚至在3米彈射落地後,能瞬間調整平衡,無縫銜接下一個武術招式。
核心難點:這類高爆發動作的核心挑戰,是機器人在重心劇烈變化、全身關節高速聯動時,始終保持平衡,同時精準控制每一個動作的力度、角度和節奏——哪怕一個關節的扭矩輸出偏差0.1%,就會導致機器人摔倒、表演失敗。
底層實現原理:
-
硬體底座:“肌肉骨骼”的極致效能
主力機型H2全身自由度從19個提升至31個(單臂7個、單腿6個、3自由度腰部、2自由度頸部),相當於給機器人裝上了能精準控制的“全身關節”;自研內轉子永磁同步電機,扭矩密度達180Nm/kg,伺服響應速度達到0.001秒級,比人類神經反射速度快100倍,單臂峰值負載達21kg,能支撐高爆發的空翻、揮棍動作。
通俗類比:這就像給武術運動員裝上了反應速度快100倍、力量控制精準到克的肌肉,既能爆發出空翻的爆發力,又能精準控制雙節棍的軌跡,不傷到自己和搭檔。
-
演算法核心:“肌肉記憶”的AI訓練
採用模型預測控制(MPC)+深度強化學習的融合框架,這是機器人能完成複雜武術動作的核心。
通俗解釋:團隊先在數字模擬世界裡,給機器人搭建了1:1的虛擬舞臺,讓AI控制的機器人在裡面完成上億次的動作訓練——就像武術運動員在武館裡反覆練習,摔倒了就調整引數重新來,最終讓機器人自主習得複雜武術技巧和平衡控制能力。
其中,MPC演算法相當於“實時教練”,每秒會對上百次機器人的重心、速度、關節狀態進行預判,提前調整每個關節的扭矩輸出,確保機器人在空翻、落地的全過程中,重心始終落在安全區間;而深度強化學習訓練出的“肌肉記憶”,能讓機器人在舞臺地面有輕微打滑、重心出現偏差時,瞬間自主調整動作,就像武術運動員臨場應變一樣。
-
道具操作:“手眼協同”的精準控制
機器人能穩定揮舞雙節棍、長劍,核心在於搭載了自研128線鐳射雷達+視覺相機,配合全新靈巧手,每秒對道具的位置、自身的姿態進行上百次掃描校準,實現道具的穩定抓持與軌跡控制,確保雙節棍的揮舞軌跡精準貼合武術動作設計,不會出現甩飛、節奏錯位的問題。
(2)20餘臺機器人叢集協同:從“單機跳”到“群體演”的全球突破
節目裡做了什麼:20餘臺機器人在沒有外部定位裝置的情況下,完成了4m/s高速跑位、複雜隊形變換、與真人演員的實時對練,全程沒有出現碰撞、跑偏,動作同步誤差小於0.1秒,實現了全球首次全自主人形機器人叢集武術表演。
核心難點:傳統機器人叢集表演,大多依賴舞臺地面的二維碼、外部動捕裝置進行定位,相當於“開了外掛”;而宇樹的機器人全程只靠自身機載感測器,在高速運動、舞臺燈光復雜、真人演員動態移動的環境下,實現精準定位和協同,還要解決長序列表演中,每臺機器人的動作誤差累計問題——一旦一臺機器人慢了0.05秒,整個叢集的表演就會亂套。
底層實現原理:
-
全自主定位:不依賴外掛的“環境感知”
自研AI融合定位演算法,透過機器人自帶的3D鐳射雷達,每秒上百次掃描舞臺環境,實時構建三維地圖,同時匹配預存的舞臺模型,計算出自身在舞臺上的精準位置,定位精度達到毫米級,完全不需要外部動捕、二維碼等輔助裝置。
通俗類比:這就像你蒙著眼睛,但是你腦子裡時刻知道自己在房間裡的位置以及周圍的情況,就能在熟悉的房間裡精準走到指定位置,而且跑步前進也不會撞牆,精度還能達到毫米級。
-
高併發叢集控制:零誤差的“團隊指揮”
自研分散式叢集控制系統,採用“統一時間基準+分散式軌跡規劃”架構:首先透過5G專網+邊緣計算,給所有機器人同步一個精準到微秒級的統一時間軸,確保每臺機器人的動作“在同一個節拍上”,指令傳輸延遲壓縮至毫秒級;
同時,主控系統只給機器人下發“目標位置、動作節拍”的核心指令,每臺機器人自主規劃自己的跑位路徑、動作執行細節,還能實時感知周邊機器人的位置,動態調整自己的路線,避免碰撞;哪怕某臺機器人出現輕微跑偏,也能在0.2秒內自主調整歸位,不影響整個叢集的表演。
-
誤差消除:長序列表演的“防跑偏機制”
團隊針對長序列武術表演,設計了“分段閉環校準”機制:把整個3分鐘的節目,拆解成數十個關鍵動作節點,每完成一個節點的動作,所有機器人都會自動校準自身位置、動作節奏,把累計的誤差清零,確保從節目開頭到結尾,同步精度始終保持在0.1秒以內。
(3)直播零失誤:國家級舞臺的“容錯保障”
節目裡做了什麼:在春晚全球直播的高壓場景下,20餘臺機器人全程零失誤,沒有出現一臺故障、摔倒,完美完成表演。
底層實現原理:
搭載了全自主容錯系統,每臺機器人都會實時監測自身的電機溫度、關節狀態、電池電量、定位精度,一旦出現輕微異常,會自動調整動作引數,優先保障平衡和核心動作執行;如果出現主控節點故障,會在0.3秒內自動切換備用主機,同時舞臺側方還有待命的備用機器人,可在節目間隙無縫替換故障裝置,徹底杜絕直播事故。
4. 國內外技術對比
| 維度 | 核心優勢 | 現存差距 |
|---|---|---|
| 運動效能 | 高動態運動控制能力全球領先,完成了波士頓動力Atlas尚未實現的連續花式翻桌跑酷、叢集協同武術表演等動作,單機極限動作引數躋身全球第一梯隊 | 在工業場景的長期穩定作業能力、複雜非結構化環境的泛化能力上,與波士頓動力、Agility Robotics仍有一定差距 |
| 量產能力 | 2025年出貨量遠超特斯拉Optimus(小批次測試階段)、波士頓動力Atlas(非量產),是全球唯一實現高效能人形機器人萬臺級量產規劃的企業 | - |
| 成本與供應鏈 | 整機成本僅為Atlas的千分之一、Optimus的約1/3,核心部件成本僅為進口產品的1/10,全棧自研供應鏈擺脫海外技術依賴 | - |
| 智慧能力 | - | 具身大模型的通用任務處理能力,相較於特斯拉Optimus的端到端大模型仍有提升空間 |
5. 未來發展方向
- 2026年目標人形機器人出貨量1萬-2萬臺,持續擴大全球市場份額;
- 深化工業巡檢、電力作業、應急救援等B端場景的規模化落地,實現單臺機器人替代3人工作量;
- 持續迭代具身智慧大模型,提升機器人的通用任務處理能力與自主決策能力;
- 推進消費級人形機器人的普及,以低價產品開啟C端市場。
二、魔法原子(MagicLab)
1. 春晚節目表現
作為春晚智慧機器人戰略合作伙伴,魔法原子是本屆春晚首家亮相的機器人企業。主會場歌曲《智造未來》中,攜6臺MagicBot Z1高動態小人形機器人、2臺MagicBot Gen1全尺寸人形機器人,與易烊千璽、陳小春等藝人同臺,完成360°托馬斯迴旋、側空翻、同步舞蹈等高難度動作;宜賓分會場,上百臺MagicDog四足機器人以“熊貓”造型完成全球首次百臺級四足機器人公開舞臺同步演繹;同時在賀歲短片中完成撈麵、送餐等生活化操作。


2. 公司核心業務與實力
- 企業基礎:2024年1月成立,總部無錫,由追覓科技孵化,核心研發人員佔比超70%;成立兩年完成多輪融資,累計融資超5億元,估值達35億元。
- 技術壁壘:核心硬體自研率超90%,覆蓋關節模組、靈巧手、伺服電機、諧波減速器等23類核心部件,自研關節峰值扭矩最高達525N·m,躋身行業第一梯隊;軟體層面打造“原子永珍”具身智慧大模型,採用“大腦+小腦”雙模架構。
- 商業化落地:產品矩陣包括人形機器人MagicBot Gen1/Z1、四足機器人MagicDog系列,覆蓋工業巡檢、商業服務、家庭陪伴、文旅演藝、教育娛樂等場景,已在27個國家建立本地化團隊。
3. 節目核心技術實現原理
魔法原子在春晚的表演,覆蓋了“高動態街舞、百臺級叢集同步、生活化精細操作”三大完全不同的技術方向,我們逐一拆解每個動作的實現邏輯:
(0)概述
- 硬體底層:MagicBot Z1奔跑速度突破4m/s,搭載自研高功率密度關節模組,支撐高動態舞蹈與空翻動作;Gen1全尺寸人形機器人雙臂最大負載達50kg,搭載自研6自由度靈巧手,實現撈麵、端餐等精細操作。
- 叢集控制:採用分散式叢集控制系統,透過時間同步演算法與多智慧體軌跡規劃,實現上百臺四足機器人的毫秒級動作同步,同步誤差小於0.01秒;透過純視覺SLAM定位,實現無外部輔助的自主編隊與動態避障。
- 智慧演算法:“原子永珍”具身大模型採用快慢雙模協同架構,“大腦”負責任務規劃與場景理解,“小腦”負責實時運動控制與平衡調節,透過數百萬條工業場景真實資料訓練,實現任務的自主泛化。
(1)主會場街舞表演:托馬斯全旋與同步舞蹈的技術突破
節目裡做了什麼:6臺MagicBot Z1小人形機器人,與真人藝人同臺完成了360°托馬斯迴旋、側空翻、連續街舞動作,同時與音樂節拍、藝人動作完美同步,轉身、擺臂、重心遷移全程連貫流暢,多機動作同步誤差小於0.01秒。
核心難點:托馬斯全旋這類街舞動作,需要機器人在單臂支撐全身重量的同時,完成腰部、腿部的高速圓周擺動,重心全程在快速變化,對關節的負載能力、扭矩控制精度、平衡調節速度提出了極致要求;同時多機協同舞蹈,需要每臺機器人的每一個動作,都精準貼合音樂節拍,差0.01秒就會出現“搶拍、慢拍”的問題。
底層實現原理:
-
硬體支撐:高功率密度的“關節心臟”
MagicBot Z1搭載了自研的高功率密度一體化關節模組,在小尺寸機身內實現了超高扭矩輸出,奔跑速度突破4m/s,單臂能穩定支撐整機8kg的重量,同時完成高速擺動,這是實現托馬斯全旋的物理基礎。
團隊針對街舞動作的高頻次、高負載特性,最佳化了關節的散熱結構與電流管理策略,確保機器人在連續3分鐘的高動態舞蹈中,不會因為關節過熱觸發保護機制,保證動作全程穩定輸出。
-
平衡控制:動態重心的實時調節
採用零力矩點(ZMP)平衡控制演算法,配合全身力控技術,在托馬斯全旋的全過程中,每秒數百次計算機器人的重心位置、支撐區域,實時調整手臂、腰部、腿部的關節角度和扭矩輸出,確保重心始終落在支撐臂的安全範圍內,不會出現側翻、摔倒的問題。
通俗類比:這就像你單臂撐在地上做圓周擺腿,大腦需要全程感知自己的重心,隨時調整手臂的發力、腰腹的扭轉、腿部的擺動,確保自己不會摔倒——而機器人的“大腦”,每秒能做數百次這樣的調整,精度比人類高上千倍。
-
節拍同步:零誤差的“音樂卡點”
團隊給所有機器人搭建了統一的高精度時間同步系統,以音樂的音訊波形為基準,把每一個舞蹈動作都精準對應到音樂的節拍點上,每臺機器人的動作啟動時間、執行時長,都精準鎖定到毫秒級,確保6臺機器人的動作完全同步,與藝人的表演、音樂的節奏完美契合。
(2)宜賓分會場:百臺熊貓機器狗的叢集表演
節目裡做了什麼:上百臺MagicDog四足機器人,以熊貓造型亮相,在宜賓分會場的城市廣場上,完成了奔跑、列陣、隊形變換、同步舞蹈,甚至實現了自然的歪頭、點頭等擬人化動作,全程動作整齊劃一,沒有出現一臺掉隊、碰撞。
核心難點:百臺級四足機器人的戶外叢集表演,核心挑戰有三個:一是戶外廣場地面不平整、燈光環境複雜,機器人的自主定位難度遠高於室內舞臺;二是百臺機器人的動作同步,需要解決大規模叢集的指令傳輸延遲、誤差累計問題;三是熊貓外皮包裹後,機身散熱空間被壓縮,需要解決高負載連續執行的穩定性問題。
底層實現原理:
-
分散式叢集控制系統:百臺機器人的“統一指揮”
採用“主站+分散式從站”的叢集控制架構,主站系統只負責下發整體的表演序列、隊形變換指令,每臺機器狗自主完成動作執行、路徑規劃、定位校準;透過時間敏感網路(TSN)技術,給所有機器人同步統一的時間基準,確保百臺機器人的動作啟動時間誤差小於0.01秒,實現“整齊劃一”的表演效果。
-
純視覺SLAM定位:戶外場景的精準導航
每臺機器狗都搭載了雙目視覺相機+IMU慣性測量單元,透過純視覺SLAM技術,實時構建戶外場景的三維地圖,匹配自身位置,同時感知周邊其他機器人的位置,動態調整行進路線,避免碰撞;哪怕戶外地面不平整、出現輕微打滑,也能自主調整步態,快速回到預定位置,完成隊形變換。
-
散熱與功率最佳化:外皮包裹下的穩定執行
針對熊貓外皮壓縮散熱空間的問題,團隊最佳化了整機的電流管理與功率控制策略,在不影響動作表現力的前提下,降低了連續運動狀態下的關節發熱量,同時最佳化了機身的散熱結構,確保機器人在長達數分鐘的連續表演中,不會因為過熱觸發保護,穩定完成所有動作。
(3)賀歲短片:撈麵、倒酒的精細操作
節目裡做了什麼:MagicBot Gen1全尺寸人形機器人,在短片中完成了撈麵、端餐、倒酒等生活化操作,麵條撈取、湯汁傾倒的力度控制精準,沒有出現灑漏、麵條斷裂的問題。
核心難點:這類精細操作的核心挑戰,是機器人對柔性物體(麵條)、易碎容器(碗、酒杯)的力控精度——力度太大,會夾斷面條、捏碎杯子;力度太小,會夾不住麵條、端不穩碗;同時還要精準控制傾倒的角度和速度,確保湯汁、酒水不會灑漏。
底層實現原理:
-
6自由度靈巧手:微米級的力控精度
Gen1搭載了自研6自由度靈巧手,指尖搭載了高精度力感測器,力控精度達到0.5N,能精準感知抓取物體的反饋力度,實現“柔性抓取”——撈麵條時,能精準控制指尖的夾持力,既牢牢夾住麵條,又不會把麵條夾斷;端碗時,能根據碗的重量、重心變化,實時調整手臂的姿態,確保碗始終保持水平,湯汁不會灑漏。
-
“大腦+小腦”雙架構:從任務規劃到精準執行
自研的“原子永珍”具身智慧大模型,採用“大腦+小腦”的快慢雙模協同架構:“大腦”負責任務規劃與場景理解,比如接收到“撈麵”的指令後,會自動拆解成“移動到鍋前-張開手-伸入鍋中-夾住麵條-抬起-放入碗中”的分步動作;“小腦”負責實時運動控制與力控調節,在每一步動作執行中,實時調整手臂的位置、指尖的力度,應對面條的柔性變化、碗的重量變化,確保任務精準完成。
4. 國內外技術對比
| 維度 | 核心優勢 | 現存差距 |
|---|---|---|
| 叢集協同 | 多機協同群控能力全球領先,完成全球首次百臺級四足機器人公開舞臺同步表演,分散式控制技術躋身行業第一梯隊 | - |
| 產品價效比 | 依託追覓科技的供應鏈優勢,實現高自研率下的極致成本控制,產品價效比遠超海外同級別產品 | - |
| 落地速度 | 成立僅兩年即實現多場景商業化落地,落地速度行業領先 | 全尺寸人形機器人的長期穩定執行能力、複雜場景的泛化能力,相較於宇樹科技、波士頓動力仍有差距 |
| 智慧能力 | - | 具身大模型的訓練資料量與通用能力,相較於銀河通用、特斯拉仍有提升空間 |
5. 未來發展方向
- 2026年工業場景計劃千臺級規模部署,在追覓工廠等場景落地物料搬運、點膠檢測等工序;
- 加速無人咖啡、無人藥房等零售解決方案的推廣,目標1-2年覆蓋全球10000家門店;
- 推進四足機器人導盲犬專案“光引001”的落地,切入助殘普惠場景;
- 持續拓展海外市場,提升全球化營收佔比。
三、松延動力(Noetix Robotics)
1. 春晚節目表現
作為春晚仿生人形機器人獨家合作伙伴,松延動力攜5款機器人參演小品《奶奶的最愛》,成為首個登上春晚語言類節目的機器人企業。其中1:1復刻蔡明的仿生機器人,以近乎真人的面部神態、口型同步、微表情動作,與真人演員完成對戲;同時4臺雙足人形機器人完成端茶、互動等生活化動作。

2. 公司核心業務與實力
- 企業基礎:2023年9月成立,總部北京,創始團隊來自清華、浙大;2025年一年內完成5輪融資,估值約20億元。
- 技術壁壘:核心技術覆蓋仿生人臉驅動、多模態互動大模型、雙足運動控制,是國內少數實現仿生人形機器人批次生產的企業;自研D2P數字人對映技術,實現虛擬數字人到實體機器人的精準對映。
- 商業化落地:構建了N系列、E系列、輪式機器人W1、“小布米”系列的產品矩陣;旗下萬元級消費級雙足機器人“小布米”(定價9998元),2025年10月發售即斬獲數千臺訂單,是全球首款萬元級消費級雙足人形機器人,產品已落地商業導覽、教育科研、家庭陪伴等場景。
3. 節目核心技術實現原理
松延動力在小品中的表演,核心分為兩大技術方向,也是仿生人形機器人最核心的兩個難題:“長得像、演得真”的仿生互動,以及**“走得穩、做得準”的生活化動作**,我們逐一拆解:
(0)概述
- 仿生人臉核心技術:透過鉑金矽膠新增高分子材料,提升面部拉伸自然度與耐久性;採用高緊湊型驅動設計,在仿生人臉內部整合32-40個微型電機,實現表情、口型、眼神的精準控制;自研D2P數字人對映技術,將虛擬數字人的表情、口型資料,實時對映到真實機器人的電機轉角上,實現語音與口型的1:1同步。
- 多模態互動:自研多模態互動大模型,實現語音、表情、眼神、肢體動作的協同表達,比如對話時的呼吸起伏、頸部與手臂的配合動作,大幅提升擬人互動體驗。
- 運動控制:自研雙足運動控制演算法,實現機器人在家庭場景的穩定行走、端茶、攙扶等高精度動作,適配非結構化的家庭環境。
(1)蔡明仿生機器人:真人級復刻與實時對戲的核心技術
節目裡做了什麼:1:1復刻蔡明老師的仿生機器人,在小品中與真人演員完成實時對戲,說話時口型與臺詞完全同步,同時配合臺詞做出眨眼、微笑、撇嘴、頭部微動作等真人級微表情,甚至能根據對手演員的臺詞,實時做出對應的神態反饋,模擬度極高,在後臺被多位演員誤認成真人。
核心難點:語言類節目對仿生機器人的要求,遠高於歌舞表演——不僅要“長得像”,更要“演得真”:口型要與臺詞1:1同步,差一幀就會出現“對口型穿幫”;微表情要貼合人物情緒,僵硬一點就會顯得很“假”;同時還要在狹小的人臉空間內,放下足夠多的驅動電機,還要保證上鏡效果,團隊甚至需要把仿生人頭整體縮小30%,對結構設計提出了極致挑戰。
底層實現原理:
-
仿生人臉硬體:真人級的“皮膚與肌肉”
首先在外觀上,團隊透過3D掃描,1:1復刻了蔡明老師的面部輪廓、五官細節,採用新增了高分子材料的鉑金矽膠製作仿生皮膚,不僅在視覺上無限接近真人皮膚的質感,還提升了皮膚的拉伸自然度與耐久性,在做出表情時,皮膚的拉伸、褶皺都與真人完全一致,不會出現“塑膠感”。
最核心的突破,是高緊湊型驅動設計:團隊在縮小30%的仿生人臉內部,整合了32個微型驅動電機,分別對應人臉的眉、眼、口、鼻等核心表情區域,相當於給機器人裝上了“人工面部肌肉”,每個電機都能精準控制對應區域的皮膚位移,實現微笑、撇嘴、眨眼、抬眉等數十種真人微表情,最小動作幅度可達0.1毫米,完全還原真人的面部神態。
-
D2P數字人對映技術:口型與表情的1:1同步
這是實現真人級對戲的核心技術,自研的D2P(數字人到物理人)對映技術,能把虛擬數字人的表情、口型資料,實時、精準地對映到實體機器人的電機上。
通俗解釋:團隊先提前採集了蔡明老師說臺詞時的面部動作、口型變化資料,製作了1:1的虛擬數字人;當機器人需要說臺詞時,系統會先把語音臺詞轉化為虛擬數字人的口型、表情動作,再透過D2P技術,把這些動作轉化為32個微型電機的轉動角度、速度指令,實時驅動電機動作,最終實現語音與口型的1:1同步,表情與臺詞情緒的完美契合,哪怕是臺詞裡的氣口、重音,都能對應到口型的細微變化上。
-
多模態互動大模型:實時對戲的“靈性反饋”
自研多模態互動大模型,能實時識別對手演員的臺詞、語氣、甚至面部表情,快速理解對話語境,輸出對應的臺詞、表情和肢體動作;同時還能實現語音、表情、眼神、肢體動作的協同表達,比如說話時配合自然的頭部轉動、呼吸起伏,甚至是說話間隙的眼神互動,完全還原真人對話的狀態,徹底擺脫了傳統機器人“念臺詞”的僵硬感。
(2)“小布米”雙足機器人:家庭場景的生活化動作
節目裡做了什麼:4臺“小布米”消費級雙足機器人,在小品中完成了穩定行走、端茶、敬禮、與演員互動揮手等動作,在客廳的非結構化環境中,全程行走穩定,端茶時沒有出現灑漏,動作流暢自然。
核心難點:消費級雙足機器人,受限於成本和尺寸,硬體效能無法和工業級大機型相比,要在家庭的瓷磚、地毯等不同地面上,實現穩定行走,還要完成端茶等精細操作,對演算法的輕量化、平衡控制能力提出了極高要求。
底層實現原理:
-
輕量化雙足運動控制演算法:小機身的穩定行走
“小布米”身高94釐米,體重僅12公斤,全身21個自由度,團隊針對小尺寸雙足機器人,自研了輕量化的模型預測控制演算法,能在算力有限的主控晶片上,實現每秒上百次的步態規劃與平衡調節,在瓷磚、地毯等不同地面上,都能自主調整步幅、步速和關節角度,實現穩定行走,哪怕被輕微觸碰,也能快速調整重心,不會摔倒。
-
力控抓取:端茶不灑的精細操作
機器人的手部搭載了微型力感測器,端茶時,能精準控制夾持杯子的力度,既牢牢握住杯子,又不會捏碎紙杯;同時在行走過程中,手臂會實時調整姿態,抵消行走帶來的晃動,確保杯子始終保持水平,杯裡的水不會灑漏,完美適配家庭場景的服務需求。
4. 國內外技術對比
| 維度 | 核心優勢 | 現存差距 |
|---|---|---|
| 仿生互動 | 仿生人臉的高整合度驅動技術、多模態情感互動能力處於國內第一梯隊,打破了海外企業在高階仿生機器人領域的壟斷 | 高動態運動控制能力,相較於宇樹科技、波士頓動力有明顯差距 |
| 消費級普及 | 率先實現消費級雙足機器人的萬元級定價,開啟了C端市場的普及路徑,差異化避開工業賽道紅海競爭,商業化落地速度領先 | 工業場景的落地能力與技術積累,弱於銀河通用、魔法原子 |
| 量產能力 | 實現了仿生人形機器人的批次生產,量產能力遠超海外同型別高階仿生產品 | - |
5. 未來發展方向
- 持續深化仿生人形機器人的技術迭代,推動產品在商業導覽、康養陪護場景的規模化落地;
- 推進消費級機器人“小布米”的量產與普及,拓展教育娛樂、家庭陪伴C端市場;
- 深化與高校、科研院所的合作,推動人形機器人教學平臺的落地;
- 持續最佳化成本,推動人形機器人進入普通家庭。
四、銀河通用(GALBOT)
1. 春晚節目表現
作為春晚指定具身大模型機器人,銀河通用在賀歲微電影《我最難忘的今宵》中,攜Galbot G1輪式雙臂機器人亮相,與沈騰、馬麗搭檔,完成盤核桃、撿玻璃碎片、疊衣服、貨架取物、串烤腸等生活化任務,實現了春晚舞臺首次無預設指令碼的機器人自主決策作業,無需提前程式設計,即可根據場景實時完成任務規劃與執行。
2. 公司核心業務與實力
- 企業基礎:2023年5月成立,總部北京,由北大王鶴博士、前ABB高管姚騰洲聯合創立,核心成員來自華為天才少年計劃、百度、微軟等企業;2025年12月完成超3億美元融資,估值達30億美元。
- 技術壁壘:國內極少數實現“百億資料集—具身大模型—機器人本體—場景規模化落地”全鏈條閉環的企業;自研“銀河星腦AstraBrain”具身大模型體系,首創虛實結合的訓練正規化,構建了百億級機器人幹活資料集,是全球具身機器人大模型資料量最大的公司之一。
- 商業化落地:產品主打Galbot系列輪式雙臂通用機器人,採用“輪式底盤+摺疊腿”複合結構,已實現千臺級規模化落地,覆蓋工業製造、智慧零售、醫療康養、城市服務等六大領域,合作客戶包括寧德時代、德國博世、豐田汽車、北汽、宣武醫院等龍頭企業,2025年工業訂單突破千臺,創下具身智慧領域商業化訂單紀錄。
3. 節目核心技術實現原理(通俗專業版)
銀河通用的表演,和其他三家企業最大的區別,是完全沒有預設的固定指令碼——其他機器人的表演,哪怕動作再複雜,也是提前編排好的固定程式;而銀河通用的機器人,是根據現場場景和任務指令,自主思考、自主規劃、自主執行,這也是具身智慧最核心的能力。我們以節目中幾個典型任務為例,拆解其底層實現原理:
概述
- 具身大模型核心:首創“合成模擬資料為主、真機採集資料為輔”的虛實結合訓練管線,解決了全球機器人幹活資料匱乏的行業難題;自研GraspVLA、GroceryVLA、NavFoM等端到端具身大模型,對透明、高光、不規則物體的抓取成功率穩定在95%以上,實現了任務的自主規劃、動態避障、長程導航。
- 硬體架構:採用“輪式底盤+摺疊腿+雙臂”的複合結構,兼顧高速移動與越障能力,身高173cm、臂展190cm、升降行程65cm,雙臂最大負載達50kg,搭載自研6自由度靈巧手,實現毫米級精細操作。
- 一體化控制系統:採用“大腦-小腦-神經控制”一體化系統,“大腦”(具身大模型)負責場景理解與任務規劃,“小腦”負責運動控制與平衡調節,“神經控制”負責關節的實時伺服響應,實現端到端的任務執行,無需預設指令碼。
核心任務邏輯:無指令碼自主作業的全鏈路流程
不管是盤核桃、撿玻璃碎片,還是疊衣服、串烤腸,機器人執行所有任務,都遵循著**“感知-決策-執行-反饋最佳化”**的端到端全鏈路,這也是它能實現無指令碼作業的核心,我們逐層拆解:
第一步:感知——“看懂”眼前的場景和物體
節目裡的挑戰:機器人需要識別出核桃、玻璃碎片、衣服、烤腸、籤子等完全不同的物體,尤其是透明的玻璃碎片,在淺色桌面上幾乎“隱形”,傳統視覺系統很容易識別失敗;同時還要適應舞臺複雜的燈光變化,準確判斷每個物體的位置、形狀、大小、材質。
底層實現原理:
- 機器人搭載了多模態感知系統,包括雙目深度相機、鐳射雷達、觸覺感測器,能同時獲取場景的視覺、深度、觸覺資訊;
- 自研的視覺大模型,在訓練階段見過了數十億張真實場景圖片,能精準識別上萬種日常物體,哪怕是形狀不規則的碎玻璃、褶皺的衣服,也能快速識別並分割出物體輪廓;
- 針對透明物體識別的行業難題,團隊透過模擬環境生成了海量的透明物體資料——不同厚度、不同碎裂形狀、不同光照條件下的玻璃碎片,讓機器人在虛擬世界中“見過”各種可能的透明形態,理解了透明物體的反光、折射規律,最終實現對玻璃碎片的識別成功率穩定在99%以上,哪怕是隻有幾毫米的玻璃渣,也能精準定位。
第二步:決策——“想清楚”任務該怎麼做
節目裡的挑戰:比如“撿玻璃碎片”這個任務,沒有提前程式設計告訴機器人“先撿大的、再撿小的,用夾子夾,放到垃圾桶裡”,機器人需要自主理解任務目標,把大任務拆解成可執行的小步驟,還要應對突發情況——比如玻璃碎片滾到了桌子底下,要自主規劃路線,調整手臂姿態去撿。
底層實現原理:
-
核心是自研的“銀河星腦AstraBrain”具身大模型,它就像機器人的“大腦”,透過百億級的機器人運算元據訓練,已經學會了上千種日常任務的執行邏輯,能根據任務指令,自主拆解動作步驟。
通俗類比:就像你讓一個人“把地上的玻璃碎片撿乾淨”,他不用你一步步教,就會自己去找垃圾桶、拿工具,先撿大塊再撿小塊,還會注意不被劃傷——銀河通用的具身大模型,就是讓機器人具備了這樣的自主思考能力。
-
針對春晚的場景,團隊還對大模型進行了輕量化微調,讓它能快速適配舞臺場景,針對不同任務快速輸出最優的動作規劃,同時具備容錯能力——如果第一次撿玻璃沒夾住,會自主調整夾子的開合角度、夾持位置,重新嘗試,直到任務完成。
第三步:執行——“精準完成”精細操作
節目裡的挑戰:不同任務對操作的要求完全不同:盤核桃需要雙手配合,力度既要足夠轉動核桃,又不能捏碎;串烤腸需要精準把烤腸穿到籤子上,偏差1毫米就會穿歪;疊衣服需要抓住衣服的邊角,精準完成摺疊動作,這些都對機器人的動作精度、力控能力提出了極高要求。
底層實現原理:
-
硬體基礎:靈活又精準的“手臂和手”
Galbot G1採用“輪式底盤+摺疊腿+雙臂”的複合結構,雙臂最大負載達50kg,重複定位精度可達±0.02毫米,比頭髮絲還細;搭載自研6自由度靈巧手,指尖配備高精度力感測器,力控精度可達0.3N,既能實現串烤腸的毫米級精準定位,又能實現盤核桃、疊衣服的柔性力控。
-
“大腦-小腦-神經”一體化控制系統
採用三級控制架構,實現端到端的精準執行:“大腦”(具身大模型)輸出任務規劃和動作指令;“小腦”(運動控制演算法)負責把指令拆解成每個關節的轉動角度、扭矩引數,實時調節手臂的運動軌跡和力度;“神經控制”(伺服系統)負責0.001秒級的實時響應,確保每個關節都精準執行指令,最終實現任務的完美執行。
-
虛實結合的訓練正規化:讓機器人提前“練會”所有動作
團隊首創“合成模擬資料為主、真機採集資料為輔”的訓練管線,解決了全球機器人幹活資料匱乏的行業難題。通俗解釋:在數字模擬世界裡,生成了數百萬種不同大小、材質、形狀的虛擬物體,還有各種不同的場景,讓機器人在虛擬世界裡完成上千億次的操作訓練,練出了一套適應性極強的“通用操作能力”;再用少量真實世界的資料做微調,就能讓機器人在真實場景裡,輕鬆完成各種沒見過的任務,這也是它能在春晚舞臺上,無指令碼完成多種生活化任務的核心原因。
4. 國內外技術對比
| 維度 | 核心優勢 | 現存差距 |
|---|---|---|
| 場景落地 | 具身大模型的場景落地能力全球領先,實現了全球首個百臺級機器人7×24小時自主運營的零售店,工業、零售場景的規模化落地能力,遠超特斯拉Optimus、波士頓動力等海外企業 | 雙足人形機器人的高動態運動控制能力,相較於宇樹科技、波士頓動力有差距 |
| 技術創新 | 首創的虛實結合訓練正規化,解決了全球機器人幹活資料匱乏的行業難題,具身大模型的操作泛化能力躋身全球第一梯隊 | 消費級市場的佈局與產品,相較於松延動力較為滯後 |
| 工業能力 | 輪式雙臂機器人的過載操作、精細操作能力處於行業第一梯隊,已獲得頭部製造企業的千臺級訂單,商業化落地規模全球領先 | - |
5. 未來發展方向
-
2026年加大“銀河太空艙”無人零售解決方案在全國的推廣力度,實現千店級規模部署;
-
深化與寧德時代、博世等工業客戶的合作,擴大工業場景的千臺級部署規模;
-
持續迭代具身大模型,提升機器人的通用任務泛化能力,拓展醫療康養、城市服務等場景;
-
推進IPO程序,提升資本市場影響力,鞏固具身智慧領域的龍頭地位。

整體總結
2026年春晚的機器人表演,並非單純的舞臺炫技,而是中國人形機器人產業的一次國家級路演。四家企業分別在高動態運動控制、多機叢集協同、仿生情感互動、具身智慧落地四大核心方向,展現了中國在人形機器人領域從跟跑到並跑、部分領域領跑的產業格局。
相較於海外企業聚焦實驗室引數、軍事場景、長期測試的技術路線,中國企業更注重場景落地、成本控制、規模化量產,形成了差異化的競爭優勢,推動人形機器人從實驗室走向工業、商業、家庭等真實場景,2026年也被業內視為人形機器人規模化應用的元年。
From the Spring Festival Gala to Global Arenas: How Far Have Chinese Humanoid Robots Come?
2026 Spring Festival Gala review of four Chinese humanoid makers—Unitree, MagicLab, Noetix, Galbot—performances, tech stacks, swarm/bionic/embodied AI, vs global peers and commercialization.
Captured at (local ISO): 2026-05-18 05:17:38
Preface
The 2026 CCTV Spring Festival Gala set a record for robot participation: Unitree, MagicLab, Noetix (Songyan Power), and Galbot brought 200+ humanoids into four flagship segments—martial arts, comedy sketch, song-and-dance, and micro-film—showing how far China’s humanoid industry has come in tech and commercial deployment. Below is a company-by-company breakdown.
I. Unitree Robotics
1. Spring Festival Gala performance
As a three-time Gala veteran,宇树科技是武术节目《武BOT》的核心技术方,携20余台H2、G1系列人形机器人,与河南塔沟武术学校学员同台,完成全球首次全自主人形机器人集群武术表演。

节目中实现了3米弹射空翻、单脚连续空翻、蹬墙后空翻、Airflare大回旋七周半、4m/s集群快速跑位等高难度动作,同时完成挥剑、耍双节棍、醉拳等武术招式,集群动作同步误差小于0.1秒,全程零失误完成直播演出;同时在义乌分会场以“齐天大圣”造型机器人刷屏全网。

2. Core business and strengths
- 企业基础:2016年成立,总部位于杭州,国家级专精特新“小巨人”企业,全球足式机器人绝对龙头,四足机器人全球市占率超69.75%;2025年人形机器人出货量超5500台,位列全球第一。
- 技术壁垒:实现从电机、减速器、控制器、运动控制算法到具身大模型的全栈自研,核心部件自研率超95%,国产化率超85%,累计拥有180余项授权专利。
- 商业化落地:产品矩阵覆盖四足机器人Go/B2系列、人形机器人H/G/R三大系列,售价从3.99万元到65万元不等,已落地工业巡检、电力作业、科研教育、应急救援等场景;2024年营收突破10亿元,C轮融资后估值超120亿元,已完成IPO辅导,拟登陆科创板。
3. Core technical implementation
(0) Overview
- 硬件底层:主力机型H2全身自由度从19个提升至31个(单臂7个、单腿6个、3自由度腰部、2自由度颈部),动作精度达毫米级;自研内转子永磁同步电机扭矩密度达180Nm/kg,伺服响应速度0.001秒级,单臂峰值负载达21kg,支撑高爆发武术动作;搭载自研128线激光雷达与全新灵巧手,实现武术道具的稳定抓持与快速更换。
- 算法与集群控制:采用模型预测控制(MPC)+深度强化学习融合框架,机器人在仿真环境中完成上亿次动作迭代,自主习得复杂武术技巧与平衡控制;自研高并发集群控制系统与AI融合定位算法,通过3D激光雷达每秒上百次扫描舞台环境,实现无外部定位的全自主协同,攻克长序列表演的运动误差累计难题;依托5G专网+边缘计算,将集群指令传输延迟压缩至毫秒级,保障动作同步性。
- 直播容错机制:搭载全自主容错系统,机器人实时监测自身状态,跑偏后可快速归位;主控节点故障时0.3秒内切换备用主机,并有备用机器人待命,保障直播零失误。
《武BOT》节目中,机器人的所有动作可拆解为三大核心技术模块,每个模块都对应着全球性的技术难题,我们逐一拆解:
(1) Extreme single-robot martial arts:从“能站稳”到“会打拳”的核心突破
What happened on stage:机器人完成了弹射空翻、Airflare大回旋、双节棍挥舞、醉拳倒地起身等连专业武术演员都需要长期训练的动作,甚至在3米弹射落地后,能瞬间调整平衡,无缝衔接下一个武术招式。
Core challenge:这类高爆发动作的核心挑战,是机器人在重心剧烈变化、全身关节高速联动时,始终保持平衡,同时精准控制每一个动作的力度、角度和节奏——哪怕一个关节的扭矩Output偏差0.1%,就会导致机器人摔倒、表演失败。
How it works:
-
硬件底座:“肌肉骨骼”的极致性能
主力机型H2全身自由度从19个提升至31个(单臂7个、单腿6个、3自由度腰部、2自由度颈部),相当于给机器人装上了能精准控制的“全身关节”;自研内转子永磁同步电机,扭矩密度达180Nm/kg,伺服响应速度达到0.001秒级,比人类神经反射速度快100倍,单臂峰值负载达21kg,能支撑高爆发的空翻、挥棍动作。
Analogy:这就像给武术运动员装上了反应速度快100倍、力量控制精准到克的肌肉,既能爆发出空翻的爆发力,又能精准控制双节棍的轨迹,不伤到自己和搭档。
-
算法核心:“肌肉记忆”的AI训练
采用模型预测控制(MPC)+深度强化学习的融合框架,这是机器人能完成复杂武术动作的核心。
In plain terms:团队先在数字仿真世界里,给机器人搭建了1:1的虚拟舞台,让AI控制的机器人在里面完成上亿次的动作训练——就像武术运动员在武馆里反复练习,摔倒了就调整参数重新来,最终让机器人自主习得复杂武术技巧和平衡控制能力。
其中,MPC算法相当于“实时教练”,每秒会对上百次机器人的重心、速度、关节状态进行预判,提前调整每个关节的扭矩Output,确保机器人在空翻、落地的全过程中,重心始终落在安全区间;而深度强化学习训练出的“肌肉记忆”,能让机器人在舞台地面有轻微打滑、重心出现偏差时,瞬间自主调整动作,就像武术运动员临场应变一样。
-
道具操作:“手眼协同”的精准控制
机器人能稳定挥舞双节棍、长剑,核心在于搭载了自研128线激光雷达+视觉相机,配合全新灵巧手,每秒对道具的位置、自身的姿态进行上百次扫描校准,实现道具的稳定抓持与轨迹控制,确保双节棍的挥舞轨迹精准贴合武术动作设计,不会出现甩飞、节奏错位的问题。
(2) Swarm coordination (20+ robots):从“单机跳”到“群体演”的全球突破
What happened on stage:20余台机器人在没有外部定位设备的情况下,完成了4m/s高速跑位、复杂队形变换、与真人演员的实时对练,全程没有出现碰撞、跑偏,动作同步误差小于0.1秒,实现了全球首次全自主人形机器人集群武术表演。
Core challenge:传统机器人集群表演,大多依赖舞台地面的二维码、外部动捕设备进行定位,相当于“开了外挂”;而宇树的机器人全程只靠自身机载传感器,在高速运动、舞台灯光复杂、真人演员动态移动的环境下,实现精准定位和协同,还要解决长序列表演中,每台机器人的动作误差累计问题——一旦一台机器人慢了0.05秒,整个集群的表演就会乱套。
How it works:
-
全自主定位:不依赖外挂的“环境感知”
自研AI融合定位算法,通过机器人自带的3D激光雷达,每秒上百次扫描舞台环境,实时构建三维地图,同时匹配预存的舞台模型,计算出自身在舞台上的精准位置,定位精度达到毫米级,完全不需要外部动捕、二维码等辅助设备。
Analogy:这就像你蒙着眼睛,但是你脑子里时刻知道自己在房间里的位置以及周围的情况,就能在熟悉的房间里精准走到指定位置,而且跑步前进也不会撞墙,精度还能达到毫米级。
-
高并发集群控制:零误差的“团队指挥”
自研分布式集群控制系统,采用“统一时间基准+分布式轨迹规划”架构:首先通过5G专网+边缘计算,给所有机器人同步一个精准到微秒级的统一时间轴,确保每台机器人的动作“在同一个节拍上”,指令传输延迟压缩至毫秒级;
同时,主控系统只给机器人下发“目标位置、动作节拍”的核心指令,每台机器人自主规划自己的跑位路径、动作执行细节,还能实时感知周边机器人的位置,动态调整自己的路线,避免碰撞;哪怕某台机器人出现轻微跑偏,也能在0.2秒内自主调整归位,不影响整个集群的表演。
-
误差消除:长序列表演的“防跑偏机制”
团队针对长序列武术表演,设计了“分段闭环校准”机制:把整个3分钟的节目,拆解成数十个关键动作节点,每完成一个节点的动作,所有机器人都会自动校准自身位置、动作节奏,把累计的误差清零,确保从节目开头到结尾,同步精度始终保持在0.1秒以内。
(3) Zero-failure live broadcast:国家级舞台的“容错保障”
What happened on stage:在春晚全球直播的高压场景下,20余台机器人全程零失误,没有出现一台故障、摔倒,完美完成表演。
How it works:
搭载了全自主容错系统,每台机器人都会实时监测自身的电机温度、关节状态、电池电量、定位精度,一旦出现轻微异常,会自动调整动作参数,优先保障平衡和核心动作执行;如果出现主控节点故障,会在0.3秒内自动切换备用主机,同时舞台侧方还有待命的备用机器人,可在节目间隙无缝替换故障设备,彻底杜绝直播事故。
4. Domestic vs. global comparison
| Dimension | Strengths | Gaps |
|---|---|---|
| Motion performance | 高动态运动控制能力全球领先,完成了波士顿动力Atlas尚未实现的连续花式翻桌跑酷、集群协同武术表演等动作,单机极限动作参数跻身全球第一梯队 | 在工业场景的长期稳定作业能力、复杂非结构化环境的泛化能力上,与波士顿动力、Agility Robotics仍有一定差距 |
| Mass production | 2025年出货量远超特斯拉Optimus(小批量测试阶段)、波士顿动力Atlas(非量产),是全球唯一实现高性能人形机器人万台级量产规划的企业 | - |
| Cost & supply chain | 整机成本仅为Atlas的千分之一、Optimus的约1/3,核心部件成本仅为进口产品的1/10,全栈自研供应链摆脱海外技术依赖 | - |
| Intelligence | - | 具身大模型的通用任务处理能力,相较于特斯拉Optimus的端到端大模型仍有提升空间 |
5. Future direction
- 2026年目标人形机器人出货量1万-2万台,持续扩大全球市场份额;
- 深化工业巡检、电力作业、应急救援等B端场景的规模化落地,实现单台机器人替代3人工作量;
- 持续迭代具身智能大模型,提升机器人的通用任务处理能力与自主决策能力;
- 推进消费级人形机器人的普及,以低价产品打开C端市场。
II. MagicLab
1. Spring Festival Gala performance
作为春晚智能机器人战略合作伙伴,魔法原子是本届春晚首家亮相的机器人企业。主会场歌曲《智造未来》中,携6台MagicBot Z1高动态小人形机器人、2台MagicBot Gen1全尺寸人形机器人,与易烊千玺、陈小春等艺人同台,完成360°托马斯回旋、侧空翻、同步舞蹈等高难度动作;宜宾分会场,上百台MagicDog四足机器人以“熊猫”造型完成全球首次百台级四足机器人公开舞台同步演绎;同时在贺岁短片中完成捞面、送餐等生活化操作。


2. Core business and strengths
- 企业基础:2024年1月成立,总部无锡,由追觅科技孵化,核心研发人员占比超70%;成立两年完成多轮融资,累计融资超5亿元,估值达35亿元。
- 技术壁垒:核心硬件自研率超90%,覆盖关节模组、灵巧手、伺服电机、谐波减速器等23类核心部件,自研关节峰值扭矩最高达525N·m,跻身行业第一梯队;软件层面打造“原子万象”具身智能大模型,采用“大脑+小脑”双模架构。
- 商业化落地:产品矩阵包括人形机器人MagicBot Gen1/Z1、四足机器人MagicDog系列,覆盖工业巡检、商业服务、家庭陪伴、文旅演艺、教育娱乐等场景,已在27个国家建立本地化团队。
3. Core technical implementation
魔法原子在春晚的表演,覆盖了“高动态街舞、百台级集群同步、生活化精细操作”三大完全不同的技术方向,我们逐一拆解每个动作的实现逻辑:
(0) Overview
- 硬件底层:MagicBot Z1奔跑速度突破4m/s,搭载自研高功率密度关节模组,支撑高动态舞蹈与空翻动作;Gen1全尺寸人形机器人双臂最大负载达50kg,搭载自研6自由度灵巧手,实现捞面、端餐等精细操作。
- 集群控制:采用分布式集群控制系统,通过时间同步算法与多智能体轨迹规划,实现上百台四足机器人的毫秒级动作同步,同步误差小于0.01秒;通过纯视觉SLAM定位,实现无外部辅助的自主编队与动态避障。
- 智能算法:“原子万象”具身大模型采用快慢双模协同架构,“大脑”负责任务规划与场景理解,“小脑”负责实时运动控制与平衡调节,通过数百万条工业场景真实数据训练,实现任务的自主泛化。
(1)主会场街舞表演:托马斯全旋与同步舞蹈的技术突破
What happened on stage:6台MagicBot Z1小人形机器人,与真人艺人同台完成了360°托马斯回旋、侧空翻、连续街舞动作,同时与音乐节拍、艺人动作完美同步,转身、摆臂、重心迁移全程连贯流畅,多机动作同步误差小于0.01秒。
Core challenge:托马斯全旋这类街舞动作,需要机器人在单臂支撑全身重量的同时,完成腰部、腿部的高速圆周摆动,重心全程在快速变化,对关节的负载能力、扭矩控制精度、平衡调节速度提出了极致要求;同时多机协同舞蹈,需要每台机器人的每一个动作,都精准贴合音乐节拍,差0.01秒就会出现“抢拍、慢拍”的问题。
How it works:
-
硬件支撑:高功率密度的“关节心脏”
MagicBot Z1搭载了自研的高功率密度一体化关节模组,在小尺寸机身内实现了超高扭矩Output,奔跑速度突破4m/s,单臂能稳定支撑整机8kg的重量,同时完成高速摆动,这是实现托马斯全旋的物理基础。
团队针对街舞动作的高频次、高负载特性,优化了关节的散热结构与电流管理策略,确保机器人在连续3分钟的高动态舞蹈中,不会因为关节过热触发保护机制,保证动作全程稳定Output。
-
平衡控制:动态重心的实时调节
采用零力矩点(ZMP)平衡控制算法,配合全身力控技术,在托马斯全旋的全过程中,每秒数百次计算机器人的重心位置、支撑区域,实时调整手臂、腰部、腿部的关节角度和扭矩Output,确保重心始终落在支撑臂的安全范围内,不会出现侧翻、摔倒的问题。
Analogy:这就像你单臂撑在地上做圆周摆腿,大脑需要全程感知自己的重心,随时调整手臂的发力、腰腹的扭转、腿部的摆动,确保自己不会摔倒——而机器人的“大脑”,每秒能做数百次这样的调整,精度比人类高上千倍。
-
节拍同步:零误差的“音乐卡点”
团队给所有机器人搭建了统一的高精度时间同步系统,以音乐的音频波形为基准,把每一个舞蹈动作都精准对应到音乐的节拍点上,每台机器人的动作启动时间、执行时长,都精准锁定到毫秒级,确保6台机器人的动作完全同步,与艺人的表演、音乐的节奏完美契合。
(2)宜宾分会场:百台熊猫机器狗的集群表演
What happened on stage:上百台MagicDog四足机器人,以熊猫造型亮相,在宜宾分会场的城市广场上,完成了奔跑、列阵、队形变换、同步舞蹈,甚至实现了自然的歪头、点头等拟人化动作,全程动作整齐划一,没有出现一台掉队、碰撞。
Core challenge:百台级四足机器人的户外集群表演,核心挑战有三个:一是户外广场地面不平整、灯光环境复杂,机器人的自主定位难度远高于室内舞台;二是百台机器人的动作同步,需要解决大规模集群的指令传输延迟、误差累计问题;三是熊猫外皮包裹后,机身散热空间被压缩,需要解决高负载连续运行的稳定性问题。
How it works:
-
分布式集群控制系统:百台机器人的“统一指挥”
采用“主站+分布式从站”的集群控制架构,主站系统只负责下发整体的表演序列、队形变换指令,每台机器狗自主完成动作执行、路径规划、定位校准;通过时间敏感网络(TSN)技术,给所有机器人同步统一的时间基准,确保百台机器人的动作启动时间误差小于0.01秒,实现“整齐划一”的表演效果。
-
纯视觉SLAM定位:户外场景的精准导航
每台机器狗都搭载了双目视觉相机+IMU惯性测量单元,通过纯视觉SLAM技术,实时构建户外场景的三维地图,匹配自身位置,同时感知周边其他机器人的位置,动态调整行进路线,避免碰撞;哪怕户外地面不平整、出现轻微打滑,也能自主调整步态,快速回到预定位置,完成队形变换。
-
散热与功率优化:外皮包裹下的稳定运行
针对熊猫外皮压缩散热空间的问题,团队优化了整机的电流管理与功率控制策略,在不影响动作表现力的前提下,降低了连续运动状态下的关节发热量,同时优化了机身的散热结构,确保机器人在长达数分钟的连续表演中,不会因为过热触发保护,稳定完成所有动作。
(3)贺岁短片:捞面、倒酒的精细操作
What happened on stage:MagicBot Gen1全尺寸人形机器人,在短片中完成了捞面、端餐、倒酒等生活化操作,面条捞取、汤汁倾倒的力度控制精准,没有出现洒漏、面条断裂的问题。
Core challenge:这类精细操作的核心挑战,是机器人对柔性物体(面条)、易碎容器(碗、酒杯)的力控精度——力度太大,会夹断面条、捏碎杯子;力度太小,会夹不住面条、端不稳碗;同时还要精准控制倾倒的角度和速度,确保汤汁、酒水不会洒漏。
How it works:
-
6自由度灵巧手:微米级的力控精度
Gen1搭载了自研6自由度灵巧手,指尖搭载了高精度力传感器,力控精度达到0.5N,能精准感知抓取物体的反馈力度,实现“柔性抓取”——捞面条时,能精准控制指尖的夹持力,既牢牢夹住面条,又不会把面条夹断;端碗时,能根据碗的重量、重心变化,实时调整手臂的姿态,确保碗始终保持水平,汤汁不会洒漏。
-
“大脑+小脑”双架构:从任务规划到精准执行
自研的“原子万象”具身智能大模型,采用“大脑+小脑”的快慢双模协同架构:“大脑”负责任务规划与场景理解,比如接收到“捞面”的指令后,会自动拆解成“移动到锅前-张开手-伸入锅中-夹住面条-抬起-放入碗中”的分步动作;“小脑”负责实时运动控制与力控调节,在每一步动作执行中,实时调整手臂的位置、指尖的力度,应对面条的柔性变化、碗的重量变化,确保任务精准完成。
4. Domestic vs. global comparison
| Dimension | Strengths | Gaps |
|---|---|---|
| Swarm coordination | 多机协同群控能力全球领先,完成全球首次百台级四足机器人公开舞台同步表演,分布式控制技术跻身行业第一梯队 | - |
| Value for money | 依托追觅科技的供应链优势,实现高自研率下的极致成本控制,产品性价比远超海外同级别产品 | - |
| Time to market | 成立仅两年即实现多场景商业化落地,落地速度行业领先 | 全尺寸人形机器人的长期稳定运行能力、复杂场景的泛化能力,相较于宇树科技、波士顿动力仍有差距 |
| Intelligence | - | 具身大模型的训练数据量与通用能力,相较于银河通用、特斯拉仍有提升空间 |
5. Future direction
- 2026年工业场景计划千台级规模部署,在追觅工厂等场景落地物料搬运、点胶检测等工序;
- 加速无人咖啡、无人药房等零售解决方案的推广,目标1-2年覆盖全球10000家门店;
- 推进四足机器人导盲犬项目“光引001”的落地,切入助残普惠场景;
- 持续拓展海外市场,提升全球化营收占比。
III. Noetix Robotics (Songyan Power)
1. Spring Festival Gala performance
作为春晚仿生人形机器人独家合作伙伴,松延动力携5款机器人参演小品《奶奶的最爱》,成为首个登上春晚语言类节目的机器人企业。其中1:1复刻蔡明的仿生机器人,以近乎真人的面部神态、口型同步、微表情动作,与真人演员完成对戏;同时4台双足人形机器人完成端茶、互动等生活化动作。

2. Core business and strengths
- 企业基础:2023年9月成立,总部北京,创始团队来自清华、浙大;2025年一年内完成5轮融资,估值约20亿元。
- 技术壁垒:核心技术覆盖仿生人脸驱动、多模态交互大模型、双足运动控制,是国内少数实现仿生人形机器人批量生产的企业;自研D2P数字人映射技术,实现虚拟数字人到实体机器人的精准映射。
- 商业化落地:构建了N系列、E系列、轮式机器人W1、“小布米”系列的产品矩阵;旗下万元级消费级双足机器人“小布米”(定价9998元),2025年10月发售即斩获数千台订单,是全球首款万元级消费级双足人形机器人,产品已落地商业导览、教育科研、家庭陪伴等场景。
3. Core technical implementation
松延动力在小品中的表演,核心分为两大技术方向,也是仿生人形机器人最核心的两个难题:“长得像、演得真”的仿生交互,以及**“走得稳、做得准”的生活化动作**,我们逐一拆解:
(0) Overview
- 仿生人脸核心技术:通过铂金硅胶添加高分子材料,提升面部拉伸自然度与耐久性;采用高紧凑型驱动设计,在仿生人脸内部集成32-40个微型电机,实现表情、口型、眼神的精准控制;自研D2P数字人映射技术,将虚拟数字人的表情、口型数据,实时映射到真实机器人的电机转角上,实现语音与口型的1:1同步。
- 多模态交互:自研多模态交互大模型,实现语音、表情、眼神、肢体动作的协同表达,比如对话时的呼吸起伏、颈部与手臂的配合动作,大幅提升拟人交互体验。
- 运动控制:自研双足运动控制算法,实现机器人在家庭场景的稳定行走、端茶、搀扶等高精度动作,适配非结构化的家庭环境。
(1)蔡明仿生机器人:真人级复刻与实时对戏的核心技术
What happened on stage:1:1复刻蔡明老师的仿生机器人,在小品中与真人演员完成实时对戏,说话时口型与台词完全同步,同时配合台词做出眨眼、微笑、撇嘴、头部微动作等真人级微表情,甚至能根据对手演员的台词,实时做出对应的神态反馈,仿真度极高,在后台被多位演员误认成真人。
Core challenge:语言类节目对仿生机器人的要求,远高于歌舞表演——不仅要“长得像”,更要“演得真”:口型要与台词1:1同步,差一帧就会出现“对口型穿帮”;微表情要贴合人物情绪,僵硬一点就会显得很“假”;同时还要在狭小的人脸空间内,放下足够多的驱动电机,还要保证上镜效果,团队甚至需要把仿生人头整体缩小30%,对结构设计提出了极致挑战。
How it works:
-
仿生人脸硬件:真人级的“皮肤与肌肉”
首先在外观上,团队通过3D扫描,1:1复刻了蔡明老师的面部轮廓、五官细节,采用添加了高分子材料的铂金硅胶制作仿生皮肤,不仅在视觉上无限接近真人皮肤的质感,还提升了皮肤的拉伸自然度与耐久性,在做出表情时,皮肤的拉伸、褶皱都与真人完全一致,不会出现“塑料感”。
最核心的突破,是高紧凑型驱动设计:团队在缩小30%的仿生人脸内部,集成了32个微型驱动电机,分别对应人脸的眉、眼、口、鼻等核心表情区域,相当于给机器人装上了“人工面部肌肉”,每个电机都能精准控制对应区域的皮肤位移,实现微笑、撇嘴、眨眼、抬眉等数十种真人微表情,最小动作幅度可达0.1毫米,完全还原真人的面部神态。
-
D2P数字人映射技术:口型与表情的1:1同步
这是实现真人级对戏的核心技术,自研的D2P(数字人到物理人)映射技术,能把虚拟数字人的表情、口型数据,实时、精准地映射到实体机器人的电机上。
In plain terms:团队先提前采集了蔡明老师说台词时的面部动作、口型变化数据,制作了1:1的虚拟数字人;当机器人需要说台词时,系统会先把语音台词转化为虚拟数字人的口型、表情动作,再通过D2P技术,把这些动作转化为32个微型电机的转动角度、速度指令,实时驱动电机动作,最终实现语音与口型的1:1同步,表情与台词情绪的完美契合,哪怕是台词里的气口、重音,都能对应到口型的细微变化上。
-
多模态交互大模型:实时对戏的“灵性反馈”
自研多模态交互大模型,能实时识别对手演员的台词、语气、甚至面部表情,快速理解对话语境,Output对应的台词、表情和肢体动作;同时还能实现语音、表情、眼神、肢体动作的协同表达,比如说话时配合自然的头部转动、呼吸起伏,甚至是说话间隙的眼神互动,完全还原真人对话的状态,彻底摆脱了传统机器人“念台词”的僵硬感。
(2)“小布米”双足机器人:家庭场景的生活化动作
What happened on stage:4台“小布米”消费级双足机器人,在小品中完成了稳定行走、端茶、敬礼、与演员互动挥手等动作,在客厅的非结构化环境中,全程行走稳定,端茶时没有出现洒漏,动作流畅自然。
Core challenge:消费级双足机器人,受限于成本和尺寸,硬件性能无法和工业级大机型相比,要在家庭的瓷砖、地毯等不同地面上,实现稳定行走,还要完成端茶等精细操作,对算法的轻量化、平衡控制能力提出了极高要求。
How it works:
-
轻量化双足运动控制算法:小机身的稳定行走
“小布米”身高94厘米,体重仅12公斤,全身21个自由度,团队针对小尺寸双足机器人,自研了轻量化的模型预测控制算法,能在算力有限的主控芯片上,实现每秒上百次的步态规划与平衡调节,在瓷砖、地毯等不同地面上,都能自主调整步幅、步速和关节角度,实现稳定行走,哪怕被轻微触碰,也能快速调整重心,不会摔倒。
-
力控抓取:端茶不洒的精细操作
机器人的手部搭载了微型力传感器,端茶时,能精准控制夹持杯子的力度,既牢牢握住杯子,又不会捏碎纸杯;同时在行走过程中,手臂会实时调整姿态,抵消行走带来的晃动,确保杯子始终保持水平,杯里的水不会洒漏,完美适配家庭场景的服务需求。
4. Domestic vs. global comparison
| Dimension | Strengths | Gaps |
|---|---|---|
| Bionic interaction | 仿生人脸的高集成度驱动技术、多模态情感交互能力处于国内第一梯队,打破了海外企业在高端仿生机器人领域的垄断 | 高动态运动控制能力,相较于宇树科技、波士顿动力有明显差距 |
| Consumer adoption | 率先实现消费级双足机器人的万元级定价,打开了C端市场的普及路径,差异化避开工业赛道红海竞争,商业化落地速度领先 | 工业场景的落地能力与技术积累,弱于银河通用、魔法原子 |
| Mass production | 实现了仿生人形机器人的批量生产,量产能力远超海外同类型高端仿生产品 | - |
5. Future direction
- 持续深化仿生人形机器人的技术迭代,推动产品在商业导览、康养陪护场景的规模化落地;
- 推进消费级机器人“小布米”的量产与普及,拓展教育娱乐、家庭陪伴C端市场;
- 深化与高校、科研院所的合作,推动人形机器人教学平台的落地;
- 持续优化成本,推动人形机器人进入普通家庭。
IV. Galbot (GALBOT)
1. Spring Festival Gala performance
作为春晚指定具身大模型机器人,银河通用在贺岁微电影《我最难忘的今宵》中,携Galbot G1轮式双臂机器人亮相,与沈腾、马丽搭档,完成盘核桃、捡玻璃碎片、叠衣服、货架取物、串烤肠等生活化任务,实现了春晚舞台首次无预设脚本的机器人自主决策作业,无需提前编程,即可根据场景实时完成任务规划与执行。
2. Core business and strengths
- 企业基础:2023年5月成立,总部北京,由北大王鹤博士、前ABB高管姚腾洲联合创立,核心成员来自华为天才少年计划、百度、微软等企业;2025年12月完成超3亿美元融资,估值达30亿美元。
- 技术壁垒:国内极少数实现“百亿数据集—具身大模型—机器人本体—场景规模化落地”全链条闭环的企业;自研“银河星脑AstraBrain”具身大模型体系,首创虚实结合的训练范式,构建了百亿级机器人干活数据集,是全球具身机器人大模型数据量最大的公司之一。
- 商业化落地:产品主打Galbot系列轮式双臂通用机器人,采用“轮式底盘+折叠腿”复合结构,已实现千台级规模化落地,覆盖工业制造、智慧零售、医疗康养、城市服务等六大领域,合作客户包括宁德时代、德国博世、丰田汽车、北汽、宣武医院等龙头企业,2025年工业订单突破千台,创下具身智能领域商业化订单纪录。
3. Core technical implementation(通俗专业版)
银河通用的表演,和其他三家企业最大的区别,是完全没有预设的固定脚本——其他机器人的表演,哪怕动作再复杂,也是提前编排好的固定程序;而银河通用的机器人,是根据现场场景和任务指令,自主思考、自主规划、自主执行,这也是具身智能最核心的能力。我们以节目中几个典型任务为例,拆解其底层实现原理:
概述
- 具身大模型核心:首创“合成仿真数据为主、真机采集数据为辅”的虚实结合训练管线,解决了全球机器人干活数据匮乏的行业难题;自研GraspVLA、GroceryVLA、NavFoM等端到端具身大模型,对透明、高光、不规则物体的抓取成功率稳定在95%以上,实现了任务的自主规划、动态避障、长程导航。
- 硬件架构:采用“轮式底盘+折叠腿+双臂”的复合结构,兼顾高速移动与越障能力,身高173cm、臂展190cm、升降行程65cm,双臂最大负载达50kg,搭载自研6自由度灵巧手,实现毫米级精细操作。
- 一体化控制系统:采用“大脑-小脑-神经控制”一体化系统,“大脑”(具身大模型)负责场景理解与任务规划,“小脑”负责运动控制与平衡调节,“神经控制”负责关节的实时伺服响应,实现端到端的任务执行,无需预设脚本。
核心任务逻辑:无脚本自主作业的全链路流程
不管是盘核桃、捡玻璃碎片,还是叠衣服、串烤肠,机器人执行所有任务,都遵循着**“感知-决策-执行-反馈优化”**的端到端全链路,这也是它能实现无脚本作业的核心,我们逐层拆解:
第一步:感知——“看懂”眼前的场景和物体
节目里的挑战:机器人需要识别出核桃、玻璃碎片、衣服、烤肠、签子等完全不同的物体,尤其是透明的玻璃碎片,在浅色桌面上几乎“隐形”,传统视觉系统很容易识别失败;同时还要适应舞台复杂的灯光变化,准确判断每个物体的位置、形状、大小、材质。
How it works:
- 机器人搭载了多模态感知系统,包括双目深度相机、激光雷达、触觉传感器,能同时获取场景的视觉、深度、触觉信息;
- 自研的视觉大模型,在训练阶段见过了数十亿张真实场景图片,能精准识别上万种日常物体,哪怕是形状不规则的碎玻璃、褶皱的衣服,也能快速识别并分割出物体轮廓;
- 针对透明物体识别的行业难题,团队通过仿真环境生成了海量的透明物体数据——不同厚度、不同碎裂形状、不同光照条件下的玻璃碎片,让机器人在虚拟世界中“见过”各种可能的透明形态,理解了透明物体的反光、折射规律,最终实现对玻璃碎片的识别成功率稳定在99%以上,哪怕是只有几毫米的玻璃渣,也能精准定位。
第二步:决策——“想清楚”任务该怎么做
节目里的挑战:比如“捡玻璃碎片”这个任务,没有提前编程告诉机器人“先捡大的、再捡小的,用夹子夹,放到垃圾桶里”,机器人需要自主理解任务目标,把大任务拆解成可执行的小步骤,还要应对突发情况——比如玻璃碎片滚到了桌子底下,要自主规划路线,调整手臂姿态去捡。
How it works:
-
核心是自研的“银河星脑AstraBrain”具身大模型,它就像机器人的“大脑”,通过百亿级的机器人操作数据训练,已经学会了上千种日常任务的执行逻辑,能根据任务指令,自主拆解动作步骤。
Analogy:就像你让一个人“把地上的玻璃碎片捡干净”,他不用你一步步教,就会自己去找垃圾桶、拿工具,先捡大块再捡小块,还会注意不被划伤——银河通用的具身大模型,就是让机器人具备了这样的自主思考能力。
-
针对春晚的场景,团队还对大模型进行了轻量化微调,让它能快速适配舞台场景,针对不同任务快速Output最优的动作规划,同时具备容错能力——如果第一次捡玻璃没夹住,会自主调整夹子的开合角度、夹持位置,重新尝试,直到任务完成。
第三步:执行——“精准完成”精细操作
节目里的挑战:不同任务对操作的要求完全不同:盘核桃需要双手配合,力度既要足够转动核桃,又不能捏碎;串烤肠需要精准把烤肠穿到签子上,偏差1毫米就会穿歪;叠衣服需要抓住衣服的边角,精准完成折叠动作,这些都对机器人的动作精度、力控能力提出了极高要求。
How it works:
-
硬件基础:灵活又精准的“手臂和手”
Galbot G1采用“轮式底盘+折叠腿+双臂”的复合结构,双臂最大负载达50kg,重复定位精度可达±0.02毫米,比头发丝还细;搭载自研6自由度灵巧手,指尖配备高精度力传感器,力控精度可达0.3N,既能实现串烤肠的毫米级精准定位,又能实现盘核桃、叠衣服的柔性力控。
-
“大脑-小脑-神经”一体化控制系统
采用三级控制架构,实现端到端的精准执行:“大脑”(具身大模型)Output任务规划和动作指令;“小脑”(运动控制算法)负责把指令拆解成每个关节的转动角度、扭矩参数,实时调节手臂的运动轨迹和力度;“神经控制”(伺服系统)负责0.001秒级的实时响应,确保每个关节都精准执行指令,最终实现任务的完美执行。
-
虚实结合的训练范式:让机器人提前“练会”所有动作
团队首创“合成仿真数据为主、真机采集数据为辅”的训练管线,解决了全球机器人干活数据匮乏的行业难题。In plain terms:在数字仿真世界里,生成了数百万种不同大小、材质、形状的虚拟物体,还有各种不同的场景,让机器人在虚拟世界里完成上千亿次的操作训练,练出了一套适应性极强的“通用操作能力”;再用少量真实世界的数据做微调,就能让机器人在真实场景里,轻松完成各种没见过的任务,这也是它能在春晚舞台上,无脚本完成多种生活化任务的核心原因。
4. Domestic vs. global comparison
| Dimension | Strengths | Gaps |
|---|---|---|
| Scenario deployment | 具身大模型的场景落地能力全球领先,实现了全球首个百台级机器人7×24小时自主运营的零售店,工业、零售场景的规模化落地能力,远超特斯拉Optimus、波士顿动力等海外企业 | 双足人形机器人的高动态运动控制能力,相较于宇树科技、波士顿动力有差距 |
| Technical innovation | 首创的虚实结合训练范式,解决了全球机器人干活数据匮乏的行业难题,具身大模型的操作泛化能力跻身全球第一梯队 | 消费级市场的布局与产品,相较于松延动力较为滞后 |
| Industrial capability | 轮式双臂机器人的重载操作、精细操作能力处于行业第一梯队,已获得头部制造企业的千台级订单,商业化落地规模全球领先 | - |
5. Future direction
-
2026年加大“银河太空舱”无人零售解决方案在全国的推广力度,实现千店级规模部署;
-
深化与宁德时代、博世等工业客户的合作,扩大工业场景的千台级部署规模;
-
持续迭代具身大模型,提升机器人的通用任务泛化能力,拓展医疗康养、城市服务等场景;
-
推进IPO进程,提升资本市场影响力,巩固具身智能领域的龙头地位。

Overall Summary
The 2026 Gala robots were not mere stage tricks—they were a national showcase. The four firms led in high-dynamic motion, swarm coordination, biomimetic interaction, and embodied-AI deployment, illustrating China’s shift from follower to peer—and leader in some niches.
Compared with overseas labs stressing specs, defense, and long R&D cycles, Chinese players emphasize scenarios, cost, and volume manufacturing—pushing humanoids into factories, retail, and homes. Many in the industry call 2026 the first year of scaled humanoid adoption.