从春晚舞台到全球赛场：中国人形机器人，到底走到了哪一步？

解读 2026 春晚四家国人形机器人企业（宇树、魔法原子、松延动力、银河通用）的节目亮点、全栈技术、集群/仿生/具身大模型原理及与海外对比与产业化路线。

前言

2026年央视春节联欢晚会创下春晚历史上机器人参与规模的新纪录，共有宇树科技、魔法原子、松延动力、银河通用四家核心国产人形机器人企业，携超200台机器人深度融入四大核心节目，覆盖武术、小品、歌舞、微电影全品类，全方位展现了中国人形机器人产业的技术突破与商业化落地能力。以下为各企业的详细拆解：

一、宇树科技（Unitree Robotics）

1. 春晚节目表现

作为春晚“三朝元老”，宇树科技是武术节目《武BOT》的核心技术方，携20余台H2、G1系列人形机器人，与河南塔沟武术学校学员同台，完成全球首次全自主人形机器人集群武术表演。

在这里插入图片描述

节目中实现了3米弹射空翻、单脚连续空翻、蹬墙后空翻、Airflare大回旋七周半、4m/s集群快速跑位等高难度动作，同时完成挥剑、耍双节棍、醉拳等武术招式，集群动作同步误差小于0.1秒，全程零失误完成直播演出；同时在义乌分会场以“齐天大圣”造型机器人刷屏全网。

在这里插入图片描述

2. 公司核心业务与实力

企业基础：2016年成立，总部位于杭州，国家级专精特新“小巨人”企业，全球足式机器人绝对龙头，四足机器人全球市占率超69.75%；2025年人形机器人出货量超5500台，位列全球第一。
技术壁垒：实现从电机、减速器、控制器、运动控制算法到具身大模型的全栈自研，核心部件自研率超95%，国产化率超85%，累计拥有180余项授权专利。
商业化落地：产品矩阵覆盖四足机器人Go/B2系列、人形机器人H/G/R三大系列，售价从3.99万元到65万元不等，已落地工业巡检、电力作业、科研教育、应急救援等场景；2024年营收突破10亿元，C轮融资后估值超120亿元，已完成IPO辅导，拟登陆科创板。

3. 节目核心技术实现原理

（0）概述

硬件底层：主力机型H2全身自由度从19个提升至31个（单臂7个、单腿6个、3自由度腰部、2自由度颈部），动作精度达毫米级；自研内转子永磁同步电机扭矩密度达180Nm/kg，伺服响应速度0.001秒级，单臂峰值负载达21kg，支撑高爆发武术动作；搭载自研128线激光雷达与全新灵巧手，实现武术道具的稳定抓持与快速更换。
算法与集群控制：采用模型预测控制（MPC）+深度强化学习融合框架，机器人在仿真环境中完成上亿次动作迭代，自主习得复杂武术技巧与平衡控制；自研高并发集群控制系统与AI融合定位算法，通过3D激光雷达每秒上百次扫描舞台环境，实现无外部定位的全自主协同，攻克长序列表演的运动误差累计难题；依托5G专网+边缘计算，将集群指令传输延迟压缩至毫秒级，保障动作同步性。
直播容错机制：搭载全自主容错系统，机器人实时监测自身状态，跑偏后可快速归位；主控节点故障时0.3秒内切换备用主机，并有备用机器人待命，保障直播零失误。

《武BOT》节目中，机器人的所有动作可拆解为三大核心技术模块，每个模块都对应着全球性的技术难题，我们逐一拆解：

（1）单机极限武术动作：从“能站稳”到“会打拳”的核心突破

节目里做了什么：机器人完成了弹射空翻、Airflare大回旋、双节棍挥舞、醉拳倒地起身等连专业武术演员都需要长期训练的动作，甚至在3米弹射落地后，能瞬间调整平衡，无缝衔接下一个武术招式。

核心难点：这类高爆发动作的核心挑战，是机器人在重心剧烈变化、全身关节高速联动时，始终保持平衡，同时精准控制每一个动作的力度、角度和节奏——哪怕一个关节的扭矩输出偏差0.1%，就会导致机器人摔倒、表演失败。

底层实现原理：

硬件底座：“肌肉骨骼”的极致性能

主力机型H2全身自由度从19个提升至31个（单臂7个、单腿6个、3自由度腰部、2自由度颈部），相当于给机器人装上了能精准控制的“全身关节”；自研内转子永磁同步电机，扭矩密度达180Nm/kg，伺服响应速度达到0.001秒级，比人类神经反射速度快100倍，单臂峰值负载达21kg，能支撑高爆发的空翻、挥棍动作。

通俗类比：这就像给武术运动员装上了反应速度快100倍、力量控制精准到克的肌肉，既能爆发出空翻的爆发力，又能精准控制双节棍的轨迹，不伤到自己和搭档。
算法核心：“肌肉记忆”的AI训练

采用模型预测控制（MPC）+深度强化学习的融合框架，这是机器人能完成复杂武术动作的核心。

通俗解释：团队先在数字仿真世界里，给机器人搭建了1:1的虚拟舞台，让AI控制的机器人在里面完成上亿次的动作训练——就像武术运动员在武馆里反复练习，摔倒了就调整参数重新来，最终让机器人自主习得复杂武术技巧和平衡控制能力。

其中，MPC算法相当于“实时教练”，每秒会对上百次机器人的重心、速度、关节状态进行预判，提前调整每个关节的扭矩输出，确保机器人在空翻、落地的全过程中，重心始终落在安全区间；而深度强化学习训练出的“肌肉记忆”，能让机器人在舞台地面有轻微打滑、重心出现偏差时，瞬间自主调整动作，就像武术运动员临场应变一样。
道具操作：“手眼协同”的精准控制

机器人能稳定挥舞双节棍、长剑，核心在于搭载了自研128线激光雷达+视觉相机，配合全新灵巧手，每秒对道具的位置、自身的姿态进行上百次扫描校准，实现道具的稳定抓持与轨迹控制，确保双节棍的挥舞轨迹精准贴合武术动作设计，不会出现甩飞、节奏错位的问题。

（2）20余台机器人集群协同：从“单机跳”到“群体演”的全球突破

节目里做了什么：20余台机器人在没有外部定位设备的情况下，完成了4m/s高速跑位、复杂队形变换、与真人演员的实时对练，全程没有出现碰撞、跑偏，动作同步误差小于0.1秒，实现了全球首次全自主人形机器人集群武术表演。

核心难点：传统机器人集群表演，大多依赖舞台地面的二维码、外部动捕设备进行定位，相当于“开了外挂”；而宇树的机器人全程只靠自身机载传感器，在高速运动、舞台灯光复杂、真人演员动态移动的环境下，实现精准定位和协同，还要解决长序列表演中，每台机器人的动作误差累计问题——一旦一台机器人慢了0.05秒，整个集群的表演就会乱套。

底层实现原理：

全自主定位：不依赖外挂的“环境感知”

自研AI融合定位算法，通过机器人自带的3D激光雷达，每秒上百次扫描舞台环境，实时构建三维地图，同时匹配预存的舞台模型，计算出自身在舞台上的精准位置，定位精度达到毫米级，完全不需要外部动捕、二维码等辅助设备。

通俗类比：这就像你蒙着眼睛，但是你脑子里时刻知道自己在房间里的位置以及周围的情况，就能在熟悉的房间里精准走到指定位置，而且跑步前进也不会撞墙，精度还能达到毫米级。
高并发集群控制：零误差的“团队指挥”

自研分布式集群控制系统，采用“统一时间基准+分布式轨迹规划”架构：首先通过5G专网+边缘计算，给所有机器人同步一个精准到微秒级的统一时间轴，确保每台机器人的动作“在同一个节拍上”，指令传输延迟压缩至毫秒级；

同时，主控系统只给机器人下发“目标位置、动作节拍”的核心指令，每台机器人自主规划自己的跑位路径、动作执行细节，还能实时感知周边机器人的位置，动态调整自己的路线，避免碰撞；哪怕某台机器人出现轻微跑偏，也能在0.2秒内自主调整归位，不影响整个集群的表演。
误差消除：长序列表演的“防跑偏机制”

团队针对长序列武术表演，设计了“分段闭环校准”机制：把整个3分钟的节目，拆解成数十个关键动作节点，每完成一个节点的动作，所有机器人都会自动校准自身位置、动作节奏，把累计的误差清零，确保从节目开头到结尾，同步精度始终保持在0.1秒以内。

（3）直播零失误：国家级舞台的“容错保障”

节目里做了什么：在春晚全球直播的高压场景下，20余台机器人全程零失误，没有出现一台故障、摔倒，完美完成表演。

底层实现原理：

搭载了全自主容错系统，每台机器人都会实时监测自身的电机温度、关节状态、电池电量、定位精度，一旦出现轻微异常，会自动调整动作参数，优先保障平衡和核心动作执行；如果出现主控节点故障，会在0.3秒内自动切换备用主机，同时舞台侧方还有待命的备用机器人，可在节目间隙无缝替换故障设备，彻底杜绝直播事故。

4. 国内外技术对比

维度	核心优势	现存差距
运动性能	高动态运动控制能力全球领先，完成了波士顿动力Atlas尚未实现的连续花式翻桌跑酷、集群协同武术表演等动作，单机极限动作参数跻身全球第一梯队	在工业场景的长期稳定作业能力、复杂非结构化环境的泛化能力上，与波士顿动力、Agility Robotics仍有一定差距
量产能力	2025年出货量远超特斯拉Optimus（小批量测试阶段）、波士顿动力Atlas（非量产），是全球唯一实现高性能人形机器人万台级量产规划的企业	-
成本与供应链	整机成本仅为Atlas的千分之一、Optimus的约1/3，核心部件成本仅为进口产品的1/10，全栈自研供应链摆脱海外技术依赖	-
智能能力	-	具身大模型的通用任务处理能力，相较于特斯拉Optimus的端到端大模型仍有提升空间

5. 未来发展方向

2026年目标人形机器人出货量1万-2万台，持续扩大全球市场份额；
深化工业巡检、电力作业、应急救援等B端场景的规模化落地，实现单台机器人替代3人工作量；
持续迭代具身智能大模型，提升机器人的通用任务处理能力与自主决策能力；
推进消费级人形机器人的普及，以低价产品打开C端市场。

二、魔法原子（MagicLab）

1. 春晚节目表现

作为春晚智能机器人战略合作伙伴，魔法原子是本届春晚首家亮相的机器人企业。主会场歌曲《智造未来》中，携6台MagicBot Z1高动态小人形机器人、2台MagicBot Gen1全尺寸人形机器人，与易烊千玺、陈小春等艺人同台，完成360°托马斯回旋、侧空翻、同步舞蹈等高难度动作；宜宾分会场，上百台MagicDog四足机器人以“熊猫”造型完成全球首次百台级四足机器人公开舞台同步演绎；同时在贺岁短片中完成捞面、送餐等生活化操作。

在这里插入图片描述

2. 公司核心业务与实力

企业基础：2024年1月成立，总部无锡，由追觅科技孵化，核心研发人员占比超70%；成立两年完成多轮融资，累计融资超5亿元，估值达35亿元。
技术壁垒：核心硬件自研率超90%，覆盖关节模组、灵巧手、伺服电机、谐波减速器等23类核心部件，自研关节峰值扭矩最高达525N·m，跻身行业第一梯队；软件层面打造“原子万象”具身智能大模型，采用“大脑+小脑”双模架构。
商业化落地：产品矩阵包括人形机器人MagicBot Gen1/Z1、四足机器人MagicDog系列，覆盖工业巡检、商业服务、家庭陪伴、文旅演艺、教育娱乐等场景，已在27个国家建立本地化团队。

3. 节目核心技术实现原理

魔法原子在春晚的表演，覆盖了“高动态街舞、百台级集群同步、生活化精细操作”三大完全不同的技术方向，我们逐一拆解每个动作的实现逻辑：

（0）概述

硬件底层：MagicBot Z1奔跑速度突破4m/s，搭载自研高功率密度关节模组，支撑高动态舞蹈与空翻动作；Gen1全尺寸人形机器人双臂最大负载达50kg，搭载自研6自由度灵巧手，实现捞面、端餐等精细操作。
集群控制：采用分布式集群控制系统，通过时间同步算法与多智能体轨迹规划，实现上百台四足机器人的毫秒级动作同步，同步误差小于0.01秒；通过纯视觉SLAM定位，实现无外部辅助的自主编队与动态避障。
智能算法：“原子万象”具身大模型采用快慢双模协同架构，“大脑”负责任务规划与场景理解，“小脑”负责实时运动控制与平衡调节，通过数百万条工业场景真实数据训练，实现任务的自主泛化。

（1）主会场街舞表演：托马斯全旋与同步舞蹈的技术突破

节目里做了什么：6台MagicBot Z1小人形机器人，与真人艺人同台完成了360°托马斯回旋、侧空翻、连续街舞动作，同时与音乐节拍、艺人动作完美同步，转身、摆臂、重心迁移全程连贯流畅，多机动作同步误差小于0.01秒。

核心难点：托马斯全旋这类街舞动作，需要机器人在单臂支撑全身重量的同时，完成腰部、腿部的高速圆周摆动，重心全程在快速变化，对关节的负载能力、扭矩控制精度、平衡调节速度提出了极致要求；同时多机协同舞蹈，需要每台机器人的每一个动作，都精准贴合音乐节拍，差0.01秒就会出现“抢拍、慢拍”的问题。

底层实现原理：

硬件支撑：高功率密度的“关节心脏”

MagicBot Z1搭载了自研的高功率密度一体化关节模组，在小尺寸机身内实现了超高扭矩输出，奔跑速度突破4m/s，单臂能稳定支撑整机8kg的重量，同时完成高速摆动，这是实现托马斯全旋的物理基础。

团队针对街舞动作的高频次、高负载特性，优化了关节的散热结构与电流管理策略，确保机器人在连续3分钟的高动态舞蹈中，不会因为关节过热触发保护机制，保证动作全程稳定输出。
平衡控制：动态重心的实时调节

采用零力矩点（ZMP）平衡控制算法，配合全身力控技术，在托马斯全旋的全过程中，每秒数百次计算机器人的重心位置、支撑区域，实时调整手臂、腰部、腿部的关节角度和扭矩输出，确保重心始终落在支撑臂的安全范围内，不会出现侧翻、摔倒的问题。

通俗类比：这就像你单臂撑在地上做圆周摆腿，大脑需要全程感知自己的重心，随时调整手臂的发力、腰腹的扭转、腿部的摆动，确保自己不会摔倒——而机器人的“大脑”，每秒能做数百次这样的调整，精度比人类高上千倍。
节拍同步：零误差的“音乐卡点”

团队给所有机器人搭建了统一的高精度时间同步系统，以音乐的音频波形为基准，把每一个舞蹈动作都精准对应到音乐的节拍点上，每台机器人的动作启动时间、执行时长，都精准锁定到毫秒级，确保6台机器人的动作完全同步，与艺人的表演、音乐的节奏完美契合。

（2）宜宾分会场：百台熊猫机器狗的集群表演

节目里做了什么：上百台MagicDog四足机器人，以熊猫造型亮相，在宜宾分会场的城市广场上，完成了奔跑、列阵、队形变换、同步舞蹈，甚至实现了自然的歪头、点头等拟人化动作，全程动作整齐划一，没有出现一台掉队、碰撞。

核心难点：百台级四足机器人的户外集群表演，核心挑战有三个：一是户外广场地面不平整、灯光环境复杂，机器人的自主定位难度远高于室内舞台；二是百台机器人的动作同步，需要解决大规模集群的指令传输延迟、误差累计问题；三是熊猫外皮包裹后，机身散热空间被压缩，需要解决高负载连续运行的稳定性问题。

底层实现原理：

分布式集群控制系统：百台机器人的“统一指挥”

采用“主站+分布式从站”的集群控制架构，主站系统只负责下发整体的表演序列、队形变换指令，每台机器狗自主完成动作执行、路径规划、定位校准；通过时间敏感网络（TSN）技术，给所有机器人同步统一的时间基准，确保百台机器人的动作启动时间误差小于0.01秒，实现“整齐划一”的表演效果。
纯视觉SLAM定位：户外场景的精准导航

每台机器狗都搭载了双目视觉相机+IMU惯性测量单元，通过纯视觉SLAM技术，实时构建户外场景的三维地图，匹配自身位置，同时感知周边其他机器人的位置，动态调整行进路线，避免碰撞；哪怕户外地面不平整、出现轻微打滑，也能自主调整步态，快速回到预定位置，完成队形变换。
散热与功率优化：外皮包裹下的稳定运行

针对熊猫外皮压缩散热空间的问题，团队优化了整机的电流管理与功率控制策略，在不影响动作表现力的前提下，降低了连续运动状态下的关节发热量，同时优化了机身的散热结构，确保机器人在长达数分钟的连续表演中，不会因为过热触发保护，稳定完成所有动作。

（3）贺岁短片：捞面、倒酒的精细操作

节目里做了什么：MagicBot Gen1全尺寸人形机器人，在短片中完成了捞面、端餐、倒酒等生活化操作，面条捞取、汤汁倾倒的力度控制精准，没有出现洒漏、面条断裂的问题。

核心难点：这类精细操作的核心挑战，是机器人对柔性物体（面条）、易碎容器（碗、酒杯）的力控精度——力度太大，会夹断面条、捏碎杯子；力度太小，会夹不住面条、端不稳碗；同时还要精准控制倾倒的角度和速度，确保汤汁、酒水不会洒漏。

底层实现原理：

6自由度灵巧手：微米级的力控精度

Gen1搭载了自研6自由度灵巧手，指尖搭载了高精度力传感器，力控精度达到0.5N，能精准感知抓取物体的反馈力度，实现“柔性抓取”——捞面条时，能精准控制指尖的夹持力，既牢牢夹住面条，又不会把面条夹断；端碗时，能根据碗的重量、重心变化，实时调整手臂的姿态，确保碗始终保持水平，汤汁不会洒漏。
“大脑+小脑”双架构：从任务规划到精准执行

自研的“原子万象”具身智能大模型，采用“大脑+小脑”的快慢双模协同架构：“大脑”负责任务规划与场景理解，比如接收到“捞面”的指令后，会自动拆解成“移动到锅前-张开手-伸入锅中-夹住面条-抬起-放入碗中”的分步动作；“小脑”负责实时运动控制与力控调节，在每一步动作执行中，实时调整手臂的位置、指尖的力度，应对面条的柔性变化、碗的重量变化，确保任务精准完成。

4. 国内外技术对比

维度	核心优势	现存差距
集群协同	多机协同群控能力全球领先，完成全球首次百台级四足机器人公开舞台同步表演，分布式控制技术跻身行业第一梯队	-
产品性价比	依托追觅科技的供应链优势，实现高自研率下的极致成本控制，产品性价比远超海外同级别产品	-
落地速度	成立仅两年即实现多场景商业化落地，落地速度行业领先	全尺寸人形机器人的长期稳定运行能力、复杂场景的泛化能力，相较于宇树科技、波士顿动力仍有差距
智能能力	-	具身大模型的训练数据量与通用能力，相较于银河通用、特斯拉仍有提升空间

5. 未来发展方向

2026年工业场景计划千台级规模部署，在追觅工厂等场景落地物料搬运、点胶检测等工序；
加速无人咖啡、无人药房等零售解决方案的推广，目标1-2年覆盖全球10000家门店；
推进四足机器人导盲犬项目“光引001”的落地，切入助残普惠场景；
持续拓展海外市场，提升全球化营收占比。

三、松延动力（Noetix Robotics）

1. 春晚节目表现

作为春晚仿生人形机器人独家合作伙伴，松延动力携5款机器人参演小品《奶奶的最爱》，成为首个登上春晚语言类节目的机器人企业。其中1:1复刻蔡明的仿生机器人，以近乎真人的面部神态、口型同步、微表情动作，与真人演员完成对戏；同时4台双足人形机器人完成端茶、互动等生活化动作。

在这里插入图片描述

2. 公司核心业务与实力

企业基础：2023年9月成立，总部北京，创始团队来自清华、浙大；2025年一年内完成5轮融资，估值约20亿元。
技术壁垒：核心技术覆盖仿生人脸驱动、多模态交互大模型、双足运动控制，是国内少数实现仿生人形机器人批量生产的企业；自研D2P数字人映射技术，实现虚拟数字人到实体机器人的精准映射。
商业化落地：构建了N系列、E系列、轮式机器人W1、“小布米”系列的产品矩阵；旗下万元级消费级双足机器人“小布米”（定价9998元），2025年10月发售即斩获数千台订单，是全球首款万元级消费级双足人形机器人，产品已落地商业导览、教育科研、家庭陪伴等场景。

3. 节目核心技术实现原理

松延动力在小品中的表演，核心分为两大技术方向，也是仿生人形机器人最核心的两个难题：“长得像、演得真”的仿生交互，以及**“走得稳、做得准”的生活化动作**，我们逐一拆解：

（0）概述

仿生人脸核心技术：通过铂金硅胶添加高分子材料，提升面部拉伸自然度与耐久性；采用高紧凑型驱动设计，在仿生人脸内部集成32-40个微型电机，实现表情、口型、眼神的精准控制；自研D2P数字人映射技术，将虚拟数字人的表情、口型数据，实时映射到真实机器人的电机转角上，实现语音与口型的1:1同步。
多模态交互：自研多模态交互大模型，实现语音、表情、眼神、肢体动作的协同表达，比如对话时的呼吸起伏、颈部与手臂的配合动作，大幅提升拟人交互体验。
运动控制：自研双足运动控制算法，实现机器人在家庭场景的稳定行走、端茶、搀扶等高精度动作，适配非结构化的家庭环境。

（1）蔡明仿生机器人：真人级复刻与实时对戏的核心技术

节目里做了什么：1:1复刻蔡明老师的仿生机器人，在小品中与真人演员完成实时对戏，说话时口型与台词完全同步，同时配合台词做出眨眼、微笑、撇嘴、头部微动作等真人级微表情，甚至能根据对手演员的台词，实时做出对应的神态反馈，仿真度极高，在后台被多位演员误认成真人。

核心难点：语言类节目对仿生机器人的要求，远高于歌舞表演——不仅要“长得像”，更要“演得真”：口型要与台词1:1同步，差一帧就会出现“对口型穿帮”；微表情要贴合人物情绪，僵硬一点就会显得很“假”；同时还要在狭小的人脸空间内，放下足够多的驱动电机，还要保证上镜效果，团队甚至需要把仿生人头整体缩小30%，对结构设计提出了极致挑战。

底层实现原理：

仿生人脸硬件：真人级的“皮肤与肌肉”

首先在外观上，团队通过3D扫描，1:1复刻了蔡明老师的面部轮廓、五官细节，采用添加了高分子材料的铂金硅胶制作仿生皮肤，不仅在视觉上无限接近真人皮肤的质感，还提升了皮肤的拉伸自然度与耐久性，在做出表情时，皮肤的拉伸、褶皱都与真人完全一致，不会出现“塑料感”。

最核心的突破，是高紧凑型驱动设计：团队在缩小30%的仿生人脸内部，集成了32个微型驱动电机，分别对应人脸的眉、眼、口、鼻等核心表情区域，相当于给机器人装上了“人工面部肌肉”，每个电机都能精准控制对应区域的皮肤位移，实现微笑、撇嘴、眨眼、抬眉等数十种真人微表情，最小动作幅度可达0.1毫米，完全还原真人的面部神态。
D2P数字人映射技术：口型与表情的1:1同步

这是实现真人级对戏的核心技术，自研的D2P（数字人到物理人）映射技术，能把虚拟数字人的表情、口型数据，实时、精准地映射到实体机器人的电机上。

通俗解释：团队先提前采集了蔡明老师说台词时的面部动作、口型变化数据，制作了1:1的虚拟数字人；当机器人需要说台词时，系统会先把语音台词转化为虚拟数字人的口型、表情动作，再通过D2P技术，把这些动作转化为32个微型电机的转动角度、速度指令，实时驱动电机动作，最终实现语音与口型的1:1同步，表情与台词情绪的完美契合，哪怕是台词里的气口、重音，都能对应到口型的细微变化上。
多模态交互大模型：实时对戏的“灵性反馈”

自研多模态交互大模型，能实时识别对手演员的台词、语气、甚至面部表情，快速理解对话语境，输出对应的台词、表情和肢体动作；同时还能实现语音、表情、眼神、肢体动作的协同表达，比如说话时配合自然的头部转动、呼吸起伏，甚至是说话间隙的眼神互动，完全还原真人对话的状态，彻底摆脱了传统机器人“念台词”的僵硬感。

（2）“小布米”双足机器人：家庭场景的生活化动作

节目里做了什么：4台“小布米”消费级双足机器人，在小品中完成了稳定行走、端茶、敬礼、与演员互动挥手等动作，在客厅的非结构化环境中，全程行走稳定，端茶时没有出现洒漏，动作流畅自然。

核心难点：消费级双足机器人，受限于成本和尺寸，硬件性能无法和工业级大机型相比，要在家庭的瓷砖、地毯等不同地面上，实现稳定行走，还要完成端茶等精细操作，对算法的轻量化、平衡控制能力提出了极高要求。

底层实现原理：

轻量化双足运动控制算法：小机身的稳定行走

“小布米”身高94厘米，体重仅12公斤，全身21个自由度，团队针对小尺寸双足机器人，自研了轻量化的模型预测控制算法，能在算力有限的主控芯片上，实现每秒上百次的步态规划与平衡调节，在瓷砖、地毯等不同地面上，都能自主调整步幅、步速和关节角度，实现稳定行走，哪怕被轻微触碰，也能快速调整重心，不会摔倒。
力控抓取：端茶不洒的精细操作

机器人的手部搭载了微型力传感器，端茶时，能精准控制夹持杯子的力度，既牢牢握住杯子，又不会捏碎纸杯；同时在行走过程中，手臂会实时调整姿态，抵消行走带来的晃动，确保杯子始终保持水平，杯里的水不会洒漏，完美适配家庭场景的服务需求。

4. 国内外技术对比

维度	核心优势	现存差距
仿生交互	仿生人脸的高集成度驱动技术、多模态情感交互能力处于国内第一梯队，打破了海外企业在高端仿生机器人领域的垄断	高动态运动控制能力，相较于宇树科技、波士顿动力有明显差距
消费级普及	率先实现消费级双足机器人的万元级定价，打开了C端市场的普及路径，差异化避开工业赛道红海竞争，商业化落地速度领先	工业场景的落地能力与技术积累，弱于银河通用、魔法原子
量产能力	实现了仿生人形机器人的批量生产，量产能力远超海外同类型高端仿生产品	-

5. 未来发展方向

持续深化仿生人形机器人的技术迭代，推动产品在商业导览、康养陪护场景的规模化落地；
推进消费级机器人“小布米”的量产与普及，拓展教育娱乐、家庭陪伴C端市场；
深化与高校、科研院所的合作，推动人形机器人教学平台的落地；
持续优化成本，推动人形机器人进入普通家庭。

四、银河通用（GALBOT）

1. 春晚节目表现

作为春晚指定具身大模型机器人，银河通用在贺岁微电影《我最难忘的今宵》中，携Galbot G1轮式双臂机器人亮相，与沈腾、马丽搭档，完成盘核桃、捡玻璃碎片、叠衣服、货架取物、串烤肠等生活化任务，实现了春晚舞台首次无预设脚本的机器人自主决策作业，无需提前编程，即可根据场景实时完成任务规划与执行。

2. 公司核心业务与实力

企业基础：2023年5月成立，总部北京，由北大王鹤博士、前ABB高管姚腾洲联合创立，核心成员来自华为天才少年计划、百度、微软等企业；2025年12月完成超3亿美元融资，估值达30亿美元。
技术壁垒：国内极少数实现“百亿数据集—具身大模型—机器人本体—场景规模化落地”全链条闭环的企业；自研“银河星脑AstraBrain”具身大模型体系，首创虚实结合的训练范式，构建了百亿级机器人干活数据集，是全球具身机器人大模型数据量最大的公司之一。
商业化落地：产品主打Galbot系列轮式双臂通用机器人，采用“轮式底盘+折叠腿”复合结构，已实现千台级规模化落地，覆盖工业制造、智慧零售、医疗康养、城市服务等六大领域，合作客户包括宁德时代、德国博世、丰田汽车、北汽、宣武医院等龙头企业，2025年工业订单突破千台，创下具身智能领域商业化订单纪录。

3. 节目核心技术实现原理（通俗专业版）

银河通用的表演，和其他三家企业最大的区别，是完全没有预设的固定脚本——其他机器人的表演，哪怕动作再复杂，也是提前编排好的固定程序；而银河通用的机器人，是根据现场场景和任务指令，自主思考、自主规划、自主执行，这也是具身智能最核心的能力。我们以节目中几个典型任务为例，拆解其底层实现原理：

概述

具身大模型核心：首创“合成仿真数据为主、真机采集数据为辅”的虚实结合训练管线，解决了全球机器人干活数据匮乏的行业难题；自研GraspVLA、GroceryVLA、NavFoM等端到端具身大模型，对透明、高光、不规则物体的抓取成功率稳定在95%以上，实现了任务的自主规划、动态避障、长程导航。
硬件架构：采用“轮式底盘+折叠腿+双臂”的复合结构，兼顾高速移动与越障能力，身高173cm、臂展190cm、升降行程65cm，双臂最大负载达50kg，搭载自研6自由度灵巧手，实现毫米级精细操作。
一体化控制系统：采用“大脑-小脑-神经控制”一体化系统，“大脑”（具身大模型）负责场景理解与任务规划，“小脑”负责运动控制与平衡调节，“神经控制”负责关节的实时伺服响应，实现端到端的任务执行，无需预设脚本。

核心任务逻辑：无脚本自主作业的全链路流程

不管是盘核桃、捡玻璃碎片，还是叠衣服、串烤肠，机器人执行所有任务，都遵循着**“感知-决策-执行-反馈优化”**的端到端全链路，这也是它能实现无脚本作业的核心，我们逐层拆解：

第一步：感知——“看懂”眼前的场景和物体

节目里的挑战：机器人需要识别出核桃、玻璃碎片、衣服、烤肠、签子等完全不同的物体，尤其是透明的玻璃碎片，在浅色桌面上几乎“隐形”，传统视觉系统很容易识别失败；同时还要适应舞台复杂的灯光变化，准确判断每个物体的位置、形状、大小、材质。

底层实现原理：

机器人搭载了多模态感知系统，包括双目深度相机、激光雷达、触觉传感器，能同时获取场景的视觉、深度、触觉信息；
自研的视觉大模型，在训练阶段见过了数十亿张真实场景图片，能精准识别上万种日常物体，哪怕是形状不规则的碎玻璃、褶皱的衣服，也能快速识别并分割出物体轮廓；
针对透明物体识别的行业难题，团队通过仿真环境生成了海量的透明物体数据——不同厚度、不同碎裂形状、不同光照条件下的玻璃碎片，让机器人在虚拟世界中“见过”各种可能的透明形态，理解了透明物体的反光、折射规律，最终实现对玻璃碎片的识别成功率稳定在99%以上，哪怕是只有几毫米的玻璃渣，也能精准定位。

第二步：决策——“想清楚”任务该怎么做

节目里的挑战：比如“捡玻璃碎片”这个任务，没有提前编程告诉机器人“先捡大的、再捡小的，用夹子夹，放到垃圾桶里”，机器人需要自主理解任务目标，把大任务拆解成可执行的小步骤，还要应对突发情况——比如玻璃碎片滚到了桌子底下，要自主规划路线，调整手臂姿态去捡。

底层实现原理：

核心是自研的“银河星脑AstraBrain”具身大模型，它就像机器人的“大脑”，通过百亿级的机器人操作数据训练，已经学会了上千种日常任务的执行逻辑，能根据任务指令，自主拆解动作步骤。

通俗类比：就像你让一个人“把地上的玻璃碎片捡干净”，他不用你一步步教，就会自己去找垃圾桶、拿工具，先捡大块再捡小块，还会注意不被划伤——银河通用的具身大模型，就是让机器人具备了这样的自主思考能力。
针对春晚的场景，团队还对大模型进行了轻量化微调，让它能快速适配舞台场景，针对不同任务快速输出最优的动作规划，同时具备容错能力——如果第一次捡玻璃没夹住，会自主调整夹子的开合角度、夹持位置，重新尝试，直到任务完成。

第三步：执行——“精准完成”精细操作

节目里的挑战：不同任务对操作的要求完全不同：盘核桃需要双手配合，力度既要足够转动核桃，又不能捏碎；串烤肠需要精准把烤肠穿到签子上，偏差1毫米就会穿歪；叠衣服需要抓住衣服的边角，精准完成折叠动作，这些都对机器人的动作精度、力控能力提出了极高要求。

底层实现原理：

硬件基础：灵活又精准的“手臂和手”

Galbot G1采用“轮式底盘+折叠腿+双臂”的复合结构，双臂最大负载达50kg，重复定位精度可达±0.02毫米，比头发丝还细；搭载自研6自由度灵巧手，指尖配备高精度力传感器，力控精度可达0.3N，既能实现串烤肠的毫米级精准定位，又能实现盘核桃、叠衣服的柔性力控。
“大脑-小脑-神经”一体化控制系统

采用三级控制架构，实现端到端的精准执行：“大脑”（具身大模型）输出任务规划和动作指令；“小脑”（运动控制算法）负责把指令拆解成每个关节的转动角度、扭矩参数，实时调节手臂的运动轨迹和力度；“神经控制”（伺服系统）负责0.001秒级的实时响应，确保每个关节都精准执行指令，最终实现任务的完美执行。
虚实结合的训练范式：让机器人提前“练会”所有动作

团队首创“合成仿真数据为主、真机采集数据为辅”的训练管线，解决了全球机器人干活数据匮乏的行业难题。通俗解释：在数字仿真世界里，生成了数百万种不同大小、材质、形状的虚拟物体，还有各种不同的场景，让机器人在虚拟世界里完成上千亿次的操作训练，练出了一套适应性极强的“通用操作能力”；再用少量真实世界的数据做微调，就能让机器人在真实场景里，轻松完成各种没见过的任务，这也是它能在春晚舞台上，无脚本完成多种生活化任务的核心原因。

4. 国内外技术对比

维度	核心优势	现存差距
场景落地	具身大模型的场景落地能力全球领先，实现了全球首个百台级机器人7×24小时自主运营的零售店，工业、零售场景的规模化落地能力，远超特斯拉Optimus、波士顿动力等海外企业	双足人形机器人的高动态运动控制能力，相较于宇树科技、波士顿动力有差距
技术创新	首创的虚实结合训练范式，解决了全球机器人干活数据匮乏的行业难题，具身大模型的操作泛化能力跻身全球第一梯队	消费级市场的布局与产品，相较于松延动力较为滞后
工业能力	轮式双臂机器人的重载操作、精细操作能力处于行业第一梯队，已获得头部制造企业的千台级订单，商业化落地规模全球领先	-

5. 未来发展方向

2026年加大“银河太空舱”无人零售解决方案在全国的推广力度，实现千店级规模部署；
深化与宁德时代、博世等工业客户的合作，扩大工业场景的千台级部署规模；
持续迭代具身大模型，提升机器人的通用任务泛化能力，拓展医疗康养、城市服务等场景；
推进IPO进程，提升资本市场影响力，巩固具身智能领域的龙头地位。

整体总结

2026年春晚的机器人表演，并非单纯的舞台炫技，而是中国人形机器人产业的一次国家级路演。四家企业分别在高动态运动控制、多机集群协同、仿生情感交互、具身智能落地四大核心方向，展现了中国在人形机器人领域从跟跑到并跑、部分领域领跑的产业格局。

相较于海外企业聚焦实验室参数、军事场景、长期测试的技术路线，中国企业更注重场景落地、成本控制、规模化量产，形成了差异化的竞争优势，推动人形机器人从实验室走向工业、商业、家庭等真实场景，2026年也被业内视为人形机器人规模化应用的元年。

阅读原文

從春晚舞臺到全球賽場：中國人形機器人，到底走到了哪一步？

解讀 2026 春晚四家國人形機器人企業（宇樹、魔法原子、松延動力、銀河通用）的節目亮點、全棧技術、集群/仿生/具身大模型原理及與海外對比與產業化路線。

來源：https://blog.csdn.net/2403_87969572/article/details/158260101

抓取時間（ISO本地）：2026-05-18 05:17:38

前言

2026年央視春節聯歡晚會創下春晚歷史上機器人參與規模的新紀錄，共有宇樹科技、魔法原子、松延動力、銀河通用四家核心國產人形機器人企業，攜超200臺機器人深度融入四大核心節目，覆蓋武術、小品、歌舞、微電影全品類，全方位展現了中國人形機器人產業的技術突破與商業化落地能力。以下為各企業的詳細拆解：

一、宇樹科技（Unitree Robotics）

1. 春晚節目表現

作為春晚“三朝元老”，宇樹科技是武術節目《武BOT》的核心技術方，攜20餘臺H2、G1系列人形機器人，與河南塔溝武術學校學員同臺，完成全球首次全自主人形機器人叢集武術表演。

在這裡插入圖片描述

節目中實現了3米彈射空翻、單腳連續空翻、蹬牆後空翻、Airflare大回旋七週半、4m/s叢集快速跑位等高難度動作，同時完成揮劍、耍雙節棍、醉拳等武術招式，叢集動作同步誤差小於0.1秒，全程零失誤完成直播演出；同時在義烏分會場以“齊天大聖”造型機器人刷屏全網。

在這裡插入圖片描述

2. 公司核心業務與實力

企業基礎：2016年成立，總部位於杭州，國家級專精特新“小巨人”企業，全球足式機器人絕對龍頭，四足機器人全球市佔率超69.75%；2025年人形機器人出貨量超5500臺，位列全球第一。
技術壁壘：實現從電機、減速器、控制器、運動控制演算法到具身大模型的全棧自研，核心部件自研率超95%，國產化率超85%，累計擁有180餘項授權專利。
商業化落地：產品矩陣覆蓋四足機器人Go/B2系列、人形機器人H/G/R三大系列，售價從3.99萬元到65萬元不等，已落地工業巡檢、電力作業、科研教育、應急救援等場景；2024年營收突破10億元，C輪融資後估值超120億元，已完成IPO輔導，擬登陸科創板。

3. 節目核心技術實現原理

（0）概述

硬體底層：主力機型H2全身自由度從19個提升至31個（單臂7個、單腿6個、3自由度腰部、2自由度頸部），動作精度達毫米級；自研內轉子永磁同步電機扭矩密度達180Nm/kg，伺服響應速度0.001秒級，單臂峰值負載達21kg，支撐高爆發武術動作；搭載自研128線鐳射雷達與全新靈巧手，實現武術道具的穩定抓持與快速更換。
演算法與叢集控制：採用模型預測控制（MPC）+深度強化學習融合框架，機器人在模擬環境中完成上億次動作迭代，自主習得複雜武術技巧與平衡控制；自研高併發叢集控制系統與AI融合定位演算法，透過3D鐳射雷達每秒上百次掃描舞臺環境，實現無外部定位的全自主協同，攻克長序列表演的運動誤差累計難題；依託5G專網+邊緣計算，將叢集指令傳輸延遲壓縮至毫秒級，保障動作同步性。
直播容錯機制：搭載全自主容錯系統，機器人實時監測自身狀態，跑偏後可快速歸位；主控節點故障時0.3秒內切換備用主機，並有備用機器人待命，保障直播零失誤。

《武BOT》節目中，機器人的所有動作可拆解為三大核心技術模組，每個模組都對應著全球性的技術難題，我們逐一拆解：

（1）單機極限武術動作：從“能站穩”到“會打拳”的核心突破

節目裡做了什麼：機器人完成了彈射空翻、Airflare大回旋、雙節棍揮舞、醉拳倒地起身等連專業武術演員都需要長期訓練的動作，甚至在3米彈射落地後，能瞬間調整平衡，無縫銜接下一個武術招式。

核心難點：這類高爆發動作的核心挑戰，是機器人在重心劇烈變化、全身關節高速聯動時，始終保持平衡，同時精準控制每一個動作的力度、角度和節奏——哪怕一個關節的扭矩輸出偏差0.1%，就會導致機器人摔倒、表演失敗。

底層實現原理：

硬體底座：“肌肉骨骼”的極致效能

主力機型H2全身自由度從19個提升至31個（單臂7個、單腿6個、3自由度腰部、2自由度頸部），相當於給機器人裝上了能精準控制的“全身關節”；自研內轉子永磁同步電機，扭矩密度達180Nm/kg，伺服響應速度達到0.001秒級，比人類神經反射速度快100倍，單臂峰值負載達21kg，能支撐高爆發的空翻、揮棍動作。

通俗類比：這就像給武術運動員裝上了反應速度快100倍、力量控制精準到克的肌肉，既能爆發出空翻的爆發力，又能精準控制雙節棍的軌跡，不傷到自己和搭檔。
演算法核心：“肌肉記憶”的AI訓練

採用模型預測控制（MPC）+深度強化學習的融合框架，這是機器人能完成複雜武術動作的核心。

通俗解釋：團隊先在數字模擬世界裡，給機器人搭建了1:1的虛擬舞臺，讓AI控制的機器人在裡面完成上億次的動作訓練——就像武術運動員在武館裡反覆練習，摔倒了就調整引數重新來，最終讓機器人自主習得複雜武術技巧和平衡控制能力。

其中，MPC演算法相當於“實時教練”，每秒會對上百次機器人的重心、速度、關節狀態進行預判，提前調整每個關節的扭矩輸出，確保機器人在空翻、落地的全過程中，重心始終落在安全區間；而深度強化學習訓練出的“肌肉記憶”，能讓機器人在舞臺地面有輕微打滑、重心出現偏差時，瞬間自主調整動作，就像武術運動員臨場應變一樣。
道具操作：“手眼協同”的精準控制

機器人能穩定揮舞雙節棍、長劍，核心在於搭載了自研128線鐳射雷達+視覺相機，配合全新靈巧手，每秒對道具的位置、自身的姿態進行上百次掃描校準，實現道具的穩定抓持與軌跡控制，確保雙節棍的揮舞軌跡精準貼合武術動作設計，不會出現甩飛、節奏錯位的問題。

（2）20餘臺機器人叢集協同：從“單機跳”到“群體演”的全球突破

節目裡做了什麼：20餘臺機器人在沒有外部定位裝置的情況下，完成了4m/s高速跑位、複雜隊形變換、與真人演員的實時對練，全程沒有出現碰撞、跑偏，動作同步誤差小於0.1秒，實現了全球首次全自主人形機器人叢集武術表演。

核心難點：傳統機器人叢集表演，大多依賴舞臺地面的二維碼、外部動捕裝置進行定位，相當於“開了外掛”；而宇樹的機器人全程只靠自身機載感測器，在高速運動、舞臺燈光復雜、真人演員動態移動的環境下，實現精準定位和協同，還要解決長序列表演中，每臺機器人的動作誤差累計問題——一旦一臺機器人慢了0.05秒，整個叢集的表演就會亂套。

底層實現原理：

全自主定位：不依賴外掛的“環境感知”

自研AI融合定位演算法，透過機器人自帶的3D鐳射雷達，每秒上百次掃描舞臺環境，實時構建三維地圖，同時匹配預存的舞臺模型，計算出自身在舞臺上的精準位置，定位精度達到毫米級，完全不需要外部動捕、二維碼等輔助裝置。

通俗類比：這就像你蒙著眼睛，但是你腦子裡時刻知道自己在房間裡的位置以及周圍的情況，就能在熟悉的房間裡精準走到指定位置，而且跑步前進也不會撞牆，精度還能達到毫米級。
高併發叢集控制：零誤差的“團隊指揮”

自研分散式叢集控制系統，採用“統一時間基準+分散式軌跡規劃”架構：首先透過5G專網+邊緣計算，給所有機器人同步一個精準到微秒級的統一時間軸，確保每臺機器人的動作“在同一個節拍上”，指令傳輸延遲壓縮至毫秒級；

同時，主控系統只給機器人下發“目標位置、動作節拍”的核心指令，每臺機器人自主規劃自己的跑位路徑、動作執行細節，還能實時感知周邊機器人的位置，動態調整自己的路線，避免碰撞；哪怕某臺機器人出現輕微跑偏，也能在0.2秒內自主調整歸位，不影響整個叢集的表演。
誤差消除：長序列表演的“防跑偏機制”

團隊針對長序列武術表演，設計了“分段閉環校準”機制：把整個3分鐘的節目，拆解成數十個關鍵動作節點，每完成一個節點的動作，所有機器人都會自動校準自身位置、動作節奏，把累計的誤差清零，確保從節目開頭到結尾，同步精度始終保持在0.1秒以內。

（3）直播零失誤：國家級舞臺的“容錯保障”

節目裡做了什麼：在春晚全球直播的高壓場景下，20餘臺機器人全程零失誤，沒有出現一臺故障、摔倒，完美完成表演。

底層實現原理：

搭載了全自主容錯系統，每臺機器人都會實時監測自身的電機溫度、關節狀態、電池電量、定位精度，一旦出現輕微異常，會自動調整動作引數，優先保障平衡和核心動作執行；如果出現主控節點故障，會在0.3秒內自動切換備用主機，同時舞臺側方還有待命的備用機器人，可在節目間隙無縫替換故障裝置，徹底杜絕直播事故。

4. 國內外技術對比

維度	核心優勢	現存差距
運動效能	高動態運動控制能力全球領先，完成了波士頓動力Atlas尚未實現的連續花式翻桌跑酷、叢集協同武術表演等動作，單機極限動作引數躋身全球第一梯隊	在工業場景的長期穩定作業能力、複雜非結構化環境的泛化能力上，與波士頓動力、Agility Robotics仍有一定差距
量產能力	2025年出貨量遠超特斯拉Optimus（小批次測試階段）、波士頓動力Atlas（非量產），是全球唯一實現高效能人形機器人萬臺級量產規劃的企業	-
成本與供應鏈	整機成本僅為Atlas的千分之一、Optimus的約1/3，核心部件成本僅為進口產品的1/10，全棧自研供應鏈擺脫海外技術依賴	-
智慧能力	-	具身大模型的通用任務處理能力，相較於特斯拉Optimus的端到端大模型仍有提升空間

5. 未來發展方向

2026年目標人形機器人出貨量1萬-2萬臺，持續擴大全球市場份額；
深化工業巡檢、電力作業、應急救援等B端場景的規模化落地，實現單臺機器人替代3人工作量；
持續迭代具身智慧大模型，提升機器人的通用任務處理能力與自主決策能力；
推進消費級人形機器人的普及，以低價產品開啟C端市場。

二、魔法原子（MagicLab）

1. 春晚節目表現

作為春晚智慧機器人戰略合作伙伴，魔法原子是本屆春晚首家亮相的機器人企業。主會場歌曲《智造未來》中，攜6臺MagicBot Z1高動態小人形機器人、2臺MagicBot Gen1全尺寸人形機器人，與易烊千璽、陳小春等藝人同臺，完成360°托馬斯迴旋、側空翻、同步舞蹈等高難度動作；宜賓分會場，上百臺MagicDog四足機器人以“熊貓”造型完成全球首次百臺級四足機器人公開舞臺同步演繹；同時在賀歲短片中完成撈麵、送餐等生活化操作。

在這裡插入圖片描述

2. 公司核心業務與實力

企業基礎：2024年1月成立，總部無錫，由追覓科技孵化，核心研發人員佔比超70%；成立兩年完成多輪融資，累計融資超5億元，估值達35億元。
技術壁壘：核心硬體自研率超90%，覆蓋關節模組、靈巧手、伺服電機、諧波減速器等23類核心部件，自研關節峰值扭矩最高達525N·m，躋身行業第一梯隊；軟體層面打造“原子永珍”具身智慧大模型，採用“大腦+小腦”雙模架構。
商業化落地：產品矩陣包括人形機器人MagicBot Gen1/Z1、四足機器人MagicDog系列，覆蓋工業巡檢、商業服務、家庭陪伴、文旅演藝、教育娛樂等場景，已在27個國家建立本地化團隊。

3. 節目核心技術實現原理

魔法原子在春晚的表演，覆蓋了“高動態街舞、百臺級叢集同步、生活化精細操作”三大完全不同的技術方向，我們逐一拆解每個動作的實現邏輯：

（0）概述

硬體底層：MagicBot Z1奔跑速度突破4m/s，搭載自研高功率密度關節模組，支撐高動態舞蹈與空翻動作；Gen1全尺寸人形機器人雙臂最大負載達50kg，搭載自研6自由度靈巧手，實現撈麵、端餐等精細操作。
叢集控制：採用分散式叢集控制系統，透過時間同步演算法與多智慧體軌跡規劃，實現上百臺四足機器人的毫秒級動作同步，同步誤差小於0.01秒；透過純視覺SLAM定位，實現無外部輔助的自主編隊與動態避障。
智慧演算法：“原子永珍”具身大模型採用快慢雙模協同架構，“大腦”負責任務規劃與場景理解，“小腦”負責實時運動控制與平衡調節，透過數百萬條工業場景真實資料訓練，實現任務的自主泛化。

（1）主會場街舞表演：托馬斯全旋與同步舞蹈的技術突破

節目裡做了什麼：6臺MagicBot Z1小人形機器人，與真人藝人同臺完成了360°托馬斯迴旋、側空翻、連續街舞動作，同時與音樂節拍、藝人動作完美同步，轉身、擺臂、重心遷移全程連貫流暢，多機動作同步誤差小於0.01秒。

核心難點：托馬斯全旋這類街舞動作，需要機器人在單臂支撐全身重量的同時，完成腰部、腿部的高速圓周擺動，重心全程在快速變化，對關節的負載能力、扭矩控制精度、平衡調節速度提出了極致要求；同時多機協同舞蹈，需要每臺機器人的每一個動作，都精準貼合音樂節拍，差0.01秒就會出現“搶拍、慢拍”的問題。

底層實現原理：

硬體支撐：高功率密度的“關節心臟”

MagicBot Z1搭載了自研的高功率密度一體化關節模組，在小尺寸機身內實現了超高扭矩輸出，奔跑速度突破4m/s，單臂能穩定支撐整機8kg的重量，同時完成高速擺動，這是實現托馬斯全旋的物理基礎。

團隊針對街舞動作的高頻次、高負載特性，最佳化了關節的散熱結構與電流管理策略，確保機器人在連續3分鐘的高動態舞蹈中，不會因為關節過熱觸發保護機制，保證動作全程穩定輸出。
平衡控制：動態重心的實時調節

採用零力矩點（ZMP）平衡控制演算法，配合全身力控技術，在托馬斯全旋的全過程中，每秒數百次計算機器人的重心位置、支撐區域，實時調整手臂、腰部、腿部的關節角度和扭矩輸出，確保重心始終落在支撐臂的安全範圍內，不會出現側翻、摔倒的問題。

通俗類比：這就像你單臂撐在地上做圓周擺腿，大腦需要全程感知自己的重心，隨時調整手臂的發力、腰腹的扭轉、腿部的擺動，確保自己不會摔倒——而機器人的“大腦”，每秒能做數百次這樣的調整，精度比人類高上千倍。
節拍同步：零誤差的“音樂卡點”

團隊給所有機器人搭建了統一的高精度時間同步系統，以音樂的音訊波形為基準，把每一個舞蹈動作都精準對應到音樂的節拍點上，每臺機器人的動作啟動時間、執行時長，都精準鎖定到毫秒級，確保6臺機器人的動作完全同步，與藝人的表演、音樂的節奏完美契合。

（2）宜賓分會場：百臺熊貓機器狗的叢集表演

節目裡做了什麼：上百臺MagicDog四足機器人，以熊貓造型亮相，在宜賓分會場的城市廣場上，完成了奔跑、列陣、隊形變換、同步舞蹈，甚至實現了自然的歪頭、點頭等擬人化動作，全程動作整齊劃一，沒有出現一臺掉隊、碰撞。

核心難點：百臺級四足機器人的戶外叢集表演，核心挑戰有三個：一是戶外廣場地面不平整、燈光環境複雜，機器人的自主定位難度遠高於室內舞臺；二是百臺機器人的動作同步，需要解決大規模叢集的指令傳輸延遲、誤差累計問題；三是熊貓外皮包裹後，機身散熱空間被壓縮，需要解決高負載連續執行的穩定性問題。

底層實現原理：

分散式叢集控制系統：百臺機器人的“統一指揮”

採用“主站+分散式從站”的叢集控制架構，主站系統只負責下發整體的表演序列、隊形變換指令，每臺機器狗自主完成動作執行、路徑規劃、定位校準；透過時間敏感網路（TSN）技術，給所有機器人同步統一的時間基準，確保百臺機器人的動作啟動時間誤差小於0.01秒，實現“整齊劃一”的表演效果。
純視覺SLAM定位：戶外場景的精準導航

每臺機器狗都搭載了雙目視覺相機+IMU慣性測量單元，透過純視覺SLAM技術，實時構建戶外場景的三維地圖，匹配自身位置，同時感知周邊其他機器人的位置，動態調整行進路線，避免碰撞；哪怕戶外地面不平整、出現輕微打滑，也能自主調整步態，快速回到預定位置，完成隊形變換。
散熱與功率最佳化：外皮包裹下的穩定執行

針對熊貓外皮壓縮散熱空間的問題，團隊最佳化了整機的電流管理與功率控制策略，在不影響動作表現力的前提下，降低了連續運動狀態下的關節發熱量，同時最佳化了機身的散熱結構，確保機器人在長達數分鐘的連續表演中，不會因為過熱觸發保護，穩定完成所有動作。

（3）賀歲短片：撈麵、倒酒的精細操作

節目裡做了什麼：MagicBot Gen1全尺寸人形機器人，在短片中完成了撈麵、端餐、倒酒等生活化操作，麵條撈取、湯汁傾倒的力度控制精準，沒有出現灑漏、麵條斷裂的問題。

核心難點：這類精細操作的核心挑戰，是機器人對柔性物體（麵條）、易碎容器（碗、酒杯）的力控精度——力度太大，會夾斷面條、捏碎杯子；力度太小，會夾不住麵條、端不穩碗；同時還要精準控制傾倒的角度和速度，確保湯汁、酒水不會灑漏。

底層實現原理：

6自由度靈巧手：微米級的力控精度

Gen1搭載了自研6自由度靈巧手，指尖搭載了高精度力感測器，力控精度達到0.5N，能精準感知抓取物體的反饋力度，實現“柔性抓取”——撈麵條時，能精準控制指尖的夾持力，既牢牢夾住麵條，又不會把麵條夾斷；端碗時，能根據碗的重量、重心變化，實時調整手臂的姿態，確保碗始終保持水平，湯汁不會灑漏。
“大腦+小腦”雙架構：從任務規劃到精準執行

自研的“原子永珍”具身智慧大模型，採用“大腦+小腦”的快慢雙模協同架構：“大腦”負責任務規劃與場景理解，比如接收到“撈麵”的指令後，會自動拆解成“移動到鍋前-張開手-伸入鍋中-夾住麵條-抬起-放入碗中”的分步動作；“小腦”負責實時運動控制與力控調節，在每一步動作執行中，實時調整手臂的位置、指尖的力度，應對面條的柔性變化、碗的重量變化，確保任務精準完成。

4. 國內外技術對比

維度	核心優勢	現存差距
叢集協同	多機協同群控能力全球領先，完成全球首次百臺級四足機器人公開舞臺同步表演，分散式控制技術躋身行業第一梯隊	-
產品價效比	依託追覓科技的供應鏈優勢，實現高自研率下的極致成本控制，產品價效比遠超海外同級別產品	-
落地速度	成立僅兩年即實現多場景商業化落地，落地速度行業領先	全尺寸人形機器人的長期穩定執行能力、複雜場景的泛化能力，相較於宇樹科技、波士頓動力仍有差距
智慧能力	-	具身大模型的訓練資料量與通用能力，相較於銀河通用、特斯拉仍有提升空間

5. 未來發展方向

2026年工業場景計劃千臺級規模部署，在追覓工廠等場景落地物料搬運、點膠檢測等工序；
加速無人咖啡、無人藥房等零售解決方案的推廣，目標1-2年覆蓋全球10000家門店；
推進四足機器人導盲犬專案“光引001”的落地，切入助殘普惠場景；
持續拓展海外市場，提升全球化營收佔比。

三、松延動力（Noetix Robotics）

1. 春晚節目表現

作為春晚仿生人形機器人獨家合作伙伴，松延動力攜5款機器人參演小品《奶奶的最愛》，成為首個登上春晚語言類節目的機器人企業。其中1:1復刻蔡明的仿生機器人，以近乎真人的面部神態、口型同步、微表情動作，與真人演員完成對戲；同時4臺雙足人形機器人完成端茶、互動等生活化動作。

在這裡插入圖片描述

2. 公司核心業務與實力

企業基礎：2023年9月成立，總部北京，創始團隊來自清華、浙大；2025年一年內完成5輪融資，估值約20億元。
技術壁壘：核心技術覆蓋仿生人臉驅動、多模態互動大模型、雙足運動控制，是國內少數實現仿生人形機器人批次生產的企業；自研D2P數字人對映技術，實現虛擬數字人到實體機器人的精準對映。
商業化落地：構建了N系列、E系列、輪式機器人W1、“小布米”系列的產品矩陣；旗下萬元級消費級雙足機器人“小布米”（定價9998元），2025年10月發售即斬獲數千臺訂單，是全球首款萬元級消費級雙足人形機器人，產品已落地商業導覽、教育科研、家庭陪伴等場景。

3. 節目核心技術實現原理

松延動力在小品中的表演，核心分為兩大技術方向，也是仿生人形機器人最核心的兩個難題：“長得像、演得真”的仿生互動，以及**“走得穩、做得準”的生活化動作**，我們逐一拆解：

（0）概述

仿生人臉核心技術：透過鉑金矽膠新增高分子材料，提升面部拉伸自然度與耐久性；採用高緊湊型驅動設計，在仿生人臉內部整合32-40個微型電機，實現表情、口型、眼神的精準控制；自研D2P數字人對映技術，將虛擬數字人的表情、口型資料，實時對映到真實機器人的電機轉角上，實現語音與口型的1:1同步。
多模態互動：自研多模態互動大模型，實現語音、表情、眼神、肢體動作的協同表達，比如對話時的呼吸起伏、頸部與手臂的配合動作，大幅提升擬人互動體驗。
運動控制：自研雙足運動控制演算法，實現機器人在家庭場景的穩定行走、端茶、攙扶等高精度動作，適配非結構化的家庭環境。

（1）蔡明仿生機器人：真人級復刻與實時對戲的核心技術

節目裡做了什麼：1:1復刻蔡明老師的仿生機器人，在小品中與真人演員完成實時對戲，說話時口型與臺詞完全同步，同時配合臺詞做出眨眼、微笑、撇嘴、頭部微動作等真人級微表情，甚至能根據對手演員的臺詞，實時做出對應的神態反饋，模擬度極高，在後臺被多位演員誤認成真人。

核心難點：語言類節目對仿生機器人的要求，遠高於歌舞表演——不僅要“長得像”，更要“演得真”：口型要與臺詞1:1同步，差一幀就會出現“對口型穿幫”；微表情要貼合人物情緒，僵硬一點就會顯得很“假”；同時還要在狹小的人臉空間內，放下足夠多的驅動電機，還要保證上鏡效果，團隊甚至需要把仿生人頭整體縮小30%，對結構設計提出了極致挑戰。

底層實現原理：

仿生人臉硬體：真人級的“皮膚與肌肉”

首先在外觀上，團隊透過3D掃描，1:1復刻了蔡明老師的面部輪廓、五官細節，採用新增了高分子材料的鉑金矽膠製作仿生皮膚，不僅在視覺上無限接近真人皮膚的質感，還提升了皮膚的拉伸自然度與耐久性，在做出表情時，皮膚的拉伸、褶皺都與真人完全一致，不會出現“塑膠感”。

最核心的突破，是高緊湊型驅動設計：團隊在縮小30%的仿生人臉內部，整合了32個微型驅動電機，分別對應人臉的眉、眼、口、鼻等核心表情區域，相當於給機器人裝上了“人工面部肌肉”，每個電機都能精準控制對應區域的皮膚位移，實現微笑、撇嘴、眨眼、抬眉等數十種真人微表情，最小動作幅度可達0.1毫米，完全還原真人的面部神態。
D2P數字人對映技術：口型與表情的1:1同步

這是實現真人級對戲的核心技術，自研的D2P（數字人到物理人）對映技術，能把虛擬數字人的表情、口型資料，實時、精準地對映到實體機器人的電機上。

通俗解釋：團隊先提前採集了蔡明老師說臺詞時的面部動作、口型變化資料，製作了1:1的虛擬數字人；當機器人需要說臺詞時，系統會先把語音臺詞轉化為虛擬數字人的口型、表情動作，再透過D2P技術，把這些動作轉化為32個微型電機的轉動角度、速度指令，實時驅動電機動作，最終實現語音與口型的1:1同步，表情與臺詞情緒的完美契合，哪怕是臺詞裡的氣口、重音，都能對應到口型的細微變化上。
多模態互動大模型：實時對戲的“靈性反饋”

自研多模態互動大模型，能實時識別對手演員的臺詞、語氣、甚至面部表情，快速理解對話語境，輸出對應的臺詞、表情和肢體動作；同時還能實現語音、表情、眼神、肢體動作的協同表達，比如說話時配合自然的頭部轉動、呼吸起伏，甚至是說話間隙的眼神互動，完全還原真人對話的狀態，徹底擺脫了傳統機器人“念臺詞”的僵硬感。

（2）“小布米”雙足機器人：家庭場景的生活化動作

節目裡做了什麼：4臺“小布米”消費級雙足機器人，在小品中完成了穩定行走、端茶、敬禮、與演員互動揮手等動作，在客廳的非結構化環境中，全程行走穩定，端茶時沒有出現灑漏，動作流暢自然。

核心難點：消費級雙足機器人，受限於成本和尺寸，硬體效能無法和工業級大機型相比，要在家庭的瓷磚、地毯等不同地面上，實現穩定行走，還要完成端茶等精細操作，對演算法的輕量化、平衡控制能力提出了極高要求。

底層實現原理：

輕量化雙足運動控制演算法：小機身的穩定行走

“小布米”身高94釐米，體重僅12公斤，全身21個自由度，團隊針對小尺寸雙足機器人，自研了輕量化的模型預測控制演算法，能在算力有限的主控晶片上，實現每秒上百次的步態規劃與平衡調節，在瓷磚、地毯等不同地面上，都能自主調整步幅、步速和關節角度，實現穩定行走，哪怕被輕微觸碰，也能快速調整重心，不會摔倒。
力控抓取：端茶不灑的精細操作

機器人的手部搭載了微型力感測器，端茶時，能精準控制夾持杯子的力度，既牢牢握住杯子，又不會捏碎紙杯；同時在行走過程中，手臂會實時調整姿態，抵消行走帶來的晃動，確保杯子始終保持水平，杯裡的水不會灑漏，完美適配家庭場景的服務需求。

4. 國內外技術對比

維度	核心優勢	現存差距
仿生互動	仿生人臉的高整合度驅動技術、多模態情感互動能力處於國內第一梯隊，打破了海外企業在高階仿生機器人領域的壟斷	高動態運動控制能力，相較於宇樹科技、波士頓動力有明顯差距
消費級普及	率先實現消費級雙足機器人的萬元級定價，開啟了C端市場的普及路徑，差異化避開工業賽道紅海競爭，商業化落地速度領先	工業場景的落地能力與技術積累，弱於銀河通用、魔法原子
量產能力	實現了仿生人形機器人的批次生產，量產能力遠超海外同型別高階仿生產品	-

5. 未來發展方向

持續深化仿生人形機器人的技術迭代，推動產品在商業導覽、康養陪護場景的規模化落地；
推進消費級機器人“小布米”的量產與普及，拓展教育娛樂、家庭陪伴C端市場；
深化與高校、科研院所的合作，推動人形機器人教學平臺的落地；
持續最佳化成本，推動人形機器人進入普通家庭。

四、銀河通用（GALBOT）

1. 春晚節目表現

作為春晚指定具身大模型機器人，銀河通用在賀歲微電影《我最難忘的今宵》中，攜Galbot G1輪式雙臂機器人亮相，與沈騰、馬麗搭檔，完成盤核桃、撿玻璃碎片、疊衣服、貨架取物、串烤腸等生活化任務，實現了春晚舞臺首次無預設指令碼的機器人自主決策作業，無需提前程式設計，即可根據場景實時完成任務規劃與執行。

2. 公司核心業務與實力

企業基礎：2023年5月成立，總部北京，由北大王鶴博士、前ABB高管姚騰洲聯合創立，核心成員來自華為天才少年計劃、百度、微軟等企業；2025年12月完成超3億美元融資，估值達30億美元。
技術壁壘：國內極少數實現“百億資料集—具身大模型—機器人本體—場景規模化落地”全鏈條閉環的企業；自研“銀河星腦AstraBrain”具身大模型體系，首創虛實結合的訓練正規化，構建了百億級機器人幹活資料集，是全球具身機器人大模型資料量最大的公司之一。
商業化落地：產品主打Galbot系列輪式雙臂通用機器人，採用“輪式底盤+摺疊腿”複合結構，已實現千臺級規模化落地，覆蓋工業製造、智慧零售、醫療康養、城市服務等六大領域，合作客戶包括寧德時代、德國博世、豐田汽車、北汽、宣武醫院等龍頭企業，2025年工業訂單突破千臺，創下具身智慧領域商業化訂單紀錄。

3. 節目核心技術實現原理（通俗專業版）

銀河通用的表演，和其他三家企業最大的區別，是完全沒有預設的固定指令碼——其他機器人的表演，哪怕動作再複雜，也是提前編排好的固定程式；而銀河通用的機器人，是根據現場場景和任務指令，自主思考、自主規劃、自主執行，這也是具身智慧最核心的能力。我們以節目中幾個典型任務為例，拆解其底層實現原理：

概述

具身大模型核心：首創“合成模擬資料為主、真機採集資料為輔”的虛實結合訓練管線，解決了全球機器人幹活資料匱乏的行業難題；自研GraspVLA、GroceryVLA、NavFoM等端到端具身大模型，對透明、高光、不規則物體的抓取成功率穩定在95%以上，實現了任務的自主規劃、動態避障、長程導航。
硬體架構：採用“輪式底盤+摺疊腿+雙臂”的複合結構，兼顧高速移動與越障能力，身高173cm、臂展190cm、升降行程65cm，雙臂最大負載達50kg，搭載自研6自由度靈巧手，實現毫米級精細操作。
一體化控制系統：採用“大腦-小腦-神經控制”一體化系統，“大腦”（具身大模型）負責場景理解與任務規劃，“小腦”負責運動控制與平衡調節，“神經控制”負責關節的實時伺服響應，實現端到端的任務執行，無需預設指令碼。

核心任務邏輯：無指令碼自主作業的全鏈路流程

不管是盤核桃、撿玻璃碎片，還是疊衣服、串烤腸，機器人執行所有任務，都遵循著**“感知-決策-執行-反饋最佳化”**的端到端全鏈路，這也是它能實現無指令碼作業的核心，我們逐層拆解：

第一步：感知——“看懂”眼前的場景和物體

節目裡的挑戰：機器人需要識別出核桃、玻璃碎片、衣服、烤腸、籤子等完全不同的物體，尤其是透明的玻璃碎片，在淺色桌面上幾乎“隱形”，傳統視覺系統很容易識別失敗；同時還要適應舞臺複雜的燈光變化，準確判斷每個物體的位置、形狀、大小、材質。

底層實現原理：

機器人搭載了多模態感知系統，包括雙目深度相機、鐳射雷達、觸覺感測器，能同時獲取場景的視覺、深度、觸覺資訊；
自研的視覺大模型，在訓練階段見過了數十億張真實場景圖片，能精準識別上萬種日常物體，哪怕是形狀不規則的碎玻璃、褶皺的衣服，也能快速識別並分割出物體輪廓；
針對透明物體識別的行業難題，團隊透過模擬環境生成了海量的透明物體資料——不同厚度、不同碎裂形狀、不同光照條件下的玻璃碎片，讓機器人在虛擬世界中“見過”各種可能的透明形態，理解了透明物體的反光、折射規律，最終實現對玻璃碎片的識別成功率穩定在99%以上，哪怕是隻有幾毫米的玻璃渣，也能精準定位。

第二步：決策——“想清楚”任務該怎麼做

節目裡的挑戰：比如“撿玻璃碎片”這個任務，沒有提前程式設計告訴機器人“先撿大的、再撿小的，用夾子夾，放到垃圾桶裡”，機器人需要自主理解任務目標，把大任務拆解成可執行的小步驟，還要應對突發情況——比如玻璃碎片滾到了桌子底下，要自主規劃路線，調整手臂姿態去撿。

底層實現原理：

核心是自研的“銀河星腦AstraBrain”具身大模型，它就像機器人的“大腦”，透過百億級的機器人運算元據訓練，已經學會了上千種日常任務的執行邏輯，能根據任務指令，自主拆解動作步驟。

通俗類比：就像你讓一個人“把地上的玻璃碎片撿乾淨”，他不用你一步步教，就會自己去找垃圾桶、拿工具，先撿大塊再撿小塊，還會注意不被劃傷——銀河通用的具身大模型，就是讓機器人具備了這樣的自主思考能力。
針對春晚的場景，團隊還對大模型進行了輕量化微調，讓它能快速適配舞臺場景，針對不同任務快速輸出最優的動作規劃，同時具備容錯能力——如果第一次撿玻璃沒夾住，會自主調整夾子的開合角度、夾持位置，重新嘗試，直到任務完成。

第三步：執行——“精準完成”精細操作

節目裡的挑戰：不同任務對操作的要求完全不同：盤核桃需要雙手配合，力度既要足夠轉動核桃，又不能捏碎；串烤腸需要精準把烤腸穿到籤子上，偏差1毫米就會穿歪；疊衣服需要抓住衣服的邊角，精準完成摺疊動作，這些都對機器人的動作精度、力控能力提出了極高要求。

底層實現原理：

硬體基礎：靈活又精準的“手臂和手”

Galbot G1採用“輪式底盤+摺疊腿+雙臂”的複合結構，雙臂最大負載達50kg，重複定位精度可達±0.02毫米，比頭髮絲還細；搭載自研6自由度靈巧手，指尖配備高精度力感測器，力控精度可達0.3N，既能實現串烤腸的毫米級精準定位，又能實現盤核桃、疊衣服的柔性力控。
“大腦-小腦-神經”一體化控制系統

採用三級控制架構，實現端到端的精準執行：“大腦”（具身大模型）輸出任務規劃和動作指令；“小腦”（運動控制演算法）負責把指令拆解成每個關節的轉動角度、扭矩引數，實時調節手臂的運動軌跡和力度；“神經控制”（伺服系統）負責0.001秒級的實時響應，確保每個關節都精準執行指令，最終實現任務的完美執行。
虛實結合的訓練正規化：讓機器人提前“練會”所有動作

團隊首創“合成模擬資料為主、真機採集資料為輔”的訓練管線，解決了全球機器人幹活資料匱乏的行業難題。通俗解釋：在數字模擬世界裡，生成了數百萬種不同大小、材質、形狀的虛擬物體，還有各種不同的場景，讓機器人在虛擬世界裡完成上千億次的操作訓練，練出了一套適應性極強的“通用操作能力”；再用少量真實世界的資料做微調，就能讓機器人在真實場景裡，輕鬆完成各種沒見過的任務，這也是它能在春晚舞臺上，無指令碼完成多種生活化任務的核心原因。

4. 國內外技術對比

維度	核心優勢	現存差距
場景落地	具身大模型的場景落地能力全球領先，實現了全球首個百臺級機器人7×24小時自主運營的零售店，工業、零售場景的規模化落地能力，遠超特斯拉Optimus、波士頓動力等海外企業	雙足人形機器人的高動態運動控制能力，相較於宇樹科技、波士頓動力有差距
技術創新	首創的虛實結合訓練正規化，解決了全球機器人幹活資料匱乏的行業難題，具身大模型的操作泛化能力躋身全球第一梯隊	消費級市場的佈局與產品，相較於松延動力較為滯後
工業能力	輪式雙臂機器人的過載操作、精細操作能力處於行業第一梯隊，已獲得頭部製造企業的千臺級訂單，商業化落地規模全球領先	-

5. 未來發展方向

2026年加大“銀河太空艙”無人零售解決方案在全國的推廣力度，實現千店級規模部署；
深化與寧德時代、博世等工業客戶的合作，擴大工業場景的千臺級部署規模；
持續迭代具身大模型，提升機器人的通用任務泛化能力，拓展醫療康養、城市服務等場景；
推進IPO程序，提升資本市場影響力，鞏固具身智慧領域的龍頭地位。

整體總結

2026年春晚的機器人表演，並非單純的舞臺炫技，而是中國人形機器人產業的一次國家級路演。四家企業分別在高動態運動控制、多機叢集協同、仿生情感互動、具身智慧落地四大核心方向，展現了中國在人形機器人領域從跟跑到並跑、部分領域領跑的產業格局。

相較於海外企業聚焦實驗室引數、軍事場景、長期測試的技術路線，中國企業更注重場景落地、成本控制、規模化量產，形成了差異化的競爭優勢，推動人形機器人從實驗室走向工業、商業、家庭等真實場景，2026年也被業內視為人形機器人規模化應用的元年。

From the Spring Festival Gala to Global Arenas: How Far Have Chinese Humanoid Robots Come?

2026 Spring Festival Gala review of four Chinese humanoid makers—Unitree, MagicLab, Noetix, Galbot—performances, tech stacks, swarm/bionic/embodied AI, vs global peers and commercialization.

Captured at (local ISO): 2026-05-18 05:17:38

Preface

The 2026 CCTV Spring Festival Gala set a record for robot participation: Unitree, MagicLab, Noetix (Songyan Power), and Galbot brought 200+ humanoids into four flagship segments—martial arts, comedy sketch, song-and-dance, and micro-film—showing how far China’s humanoid industry has come in tech and commercial deployment. Below is a company-by-company breakdown.

I. Unitree Robotics

1. Spring Festival Gala performance

As a three-time Gala veteran，宇树科技是武术节目《武BOT》的核心技术方，携20余台H2、G1系列人形机器人，与河南塔沟武术学校学员同台，完成全球首次全自主人形机器人集群武术表演。

在这里插入图片描述

2. Core business and strengths

企业基础：2016年成立，总部位于杭州，国家级专精特新“小巨人”企业，全球足式机器人绝对龙头，四足机器人全球市占率超69.75%；2025年人形机器人出货量超5500台，位列全球第一。
技术壁垒：实现从电机、减速器、控制器、运动控制算法到具身大模型的全栈自研，核心部件自研率超95%，国产化率超85%，累计拥有180余项授权专利。
商业化落地：产品矩阵覆盖四足机器人Go/B2系列、人形机器人H/G/R三大系列，售价从3.99万元到65万元不等，已落地工业巡检、电力作业、科研教育、应急救援等场景；2024年营收突破10亿元，C轮融资后估值超120亿元，已完成IPO辅导，拟登陆科创板。

3. Core technical implementation

(0) Overview

硬件底层：主力机型H2全身自由度从19个提升至31个（单臂7个、单腿6个、3自由度腰部、2自由度颈部），动作精度达毫米级；自研内转子永磁同步电机扭矩密度达180Nm/kg，伺服响应速度0.001秒级，单臂峰值负载达21kg，支撑高爆发武术动作；搭载自研128线激光雷达与全新灵巧手，实现武术道具的稳定抓持与快速更换。
算法与集群控制：采用模型预测控制（MPC）+深度强化学习融合框架，机器人在仿真环境中完成上亿次动作迭代，自主习得复杂武术技巧与平衡控制；自研高并发集群控制系统与AI融合定位算法，通过3D激光雷达每秒上百次扫描舞台环境，实现无外部定位的全自主协同，攻克长序列表演的运动误差累计难题；依托5G专网+边缘计算，将集群指令传输延迟压缩至毫秒级，保障动作同步性。
直播容错机制：搭载全自主容错系统，机器人实时监测自身状态，跑偏后可快速归位；主控节点故障时0.3秒内切换备用主机，并有备用机器人待命，保障直播零失误。

《武BOT》节目中，机器人的所有动作可拆解为三大核心技术模块，每个模块都对应着全球性的技术难题，我们逐一拆解：

(1) Extreme single-robot martial arts：从“能站稳”到“会打拳”的核心突破

What happened on stage：机器人完成了弹射空翻、Airflare大回旋、双节棍挥舞、醉拳倒地起身等连专业武术演员都需要长期训练的动作，甚至在3米弹射落地后，能瞬间调整平衡，无缝衔接下一个武术招式。

Core challenge：这类高爆发动作的核心挑战，是机器人在重心剧烈变化、全身关节高速联动时，始终保持平衡，同时精准控制每一个动作的力度、角度和节奏——哪怕一个关节的扭矩Output偏差0.1%，就会导致机器人摔倒、表演失败。

How it works：

硬件底座：“肌肉骨骼”的极致性能

主力机型H2全身自由度从19个提升至31个（单臂7个、单腿6个、3自由度腰部、2自由度颈部），相当于给机器人装上了能精准控制的“全身关节”；自研内转子永磁同步电机，扭矩密度达180Nm/kg，伺服响应速度达到0.001秒级，比人类神经反射速度快100倍，单臂峰值负载达21kg，能支撑高爆发的空翻、挥棍动作。

Analogy：这就像给武术运动员装上了反应速度快100倍、力量控制精准到克的肌肉，既能爆发出空翻的爆发力，又能精准控制双节棍的轨迹，不伤到自己和搭档。
算法核心：“肌肉记忆”的AI训练

采用模型预测控制（MPC）+深度强化学习的融合框架，这是机器人能完成复杂武术动作的核心。

In plain terms：团队先在数字仿真世界里，给机器人搭建了1:1的虚拟舞台，让AI控制的机器人在里面完成上亿次的动作训练——就像武术运动员在武馆里反复练习，摔倒了就调整参数重新来，最终让机器人自主习得复杂武术技巧和平衡控制能力。

其中，MPC算法相当于“实时教练”，每秒会对上百次机器人的重心、速度、关节状态进行预判，提前调整每个关节的扭矩Output，确保机器人在空翻、落地的全过程中，重心始终落在安全区间；而深度强化学习训练出的“肌肉记忆”，能让机器人在舞台地面有轻微打滑、重心出现偏差时，瞬间自主调整动作，就像武术运动员临场应变一样。
道具操作：“手眼协同”的精准控制

机器人能稳定挥舞双节棍、长剑，核心在于搭载了自研128线激光雷达+视觉相机，配合全新灵巧手，每秒对道具的位置、自身的姿态进行上百次扫描校准，实现道具的稳定抓持与轨迹控制，确保双节棍的挥舞轨迹精准贴合武术动作设计，不会出现甩飞、节奏错位的问题。

(2) Swarm coordination (20+ robots)：从“单机跳”到“群体演”的全球突破

What happened on stage：20余台机器人在没有外部定位设备的情况下，完成了4m/s高速跑位、复杂队形变换、与真人演员的实时对练，全程没有出现碰撞、跑偏，动作同步误差小于0.1秒，实现了全球首次全自主人形机器人集群武术表演。

Core challenge：传统机器人集群表演，大多依赖舞台地面的二维码、外部动捕设备进行定位，相当于“开了外挂”；而宇树的机器人全程只靠自身机载传感器，在高速运动、舞台灯光复杂、真人演员动态移动的环境下，实现精准定位和协同，还要解决长序列表演中，每台机器人的动作误差累计问题——一旦一台机器人慢了0.05秒，整个集群的表演就会乱套。

How it works：

全自主定位：不依赖外挂的“环境感知”

自研AI融合定位算法，通过机器人自带的3D激光雷达，每秒上百次扫描舞台环境，实时构建三维地图，同时匹配预存的舞台模型，计算出自身在舞台上的精准位置，定位精度达到毫米级，完全不需要外部动捕、二维码等辅助设备。

Analogy：这就像你蒙着眼睛，但是你脑子里时刻知道自己在房间里的位置以及周围的情况，就能在熟悉的房间里精准走到指定位置，而且跑步前进也不会撞墙，精度还能达到毫米级。
高并发集群控制：零误差的“团队指挥”

自研分布式集群控制系统，采用“统一时间基准+分布式轨迹规划”架构：首先通过5G专网+边缘计算，给所有机器人同步一个精准到微秒级的统一时间轴，确保每台机器人的动作“在同一个节拍上”，指令传输延迟压缩至毫秒级；

同时，主控系统只给机器人下发“目标位置、动作节拍”的核心指令，每台机器人自主规划自己的跑位路径、动作执行细节，还能实时感知周边机器人的位置，动态调整自己的路线，避免碰撞；哪怕某台机器人出现轻微跑偏，也能在0.2秒内自主调整归位，不影响整个集群的表演。
误差消除：长序列表演的“防跑偏机制”

团队针对长序列武术表演，设计了“分段闭环校准”机制：把整个3分钟的节目，拆解成数十个关键动作节点，每完成一个节点的动作，所有机器人都会自动校准自身位置、动作节奏，把累计的误差清零，确保从节目开头到结尾，同步精度始终保持在0.1秒以内。

(3) Zero-failure live broadcast：国家级舞台的“容错保障”

What happened on stage：在春晚全球直播的高压场景下，20余台机器人全程零失误，没有出现一台故障、摔倒，完美完成表演。

How it works：

4. Domestic vs. global comparison

Dimension	Strengths	Gaps
Motion performance	高动态运动控制能力全球领先，完成了波士顿动力Atlas尚未实现的连续花式翻桌跑酷、集群协同武术表演等动作，单机极限动作参数跻身全球第一梯队	在工业场景的长期稳定作业能力、复杂非结构化环境的泛化能力上，与波士顿动力、Agility Robotics仍有一定差距
Mass production	2025年出货量远超特斯拉Optimus（小批量测试阶段）、波士顿动力Atlas（非量产），是全球唯一实现高性能人形机器人万台级量产规划的企业	-
Cost & supply chain	整机成本仅为Atlas的千分之一、Optimus的约1/3，核心部件成本仅为进口产品的1/10，全栈自研供应链摆脱海外技术依赖	-
Intelligence	-	具身大模型的通用任务处理能力，相较于特斯拉Optimus的端到端大模型仍有提升空间

5. Future direction

2026年目标人形机器人出货量1万-2万台，持续扩大全球市场份额；
深化工业巡检、电力作业、应急救援等B端场景的规模化落地，实现单台机器人替代3人工作量；
持续迭代具身智能大模型，提升机器人的通用任务处理能力与自主决策能力；
推进消费级人形机器人的普及，以低价产品打开C端市场。

II. MagicLab

1. Spring Festival Gala performance

在这里插入图片描述

2. Core business and strengths

企业基础：2024年1月成立，总部无锡，由追觅科技孵化，核心研发人员占比超70%；成立两年完成多轮融资，累计融资超5亿元，估值达35亿元。
技术壁垒：核心硬件自研率超90%，覆盖关节模组、灵巧手、伺服电机、谐波减速器等23类核心部件，自研关节峰值扭矩最高达525N·m，跻身行业第一梯队；软件层面打造“原子万象”具身智能大模型，采用“大脑+小脑”双模架构。
商业化落地：产品矩阵包括人形机器人MagicBot Gen1/Z1、四足机器人MagicDog系列，覆盖工业巡检、商业服务、家庭陪伴、文旅演艺、教育娱乐等场景，已在27个国家建立本地化团队。

3. Core technical implementation

魔法原子在春晚的表演，覆盖了“高动态街舞、百台级集群同步、生活化精细操作”三大完全不同的技术方向，我们逐一拆解每个动作的实现逻辑：

(0) Overview

硬件底层：MagicBot Z1奔跑速度突破4m/s，搭载自研高功率密度关节模组，支撑高动态舞蹈与空翻动作；Gen1全尺寸人形机器人双臂最大负载达50kg，搭载自研6自由度灵巧手，实现捞面、端餐等精细操作。
集群控制：采用分布式集群控制系统，通过时间同步算法与多智能体轨迹规划，实现上百台四足机器人的毫秒级动作同步，同步误差小于0.01秒；通过纯视觉SLAM定位，实现无外部辅助的自主编队与动态避障。
智能算法：“原子万象”具身大模型采用快慢双模协同架构，“大脑”负责任务规划与场景理解，“小脑”负责实时运动控制与平衡调节，通过数百万条工业场景真实数据训练，实现任务的自主泛化。

（1）主会场街舞表演：托马斯全旋与同步舞蹈的技术突破

What happened on stage：6台MagicBot Z1小人形机器人，与真人艺人同台完成了360°托马斯回旋、侧空翻、连续街舞动作，同时与音乐节拍、艺人动作完美同步，转身、摆臂、重心迁移全程连贯流畅，多机动作同步误差小于0.01秒。

Core challenge：托马斯全旋这类街舞动作，需要机器人在单臂支撑全身重量的同时，完成腰部、腿部的高速圆周摆动，重心全程在快速变化，对关节的负载能力、扭矩控制精度、平衡调节速度提出了极致要求；同时多机协同舞蹈，需要每台机器人的每一个动作，都精准贴合音乐节拍，差0.01秒就会出现“抢拍、慢拍”的问题。

How it works：

硬件支撑：高功率密度的“关节心脏”

MagicBot Z1搭载了自研的高功率密度一体化关节模组，在小尺寸机身内实现了超高扭矩Output，奔跑速度突破4m/s，单臂能稳定支撑整机8kg的重量，同时完成高速摆动，这是实现托马斯全旋的物理基础。

团队针对街舞动作的高频次、高负载特性，优化了关节的散热结构与电流管理策略，确保机器人在连续3分钟的高动态舞蹈中，不会因为关节过热触发保护机制，保证动作全程稳定Output。
平衡控制：动态重心的实时调节

采用零力矩点（ZMP）平衡控制算法，配合全身力控技术，在托马斯全旋的全过程中，每秒数百次计算机器人的重心位置、支撑区域，实时调整手臂、腰部、腿部的关节角度和扭矩Output，确保重心始终落在支撑臂的安全范围内，不会出现侧翻、摔倒的问题。

Analogy：这就像你单臂撑在地上做圆周摆腿，大脑需要全程感知自己的重心，随时调整手臂的发力、腰腹的扭转、腿部的摆动，确保自己不会摔倒——而机器人的“大脑”，每秒能做数百次这样的调整，精度比人类高上千倍。
节拍同步：零误差的“音乐卡点”

团队给所有机器人搭建了统一的高精度时间同步系统，以音乐的音频波形为基准，把每一个舞蹈动作都精准对应到音乐的节拍点上，每台机器人的动作启动时间、执行时长，都精准锁定到毫秒级，确保6台机器人的动作完全同步，与艺人的表演、音乐的节奏完美契合。

（2）宜宾分会场：百台熊猫机器狗的集群表演

What happened on stage：上百台MagicDog四足机器人，以熊猫造型亮相，在宜宾分会场的城市广场上，完成了奔跑、列阵、队形变换、同步舞蹈，甚至实现了自然的歪头、点头等拟人化动作，全程动作整齐划一，没有出现一台掉队、碰撞。

Core challenge：百台级四足机器人的户外集群表演，核心挑战有三个：一是户外广场地面不平整、灯光环境复杂，机器人的自主定位难度远高于室内舞台；二是百台机器人的动作同步，需要解决大规模集群的指令传输延迟、误差累计问题；三是熊猫外皮包裹后，机身散热空间被压缩，需要解决高负载连续运行的稳定性问题。

How it works：

分布式集群控制系统：百台机器人的“统一指挥”

采用“主站+分布式从站”的集群控制架构，主站系统只负责下发整体的表演序列、队形变换指令，每台机器狗自主完成动作执行、路径规划、定位校准；通过时间敏感网络（TSN）技术，给所有机器人同步统一的时间基准，确保百台机器人的动作启动时间误差小于0.01秒，实现“整齐划一”的表演效果。
纯视觉SLAM定位：户外场景的精准导航

每台机器狗都搭载了双目视觉相机+IMU惯性测量单元，通过纯视觉SLAM技术，实时构建户外场景的三维地图，匹配自身位置，同时感知周边其他机器人的位置，动态调整行进路线，避免碰撞；哪怕户外地面不平整、出现轻微打滑，也能自主调整步态，快速回到预定位置，完成队形变换。
散热与功率优化：外皮包裹下的稳定运行

针对熊猫外皮压缩散热空间的问题，团队优化了整机的电流管理与功率控制策略，在不影响动作表现力的前提下，降低了连续运动状态下的关节发热量，同时优化了机身的散热结构，确保机器人在长达数分钟的连续表演中，不会因为过热触发保护，稳定完成所有动作。

（3）贺岁短片：捞面、倒酒的精细操作

What happened on stage：MagicBot Gen1全尺寸人形机器人，在短片中完成了捞面、端餐、倒酒等生活化操作，面条捞取、汤汁倾倒的力度控制精准，没有出现洒漏、面条断裂的问题。

Core challenge：这类精细操作的核心挑战，是机器人对柔性物体（面条）、易碎容器（碗、酒杯）的力控精度——力度太大，会夹断面条、捏碎杯子；力度太小，会夹不住面条、端不稳碗；同时还要精准控制倾倒的角度和速度，确保汤汁、酒水不会洒漏。

How it works：

6自由度灵巧手：微米级的力控精度

Gen1搭载了自研6自由度灵巧手，指尖搭载了高精度力传感器，力控精度达到0.5N，能精准感知抓取物体的反馈力度，实现“柔性抓取”——捞面条时，能精准控制指尖的夹持力，既牢牢夹住面条，又不会把面条夹断；端碗时，能根据碗的重量、重心变化，实时调整手臂的姿态，确保碗始终保持水平，汤汁不会洒漏。
“大脑+小脑”双架构：从任务规划到精准执行

自研的“原子万象”具身智能大模型，采用“大脑+小脑”的快慢双模协同架构：“大脑”负责任务规划与场景理解，比如接收到“捞面”的指令后，会自动拆解成“移动到锅前-张开手-伸入锅中-夹住面条-抬起-放入碗中”的分步动作；“小脑”负责实时运动控制与力控调节，在每一步动作执行中，实时调整手臂的位置、指尖的力度，应对面条的柔性变化、碗的重量变化，确保任务精准完成。

4. Domestic vs. global comparison

Dimension	Strengths	Gaps
Swarm coordination	多机协同群控能力全球领先，完成全球首次百台级四足机器人公开舞台同步表演，分布式控制技术跻身行业第一梯队	-
Value for money	依托追觅科技的供应链优势，实现高自研率下的极致成本控制，产品性价比远超海外同级别产品	-
Time to market	成立仅两年即实现多场景商业化落地，落地速度行业领先	全尺寸人形机器人的长期稳定运行能力、复杂场景的泛化能力，相较于宇树科技、波士顿动力仍有差距
Intelligence	-	具身大模型的训练数据量与通用能力，相较于银河通用、特斯拉仍有提升空间

5. Future direction

2026年工业场景计划千台级规模部署，在追觅工厂等场景落地物料搬运、点胶检测等工序；
加速无人咖啡、无人药房等零售解决方案的推广，目标1-2年覆盖全球10000家门店；
推进四足机器人导盲犬项目“光引001”的落地，切入助残普惠场景；
持续拓展海外市场，提升全球化营收占比。

III. Noetix Robotics (Songyan Power)

1. Spring Festival Gala performance

在这里插入图片描述

2. Core business and strengths

企业基础：2023年9月成立，总部北京，创始团队来自清华、浙大；2025年一年内完成5轮融资，估值约20亿元。
技术壁垒：核心技术覆盖仿生人脸驱动、多模态交互大模型、双足运动控制，是国内少数实现仿生人形机器人批量生产的企业；自研D2P数字人映射技术，实现虚拟数字人到实体机器人的精准映射。
商业化落地：构建了N系列、E系列、轮式机器人W1、“小布米”系列的产品矩阵；旗下万元级消费级双足机器人“小布米”（定价9998元），2025年10月发售即斩获数千台订单，是全球首款万元级消费级双足人形机器人，产品已落地商业导览、教育科研、家庭陪伴等场景。

3. Core technical implementation

(0) Overview

仿生人脸核心技术：通过铂金硅胶添加高分子材料，提升面部拉伸自然度与耐久性；采用高紧凑型驱动设计，在仿生人脸内部集成32-40个微型电机，实现表情、口型、眼神的精准控制；自研D2P数字人映射技术，将虚拟数字人的表情、口型数据，实时映射到真实机器人的电机转角上，实现语音与口型的1:1同步。
多模态交互：自研多模态交互大模型，实现语音、表情、眼神、肢体动作的协同表达，比如对话时的呼吸起伏、颈部与手臂的配合动作，大幅提升拟人交互体验。
运动控制：自研双足运动控制算法，实现机器人在家庭场景的稳定行走、端茶、搀扶等高精度动作，适配非结构化的家庭环境。

（1）蔡明仿生机器人：真人级复刻与实时对戏的核心技术

What happened on stage：1:1复刻蔡明老师的仿生机器人，在小品中与真人演员完成实时对戏，说话时口型与台词完全同步，同时配合台词做出眨眼、微笑、撇嘴、头部微动作等真人级微表情，甚至能根据对手演员的台词，实时做出对应的神态反馈，仿真度极高，在后台被多位演员误认成真人。

Core challenge：语言类节目对仿生机器人的要求，远高于歌舞表演——不仅要“长得像”，更要“演得真”：口型要与台词1:1同步，差一帧就会出现“对口型穿帮”；微表情要贴合人物情绪，僵硬一点就会显得很“假”；同时还要在狭小的人脸空间内，放下足够多的驱动电机，还要保证上镜效果，团队甚至需要把仿生人头整体缩小30%，对结构设计提出了极致挑战。

How it works：

仿生人脸硬件：真人级的“皮肤与肌肉”

首先在外观上，团队通过3D扫描，1:1复刻了蔡明老师的面部轮廓、五官细节，采用添加了高分子材料的铂金硅胶制作仿生皮肤，不仅在视觉上无限接近真人皮肤的质感，还提升了皮肤的拉伸自然度与耐久性，在做出表情时，皮肤的拉伸、褶皱都与真人完全一致，不会出现“塑料感”。

最核心的突破，是高紧凑型驱动设计：团队在缩小30%的仿生人脸内部，集成了32个微型驱动电机，分别对应人脸的眉、眼、口、鼻等核心表情区域，相当于给机器人装上了“人工面部肌肉”，每个电机都能精准控制对应区域的皮肤位移，实现微笑、撇嘴、眨眼、抬眉等数十种真人微表情，最小动作幅度可达0.1毫米，完全还原真人的面部神态。
D2P数字人映射技术：口型与表情的1:1同步

这是实现真人级对戏的核心技术，自研的D2P（数字人到物理人）映射技术，能把虚拟数字人的表情、口型数据，实时、精准地映射到实体机器人的电机上。

In plain terms：团队先提前采集了蔡明老师说台词时的面部动作、口型变化数据，制作了1:1的虚拟数字人；当机器人需要说台词时，系统会先把语音台词转化为虚拟数字人的口型、表情动作，再通过D2P技术，把这些动作转化为32个微型电机的转动角度、速度指令，实时驱动电机动作，最终实现语音与口型的1:1同步，表情与台词情绪的完美契合，哪怕是台词里的气口、重音，都能对应到口型的细微变化上。
多模态交互大模型：实时对戏的“灵性反馈”

自研多模态交互大模型，能实时识别对手演员的台词、语气、甚至面部表情，快速理解对话语境，Output对应的台词、表情和肢体动作；同时还能实现语音、表情、眼神、肢体动作的协同表达，比如说话时配合自然的头部转动、呼吸起伏，甚至是说话间隙的眼神互动，完全还原真人对话的状态，彻底摆脱了传统机器人“念台词”的僵硬感。

（2）“小布米”双足机器人：家庭场景的生活化动作

What happened on stage：4台“小布米”消费级双足机器人，在小品中完成了稳定行走、端茶、敬礼、与演员互动挥手等动作，在客厅的非结构化环境中，全程行走稳定，端茶时没有出现洒漏，动作流畅自然。

Core challenge：消费级双足机器人，受限于成本和尺寸，硬件性能无法和工业级大机型相比，要在家庭的瓷砖、地毯等不同地面上，实现稳定行走，还要完成端茶等精细操作，对算法的轻量化、平衡控制能力提出了极高要求。

How it works：

轻量化双足运动控制算法：小机身的稳定行走

“小布米”身高94厘米，体重仅12公斤，全身21个自由度，团队针对小尺寸双足机器人，自研了轻量化的模型预测控制算法，能在算力有限的主控芯片上，实现每秒上百次的步态规划与平衡调节，在瓷砖、地毯等不同地面上，都能自主调整步幅、步速和关节角度，实现稳定行走，哪怕被轻微触碰，也能快速调整重心，不会摔倒。
力控抓取：端茶不洒的精细操作

机器人的手部搭载了微型力传感器，端茶时，能精准控制夹持杯子的力度，既牢牢握住杯子，又不会捏碎纸杯；同时在行走过程中，手臂会实时调整姿态，抵消行走带来的晃动，确保杯子始终保持水平，杯里的水不会洒漏，完美适配家庭场景的服务需求。

4. Domestic vs. global comparison

Dimension	Strengths	Gaps
Bionic interaction	仿生人脸的高集成度驱动技术、多模态情感交互能力处于国内第一梯队，打破了海外企业在高端仿生机器人领域的垄断	高动态运动控制能力，相较于宇树科技、波士顿动力有明显差距
Consumer adoption	率先实现消费级双足机器人的万元级定价，打开了C端市场的普及路径，差异化避开工业赛道红海竞争，商业化落地速度领先	工业场景的落地能力与技术积累，弱于银河通用、魔法原子
Mass production	实现了仿生人形机器人的批量生产，量产能力远超海外同类型高端仿生产品	-

5. Future direction

持续深化仿生人形机器人的技术迭代，推动产品在商业导览、康养陪护场景的规模化落地；
推进消费级机器人“小布米”的量产与普及，拓展教育娱乐、家庭陪伴C端市场；
深化与高校、科研院所的合作，推动人形机器人教学平台的落地；
持续优化成本，推动人形机器人进入普通家庭。

IV. Galbot (GALBOT)

1. Spring Festival Gala performance

2. Core business and strengths

企业基础：2023年5月成立，总部北京，由北大王鹤博士、前ABB高管姚腾洲联合创立，核心成员来自华为天才少年计划、百度、微软等企业；2025年12月完成超3亿美元融资，估值达30亿美元。
技术壁垒：国内极少数实现“百亿数据集—具身大模型—机器人本体—场景规模化落地”全链条闭环的企业；自研“银河星脑AstraBrain”具身大模型体系，首创虚实结合的训练范式，构建了百亿级机器人干活数据集，是全球具身机器人大模型数据量最大的公司之一。
商业化落地：产品主打Galbot系列轮式双臂通用机器人，采用“轮式底盘+折叠腿”复合结构，已实现千台级规模化落地，覆盖工业制造、智慧零售、医疗康养、城市服务等六大领域，合作客户包括宁德时代、德国博世、丰田汽车、北汽、宣武医院等龙头企业，2025年工业订单突破千台，创下具身智能领域商业化订单纪录。

3. Core technical implementation（通俗专业版）

概述

具身大模型核心：首创“合成仿真数据为主、真机采集数据为辅”的虚实结合训练管线，解决了全球机器人干活数据匮乏的行业难题；自研GraspVLA、GroceryVLA、NavFoM等端到端具身大模型，对透明、高光、不规则物体的抓取成功率稳定在95%以上，实现了任务的自主规划、动态避障、长程导航。
硬件架构：采用“轮式底盘+折叠腿+双臂”的复合结构，兼顾高速移动与越障能力，身高173cm、臂展190cm、升降行程65cm，双臂最大负载达50kg，搭载自研6自由度灵巧手，实现毫米级精细操作。
一体化控制系统：采用“大脑-小脑-神经控制”一体化系统，“大脑”（具身大模型）负责场景理解与任务规划，“小脑”负责运动控制与平衡调节，“神经控制”负责关节的实时伺服响应，实现端到端的任务执行，无需预设脚本。

核心任务逻辑：无脚本自主作业的全链路流程

第一步：感知——“看懂”眼前的场景和物体

How it works：

机器人搭载了多模态感知系统，包括双目深度相机、激光雷达、触觉传感器，能同时获取场景的视觉、深度、触觉信息；
自研的视觉大模型，在训练阶段见过了数十亿张真实场景图片，能精准识别上万种日常物体，哪怕是形状不规则的碎玻璃、褶皱的衣服，也能快速识别并分割出物体轮廓；
针对透明物体识别的行业难题，团队通过仿真环境生成了海量的透明物体数据——不同厚度、不同碎裂形状、不同光照条件下的玻璃碎片，让机器人在虚拟世界中“见过”各种可能的透明形态，理解了透明物体的反光、折射规律，最终实现对玻璃碎片的识别成功率稳定在99%以上，哪怕是只有几毫米的玻璃渣，也能精准定位。

第二步：决策——“想清楚”任务该怎么做

How it works：

核心是自研的“银河星脑AstraBrain”具身大模型，它就像机器人的“大脑”，通过百亿级的机器人操作数据训练，已经学会了上千种日常任务的执行逻辑，能根据任务指令，自主拆解动作步骤。

Analogy：就像你让一个人“把地上的玻璃碎片捡干净”，他不用你一步步教，就会自己去找垃圾桶、拿工具，先捡大块再捡小块，还会注意不被划伤——银河通用的具身大模型，就是让机器人具备了这样的自主思考能力。
针对春晚的场景，团队还对大模型进行了轻量化微调，让它能快速适配舞台场景，针对不同任务快速Output最优的动作规划，同时具备容错能力——如果第一次捡玻璃没夹住，会自主调整夹子的开合角度、夹持位置，重新尝试，直到任务完成。

第三步：执行——“精准完成”精细操作

How it works：

硬件基础：灵活又精准的“手臂和手”

Galbot G1采用“轮式底盘+折叠腿+双臂”的复合结构，双臂最大负载达50kg，重复定位精度可达±0.02毫米，比头发丝还细；搭载自研6自由度灵巧手，指尖配备高精度力传感器，力控精度可达0.3N，既能实现串烤肠的毫米级精准定位，又能实现盘核桃、叠衣服的柔性力控。
“大脑-小脑-神经”一体化控制系统

采用三级控制架构，实现端到端的精准执行：“大脑”（具身大模型）Output任务规划和动作指令；“小脑”（运动控制算法）负责把指令拆解成每个关节的转动角度、扭矩参数，实时调节手臂的运动轨迹和力度；“神经控制”（伺服系统）负责0.001秒级的实时响应，确保每个关节都精准执行指令，最终实现任务的完美执行。
虚实结合的训练范式：让机器人提前“练会”所有动作

团队首创“合成仿真数据为主、真机采集数据为辅”的训练管线，解决了全球机器人干活数据匮乏的行业难题。In plain terms：在数字仿真世界里，生成了数百万种不同大小、材质、形状的虚拟物体，还有各种不同的场景，让机器人在虚拟世界里完成上千亿次的操作训练，练出了一套适应性极强的“通用操作能力”；再用少量真实世界的数据做微调，就能让机器人在真实场景里，轻松完成各种没见过的任务，这也是它能在春晚舞台上，无脚本完成多种生活化任务的核心原因。

4. Domestic vs. global comparison

Dimension	Strengths	Gaps
Scenario deployment	具身大模型的场景落地能力全球领先，实现了全球首个百台级机器人7×24小时自主运营的零售店，工业、零售场景的规模化落地能力，远超特斯拉Optimus、波士顿动力等海外企业	双足人形机器人的高动态运动控制能力，相较于宇树科技、波士顿动力有差距
Technical innovation	首创的虚实结合训练范式，解决了全球机器人干活数据匮乏的行业难题，具身大模型的操作泛化能力跻身全球第一梯队	消费级市场的布局与产品，相较于松延动力较为滞后
Industrial capability	轮式双臂机器人的重载操作、精细操作能力处于行业第一梯队，已获得头部制造企业的千台级订单，商业化落地规模全球领先	-

5. Future direction

2026年加大“银河太空舱”无人零售解决方案在全国的推广力度，实现千店级规模部署；
深化与宁德时代、博世等工业客户的合作，扩大工业场景的千台级部署规模；
持续迭代具身大模型，提升机器人的通用任务泛化能力，拓展医疗康养、城市服务等场景；
推进IPO进程，提升资本市场影响力，巩固具身智能领域的龙头地位。

Overall Summary

The 2026 Gala robots were not mere stage tricks—they were a national showcase. The four firms led in high-dynamic motion, swarm coordination, biomimetic interaction, and embodied-AI deployment, illustrating China’s shift from follower to peer—and leader in some niches.

Compared with overseas labs stressing specs, defense, and long R&D cycles, Chinese players emphasize scenarios, cost, and volume manufacturing—pushing humanoids into factories, retail, and homes. Many in the industry call 2026 the first year of scaled humanoid adoption.

阅读原文