具身智能下半场:大脑路线收敛背后的技术逻辑与4.55亿美金验证

去年此时,我第一次系统研究具身智能赛道。

彼时行业有个有趣的现象:机器人在舞台上翻跟头,观众里三层外三层。本体公司融资顺风顺水,小脑控制成了香饽饽。 具身智能下半场:大脑路线收敛背后的技术逻辑与4.55亿美金验证 IT技术

但我隐约觉得哪里不对。

那个被忽视的致命问题

2024年中,这个问题终于被摆上台面:机器人到底能干什么? 具身智能下半场:大脑路线收敛背后的技术逻辑与4.55亿美金验证 IT技术

不是表演,是干活。

这个问题撕开了行业的遮羞布。当聚光灯散去,市场开始追问实质:本体再灵活,无法自主决策,不过是一具精致的机械。 具身智能下半场:大脑路线收敛背后的技术逻辑与4.55亿美金验证 IT技术

风向就此逆转。

资本嗅觉永远最灵敏。到了2025年初,SkildAI、Sunday、Generalist这些专攻大脑的选手,开始蚕食原本属于本体公司的资金。 具身智能下半场:大脑路线收敛背后的技术逻辑与4.55亿美金验证 IT技术

从第一性原理推导出的全栈必然

为什么全栈是必选项?

因为具身智能的每个变量都会直接影响大脑能力。数据质量决定模型上限,本体适配影响泛化边界。在技术路线尚未收敛的阶段,任何依赖外部的环节都可能成为瓶颈。 具身智能下半场:大脑路线收敛背后的技术逻辑与4.55亿美金验证 IT技术

这意味着:想要大脑足够聪明,就必须亲手掌控数据-本体-模型每一个环节。

它石智航的实践验证了这个逻辑。AWE3.0不是VLA,也不是3D资产模型,而是一个从底层架构统一感知、决策与行动的原生具身大模型。视觉、语言、动作三种模态天然对齐,训练时可在任意模态间转换。 具身智能下半场:大脑路线收敛背后的技术逻辑与4.55亿美金验证 IT技术

自我纠错:大脑成熟的标志

FailureRecovery能力,是AWE3.0最关键的技术突破。

传统机器人执行任务时,一旦遇到意外便陷入停滞。而具备自我纠错能力的模型,会在隐空间里持续推演多种可能,自主调整策略。

插接失败,机器人会主动拔出、更换角度、重新尝试。

这像极了人类的做法。

但这个能力的实现,没有用到一秒钟遥操数据。

Human-centric:数据采集的方法论革命

行业共识是遥操数据精度最高。这个结论被它石彻底推翻。

在亚毫米级精度场景下,人工遥操的犹豫与抖动反而成为噪声。真正的精度来源于人,但不是遥操作,而是人在真实作业中的本能反应。

SenseHub数据采集套件应运而生。一双数采手套,一枚第一视角摄像头,劳动者在日常作业中即可完成数据采集。

这个方法论天然具备全场景覆盖基因。不受特定硬件限制,不依赖封闭数采中心。

线束场景:一个战略选择

长程操作、柔性操作、亚毫米精度——线束装配是工业自动化的哥德巴赫猜想。

它石选择这个地狱级场景,本身就是技术自信的表达。

如果连最柔软、最易变形的线束都能精准装配,其他常规任务便是降维打击。

结果:1小时百余次亚毫米级柔性线束完整装配,吉尼斯世界纪录就此刷新。

更惊人的是,在机器人柔性操作图灵测试中,超过50%的投票者无法分辨人与机器。

4.55亿美金的意义

这不是一次普通的融资。

高瓴创投与红杉中国联合领投,美团战投重额加注,北京机器人产业发展投资基金、上海国投先导等国资联合入局,20余家机构横跨财务、战略、产业、国资四大维度。

这个阵容,是它石主动设计的结果。

技术已经交卷,现在只选择有长期价值、有明确产业诉求、赋能清晰的投资方。

30亿资金,主要投向大脑与人才。大脑方面全力押注预训练,算力消耗极大;人才方面持续推进TARSSTAR全球顶尖人才引进计划,提供行业TOP级待遇。

下半场的胜负手已经明确:大脑强,则具身强。

枪响了。