具身智能解读及行业分析
2024年,Tesla入局人形机器人和黄仁勋的“AI的下一个浪潮是具身智能”,掀起了具身智能与人形机器人的科技革命;那2025年,春晚宇树机器人和DeepSeek的横空刷屏,则彻底点燃了AI与具身智能的产业。
就在3月5日召开的,今年政府工作报告中,具身智能首次出现,与量子科技、6G?等一同列为未来产业。要培育壮大新兴产业、未来产业,深入推进战略性新兴产业融合集群发展。此消息一出,这对于具身智能,无疑是官宣的重磅炸弹。
而此前2天的3月3号,深圳首发,打造人工智能先锋城市,印发《深圳市具身智能机器人技术创新与产业发展行动计划(2025-2027年)》。培育人工智能与机器人融合技术、多模态感知技术、高精度运动控制技术、灵巧操作技术等方面取得突破。实现十亿级应用场景落地?50?个以上,具身智能机器人产业集群相关企业超过?1200?家。
如此多利好,让我们今天不得不好好梳理一下具身智能。下文从基础知识扫盲、历史溯源、市场规模和现状、上下游产业链和对应龙头标的、总结和展望等五个维度,全面解析这一未来新兴产业。
一、基础知识扫盲
1、什么是具身智能EAI
具身智能,英文EmbodiedAI,简称EAI,?依靠物理实体(如机器人、自动驾驶车辆等)与环境交互来实现智能增长的智能系统。在智能体与环境的交互过程中,通过感知、控制和自主学习来积累知识和技能,形成智能并影响物理世界的能力。
其核心在于将感知、决策和执行紧密结合,主要挑战在于硬件性能、算法泛化能力与系统集成水平。
2、易混概念比较
(1)?EAI≠大模型+机器人,而是=AI+机器人(等物理实体)。大模型虽有推理决策、语言和视觉能力,但不存在主观感觉能力,多少亿参数都不行。(观点出自斯坦福教授李飞飞),脑、身体和环境的深度耦合是产生高级认知的基础。这需要构建新一代人工智能算法,结合了脑神经、运控控制等复杂理论,推动具身智能实现认知涌现。
(2)?EAI?≠人形机器人,?EAI>人形机器人,具身智能可以搭载到其他机器人,比如仿生机器人、机器狗、L4自动驾驶等;人形机器人只是具身智能的一种应用,也被认为是最理想的应用形态。
(3)?EAI?≠智能体Agent,两者各有交叉和侧重。?Agent?是代理人,既可以是虚拟世界的,如manus,?也可以是物理世界的智能机器人,;而EAI一定要是真实世界的实体物体,如人形机器人。
3、具身智能三要素
具身智能要同时需要具备“本体+环境交互+智能进化”三要素:
首先强调要有具身本体,不能是虚拟的,要是实体,可以是人形机器人、四足机器狗、无人汽车、无人飞机等。本体要具备环境感知、运动和操作执行等能力
其次强调与环境的交互能力,不仅能感知环境,还能通过行动来影响环境并在与环境的交互中不断学习和适应。用拟人化的思维路径去学习,做出人类期待的行为反馈。
最后强调一个增量,主要是智能的提升和进化,具身智能不仅仅要利用大模型的知识、算法理解和表达能力,更要通过本体与物理世界的交互来展现和发展智能,实现自主和智能的提升。
4、EAI三大构成部分??
具身智能EAI包括感知模块、交互模块、运控模块。其中,感知模块是基础,通为交互与运控模块提供信息,并实时反馈,以便机器人感知外部环境和物体、调整运控规划。
二、历史溯源
具身智能的发展历史可以分为以下四个阶段:
1、早期萌芽阶段(1950s-1990s):1950年,艾伦·图灵AlanTuring在论文《计算机器与智能》中首次提出“具身智能”的概念。1986年,罗德尼·布鲁克斯从控制论角度强调智能是具身化和情境化的。1991年,布鲁克斯在论文中探讨了智能产生的本源,认为智能行为可从自主机器与其环境的简单物理交互中产生。1999年,罗尔夫·普费弗等人提出智能并不局限于大脑或某些算法,强调身体对智能形成的根本影响。
2、技术积累阶段(1990s-2006):随着智能理论的完善、底层数学理论的深耕,AI三大学派从各自突破,逐步走向取长补短的综合性研究,为具身智能发展奠定理论和算法基础。
3、深度学习推动其快速发展(2006-2020):深度学习的概念由杰弗里·辛顿等人在2006年提出。通过构建深层神经网络,利用其多层结构自动学习数据的层次化特征表示,从而提高模型的性能和泛化能力,这一概念开启了深度学习的新时代。深度学习等技术的快速发展推动了具身智能研究进入新阶段,研究人员开始利用虚拟物理环境和计算能力设计和训练智能系统
4、技术突破阶段(2022年至今):以ChatGPT为代表的大模型的通用知识和智能涌现能力,为机器人实现智能感知、自主决策乃至拟人化交互方面带来巨大潜力。2023年,英伟达创始人黄仁勋提出具身智能是人工智能的下一个浪潮。2024年,具身智能入选“新一代