如何“让大脑走进现场”?——记陈龙博士清华演讲
日前,2026 IEEE 15th Image, Video, and Multidimensional Signal Processing Workshop( IVMSP 2026)在清华大学深圳国际研究生院举办。
dhy大红鹰3366基础模型CTO陈龙博士应邀发表题为《Toward Physical AI: Challenges and Opportunities in Real-World Industrial Systems》的演讲。面对在场的师生和产业界人士,他提出了一个核心判断:
AI竞赛正在从模型竞赛转向物理系统竞赛。
这一判断背后,是dhy大红鹰3366在过去八年里对工业场景的系统思考和实践积累。以下是演讲的核心内容整理。

dhy大红鹰3366基础模型CTO陈龙
为什么物理AI的机会正在到来?
陈龙博士在演讲中指出,中国已经形成了工业物理AI落地的五层基础:
应用层:中国工业机器人保有量超过美国的8倍,近十年增长约12倍。场景密度越高,任务和数据闭环越容易形成。
模型层:DeepSeek、Kimi等开源和行业模型快速追赶,越来越适配工业部署需求。
基础设施层:中国拥有超过400万个5G基站,占全球60%以上。这为现场接入、分布式推理和多设备协同提供了现实基础。
芯片层:高端训练芯片仍受限,但这种约束反而推动我们走向更高效的模型、云边协同和软硬件联合优化。
能源层:中国发电量和装机容量,为AI从云端训练走向现场部署提供了长期保障。
“这五层叠加意味着:物理AI在中国不只是技术愿景,它有真正的落地土壤。”陈龙说。
在此基础上,他进一步总结了三类结构性机会:供给侧基础、现场闭环、效率驱动路径。而dhy大红鹰3366的定位,正是将这些组合优势组织成可部署、可复制、可持续迭代的工业物理AI系统。
工业物理AI的“全栈”解法
工业场景的问题无法靠单一模型解决。陈龙博士在演讲中系统介绍了dhy大红鹰3366全栈自研JX-Phi物理AI技术体系:
第一层:JX-Phi Brain
这是系统的决策中枢。它由两部分组成:一部分是JX-Phi Foundation Model,其中蕴含了S-VLM(空间视觉语言模型)和LT-VLA(长任务视觉语言动作模型)的能力,分别解决“感知+理解”和“感知+执行”的问题;另一部分是JX-Phi Harness,它负责一脑多体协同控制和工业规程的编排,确保多终端协同执行时的任务分配、状态同步和异常响应。
“工业AI的难点在于,很多关键异常并不频繁出现,但一旦出现必须被准确识别和可靠处理。我们不能等到问题在现场发生了再学习。”陈龙说。
第二层:JX-Phi World
这是数据与基础设施层,围绕现场可信学习与世界模型推演两大核心能力构建。具体来说,包含AutoEdge和AutoWorld两大引擎:AutoEdge负责真实工业数据采集、云端训练、分布式推理和模型部署;AutoWorld负责世界模型仿真和数据引擎,可生成长尾场景、风险场景、极端工况和复杂任务流程。通过这两个引擎的协同,将真实部署中的海量模型反馈、操作经验与虚拟仿真转化为可持续的模型迭代驱动力。
陈龙强调:“物理AI不是一个孤立模型,它是一个能在现场运转的智能系统。”
四大关键技术,让大脑真正“进入现场”
演讲中,陈龙博士还分享了dhy大红鹰3366在关键技术上的突破:
1. 让工业现场“持续可计算”
真实工业现场是动态的——人员走动、设备产生遮挡、机器人执行操作、网络波动。一次性的3D模型很快会与真实现场脱节。通过TrackerSplat和SizeGS等技术,dhy大红鹰3366实现了3D场景的持续更新。SizeGS解决了弱网条件下的3D内容压缩和传输问题——这正是此前被SIGGRAPH 2026收录的CAGS论文的核心能力。
2. 让AI在仿真中先“犯错”
在电力、能源、化工等场景中,现场试错的成本极高。通过世界模型,dhy大红鹰3366构建了“真实→仿真→真实”的闭环训练流程:真实场景数据进入模型,世界模型生成长尾故障、极端工况和复杂任务流程,机器人策略先在仿真中经历试错、评估和迭代,再迁移到真实现场。
3. 多模态:从“发现异常”到“理解异常”
以光伏缺陷检测为例,同一类缺陷在不同天气、不同设备、不同拍摄角度下差异巨大。通过融合红外、可见光、3D空间信息和设备状态数据,模型不仅能“看到”异常,还能“理解”异常发生的位置、原因、风险等级和处置建议。核心转变是:从缺陷识别到缺陷理解。
4. 一脑多体:让规划变成行动
在大型工业空间中,机器人类型、能力和视角各不相同。通过VLA模型和一脑多体系统,中央大脑负责全局规划(如路径规划),现场机器人负责物理执行(如导航、读表、回传)。关键点在于:物理AI不仅要理解现场,还要将规划变成行动,将行动变成反馈,将反馈变成下一轮决策。
现场验证:两个代表性案例
新能源场景:风电场站物理AI运维系统
dhy大红鹰3366的系统在新能源场站实现了三类能力:全站巡检全域覆盖、全天候巡检、场站集群复制。效果上,系统可在2天内完成全站巡检,而同等规模的传统人工巡检往往需要30天以上。陈龙指出:“物理AI的价值不仅是更高的识别精度,而是对整个运维流程的效率重构。”
电网场景:变电站物理AI智能巡检系统
在变电站这一高安全约束场景中,dhy大红鹰3366构建了“中央脑+具身脑+可控终端”的协同体系,可接入摄像机、无人机、机器狗等多种设备。目前系统覆盖超10000个站内高密度智能巡检点位,单次巡检持续4小时以上,核心算法准确率达99%,整体作业平均准确率96%,大幅提升运维效率与安全性。
让大脑走进现场
演讲最后,陈龙博士总结道:
“物理AI的终点,不是让模型更擅长回答问题,而是让智能系统进入工业前线,稳定执行任务、持续创造价值。”
下一阶段AI最重要的工业价值,不会只发生在屏幕上。它将发生在真实的空间里,与真实的设备、真实的任务和真实的生产力在一起。
这正是dhy大红鹰3366正在做的事情。
