近日,鹏城实验室联合中国科学院空天信息创新研究院(以下简称“空天院”),在首届空天信息技术大会上正式发布了基于“中国算力网”自主研制百亿级遥感解译基础模型——“空天·灵眸”3.0版。
近年来,遥感数据呈现爆炸式增加,海量的遥感数据促使遥感基础模型参数量越来越大,对算力和基础网络架构提出了更高的要求,给人工智能赋能遥感领域带来更大的挑战,而由鹏城实验室牵头推动的“中国算力网”研究计划以及研发的新型轻算力高效能计算网络架构为遥感数据智慧感知应用的变革提供了可能。
2024年3月以来,鹏城实验室网络智能研究部与中国科学院空天院深度合作,开展联合攻关,将实验室在轻算力高效能AI网络方面研发的技术应用于遥感基础模型构建中,并在中国算力网“鹏城云脑Ⅱ” 枢纽节点上,采用高性能算力,历时数月,完成了国产化多模态空天遥感数据上的预训练,基础模型参数规模首次超过百亿。
联合研究团队还基于实验室研发的非Transformer高效能深度学习网络vHeat,并结合空天院所遥感基础模型构建技术,联合研制了一套小而精的原创性RS-vHeat架构作为“空天·灵眸”3.0版内核。该内核模拟物理热传导规律,将场景目标间视觉语义传播建模为热能扩散过程,令该架构有效突破了遥感模型推理的性能和速度瓶颈,计算吞吐量较经典结构模型提升2.4倍以上。
“空天·灵眸”3.0版目前已表现出极为优秀的泛化解译性能,可同时支持卫星、航空飞机、无人机等不同平台,以及可见光、合成孔径雷达、热红外、多/高光谱等不同传感器数据的自动化、高精度解译处理能力。尤其是对于航空大倾角成像过程中,极易出现的畸变、遮挡、缺失等干扰,识别鲁棒性大幅提升。
目前“空天·灵眸”3.0版在覆盖场景分类、目标检测、语义分割、变化检测等6大类任务的23个国际基准数据集上测试,性能平均提升4%至10%,指标均达到领先水平,并已在应急、国土、海洋、住建等多个行业部署试运行,特别是在最具挑战性的复杂要素精细分类、运动小目标连续跟踪等任务上性能卓越,为天临空地一体化应用提供了一套行之有效的解决方案。