这是一篇智能制造工程硕士论文代写范文,激光SLAM;体素法向一致性;退化场景;电信技术;自动化技术为研究论点。本文针对退化环境中 LiDAR–IMU SLAM 的退化可观性问题,围绕“旋转信息不足、数值条件恶化、长程一致性较弱”三方面展开研究,并形成以下具有内在衔接的技术路线与系统实现。1. 前端可观性增强:在 IESKF 前端引入体素平面法向量一致性观测,利用体素统计法向提供稳定的几何先验,从而在长走廊、单一大平面、重复结构等退化情形下提升姿态(尤其为旋转)子空间的可观性。
目录
摘要
Abstract
1.1 研究背景及意义
随着人工智能与机器人技术的持续发展,能够在复杂环境中自主感知—定位—规划—运动的智能体正从实验室走向产业化应用。无论是交通出行、末端物流,还是环卫、矿业与安防巡检的,系统均需在动态、部分未知且存在遮挡的环境中,获得稳定、可用且精度足够的自定位结果,并支撑在线建图、路径生成与安全避障等上层任务。传统全球定位系统(Global Position System,GPS)是最常见的定位方式,能够提供绝对位置参考,但在城市户外、室内或地下以及遮挡严重的环境中往往不可用或难以满足精度需求;即便采用增强手段,民用级精度通常亦难以支撑鲁棒自主导航。与此同时,GPS 对遮挡与反射较为敏感,在封闭或半封闭空间中难以稳定工作。基于此,同时定位与建图(Simultaneous Localization and Mapping,SLAM):在未知或部分已知场景中,设备通过搭载的传感器持续观测外界,推断自身位姿并逐步构建环境一致性地图的技术成为满足上述需求的主要路径。SLAM 的概念可追溯至Smith Randall C 等在 1986 年的工作[1]。在系统运行过程中,设备通过搭载的激光雷达或相机等传感器获取环境信息,并在运动中融合观测以闭环实现自定位与地图构建。在工程实践的角度,对 SLAM 的挑战集中体现在四个方面:一,面对光照变化、遮挡增多、纹理稀缺与重复结构等非理想条件,应能够维持连续与稳定的位姿输出,避免长时间漂移或突发失稳;二,长里程、多回合与多工况运行要求轨迹与地图在空间层面保持一致,以抑制局部误差的累积与扩散;三,考虑到嵌入式平台的算力与功耗约束,系统需在有限计算资源下完成高频观测处理与状态估计,并保证实时响应;四,面向园区与校园、室内与地下、半封闭与开放等多类型场景,算法应在传感器组合与载体形态多样化的条件下仍具备良好的泛化与可扩展能力。从应用视角观察,末端配送(图 1)、清洁巡检(图 2)、矿区运输与封闭场所作业(图 3)等场景通常具有几何结构较为规则、尺度跨度较大、视场受限且动态干扰交替出现的共性特征。鉴于 GPS 在多数目标场景中的局限,并且在多源传感器融合不断深化的背景下,系统往往采用多源传感器协同:LiDAR 提供可度量尺度的稠密几何,相机提供丰富的纹理与语义,毫米波雷达增强在低能见度条件下的感知。按主要传感器类型划分,SLAM 可大致分为视觉方案与激光雷达方案。视觉SLAM[2,3]以相机为主传感器,通过特征匹配或直接法对相邻帧进行运动估计与场景重建。

1.2 国内外研究现状
1.2.1 激光 SLAM 算法国内外研究现状激光 SLAM 按维度可分为 2D-SLAM[8]与 3D-SLAM[9]。GMapping[10]是 2D-SLAM领域具有里程碑意义的代表,其核心思想是联合利用激光雷达与里程计观测,在粒子滤波框架下实现机器人位姿估计与环境建图的在线闭环。该方法以概率栅格地图表征环境结构,通过对粒子集合进行重要性加权与更新来估计最优位姿,并在新观测到达时依据激光与里程计信息动态调整粒子权重与地图,使系统在典型平面场景中兼具实时性与可用性。GMapping 在平面场景具备良好实时性,但对起伏地形、三维视差与强自遮挡的适应性有限。在此基础上,谷歌提出的 Cartographer[11]将框架拓展至同时支持 2D 与 3D 的图优化式 SLAM,形成面向激光场景的完整系统化架构。该系统采用分布式并行处理以提升对大规模数据的处理效率,并在体系上区分局部 SLAM 与全局 SLAM:前者聚焦于局部范围内的建图与导航需求,后者用于描述更大范围的环境结构与全局一致性维护。Cartographer 已集成于 ROS(Robot Operating System)[12]生态,可与相关模块协同运行,从而在工程应用中具备良好的可接入性与扩展性。然而,Cartographer 在三维结构丰富或退化几何下(如长走廊/大平面)仍难以提供充分的姿态可观性与跨时域一致性。综上,GMapping 与 Cartographer 从不同层面展现了激光 SLAM 在实时性、系统化设计与工程集成方面的代表性进展,也为后续围绕三维场景、跨尺度一致性与鲁棒性的进一步研究提供了方法学基础与实现范式。但是二者并没有给出良好的位姿估计方案。LOAM[13] 被 广 泛 视 为 激 光 雷 达 里 程 计 的 经 典 框 架 , 并 在 其 基 础 上 催 生 了R-LOAM[14]、F-LOAM[15]与 LOAM Livox[16]等一系列具有代表性的后续工作。该方法基于场景三维结构对点云进行几何特征划分,将激光回波分为线特征与面特征,并采用 scan-to-map 的匹配模式在局部地图上完成位姿估计与地图更新;在保证匹配精度的同时注重计算效率,从而实现较高精度的定位与建图。
1.3论文结构与章节安排
第二章给出数据预处理与数学建模的基础知识。围绕多传感器(LiDAR–IMU)时间同步与外参标定,建立 LiDAR 成像模型,并利用 IMU 进行点云去畸变与世界坐标系下的体素化统计,计算体素的点数、均值与协方差以获得谱信息(特征值及其对应特征向量)。在此基础上回顾 SO(3)、SE(3)及李群—李代数、四元数微分等工具,构建名义—误差状态表示与线性化规则;同时针对 IMU 给出系统与随机误差模型、预积分递推与协方差传播,为前端 IESKF 与后端 BA 的统一建模奠定基础。第三章阐述基于旋转约束的激光雷达–惯性里程计方法。首先分析退化场景下点—面残差对旋转子空间约束不足的根源,给出误差状态 IESKF 的传播方程与先验协方差递推;继而构造两类观测:其一为带世界系不确定度传播的点—面残差,其二为体素平面法向一致性观测,以地图体素法向为先验、当前帧体素法向为测量建立投影残差及其雅可比。所有观测在线性化后统一到信息域与先验融合,完成一次迭代更新;并通过角度与位移阈值以及法向累计矩阵最小特征值等退化判据,保证前端在退化与高动态场景下的稳定工作。第四章给出基于法向对齐的体素化 LiDAR 局部 BA 优化方法。在滑窗 BA 框架内引入体素统计驱动的几何先验,吸收 BALM2 的“点簇—体素聚合”思想以降低维度与计算量。具体而言,一方面以体素协方差最小特征值构造退化正则项,抑制体素平面“厚度”,改善 Hessian 条件数与 LM 阻尼稳定性;另一方面以法向对齐约束在滑窗聚合后将局部扫描法向与全局/地图法向对齐,在中长期尺度上持续提供旋转先验,从而有效抑制走廊、单一大平面或重复构件场景下的航向漂移。同时引入 IMU 预积分因子以约束相邻关键帧的运动一致性,补足高速或稀疏观测阶段的几何信息。章节中推导上述几何项的线性化与稳健化设计(包括基于相对谱隙的自适应权重、门控与核函数),说明其与 IMU 因子的紧耦合装配与稀疏求解策略,从而构建兼顾 BA 优势与实时性的局部优化后端。第五章开展系统实验与分析。选取 HILTI 2022/2023(覆盖长走廊、楼梯、脚手架与动态干扰等强结构化室内/工地场景)、MARS-LVIG(自上而下视角、最高 12 m/s、远距的户外场景)及补充私有序列进行评测;定量指标以 ATE 为主并进行显著性检验,定性方面展示轨迹与地图的一致性。通过消融实验评估其对系统性能的贡献;同时统计模块级时延与内存占用以评估效率。结果表明,前端法向观测与后端法向对齐、退化正则的协同作用,能够在退化与高动态场景下实现更低误差、更稳定的收敛与可部署的实时性。第六章为总结与展望。总结本文在旋转可观性增强(前端法向一致性)与数值稳定性、全局一致性(后端与全局法向对齐)方面的主要贡献与实验结论,并展望融合视觉与语义先验等方向,以面向大规模、长时程、多场景的一致性
2.1 引言
激光 SLAM 是自动驾驶、机器人导航与相关智能系统中的关键基础技术。其中,数据预处理处于感知与估计的入口位置,直接决定后端优化与地图构建的可用性、精度与稳定性。围绕这一目标,激光 SLAM 的前端预处理主要涵盖三类内容:激光雷达数据的成像建模与时序校正,三维运动的数学描述与线性化工具,以及 IMU 数据的误差建模与预积分。本文在保持工程可实现性的同时,力求在同一时空度量,为后续特征关联、位姿估计与地图维护提供高质量输入。激光雷达作为高精度主动传感器,能够实时采集环境点云并提供丰富的几何信息,是构建稳定几何约束的核心来源。然而,扫描在有限时间窗内完成,载体姿态与速度的变化会引入明显的运动畸变,若不加校正将导致配准偏差与地图细节失真。本章将首先给出激光雷达的基本成像模型与数据特性,统一坐标系与时间戳约定,并在此基础上阐述点云去畸变的原理与实现路径,使原始量测被还原到统一参考时刻与世界坐标系下,为后续体素累计与法向统计奠定数据一致性基础。在估计层面,对三维运动进行准确、可微且数值稳定的表述是实现高质量定位与优化的必要条件。旋转矩阵、四元数以及李群与李代数提供了从连续时间到离散增量的系统描述框架,既满足姿态与位姿的紧凑表示,又便于雅可比推导与误差传播。本章将依次回顾相关定义与性质,给出与角速度、加速度耦合的微分方程及其离散化近似,并明确误差状态建模与线性化规则,以保证前端滤波与后端优化在数学处理上的一致性。IMU 作为高频惯性传感器,为短时运动提供连续先验,但其观测同时包含系统误差与随机误差,若直接使用易引发累计漂移。因而,需要对 IMU 的偏置、噪声与随机游走进行合理建模,并通过预积分技术将高频量测压缩为关键帧间的等效约束,从而降低优化维度并保留对偏置与外参的可微依赖。本章将系统阐述 IMU 的误差模型与预积分的理论与实现过程,给出协方差传播与雅可比递推,为后续多传感器融合与位姿优化提供统一而稳健的惯性因子接口。综上,本章通过对激光雷达时序校正、三维运动数学表述与 IMU 预积分的系统化处理,构建了一个在时间与几何层面均一致的前端预处理框架。其输出不仅为特征提取、位姿估计与地图构建提供高质量输入,也与后续章节的方法设计保持紧密耦合:去畸变后的世界系点云与体素统计为第三章中的法向一致性观测提供直接数据来源,统一的误差状态与线性化工具为 IESKF 前端与滑窗 BA 后端的联合建模提供数学基础,而稳健的惯性预积分则在高动态或观测稀疏场景中维系轨迹连续性并改善数值条件。通过上述衔接,前端预处理与后端优化在同一几何语义下形成闭环支撑,为整套 SLAM系统的精度、鲁棒性与实时性提供保障。
2.2 激光雷达数据处理
2.2.1 激光雷达模型
激光雷达(Light Detection and Ranging,LiDAR)作为主动式光学遥感技术,通过发射纳秒级脉冲激光并解析回波特性,实现对三维空间的高精度感知。其核心测距机理基于飞行时间法(Time of Flight,TOF):测量激光脉冲发射与接收的时间差 t ,结合光速参数即可得到目标距离 c ,计算目标距离 2td c ,从而获得稠密而可度量尺度的环境点云。本文使用的数据主要来自机械旋转式激光雷达 Hesai PandarXT-32 与固态混合式雷达 Livox Avia,二者均以 TOF 为基本测距原理,在不同扫描方式下提供时空分布特性各异的原始观测,为后续去畸变与体素统计奠定数据基础。与毫米波雷达和视觉传感器相比,LiDAR 在若干方面具有突出优势:其角分辨率可达 0.1°量级,有利于细节结构的区分与几何约束的稳定构建;主动发射机制使其在低照度、雨雾等复杂气象条件下仍能保持相对稳定的探测性能,增强了感知的可用性;多线束扫描配合较高采样频率能够形成空间覆盖更完整的点云,为精细化的环境建模、特征提取与后续配准优化提供高质量输入。上述特性与本文在统一几何语义下开展的去畸变、体素化统计及法向一致性建模相互呼应,共同支撑前端预处理到后端优化的一体化技术路线。在自动驾驶场景中,LiDAR 已成为高精度 SLAM 的核心传感器。图 14 展示了 Hesai的纯机械旋转式激光雷达,图 15 则为 Livox 的固态混合式雷达。以 Hesai PandarXT-32为例,其通过 32 组激光收发单元实现 360°水平视场覆盖,垂直角分辨率可达 1°,在 0.05–120 m 范围内可输出约 64 万点/秒的稠密点云;Livox Avia 采用非重复扫描,在 70.4°×77.2°视场内实现无盲区扫描,对动态障碍物的稳定观测具有优势。该类传感器产生的原始点云需经过严格的前端预处理:一方面,运动畸变补偿依赖于雷达坐标系与载体坐标系之间的刚体外参与时序关系;另一方面,特征提取需兼顾实时性与稳健性,使地面分割、平面检测等过程在算力约束下保持可用。
2.2.2 点云去畸变
本文使用两种激光雷达作为数据源。为直观展示点云的运动畸变现象,采用机械旋转式雷达生成的点云进行简化示例具有代表性与可解释性。设有一台机械旋转式激光雷达置于矩形房间内(图 16),传感器围绕其垂直 z 轴完成一次 360° 扫描即可得到一帧激光雷达图像(或一次扫描)。将扫描开始时刻定义为扫描束与坐标系 x 轴对齐的瞬间,并将雷达基座坐标系记为体坐标系(body frame)。图中以红色标注扫描初始化轴,用以指示扫描的起讫方向。考虑三种运动情形:其一,扫描期间传感器保持静止(由 a 到 a);其二,仅发生平移(由 a 到 b);其三,同时发生平移与自旋转(由 a 到 c)。三种情况均会形成相应的原始点云,图中红色部分标示为 Raw Point Clou
2.3 三维运动描述与数学工具
假设在一个单位元 处有一个平面正切这个球体,则通过ε的所有向量,如 a 都可以通过指数映射到李群的 exp(a),同样对于李群上任一元素,可以通过对数映射到正切平面的某个向量,如 3 到 3log
2.4 IMU数据处理与预积分
在实际应用中,IMU 的测量易受温度、振动与电磁干扰等环境因素影响,装配环节亦可能引入安装偏差与尺度误差,因此开展系统性的误差分析至关重要。按照来源与统计特性,IMU 误差可分为系统误差与随机误差两类:前者包括零偏、尺度因子与安装误差等可建模项,后者主要由测量白噪声与偏置随机游走等随机过程构成。在明确误差模型后,为将高频惯性观测以可微、低维的形式纳入前端滤波与后端优化,还需构建 IMU 的预积分模型,以在关键帧间提供等效约束并实现协方差与雅可比的递推。基于上述考虑,以下三节将依次给出 IMU 系统误差模型、随机误差模型与预积分模型的具体表述与推导。
2.5 本章总结
本章围绕激光 SLAM 前端的数据预处理,构建了在时间与几何度量上统一的输入。从传感器层面对激光雷达的成像与量测机理进行刻画,明确机械旋转式与固态混合式雷达在扫描方式、视场与采样特性上的差异,并给出相应的坐标系与时间戳约定。在此基础上,针对扫描时间窗内载体运动引发的几何畸变,建立以 IMU 高频观测为先验的去畸变流程:通过时间对齐与插值重构各采样时刻位姿,将原始点统一到同一参考时刻与世界坐标系下,为后续体素累计与法向统计提供一致且可度量的点云输入。本章系统梳理三维运动的数学表述与线性化工具,涵盖旋转矩阵及其微分、四元数及其耦合微分方程,以及基于李群—李代数(SO(3)/SE(3))的指数—对数映射与扰动模型,明确误差状态建模与雅可比推导规则。统一符号体系与增量约定,为前端滤波与后端优化的连续—离散转换提供可复用的数学接口,避免不同模块间的表示割裂与线性化不一致。最后,本章对 IMU 的误差来源进行分层建模,区分零偏、尺度因子与安装误差等系统误差,以及测量白噪声与偏置随机游走等随机误差,并据此推导预积分的递推与协方差传播。预积分将高频惯性量测压缩为关键帧间等效约束,既降低优化维度,又保持对偏置与外参的可微依赖,为多传感器融合、状态传播与数值稳定性提供可靠支撑.综上,本章形成三项面向后续模块的关键“中间件”:一,世界系、统一时刻的去畸变点云;二,统一的位姿、扰动表示及其线性化与传播;三,携带协方差信息的IMU 预积分因子。它们共同构成前端—后端一致的几何语义与时空基准,直接服务于第三章的基于体素法向一致性的 IESKF 前端观测构造,并为第四章的体素化局部 BA中的退化正则与法向对齐约束提供可调用的统计量与先验。
3 基于旋转约束的激光雷达–惯性里程计方法
3.1 引言
3.2 状态定义与预测模型
3.3 点–面残差建模
3.4 体素平面法向一致性观测建模
3.5 实验对比与分析
3.6 本章总结
4 基于法向对齐的体素化 LiDAR 局部 BA 优化方法
4.1 引言
4.2 状态定义
4.3 BA残差函数建模
4.4 线性化与二阶近似
4.5 实验对比与分析
4.6 本章总结
5.1 系统架构
本系统采用“前端状态估计—后端局部建图”的双层闭环架构(见图 20)。前端以 IMU 输入为主线:先由 IMU 前向传播生成位姿先验,再与去畸变后的 LiDAR 扫描重建共同进入残差计算模块,叠加点–面与体素法向一致性两类几何观测,在 IESKF中按“预测—更新—重置”进行若干次迭代直至收敛,输出里程计解。每次迭代后,姿态与位置增量通过 State Update 反馈至传播与残差计算,实现高频、低延时的前端闭环。
5.2 实验平台环境
5.2.1 硬件环境本文所有实验在一台搭载 Intel i9-13900K 处理器(32 线程,主频 5.5GHz)、128GBRAM 和双 NVIDIA GPU(RTX 4070)的主机电脑上进行。操作系统为 Ubuntu 24.04 LTS(Linux 内核版本 6.8.0)。5.2.2 软件环境本文使用的软件开发环境为 Ubuntu24.04 和 ROS Jazzy。Ubuntu 是目前由 Canonical公司维护的一个基于 Debian 的一个 Linux 发行版本。较于其他 Linux 发行版,Ubuntu在机器人研究领域具有以下显著优势:完善的硬件兼容性支持,特别是对主流机器人传感器的即插即用能力;有效解决开发环境配置难题;庞大的开发者社区支持,确保技术问题的及时响应。ROS 是一款开源的机器人操作系统,其提供了丰富的组件供开发者使用。ROSJazzy 是最新的 ROS 第二代的版本,其与 ROS1 代不同的是:ROS2 采样了去中心化架构,不依赖于 ROS Master,每个节点都可以发现其他节点并通信,提升了系统的可靠性和可拓展性,非常适合多智能体协同任务;ROS2 使用 DDS 作为通信组件,提供了实时通信、QoS(质量服务)支持,支持不同的传输协议(如 TCP、UDP、共享内存等),ROS1 与 ROS2 的区别见图 21 示。图 21 ROS1 与 ROS2 架构差异Fig21 Differences between the ROS1 and ROS2 architectures此外,ROS2 环境集成 colcon 构建系统采用 ament_cmake 编译框架实现模块化构建。通过设置 ROS_DOMAIN_ID 实现多系统隔离,利用 Fast-DDS 2.6.1 的共享内存传此外,ROS2 环境集成 colcon 构建系统采用 ament_cmake 编译框架实现模块化构建。通过设置 ROS_DOMAIN_ID 实现多系统隔离,利用 Fast-DDS 2.6.1 的共享内存传输模式优化进程间通信效率。
5.3 数据集介绍
HILTI[97,98]挑战赛数据集面向 GNSS 受限的结构化真实工地与楼宇环境,覆盖走廊、楼梯间、开放楼层、管线井、脚手架以及金属反光结构等典型的结构化与强退化场景。数据集提供多模态传感器量测(激光雷达与 IMU,部分序列同时包含相机、编码器或里程计)及其标定与分段真值信息,用于评测 SLAM 里程计在大平面、重复结构、粉尘与反光材质以及动态施工环境中的鲁棒性与精度。本文选取 HILTI 2022 数据集以及HILTI 2023 的部分序列进行实验。本论文算法在 HILTI 2022 世界挑战赛取得靠前的名次,见图 22。从数据集特征看,数据集中既包含横向几何纹理不足的长走廊与大平面,也包含易触发错误数据关联的重复构件与脚手架,以及伴随高度变化与狭窄空间约束的楼道;这些因素共同构成对点—面约束判别力与旋转可观性的严苛考验,契合本文方法在退化环境下的设计动机与验证需求。HILTI 2022–2023 的传感器套件由 Sevensense Alphasense Core 相机头(5 个 0.4 MP全局快门相机)与 Hesai PandarXT-32 组成,并刚性安装于便于手持的铝制平台上。相机间同步由 FPGA 完成,相机与激光雷达通过 PTP 同步,跨传感器时间对齐精度优于1 ms;装置外接钢针用于外部参考(见图 23)。实验评价遵循挑战赛官方流程:提交位姿估计后由平台自动完成指标计算与结果判定。为在公开数据之外进一步检验方法的鲁棒性与泛化能力,本文选取两组具有互补特 征 的 补 充 序列 ,分 别对应 非结 构 化与 结构化 且易退 化的 场景 。 Liu[100] 提供 了“private1”私有户外序列。该场景除地面外几乎不存在稳定的大平面或规则构件,几何要素稀疏且分布不规则,属于非结构化环境。在此条件下,点—面对应极为有限,局部统计受噪声与稀疏影响更为显著,能够考察体素平面性项在“弱平面、弱结构”场景中的行为边界与稳健性。对于室内结构化场景的 aggressive_spinning 的室内序列[101]。尽管属于丰富的结构化特征,但载体存在剧烈自旋等高动态运动模式,易在绕法向旋转等自由度上触发可观性不足,导致基于点—面约束的位姿估计退化。该序列用于检验本文提出的法向对齐约束在结构诱导退化与运动诱导退化叠加时对姿态子空间的补强效果。综上,两组私有数据分别从“结构缺失”与“结构存在但运动致退化”两侧对方法进行补充性验证:前者强调在弱结构、弱平面条件下的数值稳定性与误差控制,后者在典型室内结构下的旋转可观性维持。与前述 HILTI、MARS-LVIG 的公开数据形成互补,使实验范围从强结构化到弱结构化,再到高动态场景,可以更全面地评估所提方法在结构化环境相关退化问题上的适应性与鲁棒性。
5.4 SLAM算法评价指标
算法性能评估是验证定位建图系统有效性的关键环节。本文基于开源评估工具evo,采用建图领域广泛应用的绝对位姿误差(Absolute Pose Error,APE)和相对位姿误差(Relative Pose Error,RPE)两项指标,对提出的激光雷达-IMU 融合定位建图算法进行定量分析。评估方法具体描述如下。evo 作为多模态轨迹评估工具,支持 KITTI、TUM、EuRoC 等主流数据集格式的解析与转换,并提供多维度的可视化分析功能。该工具通过轨迹对比可视化、误差曲线生成等方式,可直观呈现估计轨迹与真实轨迹的时空一致性差异。在量化评估方面,evo 集成多种评价指标,其中本文重点选取 APE 和 RPE 进行算法性能表征。绝对位姿误差(APE)主要用于评估轨迹的全局一致性,其计算通过绝对轨迹误差(Absolute Trajectory Error,ATE)实现。具体而言,evo 工具首先进行轨迹对齐,消除初始位姿偏差,随后计算各对应位姿点的欧氏距离均方根误差(RMSE)作为 ATE值。
5.5 实验结果与分析
为了验证我们方法的鲁棒性,我们在一段名为“private1”的序列上进行了测试,该序列在非结构化的森林环境中采集。该序列具有快速旋转和剧烈抖动,初始角速度为 83.1deg/s,线性加速度为 6.7m/s2(不含重力加速度)。如图 25 示仍能成功建图并生成反映真实运动且与地图一致的轨迹。
5.6 本章总结
本章基于 HILTI 2022、HILTI 2023 与 MARS-LVIG 三类数据,对“体素平面性、法向一致性、局部 BA”的 LiDAR–IMU 融合方法进行了系统验证,覆盖强结构化的室内、工地场景与大范围高动态的户外场景两类典型应用域。实验采用 ATE/APE 为主要定量指标,并辅以消融分析、定性可视化与计算资源统计,从全局一致性与短时稳定性两个时间尺度对方法进行交叉印证。主要结论如下:1. 精度与鲁棒性:在 HILTI 2022 的狭窄走廊、楼梯与大平面等退化场景中,相比“LIO”系列(FAST-LIO2、Faster-LIO、Point-LIO)与特征类方法(LeGO-LOAM、LINS、LiLi-OM、LIO-SAM),本文方法显著降低 ATE,并有效避免多条序列中的失配与发散;在 HILTI 2023 的重复脚手架、镜面反射与动态干扰等更复杂环境下,仍保持连续跟踪与更小的累积漂移。2. 跨域泛化:在 MARS-LVIG 的高空俯视、最高 12 m/s 高速机动与远距稀疏观测条件下,取得最优 ATE,体现出从室内结构化场景向户外高动态场景的良好可迁移性。3. 消融验证:在三个数据集共 25 条序列上,量化其对全局误差与局部稳定性的贡献,验证了所提出约束体系在退化与高动态片段中的有效性。4. 工程可行性:以 HILTI 2022 为代表,在 10 Hz 激光频率下,系统时延与内存占用处于可部署区间,满足实时性要求。综上所述,面向结构化环境退化与运动场景,本文方法在精度、鲁棒性与数值稳定性方面较主流方法取得一致提升,并具备实时运行能力,为后续面向更大规模与更长时程的结构化环境 SLAM 研究与应用打下了坚实基础。
6.1 总结
本文针对退化环境中 LiDAR–IMU SLAM 的退化可观性问题,围绕“旋转信息不足、数值条件恶化、长程一致性较弱”三方面展开研究,并形成以下具有内在衔接的技术路线与系统实现。1. 前端可观性增强:在 IESKF 前端引入体素平面法向量一致性观测,利用体素统计法向提供稳定的几何先验,从而在长走廊、单一大平面、重复结构等退化情形下提升姿态(尤其为旋转)子空间的可观性。2. 后端数值稳健化与航向抑漂:在滑窗 BA 后端以体素协方差最小特征值构造退化正则项,并加入 IMU 和全局地图法向量对齐项,共同改善 Hessian 条件数、提升问题的数值稳定性,同时在较长时间尺度上抑制航向漂移。3. 映射数据结构统一:面向系统级一致性与实现效率,全系统采用统一的自适应体素地图模块,在前后端之间保持数据表示与使用的一致性,降低模块间接口与信息流的损耗。4. 实验验证与效率评估:基于 HILTI 2022/2023 与 MARS-LVIG 数据集开展实验(含消融与内存效率评估),结果显示,所提方法在长走廊、狭窄楼梯、重复脚手架以及高速航拍等具有代表性的退化或高动态场景中,均体现出更稳定、精度更高且具实时性的性能表现。综上,本文从可观性建模—数值稳健性—系统一致性—实验验证四个层面形成闭环:前端以法向一致性观测补充退化方向的信息,后端以退化正则与法向对齐改善优化条件与长期一致性,统一体素地图支撑模块协同,最终通过多数据集实验验证方法的有效性与工程可行性。
6.2 展望
面向结构化(兼顾部分非结构化)环境中退化场景的 LiDAR–IMU SLAM,尽管本文已在可观性建模、数值稳健性与系统一致性方面取得进展,仍有若干方向值得进一步深入与优化,概括如下。1. 多传感器融合与自适应机制围绕复杂环境下单一模态信息不足与时变场景带来的不确定性,进一步探索视觉、激光雷达、IMU 及其他传感器的融合策略,研究更具自适应性的融合与联合标定方法,以在传感质量波动、场景快速切换等条件下保持系统的适应性与泛化能力。2. 深度学习与 SLAM 融合对于不易建模的地方,可以通过深度学习大量的学习先验知识来隐性建模,提升SLAM 系统的鲁棒性。3. 场景理解与语义 SLAM面向从几何到语义的高级地图表示,进一步研究语义信息对地图构建与位姿估计的协同增益,完善语义层级的表达与更新机制,以支持更智能、更安全的人机环境交互与导航决策。4. 更加鲁棒且长时空关联的前端估计当前,前端里程计的估计还是依赖于点面、点到点的估计,基于体素地图,应当进一步研究更好的点云表示方法,如多高斯分布函数来描述体素内的几何结构。此外,前端估计应该关注于以往的历史数据,通过已有的先验避免估计失效而导致的系统崩溃。总体而言,未来工作将围绕上述方向持续推进,在坚持几何一致性的基础上强化跨模态协同与语义感知能力,推动 SLAM 技术在结构化场景中的工程化落地与稳定应用。
参考文献 略
附录:HILTI 2022 ATE 与轨迹数据图
相关文章
UKthesis provides an online writing service for all types of academic writing. Check out some of them and don't hesitate to place your order.