基于LingBot-Map:流式(Streaming)3D 场景重建的部署流程

📅 2026/7/5 10:28:04 👁️ 阅读次数 📝 编程学习
基于LingBot-Map:流式(Streaming)3D 场景重建的部署流程

一、声明

本文所述的全部步骤与方法,旨在解决运行官方脚本时因GPU 显存不足(CUDA error:Out‑of‑Memory)而导致的程序崩溃或运行失败问题。

经多次实际验证:严格按照本文提供的部署流程(包括环境配置、参数调整、内存优化策略等)进行操作,用户可以在有限的 GPU 显存资源下,成功完成 LingBot‑MAP 的流式 3D 场景重建任务,避免显存溢出错误。

如您在部署中遇到与本文描述不一致的情况,欢迎反馈以便进一步完善。

特此声明。

———————————————————————————————————————————

官方GitHub 地址:https://github.com/Robbyant/lingbot-map

其他相关资料:

1、【GitHub项目推荐--LingBot-Map:流式 3D 重建的几何上下文 Transformer】

2、【阿里拥抱开源】LingBot-Map:用于流式3D重建的几何上下文转换器

3、 lingbot-map:流式 3D 重建实战指南与解析

二、部署流程

1. 创建 conda 环境

虚拟环境安装教程:最详细!Windows下的CUDA与cuDNN详细安装教程

conda create -n lingbot-map python=3.10 -y conda activate lingbot-map

2. 安装 PyTorch (CUDA 12.8)

pip install torch==2.9.1 torchvision==0.24.1 --index-url https://download.pytorch.org/whl/cu128

3.安装 LingBot-Map

#从Github上下载lingbot-map源码(解压lingbot-map.zip可以跳过此步骤) git clone https://github.com/Robbyant/lingbot-map.git cd lingbot-map pip install -e .

4.安装可视化依赖

pip install -e ".[vis]"

5.下载模型

从 ModelScope 下载预训练权重(约 4.63 GB):

官方开源模型:lingbot-map · 模型库

三、如何使用

将下载好的模型复制到lingbot-map目录下,

创建data文件夹,在文件夹内放置视频文件(.mp4)。

运行指令:

python demo.py --model_path lingbot-map.pt --video_path .\data\your.mp4 --fps 10 --offload_to_cpu --keyframe_interval 5 --kv_cache_sliding_window 16 --use_sdpa

出现“Streaming inference”即为执行成功

指令参数

作用

--model_path指定模型权重文件的路径
--video_path指定输入的原始视频文件路径
--fps 10将视频帧率采样为10 FPS
--offload_to_cpu将预测结果及时转移至CPU内存
--keyframe_interval 5每隔4个普通帧设置1个关键帧用于KV缓存
--kv_cache_sliding_window 16限制KV缓存仅保留过去16帧的信息
--use_sdpa允许模型在未安装FlashInfer时,回退至PyTorch原生的SDPA

访问“http://localhost:8080

四、总结

本文提供了LingBot-MAP流式3D场景重建的完整部署方案,重点解决GPU显存不足导致的运行失败问题。部署流程包括:1)创建conda环境;2)安装PyTorch(CUDA12.8);3)下载并安装LingBot-MAP源码;4)安装可视化依赖;5)下载预训练模型。使用时需将模型文件放入项目目录,视频文件置于data文件夹,通过指定参数运行demo.py脚本。该方法经实测可有效避免显存溢出,成功完成3D重建任务。