3D Reconstruction from Public Photos with Machine Learning
9 months ago
- #Computer Vision
- #Machine Learning
- #3D Reconstruction
- 文章探讨了利用机器学习从公开照片重建3D模型的可能性
- 来自Reddit、YouTube和谷歌地图等渠道的公开照片可用于3D地图构建
- 相机拍摄时会丢失3D信息(深度),但机器学习能帮助恢复这些数据
- 3D重建的关键要素:每个像素的深度值(Z)和相机的焦距(f)
- 苹果的DepthPro模型提供公制尺度深度并估算焦距,从而实现精确的3D重建
- 3D重建案例包括COEX商场、森林、纽约天际线、Safeway超市和新加坡机场
- 由于训练数据集的限制,DepthPro模型在处理纽约天际线等大型场景时存在困难
- 该流程包含估算深度遮罩、将像素映射回3D空间,以及用Open3D可视化点云