# Interesting papers ## E3D-Bench: A Benchmark for End-to-End 3D Geometric Foundation Models - 16 가지 geometric foundation model 비교 - https://arxiv.org/pdf/2506.01933 <img width="924" alt="Image" src="https://github.com/user-attachments/assets/8cf52b30-2b10-4892-9928-36787801fc20" /> <img width="924" alt="Image" src="https://github.com/user-attachments/assets/29d52110-12d0-4965-9753-9fb9ec4ed54f" /> <img width="924" alt="Image" src="https://github.com/user-attachments/assets/1c8bb9b3-dda0-4b5c-a57a-4c21ff51d790" /> <img width="924" alt="Image" src="https://github.com/user-attachments/assets/9e08aeff-0c8b-4619-bfbf-92509726edda" /> <img width="924" alt="Image" src="https://github.com/user-attachments/assets/ec995e26-3d78-4b22-80b0-f5410186eb50" /> <img width="924" alt="Image" src="https://github.com/user-attachments/assets/ade975fc-6904-4938-aa0f-0c68e07df087" /> <img width="924" alt="Image" src="https://github.com/user-attachments/assets/e40a9310-b292-4e1b-a786-e2b57e0370bf" /> <img width="1038" alt="Image" src="https://github.com/user-attachments/assets/3ca5f430-7343-4520-a654-743826c7f49f" /> Findings: - Multi-view geometry inference 가 pair-view inference 보다 어렵다 - 곧바로 3D scene geometry 를 추정하는게, depth/pose를 먼저 구하고 추정하는거보다 어렵다 - Metric-scale depth estimation은 아직 풀어야할 문제다 - 다양한 geometric attribute (e.g. pose, depth, matching)을 joint estimation 하는게 성능 향상의 요인이 될 수 있다. - 데이터가 많이 없는 도메인에서는 성능이 급격히 떨어진다 - 현재로서는 ViT vs Diffusion 중 어떤게 더 성능이 좋다고 단정하기 어렵다 - 성능이 좋은 2D foundation model을 먼저 사용하면 3D GFM도 성능이 좋아진다 - 현재로서는 GFM은 실시간 deployment는 어렵다 -