noaho
6 posts


🎉 After one year of teamwork, we are excited to release our 3D foundation model — LingBot-Map! Unlike DA3/VGGT, LingBot-Map is a purely autoregressive model for streaming 3D reconstruction ⚡ It achieves ~20 FPS on 518×378 resolution over sequences exceeding 10,000 frames — and beyond 🚀 Two key insights behind LingBot-Map: 🔑 Keep SLAM's structural wisdom: build Geometric Context Attention with long-context modeling while maintaining a compact streaming state 🔑 Make everything end-to-end learnable — no optimization, no post-processing Let's check out our demos 👇







360度動画から人を消し去るの出来たわ! 動画版消しゴムマジック! Segment Anythingで領域分類して、 YOLOで人物検出して、 Stable Diffusionで消す。 人がいても人のいないフォトグラメトリできちゃう。



「写真から人や車や空などを識別してマスク処理するツール」を公開しました✨ フォトグラメトリをやっている人に役立つかなと思います 無料DL: booth.pm/ja/items/77347…


