Sim Jiahao
177 posts

Sim Jiahao retweetledi
Sim Jiahao retweetledi

Gaussian splats in RViz?!
It is finally happening!
@PatelVideh at @TryClutterbot just released an open source RViz plugin that lets you load GSplats directly in RViz!
This is a huge breakthrough and we can't wait to see what #ROS users do with it!
⬇️⬇️⬇️
GIF
English
Sim Jiahao retweetledi
Sim Jiahao retweetledi
Sim Jiahao retweetledi
Sim Jiahao retweetledi

今年度,萩原研究室のメンバーは,博士後期課程2名,博士前期課程6名,学部生14名の合計22名となりました.
SOBITSの集合写真には56名が参加してくれました。
今年度も生活支援ロボットの知能化について新たな可能性に挑戦していきますので,宜しくお願い致します.
SOBITS@創価大学@sobits_soka
【新年度のご挨拶】 崔研究室と萩原研究室からなるTeam SOBITSに新たに鈴木研究室の仲間も加わり、研究室のメンバーは56名となりました! 今年も全力で成長していきますので、応援よろしくお願いします!! #sobits #創価大学
日本語
Sim Jiahao retweetledi
Sim Jiahao retweetledi

【新年度のご挨拶】
崔研究室と萩原研究室からなるTeam SOBITSに新たに鈴木研究室の仲間も加わり、研究室のメンバーは56名となりました!
今年も全力で成長していきますので、応援よろしくお願いします!!
#sobits #創価大学

日本語
Sim Jiahao retweetledi

Generate FULLY CONTROLLABLE 3D assets from a SINGLE image, locally on your PC.
Made a 1-click launcher for the official Anigen Gradio app, and a dedicated viewer.
Crazy this is now possible. What you're seeing here came from one image.
Requires: NVIDIA GPU 6GB VRAM
Yanpei Cao@yanpei_cao
Static 3D generation isn't enough. We need assets ready for animation. Our new #SIGGRAPH work, AniGen, takes a single image and generates the 3D shape, skeleton, and skinning weights all at once. Code is fully open-sourced! Kudos to @KyrieIr31012755 and @VastAIResearch 🧵(1/4)
English

Nice to see continued progress on world models. The shift toward learning structured environment dynamics feels increasingly important for downstream planning and control.
Xuanchi Ren@xuanchi13
We scaled up Lyra to generate explorable 3D worlds! 🚀 Introducing Lyra 2.0 — turning a single image into a 3D world you can walk through, look back, and even drop a robot into 🤖 Code and Model available today! 🌐 Website: research.nvidia.com/labs/sil/proje… (1/N)
English
Sim Jiahao retweetledi

Today is world model 2.0 day...
Over + Over = Back
3d-models.hunyuan.tencent.com/world/
huggingface.co/tencent/HY-Wor…
English
Sim Jiahao retweetledi

「ワールドモデル」はAIで最近よく聞くキーワードだけど、研究者間でも「何がワールドモデルか」の定義がバラバラだった。
北京大学・清華大学など8機関が共同で、ワールドモデルの統一定義と推論フレームワーク「OpenWorldLib」を発表した(GitHubで公開済み)。
論文の定義はシンプルで明快。ワールドモデルとは「知覚(視覚・音声・触覚などの感覚入力)を中心に、行動に基づくシミュレーションと長期記憶を備えた、複雑な世界を理解・予測するモデルやフレームワーク」のこと。
面白いのが「これはワールドモデルではない」リスト。
Soraはリリース当初「世界シミュレーター」と呼ばれたけど、論文はこれを明確に否定。複合的な知覚入力(視覚・聴覚・触覚など)を統合して世界と対話できなければ、いくら綺麗な映像を作れてもワールドモデルではないという立場。コード生成・Web検索・アバター動画生成も同様にNG。
逆に認められるのは4タスク。インタラクティブ動画生成(操作に反応しながら次フレームを予測する)、マルチモーダル推論(空間・時間・因果関係を複合的に理解する能力)、3D生成・再構成(物理空間を構造的に表現する)、VLA(Vision-Language-Action、映像と言語を統合してロボットが動作を生成するモデル)。
VLAの具体例として、Physical Intelligenceが開発した「pi-0」「pi-0.5」(ロボットアームの汎用制御モデル)がフレームワークに統合済み。ナビゲーション動画生成の評価では「Hunyuan-WorldPlay」が最も高い視覚品質を達成し、一方で「WoW」は多様な機能を持つものの物理的リアリズムはNVIDIAの「Cosmos」に劣るという結果も出た。
フレームワーク自体はPipeline → Operator → (Synthesis / Reasoning / Representation) + Memoryの5モジュール構成で、Python 3.10 + conda環境で動かせる。GPUはNVIDIA A800(80GB)/ H200(141GB)で動作確認済み。

日本語
Sim Jiahao retweetledi

Sim Jiahao retweetledi
Sim Jiahao retweetledi

本日は創価大学第52回卒業式でした!
卒業生の皆様、ご卒業おめでとうございます㊗
就職した方、進学した方それぞれ進んだ道でのご活躍を応援しています‼️✨
#SOBITS #崔研究室 #萩原研究室 #創価大学



日本語
Sim Jiahao retweetledi

RoboCup@Space JP のWebサイトを公開!
未だ実現されていない技術の実現を目指し、「AI × 宇宙 × ロボット」の技術を発展させる場を作っています🚀✨
みなさま、ぜひぜひご参加ください!!
▶︎ robocupatspacejp.github.io
#RoboCup #RoboCupAtSpace

日本語
Sim Jiahao retweetledi
Sim Jiahao retweetledi

本日開催、コンピュータビジョン勉強会@関東「世界モデル論文読み会」の発表資料です。「世界モデルにおける分布外データ対応の方法論」という内容で、特定の論文の紹介というよりは、世界モデルをある切り口から眺めてみる内容になります。
#cvsaisentan
speakerdeck.com/koukyo1994/shi…
日本語
Sim Jiahao retweetledi

Introducing colmapview.github.io v0.5
Beyond mobile support, now you can remove unwanted camera from the COLMAP data and export a copy, edit the camera model for compatibility need, save config presets, export demo videos, and more.
English












