
toshi_456
761 posts

toshi_456
@tech_nichijo
SB IntuitionsでVLMの研究や開発をしています。 深層学習/自然言語処理/ROSに興味あり。C++/PythonたまにCを使います。 最近データ分析コンペにはまっています。 → SIGNATE 🥇1🥈1、 Nishika 🥇2
Katılım Şubat 2022
271 Takip Edilen426 Takipçiler
Sabitlenmiş Tweet

768x768の入力に対応した日本語対応LVLMの重みを公開しました。Heron-BenchのAverageは50.39で現状公開されている日本語モデルではトップクラスの性能です。またパラメータ数が1.86Bと比較的小さく、bf16でもVRAMが5GBほどで推論可能です。ぜひ遊んでみてください!
huggingface.co/toshi456/llava…
日本語
toshi_456 retweetledi

📢Sarashina2.2-OCR公開
文書画像の解析に特化したOCRモデルをリリース🚀
✅️レイアウトを保ちMarkdown変換
✅️日本語特有の縦書き文書に強い
✅️図表も逃さず検出し位置出力
複雑な文書画像を人にもAIにも扱いやすい形式で高精度にデータ化します✨️
詳細はこちら
huggingface.co/sbintuitions/s…
日本語
toshi_456 retweetledi
toshi_456 retweetledi

PowerCLIP is now public.
GitHub: github.com/KMasaki0210/Po…
We released the code, pretrained models, and data for PowerCLIP.
Hope this is useful for reproducibility and future research.
Masaki Kawamura@Masakichi333210
Our paper "PowerCLIP: Powerset Alignment for Contrastive Pre-Training" has been accepted to @CVPR 2026! 🎉 See you in Denver!
English
toshi_456 retweetledi

チューリング、自動運転の研究開発を支援する約111時間分のデータセットを公開しました。
End-to-End自動運転システムおよびVision-Language-Action(VLA)モデルの学習・評価への活用を想定しています
tur.ing/news/opendatas…
日本語
toshi_456 retweetledi

『現代日本語書き言葉均衡コーパス』第2部(BCCWJ2)を公開しました。従来のBCCWJの拡張として、今回、2006~2010年刊行の書籍からサンプリングした約2300万語分を公開しました。
2028年度末までに2006~2025年のデータを追加し、2億語規模のコーパスとする計画です。
www2.ninjal.ac.jp/BCCWJ2/

日本語
toshi_456 retweetledi

とうとう公開できて感無量!大感謝!
snipping toolのように事務用のロースペックマシンでも快適に動かせて高精度、というのが開発コンセプトで、(VRAMではなく)DRAMが1GBくらい空いてれば動くと思います。
技術の話をしたいのですが、私がkagglerとして得たノウハウを詰め込んでいます(続く
国立国会図書館 NDL@NDLJP
NDLOCR-Liteを公開しました。ノートPC等の一般的な環境で動作する軽量なOCRです。英活字や手書きにも試行的に対応しています。 マウス操作のみでお使いいただけるようWindows及びMacに対応したアプリもご用意しました。是非お試しください! lab.ndl.go.jp/news/2025/2026… 使い方 lab.ndl.go.jp/data_set/ndloc…
日本語

LLM-jp勉強会のマルチモーダルWGの18ページ目の資料の詳細を知りたい
drive.google.com/file/d/16_C8Ww…
日本語
toshi_456 retweetledi

SBIntのVLMチームのインタビュー記事が公開されました。
VLMチームは研究や開発をともに行ってくださるメンバー募集中です。ご興味持っていただけましたらぜひご応募ください。
採用リンク: open.talentio.com/r/1/c/sbintuit…
SB Intuitions@sbintuitions
📢メディア掲載情報 ITmedia AI+にてインタビュー記事が掲載されました。 Vision AI部の3名が開発秘話について語っています。 目を持つ国産生成AI「Sarashina2.2-Vision」 開発者が「ライバルまであと1歩、2歩」と語る性能になるまで itmedia.co.jp/aiplus/article… #SBIntuitions
日本語




