Sabitlenmiş Tweet
Yuto Abe
167 posts

Yuto Abe
@ReactYuto
Speech AI / Full-Duplex Dialogue Web Systems × MLOps Waseda Univ. (FSE) → Kobayashi & Ogawa Lab M2 Aspiring AI / ML Forward Deployed Engineer 和敬塾西寮/東海高⛳️🎾🎸
名古屋→東京 文京区→新宿区 ap-northeast-1 Katılım Mart 2021
564 Takip Edilen230 Takipçiler

技術書典オンラインマーケットでCloudNative Daysの「クラウドネイティブ技術実践ハンズオン」を購入しました!
#技術書典 #技術書典で刺さった本 techbookfest.org/product/6AuEZp…
日本語
Yuto Abe retweetledi

Hugging Face just released @LeRobotHF a humanoid robot you can build for roughly $2,500!
A full open stack with hardware, simulation, training environments, runtime tools, datasets and robot learning workflows designed to take a humanoid from assembly to real world control.
Key details below.

English
Yuto Abe retweetledi

AI한테 코드 짜달라고 하면 기능은 돌아가는데 슬금슬금 복잡도만 올라가서 나중에 리팩토링 지옥 열리기 십상임. 이럴 때 Cursor 개발팀이 자기들 내부에서 제일 많이 쓴다는 /thermo-nuclear-code-quality-review 스킬 참고하면 직효약일 듯. 1k 라인 넘는 파일은 아예 차단하고, 알맹이 없는 껍데기 래퍼나 로직 유출 플래그 세우고, 돌아는 가는데 코드 더럽히는 PR은 가차 없이 쳐냄 ㅋㅋㅋ. 프롬프트 구조 그대로 가져다가 우리 팀 AI 에이전트 룰셋이나 Cursor Composer에 박아두고 쓰기 딱 좋네.
eric zakariasson@ericzakariasson
the most used skill internally at cursor right now /thermo-nuclear-code-quality-review - deletes complexity instead of moving it - blocks files over 1k lines - flags thin wrappers and leaked logic - rejects PRs that work but make code messier
한국어
Yuto Abe retweetledi
Yuto Abe retweetledi

【重大告知】
ついにイベント開始です!!
◤ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄◥
【2026年最新版】バックエンド × インフラ勉強会 ~生成AI時代に静かに市場価値を跳ね上げる秘訣~
◣___________◢
を開催します!
✅ 募集期間:5月17日(日)〜 5月22日(木)23:59まで
▼ ウェビナー開催日時
1日目:5月23日(土)20時〜
2日目:5月24日(日) 20時〜
※カレンダーに入れておいてください。
2日間で全てオンラインで行う企画となっております。
このウェビナーでは、
❶ AIでエンジニアは不要になるのか?に対する解
❷ バックエンドからインフラに守備範囲を広げた方が良い理由
❸ テックリードになるために必要な2つの能力
❹ インフラへ守備範囲を広げる6つのメリット
❺ なぜインフラ力を上げることがこんなにも難しいのか
❻ 僕の7年間のキャリアの全貌
❼ 再現性高くインフラ力を向上させる勝利のサイクル
❽ インフラスキル習得ロードマップ
これらを400ページを超えるスライドで徹底的に言語化していきます。
【さらに】
ウェビナーの参加特典として以下8個をお渡しします。
❶ 【90分で完結】「データ指向アプリケーションデザイン」超圧縮講義
❷ 【コツを掴めば一撃】Google Cloud 30日最速攻略ガイド
❸ 【後戻り不可】AWSインフラ構築の「落とし穴」20選 - 現場で使える失敗回避マニュアル
❹ 【認証・認可を制する者がバックエンドを制す】OAuth 2.0 & OIDC 集中講義
❺ 【効果抜群】 年間600万円以上削減した、AWSのコスト削減施策10選
❻ 【設計Doc】 50万件の大量メール配信基盤の構築
❼ 【挫折したエンジニア向け】 Kubernetes習得 完全ロードマップ
❽ 【法人成り経験者が語る】フリーランスエンジニアへのTips 50選
勉強会に参加して爆発的にモチベーションを高めてもらい、そしてこの8個の特典を使って、実際に業務や学習に活かしてもらえたら嬉しいです。
———————————————
ウェビナー参加方法
① @engineer_ryoma をフォロー
② RT & いいね &「参加!」とリプライ
③ こちらへ👉 bit.ly/ryoma-webiner
———————————————
それでは、当日Zoomにてお待ちしております!
日本語
Yuto Abe retweetledi

Chrome の 組み込み AI を使ってみよう!Built-in AI API ハンズオン に参加を申し込みました! gdg-tokyo.connpass.com/event/393063/?… #gdgtokyo
日本語

最近 AI でスライド作っていると「AIっぽい」「熱が感じられない」と言われることが多くなってきたので,”1スライド1メッセージ / 経緯はAppendix送り / カード乱用禁止 …” 等を,ClaudeCode SKILL形式にまとめて使ってみる gist.github.com/abePclWaseda/c…
日本語
Yuto Abe retweetledi
Yuto Abe retweetledi

AIエージェント設計勉強会 〜long-runningタスクの設計と実践知〜 に参加を申し込みました! layerx.connpass.com/event/391940/?… #AIエージェント設計勉強会
日本語
Yuto Abe retweetledi

Introducing GPT-Realtime-2 in the API: our most intelligent voice model yet, bringing GPT-5-class reasoning to voice agents.
Voice agents are now real-time collaborators that can listen, reason, and solve complex problems as conversations unfold.
Now available in the API alongside streaming models GPT-Realtime-Translate and GPT-Realtime-Whisper — a new set of audio capabilities for the next generation of voice interfaces.
English
Yuto Abe retweetledi

Our new voice models are now available in the Realtime API:
🎙️ GPT-Realtime-2: Build production-ready voice agents that can think harder, take action, handle interruptions, and keep conversations flowing.
🎙️ GPT-Realtime-Translate: Translate while streaming across more than 70 input and 13 output languages, breaking down language barriers and helping people communicate more naturally.
🎙️ GPT-Realtime-Whisper: Transcribe streaming audio as words are spoken to generate captions and notes in real time.
openai.com/index/advancin…
English
Yuto Abe retweetledi

何事もそうだけど、結果が出るかどうかの差はシンプル。
「自分は何がしたいのか」という目的と、どれだけ狂ったように熱量を注げるか。これだけ。
エンジニアの成長速度も、
「目標と期限」を明確に設定して、必要なステップをロードマップに落とし込めば、
あとは、誰よりも時間を投下してやるだけ。
モチベなんてものは存在しない。
手に入れたいものを明確にして、
毎日自分の軸に従って、自分に嘘をつかずにやるべきことをやるだけ。
腹落ちせずにモヤモヤしながらやってるんだったら、素直に辞めたらいい。
本心からやりたいことで、自分に必要だと理解していれば、四六時中だってやれるはず。
面白い漫画やゲームに朝から晩まで没頭するのと同じ。
自分の仕事や報酬を結びつけたり、楽しめる仕組みを作っていく努力はもちろん大切だけど、
根本の「なぜこれをやるのか」「自分は何がしたいのか」ここが全て。
結局、それを本心で思えるかどうか。
結果を出している人は、
総じて「自分が何を欲しているか」が明確。
逆に、自分の欲しいものがわかっていない状態で「何を掴めばいいのか」っていう話ですしね。
手に入れたいものの解像度が高いから、難しいことは何もない。
本人からすれば、必要なことをただ淡々とやってるだけ。
どれだけ時間を投下して、試行錯誤したか。その差でしかない。
考え方やマインド次第で、どこまでも行ける。
せっかくやるなら、毎日ワクワクしながら上を目指していけたほうが絶対に良い。
日本語
Yuto Abe retweetledi

Grok Voice is used by Starlink right now
X Freeze@XFreeze
Grok Voice brutally dominates the top of the τ-voice Bench Grok scores 67.3%, while Gemini sits at 43.8% and GPT Realtime at 35.3% This is a massive lead over the competitors and it's not even close The best real-time reasoning voice agent out there
English
Yuto Abe retweetledi

最高ですね。これでもう、ドンキで働かなくても、ドンキで働くゲームをプレイすればいいわけですね(笑)
でも冗談抜きで、将来的には人間が自宅からロボットを遠隔操作して、店舗や倉庫で働くようになると思います。労働がどんどん「ゲームのようなインターフェース」に近づいていく未来ですね。
HAL2400 | AI Visual Creator@HAL2400AI
ドンキで爆速品出しするゲームのプレイ映像。 GPT Image 2 × Seedance 2.0で作る架空のゲーム動画。
日本語
Yuto Abe retweetledi

NVIDIA Japan では、学生向けの 2026 年夏季インターンを募集しています!
東京勤務の Tegra System Software チームで、Graphics Engineer Intern として参加しませんか。
nvda.ws/3Qx06lH
最先端のゲーム機や組み込みデバイス向けのグラフィックス ドライバーおよびシステムソフトウェアの開発に携わり、シニアエンジニアと協働しながら、C/C++ や低レベルグラフィックス/GPU システムに関するスキルを磨くことができます。
CS/EE/CE、または関連分野を専攻し、優れた C/C++ プログラミング能力と英語の読解、ライティングスキルをお持ちの学生の方は、NVIDIA のキャリアサイトで JR2011824 を検索してご応募ください。
nvda.ws/3Qx06lH

日本語
Yuto Abe retweetledi

✏️ニュースリリース
WebクロールとWebアーカイブに基づく大規模音声・音響データセットの一般公開
nii.ac.jp/news/release/2…
大学共同利用機関法人 情報・システム研究機構 国立情報学研究所の大規模言語モデル研究開発センター(LLMC)は、主宰する LLM 勉強会(LLM-jp)の対話WGの活動の成果として、Web上のオープンなデータソースから構築した2つの大規模音声音響データセット(CC Audio および Archive.org Audio Dataset)を一般公開しました。対話WGは、NII/LLMC科学主幹の東中竜一郎教授が主担当を務め、早稲田大学の小川哲司教授、慶應義塾大学の高道慎之介准教授との緊密な連携のもと推進される研究グループです。
これらのデータセットは、大規模ウェブクロールデータセット「Common Crawl」と世界最大級のデジタルライブラリ「Archive.org」から得られた音声音響データへのURLリストと、これらのデータに対するメタデータ(言語種別や音声・音響の種類等)からなります。2つのデータセットを合わせることで、日本語だけで48,000時間を超える音声リソースへのアクセスが可能となります。大規模な日本語の音声モデルの構築に有用であるだけでなく、多様な音響・音声を含むため、多様な音声のモデリングにも活用いただけます。
これまで公開されている日本語音声データとしては、69,000時間規模のJ-CHATが最大のものとして知られており、LLM-jp-Moshiといった研究成果もこのデータに支えられて実現されました。今回公開するデータは約48,000時間規模であり、J-CHATに次ぐ国内最大級の日本語音声・音響データセットとなります。本データはLLM-jp-Moshi1の改善に利用されます。
日本語音声・音響分野では大規模なオープンリソースが依然として不足しており、その確保に困難を抱えている研究者は少なくありません。本データセットはWeb上の音声コンテンツから日本語を抽出・選別し、内容の確認・検証を経て整備したものです。大規模データのキュレーションと公開が研究コミュニティの発展に寄与することを期待しています。
LLMC では、本データセットの公開を通じて、次世代の音声生成AIおよび音声認識AIの研究開発を加速させ、学術研究およびAI開発の共通基盤となる大規模なデータインデックスと収集ツール群の整備を進めていきます。
日本語

Recap: Google I/O 2026 に参加を申し込みました! lycorptech-jp.connpass.com/event/391334/?… #recap_googleio
日本語






