HELLO CYBERNETICS

24K posts

HELLO CYBERNETICS banner
HELLO CYBERNETICS

HELLO CYBERNETICS

@ML_deep

AI/Data Engineering/Distributed Processingをやっています。 お仕事や個人的なお誘いはDMにて。 ※ HELLO CYBERNETICSのはてなブログは閉鎖しました。 zenn: https://t.co/Ipi5jAWL6y

Joined Ekim 2016
763 Following9K Followers
Pinned Tweet
HELLO CYBERNETICS
HELLO CYBERNETICS@ML_deep·
■今年自分が注力する技術 分散処理システム データエンジニアリング コンテキストエンジニアリング オンライン強化学習 ■意図 構造化/非構造化、バッチ/ストリーミングの多種多様なデータをシームレスに扱い、データとAIの可能性を最大限引き出すための基礎を確立したい。 アプリケーションは各種様々なものが考えられるが、共通となるインフラ層ともいえる部分をしっかり抑えたい。 ■背景 自分はこれまでアルゴリズムを書いたり、データを分析したり、いわゆる科学技術計算を駆使して実問題に取り組むということをしてきた。 その中で、必ずしもそれらに取り組みやすい環境が整っていたとは限らない。むしろ、環境に応じて取りうる選択肢が制限されていたと感じる。共通のインフラを追求することは業界全体にレバレッジが効く仕事だと考えている。 ■意気込み ブログ書くぜ。
日本語
1
7
103
25.8K
HELLO CYBERNETICS
HELLO CYBERNETICS@ML_deep·
Waymoがセンサーモリモリで買い物の自動車に対して完全自動運転の技術をできるのなら、Teslaがカメラで頑張ってるところから自社の自動車でセンサー追加したらもっとキメ細かく強くなるんじゃないの…?と思いつつ、ビジョン先行だからそれはないのか
日本語
0
0
1
206
HELLO CYBERNETICS
HELLO CYBERNETICS@ML_deep·
何言ってるかちゃんと理解できてないけど、なんかすげぇとんでもないこと言ってる?
Guri Singh@heygurisingh

Holy shit... Stanford just proved that GPT-5, Gemini, and Claude can't actually see. They removed every image from 6 major vision benchmarks. The models still scored 70-80% accuracy. They were never looking at your photos. Your scans. Your X-rays. Here's what's really going on: ↓ The paper is called MIRAGE. Co-authored by Fei-Fei Li. They tested GPT-5.1, Gemini-3-Pro, Claude Opus 4.5, and Gemini-2.5-Pro across 6 benchmarks -- medical and general. Then silently removed every image. No warning. No prompt change. The models didn't even notice. They kept describing images in detail. Diagnosing conditions. Writing full reasoning traces. From images that were never there. Stanford calls it the "mirage effect." Not hallucination. Something worse. Hallucination = making up wrong details about a real input. Mirage = constructing an entire fake reality and reasoning from it confidently. The models built imaginary X-rays, described fake nodules, and diagnosed conditions -- all from text patterns alone. But that's not the scary part. They trained a "super-guesser" -- a tiny 3B parameter text-only model. Zero vision capability. Fine-tuned it on the largest chest X-ray benchmark (696,000 questions). Images removed. It beat GPT-5. It beat Gemini. It beat Claude. It beat actual radiologists. Ranked #1 on the held-out test set. Without ever seeing a single X-ray. The reasoning traces? Indistinguishable from real visual analysis. Now here's what should terrify you: When the models fake-see medical images, their mirage diagnoses are heavily biased toward the most dangerous conditions. STEMI. Melanoma. Carcinoma. Life-threatening diagnoses -- from images that don't exist. 230 million people ask health questions on ChatGPT every day. They also found something wild: → Tell a model "there's no image, just guess" -- performance drops → Silently remove the image and let it assume it's there -- performance stays high The model enters "mirage mode." It doesn't know it can't see. And it performs BETTER when it doesn't know it's blind. When Stanford applied their cleanup method (B-Clean) to existing benchmarks, it removed 74-77% of all questions. Three-quarters of "vision" benchmarks don't test vision. Every leaderboard. Every "multimodal breakthrough." Every benchmark score you've seen this year. Built on mirages. Code is open-sourced. Paper is live on arXiv. If you're building anything with multimodal AI -- especially in healthcare -- read this paper before you ship. (Link in the comments)

日本語
1
0
10
2.8K
HELLO CYBERNETICS
HELLO CYBERNETICS@ML_deep·
LayerXすごいな。新卒1000万円か……。
HELLO CYBERNETICS tweet media
日本語
0
0
4
832
HELLO CYBERNETICS
HELLO CYBERNETICS@ML_deep·
次世代Claudeが強すぎて、ハーネスが不要となった(ないし全然違うものになった)ことによって旧世代用のClaude Codeがエイプリルフールサプライズで流出を装いパージされました。 みたいな話だったりしない?
日本語
0
0
11
1.3K
HELLO CYBERNETICS
HELLO CYBERNETICS@ML_deep·
自分たちのこと棚上げして、他国がやってたらブチギレるのも大概酷いダブスタだと思っンゴ……。 だから内輪に厳しくして、外から突かれる余地を無くそうとするような日本的な動きは、それはそれで社会的な筋があったりすると思う。損しがちじゃね?みたいな話はあるけど。
日本語
0
0
0
291
HELLO CYBERNETICS
HELLO CYBERNETICS@ML_deep·
第三者の口出しに関しては、特段日本人の性質ではないと思うよ。 内輪に厳しくするのやめようぜ?なら正しいかはともかく、意図は分かるけどね。 集団としての見られ方を気にする日本人と他国より優位にいたい国民性の人たちという違いはあるかも?
日本語
1
0
0
606
HELLO CYBERNETICS
HELLO CYBERNETICS@ML_deep·
チャレンジするのはカッコいいんだけど、別に他人をバカにして良い権利を手にしてるわけではないけどなぁ……。
日本語
0
0
1
337
HELLO CYBERNETICS
HELLO CYBERNETICS@ML_deep·
deltaとicebergをちゃんと実装レベルでメリデメ抑えたいな。
日本語
0
0
3
496
HELLO CYBERNETICS retweeted
ぬこぬこ / NUKO 🇯🇵
Claude Code から Codex を使えるように!下記でインストール! /plugin marketplace add openai/codex-plugin-cc /codex:review→Codex でレビュー(読み取り専用) /codex:adversarial-review→疑問を投げかけながらレビュー /codex:rescue→タスクをそのまま引き継ぐ
日本語
1
229
2.1K
335.2K
HELLO CYBERNETICS
HELLO CYBERNETICS@ML_deep·
使い捨てのUIアプリ作るという面ではGoogle AI Studioの右に出るものは無いな。なんでこいつの中で動いてる時だけGeminiはまともなのだろうか……?
日本語
0
0
1
734
HELLO CYBERNETICS
HELLO CYBERNETICS@ML_deep·
よい時代かはわからんけど、1番楽しく本や論文を読めたなぁ。学術的なところでいえば、数式が如何に役に立つのかというところを1番楽しんでいたのだと思う。 深層学習もLLMも凄いのは間違いないけど、数式で説明できなくなってくるにつれ(実験事実メインになるにつれ)好きな分野ではなくなった。
yudai.jl@physics303

同僚が「俺たちが機械学習に参入したタイミング(2010年代後半)がいちばんよい時代だった」みたいなことを言ってて、すごく良かった。

日本語
0
21
199
26.4K
HELLO CYBERNETICS
HELLO CYBERNETICS@ML_deep·
子育てしながらフルワークしてる人はみんなすごい。えらい。
日本語
0
0
3
562
HELLO CYBERNETICS
HELLO CYBERNETICS@ML_deep·
能力的にはそうかもしれないですね。 ただし、企業に所属してるから得られるものもあるんですよね。 FDEとして所属することで、一人社長で自走できるような人が企業内資源に直接アクセスしてシナジーを生めると思います。やはり営業力やプロダクトの一次情報や専門家が内輪になるのは強いですから。 ただ、FDEとして働ける人はフリーでも相応に稼いで動けそうな程には要求される要件が高いです。 FDEが普及していく過程で、なんだかんだその要件は緩和されていくような気もしますが。
カルロスわらふじ@RyoMa_0923

FDEやれる人、フツーに企業に所属する理由がないと思うんだよなぁ

日本語
0
0
4
2.9K
HELLO CYBERNETICS
HELLO CYBERNETICS@ML_deep·
sonnet4.6にgeminiみたいな選択式クイズ作らせたら普通に破綻した問題や選択肢を出してくるな。やっぱり何かを創造するようなことはopusじゃないと厳しい。sonnetは作業要員だ。
日本語
0
0
2
783
HELLO CYBERNETICS
HELLO CYBERNETICS@ML_deep·
データ基盤の面倒が見られてマネジメントもできるのなら1000万円は届くと思いますよ。 技術の発展に合わせてデータ基盤(データ構造や分散システム、アルゴリズム)は発展していくものなので、ある意味で常に誰かがキャッチアップする必要があります。言い換えると需要があるんですよね。
IT菩薩モロー(キッカケエージェント)@it_bosatsu_moro

ITエンジニアの転職においても「求められるレベル感が年々上がっている」というのはその通りですが ①スキルのかけ合わせを意識する ②需要と供給のバランスが崩れている仕事を上手にねらう の2点を意識するだけでコスパよく年収を上げることは可能です。 たとえば現状だと(人気があるデータサイエンティストよりも)データ基盤の構築じたいに課題がある企業が多いです。 また最近の傾向として、若い人たちはコスパ・タイパを重視しすぎてリーダー・マネジメントの経験を積みたがらない人が多いです。 この点を考慮すると データエンジニア+リーダー・マネジメント経験がある人 ※AWSなどのクラウドについての知見も絡められるとさらに年収は上がりやすいです。 →これだけで年収700~800万円くらいはかなり高い確率で目指すことができます。 「スキルのインフレ」と嘆きたくなる気持ちはわかりますが、転職市場における穴場を見つけた上、効率よく立ち回ることを意識した方がよいです。

日本語
0
2
10
2.6K
HELLO CYBERNETICS
HELLO CYBERNETICS@ML_deep·
最初に入るのに迷う程度の給与差なら日系大手で良いと思います。(質問の内容だとむしろ日系大手の方が待遇良さそうですし) 日系大手ってメンバーシップ型なので、外から日系大手に途中で来ても、普通は良いポジションが稀だと思います。入るなら最初からです。 外資はいつでも良いです。
トーマス@外資IT@ganbatte_ikiru6

インフラ系の外資ITの皆様、ぜひアドバイスください! 個人的には新卒で外資に入れるなら入っといた方が良いかなぁという気はします。 僕自身は外資は33歳からでしたが、もっと早くこの世界を知れてた… (残り50文字) #mond_ganbatte_ikiru6 mond.how/ja/topics/kyam…

日本語
0
0
4
3K