chokoryu

920 posts

chokoryu banner
chokoryu

chokoryu

@naka_ryu116

Ryu Nakamatsu | Sr. Consultant @deloitte_jp ← Engineer/Researcher @SoftBank & @AIST_JP ← Electrical Engineering @UBC | Interests: 🍺🥃💻💹🏀⛷️🎸🏃

日本 東京 Katılım Temmuz 2014
670 Takip Edilen193 Takipçiler
chokoryu
chokoryu@naka_ryu116·
LoL本格的に再開するか…
Satoshi Nakajima @MulmoCast@snakajima

68人の大学生に1日1時間のビデオゲームを30週間続けてもらったところ、測定可能なレベルで頭が良くなった、という研究結果を紹介するX投稿です。 実験では、参加者を二つのグループに分けて、半分には「League of Legends(リーグ・オブ・レジェンド、世界的に人気の対戦型アクションゲーム)」を、もう半分には「Legends of the Three Kingdoms(三国志をテーマにした中国発の戦略カードゲーム)」をプレイしてもらいました。 30週間後にEEG(脳波計、頭皮につけた電極で脳の電気的な活動を測る装置)で脳をスキャンしたところ、両グループともに認知能力の向上が確認されたそうです。アクションゲームは反射神経や視覚的な情報処理を、戦略ゲームは計画立案や記憶力を鍛える、というこれまでの研究結果とも符合する内容です。 ビデオゲームは長らく「子供の脳に悪い」と批判されてきましたが、適度なプレイがむしろ脳の働きを高めるという研究は近年積み重なっています。考えてみれば、複雑なゲームをこなすには、目の前の状況を素早く把握し、複数の選択肢を比べ、瞬時に最適な行動を選ぶ必要があり、これは脳にとって優れたトレーニングになります。 興味深いのは、AIの世界でも、囲碁の「AlphaGo」、Dota 2(ドータ・ツー、人気のオンライン戦略ゲーム)の「OpenAI Five」、StarCraft II(スタークラフト・ツー、リアルタイム戦略ゲーム)の「AlphaStar」など、ゲームを舞台にAIを鍛え上げてきた歴史があることです。人間の脳とニューラルネットワーク(人間の脳の仕組みをまねた、AIの中核技術)はまったく違う仕組みですが、「難しいゲームに挑み続けることで賢くなる」という点は共通しているように見えます。 子供にゲームを禁じる前に、どんなゲームをどれくらいやるかを一緒に考える時代に入ったのかもしれません。

日本語
0
0
0
128
chokoryu retweetledi
Shin丨AI×プロダクト開発の専門家🤵🏻
最近読んだ『Software Engineering is back(ソフトウェアエンジニアリングが戻ってきた)』という記事が、かなり刺さりました。主張はシンプルで「コーディングエージェントが、これまで自分が使ってきたフレームワークを置き換えた」という話📝 ここで言っているのは『vibe coding最高』みたいな軽いノリではなく、むしろ逆で「考える仕事が主役に戻る」という宣言でした。コードを書く労働が軽くなるほど、設計・判断・トレードオフ・エッジケース対応の価値が相対的に上がる。つまり『エンジニアリング』が戻る、という整理。 記事の中で好きだった言い方が「Automated Programming(自動化プログラミング)」です。『タイピングの苦行』が消えて、建築でいうと「レンガを積む」から「建物を設計する」に比重が戻る。服作りでいうと「縫う」から「デザインする」に戻る。こういう比喩って、現場感がないと出てこないんですよね。しかも筆者は「何も考えずにAIに丸投げ」ではなく、アーキテクチャや仕様決定、深夜3時に刺さる地雷みたいな論点は今まで通り(むしろ以前より)考えている、と言います。消えたのは『手を動かす消耗』だ、と。 そして記事が一段深いのは「フレームワークが解決してきた問題」を3つに分解している点です。1つ目が『簡略化』。自分で設計する怖さから、既製の型に逃げる。2つ目が『自動化』。ボイラープレートを減らす。3つ目が本音の部分で『労働コスト最適化』。企業は『ソフトウェアエンジニア』ではなく『React開発者』のような交換しやすい駒を雇いたい。フレームワークはそのための分業装置にもなっていた、という指摘です。ここ、めちゃくちゃ重要です。フレームワーク論に見せかけて、実は組織設計と人材市場の話でもある。 この分解で見える景色は「AIで消えるのはフレームワークではなく『フレームワークに逃げる動機』」かもしれない、ということです。AIエージェントがボイラープレートを量産できるなら『自動化のためにフレームワークを選ぶ』理由が薄れる。さらに、AIが既製の型を超えて「いま目の前の要件」に合わせたコードを生成できるなら『一律の簡略化』のメリットも相対化される。結果として、最終的に残る価値は『設計できる人』に寄っていく。筆者は「問題は『いずれ出るかもしれない課題』ではなく『いま解くべき課題』を解け」と言い切っています。これもAI時代の原則っぽいです。 個人的に「なるほど」と思ったのは、最先端の話の結論が『bashが万能』に落ちているところです。1989年生まれの古い道具が、AIエージェントにとっての『世界との接着剤』になる。派手なMCP設定より、単純なエージェントループ+bashで充分に価値が出るケースが増えている、という見立てでした。ここから学べるのは「未来は新ツールで来るとは限らない。既存の道具が、別の文脈で最強化される」ということです。プロダクトでも同じで、AI時代に伸びるのは『新機能てんこ盛り』より『基本機能がAIで極限まで強くなる』パターンだったりします。 じゃあこれ、現場では何が起きるのか。自分なりに論点を並べます。 1 『実装力』の定義が変わります。コードを速く書くではなく『意図を正しく伝えて、狙った形に収束させる』が実装力になります。 2 『設計の負債』が可視化されます。AIが速く作るほど、曖昧な仕様や雑な境界設計がボトルネックになります。 3 『ミドル層の二極化』が進みます。記事のコメントにも近いですが、AIはトップの増幅器になりやすい一方、学習ルートが整備されないと格差が広がるリスクがある。だから組織は、育成を『ドキュメント+レビュー+意図の言語化』に寄せないと詰みます。 プロダクトマネージャー視点だと、もっと直接的でフレームワーク前提のロードマップが崩れます。今までは「この基盤を入れれば速くなる」「この型に乗れば増員できる」みたいな意思決定が成立していました。でも、AIが『型』の価値を下げるなら、競争優位は「型の選定」ではなく「何を作り、どう検証し、どこで差別化するか」に戻る。つまり、PMの仕事は『仕様を書く人』から『制約条件を設計して勝ち筋に誘導する人』に寄っていく。ここで大事なのは、AIで作るほど『自由度が増える』のではなく、むしろ『自由度を制御できるか』が問われる点です。自由に作れると、人は散らかります。だからこそ、エンジニアリングが戻るというお話かなと👀 blog.alaindichiappari.dev/p/software-eng…
日本語
3
28
233
27.6K
chokoryu
chokoryu@naka_ryu116·
@fkubota_ 久しぶりですおめでとうございます!!🍻🍻
日本語
1
0
1
271
fkubota🦉
fkubota🦉@fkubota_·
やほーみんな久しぶりー! 実は12月からGoalsって会社で働いてるよ! 40社カジュアル面談して10社ぐらい会食とかもして丁寧に決めました。 社会課題に取り組みたくて探した結果、大好きな日本の飲食を守るぜ!って感じで働いています🔥 積極採用中です。 goals.co.jp
日本語
4
0
75
4.9K
chokoryu retweetledi
Chicago Bulls
Chicago Bulls@chicagobulls·
OFFICIAL: We have signed Yuki Kawamura to a Two-Way contract. Welcome back, @KawamuraYuki 🇯🇵
Chicago Bulls tweet media
English
527
12.2K
76.1K
5.9M
chokoryu retweetledi
Ado
Ado@ado1024imokenp·
改めまして、THE FIRST TAKEに出演しました。うっせぇわを歌いました。 youtu.be/ujyJRxAKpVE?si… とても緊張しました。これは私です。
YouTube video
YouTube
Ado tweet media
日本語
1K
8.9K
85.9K
3.8M
chokoryu retweetledi
yuki-P
yuki-P@yuki_p02·
GrokとGemini比較です。 Grok…俺恥ずかしいよ…
yuki-P tweet mediayuki-P tweet media
日本語
63
828
3.8K
508.8K
chokoryu retweetledi
VraserX e/acc
VraserX e/acc@VraserX·
🔥 GPT-6 may not just be smarter, it might be alive (in the computational sense). A new research paper called SEAL, Self-Adapting Language Models (arXiv:2506.10943) describes how an AI can continuously learn after deployment, evolving its own internal representations without retraining. Some of the SEAL researchers are now working at OpenAI. 👀 That’s no coincidence. SEAL’s architecture enables models to: •learn from new data in real time •self-repair degraded knowledge •form persistent “memories” across sessions If GPT-6 integrates this, it won’t just use information, it will absorb it. A model that adapts to the world as it changes. A system that gets better every single day. This could be the birth of continuous self-learning AI, the end of the frozen-weights era. Welcome to the next chapter.
VraserX e/acc tweet media
English
164
473
3K
278.2K
johannyjm1
johannyjm1@johannyjm1·
結婚式なう💒
johannyjm1 tweet media
日本語
23
4
156
5.8K
chokoryu retweetledi
Sam Altman
Sam Altman@sama·
Today we are launching my favorite feature of ChatGPT so far, called Pulse. It is initially available to Pro subscribers. Pulse works for you overnight, and keeps thinking about your interests, your connected data, your recent chats, and more. Every morning, you get a custom-generated set of stuff you might be interested in. It performs super well if you tell ChatGPT more about what's important to you. In regular chat, you could mention “I’d like to go visit Bora Bora someday” or “My kid is 6 months old and I’m interested in developmental milestones” and in the future you might get useful updates. Think of treating ChatGPT like a super-competent personal assistant: sometimes you ask for things you need in the moment, but if you share general preferences, it will do a good job for you proactively. This also points to what I believe is the future of ChatGPT: a shift from being all reactive to being significantly proactive, and extremely personalized. This is an early look, and right now only available to Pro subscribers. We will work hard to improve the quality over time and to find a way to bring it to Plus subscribers too. Huge congrats to @ChristinaHartW, @_samirism, and the team for building this.
English
3.1K
2.9K
41.7K
7.8M
chokoryu retweetledi
kazmot
kazmot@kmotohas·
「作りながら学ぶ!LLM自作入門」を圧縮して2時間くらいで学べるハンズオンを作りました。社内でデリバリーしましたが、刺さる人には激しく刺さりつつ、多くの入門者を置いてけぼりにしました。トークン化、セルフアテンション、GPT構築、事前学習を学びたい方、どうぞ。 colab.research.google.com/drive/1g-KjfRW…
日本語
1
365
2.7K
166.8K
chokoryu retweetledi
Daisuke Okanohara / 岡野原 大輔
LLMの幻覚(Hallucination)が統計的な必然性と評価設計の歪みから説明する統一的な理論枠組みが提唱されている。 まず、統計的必然性について:事前学習は学習対象の分布を近似する密度推定問題(出現確率を推定する問題)とみなせる。このとき言語モデルを使って与えられた文が妥当か、妥当でないかという分類器IIV(Is-It-Valid)(例:「OOの誕生日は9月8日である」など)を構成すると考える。 仮想的に分類器は、半分の確率で実際の学習対象の集合Vからのサンプルと、半分をランダムに構成した誤り集合Eで構成する。この時、分類器は閾値1/|E|より大きいものは妥当だと答え、そうでないものは妥当ではないと答えるのが最適な戦略となる(ノイズありの場合のベイズ最適) この場合、誤り集合に属するサンプルを妥当だと答えてしまう確率は、必ず分類器の誤正解率の2倍程度(正確にはこれから正例と誤例のサイズ比と、キャリブレーション分を引いたもの)が含まれることが示される。 ほぼ完璧な分類を達成する(分類平面を完全に覚える)ことは困難であるため、ここから、ハルシネーションは事前学習のみでは防ぎきれないことがいえる。 例えば、ある人の誕生日を学習データから覚える場合を考える。この場合、その人の特徴と誕生日の間には何の関係はなく、誕生日は丸暗記をする必要がある。分類平面としては非常に複雑で(殆ど似た特徴を持つ人と何も相関がない)、統計的手法で覚えるには非常に多くのサンプル数が必要となる。 この場合、上記の議論では、分類器は1/364(|E|=364)より確率が大きければそれを答えるのが確率の観点からは最適戦略となる。 また、Good-Turing 推定とよばれる、未知の確率がどの程度出現しうるかを、学習データ中に1度だけ出現したデータ(singleton rate)の割合で見積もるアプローチを使うと、誤分類率は、このsingleton rateがほぼ下限であることを示せる。 世の中の情報はロングテールであるため、多くが低確率しか出現せず、この場合は誤分類率の下限は抑えられず、それを下限とするハルシネーションも一定割合は防げないことがいえる。 一方、(密度推定タスクである)事前確率ではハルシネーションは防げないとしても、事後学習でハルシネーションを防ぐことは原理上可能である。 しかし、現在の事後学習タスクでは、必ずしもわからないことを分からないと答えることが、ベンチマーク上有利ではなく、分からない場合でも多択問題でそれっぽいことを答えて当たる戦略が促進される。 学習コミュニティは、分からない場合は分からないと答えることにインセンティブがあるようなベンチマークを設計していかないといけない。 コメント === この研究はハルシネーションに対して、明確に統計的機械学習の枠組みにおいては限界があることを明確に示している。今後多くのハルシネーション研究はこの研究を参照するだろう。 本研究で述べられていないが、ハルシネーションに対する対策の示唆を与えていると思える。 サンプル数が少ない場合は丸暗記せざるをおえず、学習データを過剰に信用すれば、(たとえ1サンプルしかなくても)覚えることは可能である。学習データでどれが信用できるか、ノイズが少ないかというったことを考慮にしてモデルを変えるといったことができればよいのではないか。少なくとも人間はそのようにして少サンプルからの学習を可能としている(一方、そのせいで容易に騙されるが)。
日本語
5
141
594
86.5K
chokoryu
chokoryu@naka_ryu116·
紅とSilent Jealousyを足して2で割った感じの曲をMarc Hudsonが歌ってるってX JapanとDragonForce好きからするととっても素敵🎸 youtu.be/XM6aRpeXh-M?si…
YouTube video
YouTube
日本語
0
0
2
334