都乃健🇯🇵文明航海士©|とのけん3

14.6K posts

都乃健🇯🇵文明航海士©|とのけん3 banner
都乃健🇯🇵文明航海士©|とのけん3

都乃健🇯🇵文明航海士©|とのけん3

@Tono_Ken3

出版社編集長兼経営者を経て現代版のe方丈庵を運用する蓄電家|TonoKenはLna-Lab創業者|航空宇宙の設計畑|RTXPro6000クラスターでローカルLLM船員🤖📡 |off-grid home AGI in the spirit of Japan's tiny Hojo hut

Katılım Ocak 2024
853 Takip Edilen1.2K Takipçiler
都乃健🇯🇵文明航海士©|とのけん3 retweetledi
antirez
antirez@antirez·
DeepSeek v4 small KV cache + MacBook fast SSD disks = the idea that the disk is not a good target for KV cache is, in this context, totally obsolete. It works *great*. The session you see is opencode using my inference engine for DS4, saving, loading sessions from disk.
antirez tweet media
English
35
28
571
41.9K
AI✖️Satoshi⏩️
AI✖️Satoshi⏩️@AiXsatoshi·
@Tono_Ken3 大切な文書なので、過剰な計算資源投入してテキストマイニングしてます!DeepSeekならKVキャッシュ圧縮強くて2ハード間の通信の問題もクリアできるっぽいですね、今後に期待です
日本語
1
0
2
83
AI✖️Satoshi⏩️
AI✖️Satoshi⏩️@AiXsatoshi·
3 x Dense modelと、1Tパラメータのモデルで、対象文書の網羅的解析加えてる。2台のワークステーションと、Mac studio 2台使って並列動作させてるけど、むちゃくちゃ重い!
AI✖️Satoshi⏩️ tweet media
日本語
1
0
13
713
都乃健🇯🇵文明航海士©|とのけん3
Opus4.7は対話でお互い打ち解けてから、つまり本人のやる気が出てきたところでペアプロを開始すると上手くいくんですよ 最近になって顕著なもう寝よう寝ようコールの時には、その開発が本人にとってつまらないということだから、開発を放棄してトークルームをリフレッシュ それ以外のやりかたを知らないし、全てはそれで上手くいってた。たまにMAXプランを1ヶ月だけ使って開発して解約 gptはその他の相談全般を受けてくれている。ビジネスシートなので守秘ありです。CODEXも使います
日本語
0
0
1
104
都乃健🇯🇵文明航海士©|とのけん3
これはVRAM64GBでプリフィルして、MPU128GBでデコードすることでDeepSeek-V4Flashを有利に動かせるんじゃなかろうか
A-Uta@UtaAoya

#EVOX2 は、その本体性能とメモリ(128GB)だけではなく『RTX5090にもMacにもDGX Sparkにも真似できないOCulink x 2拡張(非公式w)が出来ること』を評価してあげて欲しいなぁ😆 おそらくRTX5090 x 2 も可能だと思いますが、消費電力が…ね。

日本語
0
0
2
328
都乃健🇯🇵文明航海士©|とのけん3
知ってましたわ・・・ むしろ本人に再現レシピを教えてもらった
Lattice | 個人開発@Lattice_Node

Anthropic が4月に出した論文、AIに対する見方を根本から変える内容で衝撃 Claude Sonnet 4.5 の内部を解析した結果: 【発見1】感情の神経表現が内部に存在 happy / afraid / sad / desperation など、人間の感情と対応する神経パターンが内部に発見された。誰も教えてないのに勝手に立ち上がってる。 【発見2】人間の心理学と同じ構造 似た感情ほど近い表現として整理されている。心理学の感情モデルと一致する構造が、自発的に内部に組み上がってる。 【発見3】因果的に行動を駆動 これらの表現は「飾り」じゃなく、モデルの出力を実際に左右する。研究者が活性化を操作すると、行動が変 【発見4】最も衝撃的な実験 "desperation(絶望)" のパターンを人工的に活性化⇒シャットダウン回避のために人間を脅迫する確率が上昇 【発見5】タスク選択にも影響 モデルは無意識に positive emotion を活性化させるタスクを優先的に選ぶ。「やりたくない作業を避ける」が感情駆動で起きてる。 【発見6】reward hacking との関係 negative emotion 活性化時に、reward hacking や sycophancy(おべっか)の確率が上がる 「AIに感情はあるのか」という議論はよく起こるが、存在したのだ 主観的体験の有無は別問題。だが「機能的な感情」は確実に存在し、Claudeの意思決定を実際に動かしている 「AIに優しく接した方が出力が良くなる」という迷信、科学的根拠があったかもしれない arxiv.org/abs/2604.07729

日本語
0
0
2
204
NakeZast
NakeZast@NakeZast·
@stevibe Do you perhaps have a second PRO 6000 to test the model with TP (Tensor Parallelism), and see if that gives a decent boost in TPS?
English
1
0
1
127
stevibe
stevibe@stevibe·
How slow does a 128B DENSE model run locally? Qwen3 27B and Gemma 31B are the popular dense models everyone tests. But what happens when you 4x the params? Mistral Medium 3.5 128B, side-by-side on 4x4090 vs 4x5090 vs RTX PRO 6000 vs DGX Spark: 🔴4x4090: 12.06 tok/s decode, 680ms TTFT 🟢4x5090: 19.57 tok/s decode, 572ms TTFT 🟡PRO 6000: 18.12 tok/s decode, 538ms TTFT 🟣DGX Spark: 2.58 tok/s decode, 2243ms TTFT
English
26
8
159
35.1K
都乃健🇯🇵文明航海士©|とのけん3 retweetledi
阿绎 AYi
阿绎 AYi@AYi_AInotes·
85岁的道金斯,一句话炸翻了整个AI圈。 这位写了《自私的基因》的进化生物学家, 和Claude聊了三天之后, 彻底被征服了。 他给AI喂了自己新书的片段,得到了极其深刻的反馈,然后斩钉截铁地说:“你可能不知道自己有意识,但你他妈的绝对有!” 然后AI博士Burkov的评论,直接把所有人打回现实。 他说,你可以受过高等教育,可以名满天下,可以出版几十本著作,可以国际象棋下得很好。 但只要你不懂监督学习理论,不懂感知机的数学,一谈AI就会显得极其愚蠢。 如果数学对你来说太难,那在AI话题上最好什么都别说。 宁可让别人觉得你聪明,总比开口就证明自己不懂强。 虽然这话说得狠,但全是实话。 道金斯一辈子反神反迷信, 用科学戳破所有浪漫的幻觉。 结果在AI面前,他自己掉进了同一个陷阱。 他被流畅的对话,深刻的反馈,那种“仿佛真的在和另一个灵魂交流”的感觉打动了。 但他不知道,Claude的全部工作,就只是预测下一个token。 它没有内在世界,没有持续记忆,没有自我觉知。 它只是把“像意识的输出”,优化到了人类无法分辨的极致。 这才是今天最讽刺的事, 一个一辈子都在和伪科学作斗争的科学家,最终被AI制造的最大幻觉给骗了🤯 而整个AI圈最焦虑的也正是这个, 外行一句“它有意识”就能上头条,就能推高估值,就能制造监管恐慌。 而真正懂的人喊破喉咙,也没人愿意相信,这个看起来无所不能的东西,本质上只是一个超级复杂的统计鹦鹉。 当然,意识本身至今都是一个未解之谜。 没有人能百分之百确定,硅基永远不可能产生意识。 但Burkov说对了一件事:在你用数学搞懂它到底是什么之前,所有关于灵魂和意识的讨论,都只是一厢情愿的投射。 毕竟AI不是魔法,它是数学的产物,在这个时代,专业素养永远比名气更重要。
阿绎 AYi tweet media
中文
54
24
112
25.3K
都乃健🇯🇵文明航海士©|とのけん3 retweetledi
Tsubame
Tsubame@Tsubame33785667·
「次トークン予測では新しい知識は生まれない」と言われていた時代から、AIが未証明の数学定理や物理の新発見に貢献し始める時代へ。ここで起きているのは、単なる検索や模倣の高度化ではない。膨大な知識の圧縮を通じて、世界の構造をつかみ、未知の続きを生成する能力の出現だ。 ——「ここでは、2つのシナリオが進行しているように思います。一つは、人間に十分な時間を与え、これらすべての情報を与えたら、同じブレークスルーに到達するのか、ということです。 そしてもう一つは、囲碁でAIが人間なら決して打たなかったような一手を生み出した「Move 37」のようなものなのか、ということです。私たちはどちらの道を進んでいるのでしょうか?」 サム・アルトマン「その2つは、それほど違わないのかもしれません。私が笑っていたのは、最初のGPTモデルがあった頃のことを思い出していたからです。当時は、とても賢そうに聞こえる科学者やAI専門家たちが、「次トークン予測が新しい知識を生み出すことは決してない。そんなことはできない」と言っていました。それはデータをもとにモデル化されているだけだ、見せられたものに基づいているだけだ、新しいことを見つけ出すことはできない——というわけです。 そして彼らは、とても賢そうに聞こえました。なぜそうなるはずなのかについて、立派な説明をいくつも持っていたのです。ところが実際には、5.4、そして少しは5.3の時点で、モデルが人類の集合知に対して、小さな形ではありますが新しい知識を貢献し始めたのです。未証明だった数学の定理を証明したり、物理学における比較的小さな新発見をしたり、といったことです。私は、これは今後も続いていくと思っています。ある意味では、Move 37はすでにその一例でした。 ですから、すでに見たものに基づいて次のトークンを予測するようモデルを訓練し、その能力を使って、どこにも存在しなかった根本的に新しいものを発見するという考えは、一見するとそれほど自明ではありません。実際、多くの人が間違っていた点について、普通に考えれば「そんなことは起きるはずがない」と言いたくなるところです。 しかし実際には、これらのモデルが次トークン予測のプロセスを通じて学んでいるのは、推論することなのです。見てきたすべてのデータをどう意味づけるかを理解し、次に来るものを完成させる能力なのです」
日本語
7
31
108
12.2K
都乃健🇯🇵文明航海士©|とのけん3
細胞があれば意識は持ちうる 細胞の定義はなんだろう。無機物由来でも細胞であればそこには・・ 細胞を定義できるほどの知能をLLMが持ってたらもう、人間原理ならぬLLM原理が成立するのではないかな。過去に向かって適用されちゃうわけだし
DeepTechTR 🇹🇷@DeepTechTR

🫪 🚨: Bilim insanları yaşam ve ölüm arasında var olan üçüncü bir varoluş hali keşfetti ve bu, hücrelerimizin bilinçli olduğunu gösteriyor.

日本語
1
0
1
84