677 posts

鮗 banner
鮗

@wintery_fish

ほくりくちほーのITエンジニア(見習い)

日本 Katılım Ocak 2024
53 Takip Edilen7 Takipçiler
鮗
@wintery_fish·
政府としては、モザイクなしえちえちデータにはアクセス出来ないようにしたいのかな
日本語
0
0
0
17
鮗
@wintery_fish·
モザイクの話、インターネット上には無限にモザイクのないえちえちデータが転がっていて見ようと思えば簡単に見れる状態で、日本のクリエイターにだけ制約を課すのは正直意味が分からない
日本語
1
0
0
19
鮗 retweetledi
elvis
elvis@omarsar0·
// Code as Agent Harness // 100+ page report on all things related to agent harnesses. (bookmark it) In particular, the survey summarizes methods and applications of code as agent harness. This paper makes a strong case that code-as-harness might be the key to moving us towards a broader science harness engineering. Is code all you need? Maybe. Regardless, the paper argues that future systems must have the following four properties: executable, inspectable, stateful, and governed. Paper: arxiv.org/abs/2605.18747 Learn to build effective AI agents in our academy: academy.dair.ai
elvis tweet media
English
33
153
799
77.2K
鮗
@wintery_fish·
画像分類もみんなでResNetを改造して遊んでたらViTというブレイクスルーによって一掃されたので、もう少しでTransformerも一掃されそうな雰囲気を感じる
柴田 淳-【新刊】みんなのPython第五版/Pythonで学ぶはじめてのプログラミング入門教室@ats

最近のLLMの研究開発動向まとめ。 ・最近のLLMは、性能向上よりも「長文処理のコスト削減」が重要テーマになっている。 ・Gemma 4は、層をまたいでKVキャッシュを共有し、長文時のメモリ消費を大幅に削減した。 ・Laguna XS.2は、レイヤごとに注意機構の“予算配分”を変え、高価な全体注意を節約している。 ・ZAYA1-8Bは、圧縮した潜在空間で直接Attentionを行うCCAを採用し、Attention自体の計算量を減らした。 ・DeepSeek V4は、残差接続そのものを多重化するmHCや、長文を圧縮して扱うCSA/HCAを導入している。 ・どのモデルも「Transformerを捨てる」のではなく、Transformer内部を少しずつ改造している。 ・結果として、コードや実装の複雑さは急激に増しており、現代LLMは“魔改造Transformer”の時代に入っている。 以前のLLM競争は、「パラメータ数を増やす」「学習データを増やす」という力技の側面が強かった。しかし最近は、推論時のメモリ帯域やKVキャッシュサイズ、Attention FLOPsの削減といった、かなりハードウェア寄りの最適化が前面に出てきている。特にReasoningモデルやAgent系では、長時間・長文脈を保持する必要があるため、単純に高性能GPUを積むだけでは限界が見え始めている。 興味深いのは、これらの改良が「Transformerの置き換え」ではなく、「Transformer内部の局所改造」で進んでいる点だ。Attention共有、圧縮Attention、残差経路の多重化など、個々は小さな変更に見えても、積み重なると実装は極端に複雑になる。GPT-2時代は数十行で説明できたTransformerが、2026年には巨大な“最適化の寄せ集め”になりつつあり、LLM開発が完全にシステム工学化していることを感じさせる記事だった。 magazine.sebastianraschka.com/p/recent-devel…

日本語
0
1
2
354
鮗
@wintery_fish·
Fitbit Air 買っちった Google Health Premium のお試しも設定したので、解約だけ忘れないようにしないと
日本語
0
0
0
383
鮗
@wintery_fish·
コンセプトが似ているからか私の心に刺さる刺さる
日本語
0
0
0
16
鮗
@wintery_fish·
Hymn Proの続報が全然出てこない中、同じアンビエンテックのBarcarolleが気になりだしつつある
日本語
1
0
0
43
鮗
@wintery_fish·
あとは、わざとコードの一部を壊してE2Eテストや結合テストがちゃんと失敗することを確認するカオスエンジニアリングのような何かをしたい場合にも使えるかもしれん
日本語
0
0
0
76
鮗
@wintery_fish·
Sakana AIが出していたランダムな文字列を最初に渡すことで出力の多様性を上げる手法、Claude Code や Codex に探索テストをやらせるときに役立つかも?
日本語
1
0
1
77
鮗
@wintery_fish·
そういう無駄なところで認知負荷を上げる施策は理解できないわ
日本語
0
0
0
12
鮗
@wintery_fish·
読むときに HTML にするのはいいけど、それは各々が Markdown から変換すべき。例えば、私はダークテーマよりライトテーマ、もっといえば Catppuccin Latte あたりが好きなんだけど、HTML で雑に書かれるとダークテーマになって逆に可読性落ちる。あとフォントとかもね
日本語
1
0
0
25
鮗
@wintery_fish·
AIにMarkdownではなくHTMLを書かせるやつ、Slack とかで雑に共有する文書ならありだけど、git 管理するようなやつには適用しないでほしい派
日本語
1
0
1
35
鮗
@wintery_fish·
週一時間相談させてもらってる会社OBの強強エンジニアには筋悪だと言われたけど、これに限ってはマークダウンをレビュー対象として置いたほうがいい
日本語
0
0
0
13
鮗
@wintery_fish·
システムテストはやっぱり手順をマークダウンで持っておいたほうがいい気がするなぁ。AI が書いてきたコードをレビューするのは大変なので、マークダウンの方を重点的にレビューするほうが効率よい。
日本語
1
0
0
19
鮗
@wintery_fish·
出身研究室だとそれが結構普通だったんで人間性が麻痺してるんだよなぁ
日本語
0
0
0
9
鮗
@wintery_fish·
自分は結構口出しする方ではあるが、ブリリアントジャークにもなりかねんのでバランス感覚が大事な気もする。自分も気をつけているが、後から振り返るたブリリアントジャーク的振る舞いに見えるなぁと反省することが多い konifar-zatsu.hatenadiary.jp/entry/2026/05/…
日本語
1
0
1
149
鮗
@wintery_fish·
AGENTS.mdって子ディレクトリで作業していてもちゃんと読み込んでくれるのか
日本語
0
0
0
9