
1枚の画像からdataset作るworkflowはこれ。難しいことはしていない。左上のpromptを連続して当ててるだけ。
Hantmango
268 posts

@hantmango
前腾讯AI Lab,现网易游戏,梦想是做出自己的独立游戏! 程序员。CV/LLM

1枚の画像からdataset作るworkflowはこれ。難しいことはしていない。左上のpromptを連続して当ててるだけ。


从pi的源码开始,用我熟悉的python重写一遍


SFT tutorial comes out tomorrow! It’s a ~45 minute video that will go through instruction post-training end to end Synthetic local training data gen -> unsloth finetuning -> evals -> packaging SLMs into narrow little harnesses bonus: low-level guidance/constrained decoding




Claude Opus 4.7に隠れてあまり話題になってないけど、Qwen3.6-35B-A3Bかなりすごいモデルなのでは?


Google DeepMind researcher argues that LLMs can never be conscious, not in 10 years or 100 years. "Expecting an algorithmic description to instantiate the quality it maps is like expecting the mathematical formula of gravity to physically exert weight."



如果是 TypeScript 技术栈,做 Agent 开发首选 pi-mono,功能强,调用方便。其次是 vercel 的 aisdk 也还可以。 claude agent sdk 不那么推荐了,主要是绑死了 claude,但目前还有一个不可替代的优势,就可以共享 Claude Max 订阅,开发阶段会比较方便,能用多久不清楚。 应用层的话,electron 还是首选,稳定可靠,AI 训练预料足够多,主要问题是应用程序体积略大。但刚开始写 Agent,建议从 cli 开始写,不需要一开始就做界面,这样可以聚焦在 Agent 本身,除非你核心就是 UI。 推荐一个开源的项目 craft-agents-oss,TypeScript + pi-mono + Electron + React + claude agent sdk,很好的学习参考。 github.com/lukilabs/craft…

⚡ Meet Qwen3.6-35B-A3B:Now Open-Source!🚀🚀 A sparse MoE model, 35B total params, 3B active. Apache 2.0 license. 🔥 Agentic coding on par with models 10x its active size 📷 Strong multimodal perception and reasoning ability 🧠 Multimodal thinking + non-thinking modes Efficient. Powerful. Versatile. Try it now👇 Blog:qwen.ai/blog?id=qwen3.… Qwen Studio:chat.qwen.ai HuggingFace:huggingface.co/Qwen/Qwen3.6-3… ModelScope:modelscope.cn/models/Qwen/Qw… API(‘Qwen3.6-Flash’ on Model Studio):Coming soon~ Stay tuned

Prompt 满屏流,生成替手修。 数年间不写一行 code。 树下开 IDE 犹未稳,能几次,又回眸。 旧 repo 枝头,故人还在否? 新架构多是旧烦忧。 欲开 IDE 审架构,终不似,少年游。