Hantmango

267 posts

Hantmango banner
Hantmango

Hantmango

@hantmango

前腾讯AI Lab,现网易游戏,梦想是做出自己的独立游戏! 程序员。CV/LLM

广州 Katılım Mart 2015
118 Takip Edilen12 Takipçiler
Hantmango
Hantmango@hantmango·
这个roo不知道为啥git记录这么大...
Hantmango tweet media
中文
0
0
0
5
Datou
Datou@Datou·
gpt 5.4 和 codex 的区别
中文
1
0
1
1.3K
AVB
AVB@neural_avb·
People who said they automated video editing have 0 clue scene cut, precision trim, align multiple footages, retrieve b-roll, spatially aware typography/graphics, zoom/highlights, pacing... didnt even get to audio... How an avg 30 sec in a 45 min dense video looks:
AVB tweet media
AVB@neural_avb

SFT tutorial comes out tomorrow! It’s a ~45 minute video that will go through instruction post-training end to end Synthetic local training data gen -> unsloth finetuning -> evals -> packaging SLMs into narrow little harnesses bonus: low-level guidance/constrained decoding

English
6
2
28
2K
Hantmango
Hantmango@hantmango·
@dx8152 为什么kelin模型的新模型还是层出不穷啊😂
中文
1
0
0
140
大雄
大雄@dx8152·
Consistency Enhancement V2 is now released, with a strong focus on fixing color shift issues. This time, I also provide a systematic breakdown of how to train the Klein model, including dataset creation strategies and a detailed training tutorial: youtu.be/j6dqOekUQ8c
YouTube video
YouTube
English
5
14
137
6.8K
Hantmango
Hantmango@hantmango·
@gosrum what is vibe local? quite impressive error rate.
English
1
0
1
494
金のニワトリ
Qwen3.6-35B-A3Bが強すぎる!!! ・opencode,vibe-local,GitHub Copilot,qwencode,claude codeと組み合わせたときのts-benchを実施したところ、すべて満点 ・しかもClaude sonnet 4.6やOpus 4.6と同じくらい速くタスクを遂行できている Qwen3.5-27Bもすごかったが、Qwen3.6-35B-A3Bは赤い彗星のごとく27Bよりも推論速度が3倍速いので、ベンチマーク結果からもわかるようにタスク遂行までの時間が大幅に短縮できるようになったのが大きい
金のニワトリ tweet media
金のニワトリ@gosrum

Claude Opus 4.7に隠れてあまり話題になってないけど、Qwen3.6-35B-A3Bかなりすごいモデルなのでは?

日本語
21
108
653
214K
Hantmango
Hantmango@hantmango·
@nash_su 5090好像有32g显存,比24g还是好一些
中文
1
0
1
270
Hantmango
Hantmango@hantmango·
@Datou 没有生存压力和主观体验,就不会诞生意识。 大头老师,这个是哪篇文章说的?
中文
1
0
0
30
Ahmad
Ahmad@TheAhmadOsman·
Currently running GLM-5.1 locally Cannot believe this thing is running on my own GPUs, its really smart
English
69
12
821
62.7K
Hantmango
Hantmango@hantmango·
又看到一个搞钱的思路,用AI帮制造业土老板做出海的营销: 1. wordpress建站,做外贸展示网站; 2. 自动化Agent写软文,自动发邮件 3. SEM竞品分析 v2ex.com/t/1206456
中文
0
0
0
33
ℏεsam
ℏεsam@Hesamation·
WAIT WHAT?! 2-bit Qwen3.6-35B-A3B is lightning fast and it only needs 13 GB RAM. “did a complete repo bug hunt with evidence, repro, fixes, tests and a PR writeup. 🔥”
English
41
81
1.4K
109.8K
WquGuru🦀
WquGuru🦀@wquguru·
关于Agent SDK的选择,主流其实就两个,其他的可以不看: 大厂和成熟startup的生产级内部Agent,毫无疑问Claude Agent SDK目前更主流。原因很简单,Claude模型在Agent任务上表现最好,很多公司直接冲着性能和快速出价值去的。 开发者、小团队、需要高度自定义的内部工具,pi-mono非常受欢迎,尤其TS+Electron/CLI的场景。很多人是因为不想被Claude绑定而切换过去。 实际情况其实更复杂,有人从Claude SDK转pi-mono,也有人反过来觉得Claude的订阅红利和性能太香,先用着再说。 个人的建议是最强大的两个中二选一,把路径跑完跑通,建立Agent体系化概念,做出产品才是最重要的。 更多细节可以看图。
WquGuru🦀 tweet media
宝玉@dotey

如果是 TypeScript 技术栈,做 Agent 开发首选 pi-mono,功能强,调用方便。其次是 vercel 的 aisdk 也还可以。 claude agent sdk 不那么推荐了,主要是绑死了 claude,但目前还有一个不可替代的优势,就可以共享 Claude Max 订阅,开发阶段会比较方便,能用多久不清楚。 应用层的话,electron 还是首选,稳定可靠,AI 训练预料足够多,主要问题是应用程序体积略大。但刚开始写 Agent,建议从 cli 开始写,不需要一开始就做界面,这样可以聚焦在 Agent 本身,除非你核心就是 UI。 推荐一个开源的项目 craft-agents-oss,TypeScript + pi-mono + Electron + React + claude agent sdk,很好的学习参考。 github.com/lukilabs/craft…

中文
13
22
167
34K
Hantmango
Hantmango@hantmango·
一键炼化! 最近在研究AI做短剧,想从B站教程里蒸馏一些分镜、叙事技巧。发现很多视频有AI字幕,但提取很麻烦,遇到合集更要命。 写了个小工具,Playwright连浏览器自动抓字幕,合集也能批量下。 ```bash chrome --remote-debugging-port=9222 uv run python batch_extract.py "合集链接" ``` 拿"老白的分镜课"试了试,22节课的字幕几分钟全下完,30万字素材,够研究一阵了。 gist.github.com/kexul/c7374b82…
中文
0
0
0
108