Zack
19 posts


让 Qwen3.7-Max 帮我复刻了一个 Poolsuite FM 的播放器。一句 prompt,10 分钟,花了 $20,效果直接放图你们感受一下。
体感推理能力跟 Opus 4.7 差不多,但便宜不少。我一开始走 OpenRouter 的 API,用了几天账单有点肉疼,后来切到阿里云百炼的 Token Plan,每月 25000 Credits,同样的活儿成本直接打下来了。
回头看了眼 Code Arena 放的榜,Qwen3.7-Max 得分 1541,全球第二,就比 Claude 低一点,GPT-5.5、Gemini-3.5-Flash、GLM-5.1 全排它后面。榜单跟体感对上了,这个模型写代码确实不错!
aliyun.com/benefit/scene/…
中文

Gemini 3.5 Flash from @GoogleDeepMind is live on OpenRouter!
Beats Gemini 3.1 Pro on coding, agentic work, and tool use at Flash-tier price and speed.
1M context, 65K max output, multimodal. $1.50/M input, $9/M output.

English

🚀Qwen3.6-Plus is on Nous Portal now and FREE for a limited time.
Hermes Agent, here we go!! ⚡️ @NousResearch
Nous Research@NousResearch
Qwen 3.6 Plus by @Alibaba_Qwen is now FREE for a limited time on Nous Portal! Nous Portal is one easy subscription that gives you access to 300+ models, exclusive discounts, and bundles your tokens and paid tools together for hassle-free setup and simple billing.
English

Cursor 官方团队自己在用的 CI、Code Review、发版、测试、清理代码、周报等工作流的 Skills 打包成一个 Plugin,一句指令安装:/add-plugin cursor-team-kit
cursor.com/marketplace/cu…
# 三类组件:17 个 Skills + 1 个 Agent + 2 条 Rules
1. Skills(17 个,核心)
按用途可以归为五组:
A. CI / 合并循环(让 PR 顺利绿灯)
· loop-on-ci:盯住 CI,失败就自动迭代直到通过。
· fix-ci:定位失败 job,读日志,做最小修复。
· check-compiler-errors:跑编译/类型检查,汇报问题。
· fix-merge-conflicts:解冲突 → 跑构建/测试 → 输出处理记录。
B. PR 全流程(写代码到合入)
· new-branch-and-pr:开新分支、完成工作、提 PR 一条龙。
· review-and-ship:结构化自审 → 提交 → 开 PR。
· make-pr-easy-to-review:清理乱糟糟的提交历史、补充描述、给 reviewer 留导读。
· get-pr-comments:拉取并总结 PR 评论。
· pr-review-canvas:生成一份交互式 HTML 评审报告,diff 被自动归类、加注释——这是这套工具里比较有想象力的能力。
C. 验证与测试(防止"看起来对")
· verify-this:用 baseline/treatment 双对照"证伪/证实"一个声称,给出明确结论。这是科学化 debug 的方法论封装。
· run-smoke-tests:跑 Playwright 冒烟测试并 triage。
· control-cli:本地搭一个能驱动、检查、profile 交互式 CLI/TUI 的 harness(用于启动回归、内存泄漏、卡死、提示流复现)。
· control-ui:与上面对应,用 CDP 驱动 Web/Electron/IDE UI,做截图、a11y 快照、性能 profile、视觉 diff、UI bug 复现。
D. 总结与复盘
· what-did-i-get-done:按时间段汇总自己的 commit,输出简洁状态。
· weekly-review:生成周报,区分 bugfix / 技术债 / 新功能。
E. 代码与流程治理
· deslop:清理"AI 味"残留代码(冗余注释、过度抽象、模板套话等)。
· workflow-from-chats:从聊天历史里提炼稳定的工作偏好,沉淀为新的 skill / rule / 文档——团队自己规模化经验的方式。
2. Agent(1 个)
· ci-watcher:长时监听 GitHub Actions,返回简明 pass/fail 报告,附失败链接。适合后台代跑、不需要人盯。
3. Rules(2 条)
两条非常具体的强约束,反映 Cursor 团队的代码品味:
· typescript-exhaustive-switch:对 union/enum 必须穷尽 switch(编译期保护)。
· no-inline-imports:禁止行内 import,一律顶部声明。

eric zakariasson@ericzakariasson
this is cursor team kit: a plugin for some skills we use to build cursor at cursor skills for verifying changes, driving local tools, and shipping reviewable PRs cursor.com/marketplace/cu…
中文

ToDesk太恶心了,发现开通了会员只是最基础的——想用别的功能,还得一个个再开"权益"。受不了,换了 UU远程,免费的,比我花钱的 ToDesk 还顺手。
其实 ToDesk 我用得挺勤,但是开通了会员还需要继续付费,跟套娃一样这就让我很不爽。基本上每个功能都需要单独付费一次。
UU远程就没那么问题,而且全免费(优点):
- 全免费
- 连接秒进,画质默认拉满
- 文件拖进去就传,没看到限速
- 虚拟显示器直接开
- 多设备随便绑
- 用了快一个月,没碰到一次"开通权益才能使用"的弹窗
ToDesk 我已经卸了。会员钱当交学费,以后不能上这个当了,在使用的时候还是要去找相关的替代品,有可能免费的会是更好的。


中文

1.8B tokens.
18 hours.
One persistent Codex /goal.
Not a demo.
Not a benchmark.
A real open-source engineering loop:
251 commits
84 closed GitHub work items
44 closed PRs
40 closed issues
413 CI runs
The real question is:
Can long-running agents stay on path across issues, branches, PRs, reviews, CI, merges, docs, and releases?
This run was built around a multi-agent loop:
PM Router → Parser Builder → Quality Gatekeeper → Growth & Release with GitHub as the source of truth
and a read-only Local Supervisor watching logs and worktrees.
Once agents run for hours, the bottleneck becomes observability.
Where did the tokens go?
Why agent run soooooooooo slowly?
That’s why I’m building agenttrace — local-first observability for AI coding agents.
github.com/luoyuctl/agent…
#AIAgents #DevTools


English

我的龙虾三万已经全面切换到 DeepSeek V4 Pro 了。
体感上跟 Sonnet 完全没差别,有些任务甚至更好。
价格呢?Sonnet 15美金/百万token,DeepSeek V4 Pro 只要8毛7。差了17倍完全没有了token焦虑(我也曾有)
Easy Router 是我们做的一站式AI模型网关——一个API Key就能用 DeepSeek V4 Pro、Claude Opus 4.7、GPT-5.5、Gemini 3 Pro、Kimi K2.5、通义千问等40多个全球模型。
零平台费,零加价。别人收5.5%,我们一分不收。
别犹豫,直接试。
easyrouter.io
中文












