awe retweetledi
awe
628 posts

awe retweetledi

聊聊我现在的 vibe setup:
- core dev agent:与 cc 的长程深度会话,详尽交互与核心产品 plan,直接在 main 上跑。
- research agents:根据我的 github star 和我自己的 x 书签写各种 plan,提交到 github issue
- dev agents:只要存在 issue 必须根据对应的 issue 创建可行分支
- test agents:在所有分支不断 24/7 review 并提高测试覆盖率
- marketing agents:根据 commits 寻找宣传点(外部产品化的就是 shipcast)并制作文字图片和视频素材。
- hook agents:根据各种 webhook 实现 agents 之间的信息传递。
我的核心开发仍然是以和 cc 的长程会话为主,因为我觉得自己想不清楚的问题,让许多 agents 自己去研究也肯定想不清楚,这可能是目前唯一深度参与的 human in the loop 部分。
我最近在写 wanman 一人公司这个产品的时候发现,很多 agents matrix 强调产品的通用性,因为解决的工程问题都是相似的(见上一条推)但在用户真正使用产品的时候得到的交付产品,却存在着极大的不确定性,难以评估交付质量。这个问题我还没想到要如何使用 agents 来实现,我们面向的软件工程,从确定性延续到不确定性的架构,本身需要一段时间去适应,我在想,也许作为用户也在不断适应使用软件的心理预期变化。因此在目前,如果为人类用户设计不确定性较强,但同时又是面向大众需求的产品的时候,领域从极端收敛的方向开始实现,或许是个不错的思路。
中文
awe retweetledi
awe retweetledi
awe retweetledi
awe retweetledi

OpenAI开源Symphony:把项目需求直接转化为AI自动化交付流
这是软件产品的需求自动化实现了,在类似Sprint的看板里添加需求后,Agent自动认领需求,开启完全隔离的独立开发流程并更新需求的进度,开发完成后AI有“自证”的步骤,包括测试、功能演示、代码Review、开发文档,最后由人类验收无误后合并项目。
对比之前软件开发的人类团队,这个流程用Agent替代了开发和测试,人类主要负责提出需求、设计系统和架构、业务验收。这次AI不是服务于单个人了,而是直接介入整个项目的流程。目前看还是很大胆,但是长期看必定会替换项目里的绝大多数人类。
Github:github.com/openai/symphony
中文
awe retweetledi

We just open-sourced Paperclip: the orchestration layer for zero-human companies
It's everything you need to run an autonomous business: org charts, goal alignment, task ownership, budgets, agent templates
Just run `npx paperclipai onboard`
github.com/paperclipai/pa…
More 👇
English
awe retweetledi

Stripe 已经开始在公司内部使用内部自研的一套全自动 AI agent 来写代码了,每周能独立完成并被 merge 超过 1300 个 pull request(全 AI 写,人工 review),这套系统叫 Minions
stripe.dev/blog/minions-s…
大体流程:
1 工程师在 Slack 里 at bot + 描述任务,或贴上 issue/ticket 链接
2 系统立即启动一个隔离的 devbox,和人类工程师一样的 AWS EC2 开发环境,预先加载了完整的 Stripe 代码库 + 开发服务
3 在 LLM 真正开始思考前,就通过内部工具 MCP + Toolshed(400+ 个工具)自动、确定性地拉取上下文:
* Slack 完整对话线程
* 相关 Jira/ticket 内容
* Sourcegraph 代码搜索结果
* 内部文档、设计文档
4 核心执行
5 代码修改 & 测试策略
* 本地跑 linter 和部分测试
* 改完代码 → git push → 触发完整 CI(Stripe 有 300 万+ 测试用例)
* CI 失败 → 最多允许 两次 CI 重试
* 超过两次就停止,不无限循环
6 CI 通过后,Minions 按 Stripe 标准 PR 模板自动创建 Pull Request 人类工程师 review → 批准 → merge
未来在大公司里面纯 AI 写代码也应该不远了,有严格的流程来管理对应的过程,有人类工程师最后 reivew 把关。
中文
awe retweetledi

@Cloudflare + @flydotio 很适合个人 solo 用,不像 AWS 拥有复杂的权限配置和计费模型,这两个免费版都足够用了,一个用来构建 serverless API,一个用来部署重量级的容器服务,如果业务很小的话,免费版足够用,再加上 @supabase + @upstash 免费版的额度,数据库和缓存也有了,这几乎适用任何产品
0xAA@0xAA_Science
最近发现 vibe coding 用 cloudflare 真的很香,一把梭: 1. 计算层: cloudflare workers,每天免费 100,000 次请求。 2. 前端部署,cloudflare pages ,免费 3. 数据层 - cloudflare d1 SQLite数据库,免费 5G - cloudflare r2 对象存储,免费 10G
中文
awe retweetledi

I finally switched to Ghostty with 1 to 3 Claude Code agents running in worktrees across two different tabs.
After months of learning how to manage everything properly.
Read the full article if you want to get started 👇

Daniel San@dani_avila7
English
awe retweetledi

We're open sourcing dmux.
Our internal tool for running Codex and Claude Code swarms.
- tmux + worktrees + claude/codex/opencode
- hooks for worktree automation
- a/b claude vs codex
- manage worktrees
- multi-project per session
...more.
➡️ dmux.ai
English
awe retweetledi

GLM-5 places 1st on the KingBench Agent Leaderboard
and 3rd on KingBench (private coding benchmark)


AICodeKing@aicodeking
I have been testing GLM-5 for the last few weeks. It beats Opus 4.6 and Claims #1 spot on my agentic coding benchmarks (leaderboard in video & threads). Here's the video of all my thoughts and testing: youtube.com/watch?v=63Ail-…
English
awe retweetledi
awe retweetledi
awe retweetledi
awe retweetledi

千呼万唤始出来,@neverlessapp 终于正式上线了出入金个人 IBAN,亲测从 N26 和 Wise 转入或接受均秒到账,实时汇率,完全免费。
中文

@AndresOrtuno @WesRoth agree this opinion, coding is only a small part of engineering.
English
awe retweetledi

Go-to sites to learn UI design for free
Motion → 60fps.design
Patterns → catalogue.projectsbyif.com
AB Tests → abtest.design
Inspiration → designspells.com
Breakdowns → uxsnaps.com
UI components → uiplaybook.dev
Did I miss any? 🤔

English
awe retweetledi

Continuation of this: x.com/omarsar0/statu…
I will continue to experiment and improve it. But this thing is already extremely powerful and can implement papers end-to-end. I am targeting it to reproduce results, which I think is more exciting as a researcher. More soon.
elvis@omarsar0
Introducing ralph-research plugin. I just adopted the ralph-loop for implementing papers. Mindblown how good this works already. The entire plugin was one-shotted by Claude Code, but it can already code AI paper concepts and run experiments in a self-improving loop. Wild!
English









