王富贵
650 posts


其实还蛮好奇大家对 “一个 Agent” 、 “Agent 同事” 的定义到底是什么,听着是挺性感,但 LLM 底子都是 stateless 的
所谓的 “Agent 同事” 这个实体到底是什么,是一个 Agent-Loop 带着一堆 markdown,还是一个 Claude Code / Codex 的 session
BlanPlan@blanplan
@Yeuoly1 Agent 不当同事这个思路对了。用户界面还要 control surface, 不模仿 Slack-style 多频道团队结构, 单一对话入口看智能体后台进度更合理。让 agent 跑大事加出可执行摘要, 用户随时可介入。
中文
王富贵 retweetledi

好聪明的设计.
iOS 沙盒下, agent 能看屏, 能推理, 但没法跨 app 发点击.
外接微控制器, 对 iOS 暴露成 USB MIDI (接收 agent 命令) + USB HID mouse (执行点击).
MIDI 有 iOS 零权限原生支持, HID 直接被当真鼠标, 完美的 agent (physical) tool, 实时可调用.
Finn Voorhees@finnvoorhees
Okay this is *crazy* An agent running entirely on iPad* that can control any app
中文

发布博客:
<想不到本地 TTS 已经这么强了!16G Mac 零成本实现高质量语音生成>
versun.me/blog/local-tts…
想不到现在的语音模型已经这么强了!以前用 ElevenLabs 的 API 总是舍不得放开用,更别提自由克隆音色了。
直到昨天,我抱着试一试的心态,在自己那台 M1 + 16G 内存的老 Mac mini 上部署了 Qwen3-TTS。结果出乎意料——不仅运行极其丝滑,输出质量也相当惊艳!
虽然它目前主打的不是直接克隆,但完全能根据提示词精准生成并稳定保持你想要的音色,可玩性极高,我配置到小龙虾上,每天给我读日报,体感很不错
独乐乐不如众乐乐,今天就来给大家简单复盘一下这个极简的部署过程
中文

















