闪光小猫
2.8K posts


@ec12edfae2cb221 我把你之前抽出来的那个 axcli 做了个 skills
结果 Agent 老想跳过 cdp mcp 直接上手操作浏览器 😂
中文

STT 模型已经很成熟了, 200M 参数就够了. 另外自己的语音被拿去训练, 这是无法接受的.
另外没必要多语言. 你都 Rua 了就纯 Rua 好了.
github.com/andelf/picc/bl…
Vincent Yang@m1ssuo
做了一个 macOS 语音输入工具叫 Koe(声),完全没有 GUI,菜单栏只有一个小图标。 起因是我试遍了市面上几乎所有的语音输入 App,要么收费,要么界面丑,要么用起来繁琐——臃肿的 UI、笨重的词典管理、做个简单的事要点好几下。 所以我自己写了一个: - 按住 Fn 说话,松开自动粘贴到当前输入框,全程无需切换窗口 - 所有配置都是纯文本文件,放在 ~/.koe/ 下,用 vim 就能改 - 词典是一个 .txt 文件,一行一个词,甚至可以用 AI 批量生成专业术语 - 改完配置不用重启,下次按 Fn 自动生效 技术上是 Objective-C 负责 macOS 系统集成(热键、录音、剪贴板、粘贴),Rust 负责网络部分(ASR 流式识别 + LLM 纠错),两层通过 C FFI 连接。语音识别用的豆包大模型,纠错支持任意 OpenAI 兼容接口。 没有开发者帐号了,所以没法传 TF 了,想玩的可以自己编译下。 github.com/missuo/koe
中文

做了一个 macOS 语音输入工具叫 Koe(声),完全没有 GUI,菜单栏只有一个小图标。
起因是我试遍了市面上几乎所有的语音输入 App,要么收费,要么界面丑,要么用起来繁琐——臃肿的 UI、笨重的词典管理、做个简单的事要点好几下。
所以我自己写了一个:
- 按住 Fn 说话,松开自动粘贴到当前输入框,全程无需切换窗口
- 所有配置都是纯文本文件,放在 ~/.koe/ 下,用 vim 就能改
- 词典是一个 .txt 文件,一行一个词,甚至可以用 AI 批量生成专业术语
- 改完配置不用重启,下次按 Fn 自动生效
技术上是 Objective-C 负责 macOS 系统集成(热键、录音、剪贴板、粘贴),Rust 负责网络部分(ASR 流式识别 + LLM 纠错),两层通过 C FFI 连接。语音识别用的豆包大模型,纠错支持任意 OpenAI 兼容接口。
没有开发者帐号了,所以没法传 TF 了,想玩的可以自己编译下。
github.com/missuo/koe
中文







