Reina 已转推

==别再拿 Opus 跑Hermes工作流了,纯烧钱。分享下我目前跑通的一人公司“云+端”大模型架构==
核心逻辑就一条:体力活留本地,脑力活上云端
硬件底座:Mac mini M4 (32GB)
统一内存神器。后台常驻挂两个量化小模型,剩下内存依然足够日常开发,性价比拉满
三核模型矩阵:
1.前置路由 (Hermes 3 8B):无情的 API 调度器。专做意图识别和吐结构化 JSON 去调外部工具。毫秒响应,不废话
2.本地主力 (Qwen3 14B):干 80% 的脏活。日常代码脚手架、RAG 数据清洗、文案初稿量产全包。无限重试,边际成本为零
3.云端大脑 (Claude Opus):零琐事消耗。只吃本地喂过来的高密度半成品,做极其复杂的架构推演和最终的个人 Vibe 注入。把最贵的 API 额度全花在刀刃上
调度与编排:
• 写代码:Codex CLI 底层指向本地 Qwen,开多分支跑终端自动化
• 业务流:n8n 或 Dify 把 Hermes -> Qwen -> Opus 串联起来,跑无人值守的闭环
结论:与其去卷一两个神级 Prompt,不如搭一套低成本、高流转的 Pipeline
一人公司的终局,就是把算力杠杆用到极致
中文






















