逆流而上
30 posts

逆流而上 me-retweet

一觉醒来到 2K fo了,这次还是延续上次 1K 时的活动规则。
关注我 @aiandcloud 并转发 + 评论这条内容,6 月 12 日开奖, 送 $100 GPT-5.5 API token,有效期两个月。
如果活动期间到了 3K fo,就再加一个 $200 的名额,万一到 4K 就加个 $300 的也行!
感谢大家的支持!🥰

中文

No more waitlist. The GitHub Copilot app's technical preview is now available to everyone currently on Copilot Pro, Pro+, Max, Business, and Enterprise plans.
This agent-native desktop experience lets you decide what agents work on, how they work, and what ships. Go from issue to merge all in one place. ✨
English

New Model:
huihui-ai/Huihui-gemma-4-31B-it-qat-q4_0-unquantized-abliterated
This is an uncensored version of google/gemma-4-31B-it-qat-q4_0-unquantized created with abliteration
huggingface.co/huihui-ai/Huih…
English

A strong model evolution needs a solid harness system, and vice versa. 14 days, 5 people, one vibe-coding journey — and MiMo Code was born. It's open source: github.com/XiaomiMiMo/MiM…

English

@uniswap12 试过很多个tts,qwen3 tts 音色设计好用,VoxCPM 2 克隆好用(控制语气)。小米mimo的 tts 克隆也不错。
效果可以看我首页的有声书示例。
中文

有什么免费好用的声音克隆软件吗?
先说一个现实:2026 年这个赛道的免费工具正在快速收紧。
国内监管对声音克隆合规要求越来越严,一批原来免费额度很高的工具要么只剩海外版、要么变成了付费优先。与此同时,搜索"免费声音克隆"出来的结果里,假冒官网特别多——页面做得一模一样,进去上来就让你付钱,根本不是官方站。
下面按使用门槛从低到高,把目前真实可用的整理一遍。
一、在线直接用,不需要翻墙
这类是门槛最低的,打开网页就能用,不需要安装任何东西,也不需要 VPN。
AnyVoice中文站
国内中文站,注册送 15 万字免费额度,是目前国内免费额度最高的在线工具之一。支持声音克隆,上传一段录音就能克隆自己的声音。底层基于 IndexTTS2 优化版,中文停顿和情绪表现都不错,有声书和短剧场景用的人比较多。
→ 地址:anyvoice.cn
VoxCPM 2(清华 OpenBMB 出品)
清华团队做的,有在线 demo 可以直接体验。2B 参数模型,48kHz 输出,支持 8192 tokens 上下文,长文本稳定性在开源模型里算比较好的。在线体验版可以免费用,深度使用需要本地部署。
→ 在线体验:voxcpm.modelbest.cn
二、在线直接用,需要翻墙
这两个是目前海外评测里中文效果比较好的,但国内需要 VPN 才能访问。特别注意:国内搜索出来的同名网站很多是假的,一进去就让付钱,不要上当。
Fish Audio
每月免费 8000 字额度,支持声音克隆,上传 10-30 秒录音即可。中文效果中上,对话场景和短视频旁白用起来顺手。
→ 官方地址:fish.audio/zh-CN/app/voic…
MiniMax
每月免费 1 万字额度,音色自然度高,情感表现细腻,是目前在线工具里中文综合表现比较好的之一。同样需要翻墙,国内同名网站基本是假的。
→ 官方地址:minimax.io/audio/voices-c…
NiceVoice
之前免费额度很高,很多人用过。2026 年开始国内已经无法直接访问,只剩海外版。如果你有稳定的 VPN 可以试,但国内搜到的 NiceVoice 基本都是假站,不要注册付钱。
三、开源模型,有一定技术门槛
这类需要自己部署,对电脑有要求(通常需要 NVIDIA 显卡和足够显存),但完全免费、数据不出本地、没有字数限制。
目前真正值得关注的开源模型(2026 Q1 之后):
IndexTTS2(B站开源)
目前开源 TTS 里中文效果最好的之一,没有之一这种说法可能夸张,但确实很强。支持情绪与音色解耦,可以用同一个音色表达不同情绪,不会"变声"。支持参考音频情绪迁移,复杂情绪场景比纯文本指令更准。
本地部署需要 NVIDIA 显卡,最低 4GB 显存可跑(质量有折扣),8-16GB 显存效果更好。不想折腾的,直接去 AnyVoice 用在线版,底层就是 IndexTTS2 优化版。
→ GitHub:github.com/index-tts/inde…
Qwen3-TTS(阿里开源,2026.01 发布)
情绪控制很强,支持用自然语言指令调整语气,比如"用轻松的语气""稍微快一点"。流式生成延迟最低 97ms,支持中文及方言。对本地算力要求较高,更适合有 GPU 资源的团队。
→ HuggingFace 在线试用:huggingface.co/spaces/Qwen/Qw…
VoxCPM 2(清华 OpenBMB,2026.04 开源)
上面在线体验版就是这个模型。8192 tokens 上下文窗口,长文本稳定性在同类开源模型里靠前。本地部署参考 HuggingFace 页面。
→ HuggingFace:huggingface.co/openbmb/VoxCPM…
四、CosyVoice 和 GPT-SoVITS——还值得用吗?
单独说这两个,因为网上吹得很多,但要说清楚现实:
CosyVoice(阿里开源)
CosyVoice 2 / CosyVoice 3 在 2024-2025 年是很多人用的主力,效果在当时很好。但 2026 年 Qwen3-TTS、IndexTTS2 等新模型出来之后,CosyVoice 在情绪控制、中文停顿自然度、长文本稳定性这几个维度上已经不是同一个量级了。
如果你现在从零开始选,没有必要花时间去折腾 CosyVoice,直接上新模型。如果你已经在用而且效果够用,也不是非换不可。
→ 在线试用:huggingface.co/spaces/FunAudi…
GPT-SoVITS
曾经是开源声音克隆的代名词,GitHub star 极高,很多教程。问题是它的上手门槛比较高(需要训练自己的模型),中文停顿和情绪的处理方式比较老,和现在的新模型相比整体落后了一个世代。
如果你是纯技术爱好者想折腾,可以玩一玩。如果你的目标是做有声书或短剧内容,2026 年没有必要从 GPT-SoVITS 起步,时间成本不值得。
→ 在线试用:huggingface.co/spaces/lj1995/…
五、怎么选
想直接用,不折腾,国内网络
AnyVoice,注册送 15 万字
有翻墙条件,想多试几个
Fish Audio + MiniMax,每月各有免费额度
有 NVIDIA 显卡,想本地部署
IndexTTS2 或 VoxCPM 2,按显存选
有服务器 GPU,对情绪控制要求高
Qwen3-TTS,部署成本高但效果强
想试旧模型看看效果
CosyVoice 3 在线试用,但不建议长期投入
最后说一句
这个赛道变化非常快,2026 年上半年密集发布了好几个新模型,网上很多教程和推荐还停留在 2024 年的认知。
做决策之前,最好用自己的真实文本跑一遍,而不是只看别人的 demo 或测评截图。 特别是要做有声书或长篇内容的,一定要用 3000 字以上的文本实测稳定性,开头效果好不代表跑到中后段还好。
#AI #AIAgent @nikitabier @XCreators @grok @xai

中文

🚀✨ Copilot CLI v1.0.56 released!
21 features & enhancements in this release
Top features:
• Free and Student users can select models other than Auto in the model picker 🆓
• Model picker shows accurate total context window size per pricing tier
• MCP tools now surface both human-readable text and structured content to agents, merging or deduplicating as needed
• Reasoning effort picker respects model capabilities; unsupported options hidden
• Code review agent now uses the same model as current session instead of fixed default
• BYOK provider configuration applies correctly to ACP sessions
• Remote session URL uses the actual repository owner/name instead of literal 'copilot'
Enhancements:
• ThemePicker side-by-side layout fits within 120-column terminals without wrapping
• Extended key reporting works in tmux without Kitty keyboard protocol
• Config and settings files are written atomically to prevent data loss from concurrent CLI processes
• Diff view uses continuous scroll, sticky headers, full terminal width, and theme-aware colors 🖥️
• Web_fetch tool prefers markdown content using HTTP content negotiation for cleaner docs results 📄
• Cursor stays at correct position after pasting text with tab characters
• Context window tier selection persists durably in session events and survives SDK resume paths
• Trusted folder confirmation message clarifies permissions may be remembered for the session
• File paths in /env output display with correct formatting
• Reasoning text always appears above assistant response in conversation timeline
• Assistant responses render without single-word orphan lines in terminal timeline
• When GitHub CLI is on PATH, MCP server omits redundant gh-replaceable tools by default reducing token usage
Bug fixes:
• Fixed /context small-token legend formatting and free-space grid rounding
• Fixed remote session URL bug using literal 'copilot'
• Fixed rubber duck agent enable/disable setting via copilot config
• Fixed sticky cursor positioning after pasting tab-containing text
• Fixed key reporting fallback when Kitty keyboard protocol unavailable in tmux
Misc:
• Added builtInAgents.rubberDuck setting to enable or disable rubber duck agent
• Hardened token usage by reducing redundant tool calls
• Updated confirmation messaging for trusted folder permissions
github.com/github/copilot…
#GitHubCopilotCLI
English
















