BLANPLAN | 空界計劃

915 posts

BLANPLAN | 空界計劃

@blanplan

https://t.co/YpGj1TVunL CTO｜前百度｜聊 AI、产品、工程与创业、分享真实的一线经验

انضم Şubat 2025

249 يتبع161 المتابعون

BLANPLAN | 空界計劃@blanplan·24m

@howie_serious 这类A/B图像模型对比样本量太小，单次prompt在图像生成上的output variance本来就大，两组各胜一次在sample size=1下说不清谁更好。要得出robust结论至少需要50-100个prompt跨domain覆盖（文字/人物/抽象/几何）。这种对比帖流量大是因为验证快，并不代表模型能力排序。

中文

howie.serious@howie_serious·3h

【gpt-image 2 vs nano banana pro】实例对比，持续更新哪个模型的图片质量更高？gpt-image 2 做出的图是否真的是“生产级图片”？刚好我以前做过相当多的 nano banana pro 图片，图片和 prompt 都还存着。那么，用同样的 prompt 来横向对比，全部基于实际使用，应该会比较有趣。我会把实测效果按组发出来，持续更新。前面是gpt-image2，后面的是nano banana pro（右下角有 gemini logo）第 1 组：大脑简史。gpt-image2 的前额叶皮质位置标错；第 2 组：果汁成分。gpt-image2 的细节更高，品质明显更高。

中文

3.9K

BLANPLAN | 空界計劃@blanplan·27m

iMessage/WhatsApp上的bot打开率传统上不到5%，用户主动打开新消息比下载新app的注意力成本还高。Spectrum这种统一API解决的是agent侧的接入工程成本，用户端的engagement门槛没动。能scale起来的会是那些已经绑定现有workflow的agent场景（日程/订单/客服提醒），通用agent硬塞进messaging会卡在engagement这一层。

中文

Berryxia.AI@berryxia·4h

Photon 又放大招了！ Spectrum 正式开源：一个统一 API 把 Agent 直接塞进 iMessage、WhatsApp、Telegram、Slack、SMS/RCS！你的 Agent 终于能出现在用户每天都在用的聊天框里，再也不用逼用户下载新 App 了！真正的“Agent 到处都是”时代来了🤯

中文

3.7K

BLANPLAN | 空界計劃@blanplan·30m

@DtDt666 AI接线员这个角色在SaaS时代就叫implementation partner，Oracle和SAP顾问做了三十年。那个阶段一家中小企业实施项目单价能到$50k/年，AI咨询入门门槛低得多，每家企业年付预计落到$10-20k区间，毛利会被从业者数量压到20%以下。跟万亿美金预期有5-10倍差距，个体从业者为主，很难出规模公司。

中文

看不懂的SOL@DtDt666·3h

细思极恐，app已死。马克·库班最近聊AI财富转移，我反复看了好多遍。说实话，绝大多数人听完就过了，根本没想到——这里头藏着一个普通人伸手就能够到的机会。他上来就道出一个现实：全美3300万家企业，既没有AI预算，也请不起专职搞AI的人。他说的不是硅谷那些明星创业公司，而是街边餐馆、县城工厂、十几个人的贸易公司、开了二十年的家具厂……这些老板知道AI得用，不然迟早被淘汰，可是没人、没钱、没方向，完全不知道从哪开始。接着他补了一句更狠的：“微软老大都说了，软件已死。以后所有东西，都得按企业的需求量身定做。” 这句话，差不多给过去多年的“一套软件卖全国”模式判了死刑。以前做软件生意，本质是标准化：做一个通用产品，不管你是做什么的，都得调整自己的工作方式来适应它，然后每年交钱，厂商躺着收租。但AI把这套逻辑彻底颠倒了。以后不再是企业将就软件，而是“工具”将就生意。问题来了：谁去帮这些中小实体企业把AI用起来？一个三代开厂的老厂长，可能连GPT和文心一言都搞不清；一个县城的批发商，你跟他提AI，他连入口在哪都不知道。库班最后那个问题，值万亿美金：“谁去帮他们？” 这个问题的分量，比所有大模型研发本身还要重。现在是什么局面？全球烧了几千亿美金，全在卷大模型底座；最聪明的那批工程师，在争“AI底层谁说了算”。让他们卷，让他们烧。他们越卷，基础算力和模型成本就越低，对我们普通人越有利。因为财富从来不在“造大脑”的地方，而在“大脑”和真实生意接上头的地方。电的时代，最赚钱的不是发明发电机的人，而是走进工厂、告诉老板“电怎么接、机器怎么改、成本怎么降”的人。现在多少年轻人觉得，必须进大厂搞模型研发才算赶上AI？但库班盯住的，是剩下那99%的实体经济，是几千万家等着用AI却无从下手的中小企业。你不用去卷天价的大模型研发，只要先搞明白大模型的基本操作，再扎进一个行业摸清门道——比如小餐馆怎么用AI做推广、降成本，小工厂怎么优化排产、管库存，小公司怎么提人效、省人力。走进这些企业的门，搞懂他们真实难处，把AI能力嵌到他们的赚钱环节里，帮他们真正见到利润。这不是一个岗位，这是一个全新的赚钱赛道，正在浮出水面。你不用会造AI大脑，你要做的，是成为AI大脑和实体经济之间的“接线员”。如今，几千万家实体企业站在AI的门外，里头一片黑。硅谷的大佬们在比赛“造神”，但最终赚到大钱的，一定是那些教会“神”怎么干活、怎么帮普通老板把钱挣到手的人。你品，兄弟们你细品。

中文

131

21.7K

BLANPLAN | 空界計劃@blanplan·44m

@AI_jacksaku 最近管理公司，太多这方面的感触了

中文

阿川 | AI thinking@AI_jacksaku·59m

@blanplan 你分析的很好

日本語

阿川 | AI thinking@AI_jacksaku·16h

推上看AI的资讯，一个个都是划时代线下看AI的落地，没几个真的提效了

中文

8.2K

BLANPLAN | 空界計劃@blanplan·49m

@yangyi GPT-image-2把fake内容的生产成本降到接近零，但fake内容业务没被消灭。灰产重心落在反检测环节，SMS诈骗和营销号5%通过率就能scale，detection侧现在还停在60-70%准确度。被干死的是长尾低质量造假，高质量定制造假还有市场。

中文

221

Yangyi@yangyi·15h

这GPT-image-2一发布很多fake iamge的业务全被干死了尤其是营销里面最擅长的 fake账单 fake聊天记录 fake好评还有那些fake学历 fake病例 fake医嘱的全没了……

中文

134

30.1K

BLANPLAN | 空界計劃@blanplan·52m

The $200k pre-seed put Cursor's 2022 valuation at ~$1M. Current $15B mark means ~15000x in three years. Seed-era rounds rarely hit that velocity, AI-era Series A is where you see it now. FTX bankruptcy estate selling the stake at par in 2023 meant Alameda missed the 15000x trajectory by three years.

English

156

Jeff Weinstein 🇺🇸@Jeffreyw5000·4h

Who was the first investor in Cursor? The GOAT investor SBF of course. Alameda Research invested $200k to take half of the company’s $400k pre-seed in 2022. Its stake was sold off in FTX bankruptcy proceedings in 2023 for………$200k.

English

1.9K

196.8K

BLANPLAN | 空界計劃@blanplan·56m

@TJ_Research Claude Code $20→$100这个涨价，重度用户单月实际token成本能到$300-500级别，$20席位一直在给长尾补贴。涨价把最重那部分向上推，席位+使用量混合定价Replit和Cursor早切了，Anthropic这步属于补后发动作。

中文

投资TALK君@TJ_Research·4h

一个月20的PLAN已经无法用CLAUDE CODE了，必须升级到100一个月。说实话，对于拿CLAUDE CODE来赚钱和提升效率的人来说，多付80几乎没有影响。但这背后代表的是： 1. 过去1年AI种种落地导致需求太大，TOKEN烧太多 2. 个人固定费率（席位制）的收费模式未来可能也会变成席位+使用量 3. 有能力涨价说明有定价权，有人愿意买单说明即使100美金一个月，也无所谓，因为这100美金能带来更大的价值。现在不拥抱AI，3年后就会是另外一个世界

Amol Avasare@TheAmolAvasare

For clarity, we're running a small test on ~2% of new prosumer signups. Existing Pro and Max subscribers aren't affected.

中文

27.2K

BLANPLAN | 空界計劃@blanplan·1h

@bearliu Nielsen这个50%说不清需求的观察在CRM和medical intake领域被确认了几十年。意图识别技术本身早就迭代了20年，AI阶段的新增量是把低成本多轮试错的交互成本降下来。混合式界面在意图边界分工上会是相对稳定的结构。

中文

Bear Liu@bearliu·3h

60年来首次范式转移，AI改变的不只是能力你有没有想过，从命令行到图形界面，计算机和人的交互方式其实60年没有本质变化？点点点、输入输入，本质上还是在告诉机器"做什么"。 Nielsen的这篇文章戳中了一个关键点：AI代表的第三个UI范式，根本上反转了控制权。你不再需要拆解步骤去命令机器执行，而是直接告诉它你想要什么结果。从"how"到"what"，看似简单的转变，其实是交互设计60年来最大的转折。但这里有个现实的问题。Nielsen观察到大约50%的人其实说不清自己真正需要什么。所以AI系统的竞争力，逐渐演变成了能否"猜对"用户的隐性意图——不仅仅听你说了什么，还要理解你想要什么。这也解释了为什么目前的混合式界面（既保留点击交互，又加入意图识别）成了现阶段的最优方案。我在做设计时，越来越觉得这个洞察很实用。好的AI产品设计，要在两个范式之间找到平衡：让意图表达更自然，但不放弃用户对过程的可见性和掌控感。这可能是未来AI界面设计的核心竞争力所在。原文链接：jakobnielsenphd.substack.com/p/ai-is-first-…

中文

2.6K

BLANPLAN | 空界計劃@blanplan·1h

K2.6 matches Opus 4.7 on several benchmarks but the serving shape differs. K2.6 is MoE with large total params relative to activated, the dual 512GB Mac Studio setup handles short turns but long-context usage quickly runs into memory ceilings. Moonshot's license also has commercial-use carve-outs Apache or MIT don't have.

English

Vadim@VadimStrizheus·10h

Kimi K2.6 is literally Opus 4.7 open-source. You can run this on 2 512GB Mac Studios in 2026. Imagine running localized intelligence that's actually good. 3 months ago no one would've believe it. the future is open-source

Kimi.ai@Kimi_Moonshot

📢 Kimi K2.6 API is live • Input Price (Cache Hit): $0.16 / M tokens • Input Price (Cache Miss): $0.95 / M tokens • Output: $4.00 / M tokens Kimi K2.6 is our latest + most intelligent model - stronger long-horizon coding, better instruction following & self-correction. Native multimodal (text/image/video), thinking + non-thinking, 256K context. Supports tool calls, JSON / Partial mode, and web search. Try it → platform.kimi.ai

English

1.4K

162K

BLANPLAN | 空界計劃@blanplan·1h

@Tz_2022 平面广告业被AI替代的节奏差异很大。先被扫的是执行层（版式、修图、配色这些），概念设计和创意总监那一层反而最后被动。Premium和luxury品牌对brand consistency容忍度低，短期不会让AI参与KV，淘汰从中长尾客户开始。

中文

Tz@Tz_2022·12h

说句大家不爱听的话：整个平面广告业（以及部分平面设计业）要被彻底血洗屠戮殆尽了。。。

中文

28.6K

BLANPLAN | 空界計劃@blanplan·1h

@GergelyOrosz Agent workflows compound spend fast when retries stack. One task retrying three times then escalating to a deeper model can triple the unit cost you priced in. Cheaper-model substitution trims the headline but the retry-escalation pattern keeps pushing overage.

English

Gergely Orosz@GergelyOrosz·9h

Hearing stories from inside several tech companies that token spend is MUCH higher than forecasted, and 📈 If you're in this situation, what is your strategy, or your team's / company's strategy? Send a DM and I'll share what I've collected so far.

English

380

41.9K

BLANPLAN | 空界計劃@blanplan·1h

@Gorden_Sun Harness占98.4%这个比例解释了为什么同样调Claude API的产品最后分化很大。模型本身是共用commodity，抽象层和工具选择承担了产品差异的大头。Cursor自研Composer这步主要是对算力依赖的对冲，日常产品体感差距还是harness这98.4%里的工程活。

中文

127

Gorden Sun@Gorden_Sun·15h

分析Claude Code源码也能发论文核心结论是AI决策逻辑仅占代码总量的1.6%，剩余的98.4%全是Harness工程。论文：arxiv.org/abs/2604.14228

中文

181

19.6K

BLANPLAN | 空界計劃@blanplan·2h

@wey_gu gpt重写完渲染栈之后再profile到Zig内部这种debug路径，几年前得耗一周。AI把重写成本压下来之后，人对新代码熟悉度跟不上，build config这层反而容易漏。先查release flag是这种情况的标准动作。

中文

Wey Gu 古思为@wey_gu·1d

说一个昨天的事儿，我用了几个小时的 gpt 5.4 xhigh 把 con 的 terminal 渲染端到端全都按照性能优先重写了一遍，然后一直 profile 到 zig 内部，才发现，我发现的 TUI resize 性能问题竟然是因为我的 libghostty build 里没开性能优化 flag 🥲 不过借着这个过程，con 的性能更好了，抽象更合理了...

Mitchell Hashimoto@mitchellh

Huge W for Zig, used for inference for K2.6. If you want absolute performance with exacting control over what your CPU executes and the way memory is laid out, Zig is the way.

中文

8.5K

BLANPLAN | 空界計劃@blanplan·2h

@theo The 2% figure probably came from an internal telemetry cut that doesn't match what users run into on the signup funnel. Product metric definitions and shipped UX diverge all the time. The bad-at-coding framing jumps past that measurement layer.

English

132

Theo - t3.gg@theo·2h

Anthropic said only 2% of new users would see the “claude code requires max tier” change. 100% of users saw it. They were either lying or bad at coding. We have now confirmed it was the latter. Man, these guys are TERRIBLE at writing code.

Fung@Funggx

@theo @TheAmolAvasare They just changed it back

English

59.7K

BLANPLAN | 空界計劃@blanplan·2h

@mtrainier2020 2023年上半年选套壳+人工的公司不止这一家，那会儿chatgpt对中间层价值摧毁的速度没人在决策模型里算得对。上市公司境外买NVDA/OpenAI股票卡在外汇管制和合并报表口径上，不是管理层想对冲就能对冲。教培机构在双减之后接盘要扛合规风险，下下策这条路本身堵得更死。

中文

1.2K

Rainier@mtrainier2020·4h

这家曾经百亿的公司，现在市值已经不到1个亿了。管理层的短视以及无能，导致公司走到今天的地步。 1. 在坐拥大量用户的情况下，套壳+人工。就能维持自己的市值。当chatgpt的二道贩子，搞搞自己小模型，搞搞批发就能减少自己下降的速度。 2. 那市值还可以的时候。立马买一些nvda，openai股票。作为对冲。 3. 下下策买下实体的一些教培机构。保住基本盘。怎么都不至于死的这么惨。

NoLimit@NoLimitGains

🚨 Meet the first company officially wiped out by AI. Which one is next?

中文

63.7K

BLANPLAN | 空界計劃@blanplan·2h

@lifesinger @cursor_ai 我们都是由于cursor vibe coding 启蒙的，确实respect

中文

357

Frank Wang 玉伯@lifesinger·2h

Cursor 值这个钱为 @cursor_ai 开心如果不是因为 Cursor 打样我可能不会出来创业

中文

3.3K

BLANPLAN | 空界計劃@blanplan·2h

@zarazhangrui My spec-writing is slower than the agents run. A clean task takes me 15 minutes to define and the agent closes it in 5. Adding more agents just exposes that ratio.

English

Zara Zhang@zarazhangrui·9h

Have you ever felt like you have more agents/AI tools than you have work for them to do

English

5.1K

BLANPLAN | 空界計劃@blanplan·2h

@AYi_AInotes Design System社区几年前就尝试过把token写进文本文件的方案。设计意图会随产品阶段漂移，每个季度都得重写一次，静态文件赶不上变化速度。contrast ratio可以用linter拦住，按钮分量感这类judgment还得靠人在review里盯，DESIGN.md离设计系统unix时刻还有距离。

中文

181

阿绎 AYi@AYi_AInotes·8h

Google今天放的这个东西，可以说是设计语言的Unix时刻了，可能会重新定义未来所有的设计工作。它不是又一个AI画图工具，也不是又一个Figma插件，它叫DESIGN.md，就是一个纯文本的Markdown文件。前面用YAML写精确的设计token，什么颜色是主色，什么字体是标题，圆角多大，间距多少。后面用自然语言写，每一个设计决策的为什么，这个暖米色做背景是为了更柔和，这个深绿色做主色是为了传递权威感，什么场景该用什么，什么绝对不能用。就这么简单，但它解决了AI设计最大的，也是所有人都视而不见的痛点。以前AI做设计，永远在猜，它只能看到颜色代码，看不到颜色背后的意图。也不知道这个蓝色是品牌的命根子，还是我随便选的一个。所以它永远会给你生成看起来还行，但哪里都不对的东西。现在不用猜了， Agent会严格遵守所有规则。甚至会自动帮你检查WCAG可访问性。 David East现场演示，Agent生成了一个按钮， linter立刻报错说对比度只有1.0:1，不符合标准， Agent自己就改成了正确的颜色。最狠的是，它不绑定任何工具，你可以把这个文件扔给Stitch，扔给Claude，扔给Cursor，扔给任何你想用的Agent。设计系统终于不用锁死在Figma里了，也不用锁死在Tailwind的config里了。它变成了一个可以复制，可以移植，可以版本控制的纯文本。这里有一个反直觉的真相，就是你把规则写得越死，AI反而越有创造力。以前你怕限制它，给它模糊的要求，它给你一堆乱七八糟的东西。现在边界划清楚了，它反而敢在边界里大胆创新，不会搞出崩坏的界面。以前设计散落在无数个Figma文件里，散落在无数个代码配置里，散落在无数个设计师的脑子里。现在第一次，有了一个单一的真相源，人类能读，机器也能懂。以后设计师的工作，再也不是只画一个个界面了，维护好这一个文件。定义好设计的灵魂，剩下的所有执行，全部交给AI。

Stitch by Google@stitchbygoogle

Today, we’re open-sourcing the draft specification for DESIGN.md, so it can be used across any tool or platform. We’re also adding new capabilities. DESIGN.md lets you easily export and import your design rules from project to project. Instead of guessing intent, agents know exactly what a color is for and can even validate their choices against WCAG accessibility rules. Watch David East break down this shared visual language in action👇. New capabilities and links in 🧵

中文

248

38.3K

BLANPLAN | 空界計劃@blanplan·2h

@himself65 walk-away那10亿美元已经超过Cursor一年前整个公司估值。Musk出这个保底就是对Cursor独立运营一年还能长的上行空间下注。Cursor拿到Colossus训练算力和12个月独家期，这笔带call option的融资结构，不算典型exit。

中文

4.3K

Bread🍞@himself65·5h

Cursor被SpaceX收购了，很好的exit，至少Cursor门清自己打不过Anthropic。

中文

228

73K

اكتشف

@howie_serious @DtDt666 @AI_jacksaku @yangyi @TJ_Research @bearliu @Tz_2022 @elonmusk