mousepotato
2.3K posts

mousepotato
@iluciddreaming
🇺🇸 硅谷打工人|AI 产品|独立开发|技术管理 👨🏻💻 写代码,也写产品、增长和团队管理 🧠 从程序员转型产品型创作者的路上 🚀 Build | Ship | Grow
San Francisco, CA Beigetreten Nisan 2010
447 Folgt295 Follower
Angehefteter Tweet

OpenAI Developers 发布了 Realtime-2 的提示指南。
里面讲的不是普通 prompt 小技巧,而是语音产品真正会踩的坑:
怎么调整推理强度,
怎么写前导说明,
怎么设计工具调用行为,
怎么处理不清晰音频,
怎么准确捕获实体,
怎么在长会话里保持状态。
这说明语音 AI 正在进入工程化阶段。
以前大家关注:
声音像不像真人?
延迟够不够低?
会不会打断?
但真正做产品会发现,最难的是:
用户说得含糊,环境有噪音,任务跨多步,还要调用工具。
语音 Agent 不是 TTS + STT + LLM 的拼装。
它更像一个实时操作系统。
下一代语音产品的胜负,不在音色,而在复杂场景里的稳定执行。
OpenAI Developers@OpenAIDevs
Building voice applications with GPT-Realtime-2? Our new prompting guide covers how to tune reasoning effort, use preambles, design tool behavior, handle unclear audio, capture exact entities, and maintain state in longer sessions. developers.openai.com/api/docs/guide…
中文

好像用订阅登录安装好以后,切API也能用Codex的Chrome插件。
我让帮我买一支牙膏,现在已经走到下单环节了。


向阳乔木@vista8
今天发布的Codex Chrome插件用上了,有几个坑: 1. 更新Codex,第三方API模式不支装插件,切为官方订阅登录。 2. Codex Chrome插件安装挑节点,比如香港地区不支持,有些节点会打不开页面。 3. 建议把Chrome设置为默认浏览器,有步骤会引导跳默认浏览器。 4. 如果死活连不上插件,可以重启电脑试试。 简单安装流程: 升级Codex -> 打开设置 -> 电脑控制(Computer Use)-> Google Chrome,安装浏览器插件 必须在Codex 对话中用 @ Chrome 调用。 Terminal 版 Codex虽然能调用Chrome skill,但找不到node_repl,有点坑。
中文

GPT Image 2 Prompt:水墨风格 Slides/PPT
可以把下面的提示词模板发给 Agent,让 Agent 帮你生成每一页 Slides 的画图 Prompt,Codex 这样有画图能力的直接出图。
--- 提示词模板 ---
Title: [在此输入幻灯片标题]
Key Points:
- [要点 1:简洁的描述]
- [要点 2:核心数据或事实]
- [要点 3:关键结论]
Visual Elements:
[描述视觉元素,例如:纹理宣纸背景 (Textured rice paper background)、水墨山水 (Ink-wash motifs)、
简约的圆圈 (Enso circle)、红色印章 (Red seal mark)、雾气效果 (Mist-grey effects)]。
整体风格应保持 [Quiet / Restrained / Wabi-Sabi / Contemporary East-Asian Luxury]。
Layout Preference:
[布局说明,例如:左右分割 (Split layout)、居中对齐 (Centered layout)、
文字居左且右侧留白 (Left-aligned text with negative space)]。
Text Hierarchy:
[文字层级,例如:标题使用大号衬线字体 (Large Display Serif),正文使用易读的衬线字体 (Body Serif),
确保视觉平衡和清晰的阅读顺序]。
Continuity Note:
[延续性说明,例如:保持与前一页相同的背景纹理和色调 (#F5F0E8, #2C3E2D),
使用相似的印章位置以维持视觉一致性]。
----- 示例 ------
Title: Agent Loop 深度解析: 揭秘 AI 智能体的心脏.
Key Points: 核心定义、主要职责、设计目标。
Visual Elements: 大号优雅标题,背景为宣纸纹理,带有淡淡的水墨山水和圆圈笔触,角落处有红色小印章。
Layout: 干净的布局,大量留白(Open Sky)。
Text Hierarchy: 标题最为突出,下方是较小的正文。

中文

@bearliu AI 没有脾气,现在的 AI agent 在尝试理解人的。用的还是 grep 关键词。 AI 的情绪设计太简单粗暴了。
中文















