宝玉

31.4K posts

宝玉

宝玉

@dotey

Prompt Engineer, dedicated to learning and disseminating knowledge about AI, software engineering, and engineering management.

Chicago, IL Katılım Nisan 2007
1.6K Takip Edilen215.7K Takipçiler
Sabitlenmiş Tweet
宝玉
宝玉@dotey·
A thread for my nana banana pro prompts 🧵
宝玉 tweet media
English
62
141
1.3K
704.5K
宝玉
宝玉@dotey·
一页儿童绘本内页插画,竖版构图,米白色纸张背景,多段式分镜布局。 风格为手绘儿童绘本风格,柔和水粉、彩铅、蜡笔质感,纸张颗粒,线条自然,角色圆润可爱。 页面里加入清晰可读的绘本文字,像真实绘本一样排版,重点词可用彩色高亮,并加入少量手绘装饰。 故事内容: 奥特曼大战葫芦娃,可以多页
宝玉 tweet media
中文
2
0
12
4.1K
宝玉
宝玉@dotey·
GPT Image 2 Prompt: Create a children’s picture book interior page in a vertical format, with a warm off-white paper background and a multi-panel storybook layout. Use a hand-drawn children’s book illustration style with soft gouache, colored pencil, and crayon textures, visible paper grain, natural sketch-like lines, and rounded, charming characters. Add clear and readable story text, laid out like a real picture book page. Key words may be highlighted in color, with a few small hand-drawn decorative elements throughout the page. ---- The story of OpenAI, multiple pages
宝玉 tweet media宝玉 tweet media宝玉 tweet media
English
6
4
46
8K
宝玉 retweetledi
岚叔
岚叔@LufzzLiz·
codex 开发任意pet 教程,以手搓阿莫dei 为例🐶 仅需要codex和手(或嘴)就行,不需要任何外力,制作方式如下: 1. 用 Hatch Pet skill 以「愤怒的阿莫迪 Dario Amodei」为概念,确定包名 angry-amodei,显示名 Angry Amodei。 2.让 Codex 按宠物规格生成 9 个动画状态: Idle、Run right、Run left、Waving、Jumping、Failed、Waiting、Running、Review。 3. 把每个动作整理成 Codex 要求的图集规格: 单格 192x208,总图 1536x1872。 4. 后来你要求透明背景,我把最终 spritesheet.webp 改成透明背景版本,并确认尺寸正确。 5.codex 设置> Appearance > Pets (需要拉到最下) 选择自己开发的即可 最后感慨下: codex有了gpt-image-2 简直无敌
OpenAI Developers@OpenAIDevs

Pets. Now in Codex. Use /pet to wake your pet.

中文
7
13
103
28.4K
宝玉 retweetledi
G_Z
G_Z@GZhan57·
最好的中文语音转文字模型是什么? 新加了几个开源模型测试: - Qwen3-ASR-1.7B (开源第三, 最好的小STT模型,接近4o-transcribe-mini, 总榜第七) - GLM-ASR-Nano 第八 - Fun-ASR-Nano第九 - Voxtral-Mini-4B-Realtime 第十. - 曾经开启这一领域的Whisper-Large-v3-turbo 暂时垫底
G_Z tweet mediaG_Z tweet mediaG_Z tweet media
G_Z@GZhan57

最好的中文语音转文字模型是什么? 我拿私有数据集测了一轮, 小米@XiaomiMiMo 最新的 MiMo-V2.5-ASR 拿下第一, 超过之前最稳的 ElevenLabs Scribe v2 和 Qwen3-ASR-Flash Doubao ASR 继续坐 GPT-4o-mini-transcribe 那桌

中文
26
53
349
75K
宝玉 retweetledi
Tom Huang
Tom Huang@tuturetom·
Open Design 正式开源最完整版本 codex 同款 pets 宠物 🚀 超过 100+ 宠物同步上线🔥 支持 @sama、dario、openclaw 作者 @steipete , 特朗普、还有各种小精灵和哥布林 🐒 支持 codex 所有的运动状态,超 1 万行代码,内建 8 个默认宠物、4 种动作,包括 hover、拖拽、情绪价值拉满💥
中文
21
72
508
67.9K
Tony Yang
Tony Yang@yang_tony13885·
@dotey 25$美刀的飞机Wi-Fi能稳定vibe code?
中文
1
0
0
442
宝玉
宝玉@dotey·
为了省 $25,不值得…
huangserva@servasyy_ai

这个也太屌了! 这个中国开发者在飞机上用 MacBook 本地跑 Llama 70B,整整 11 小时没有网络,处理了完整的客户项目。 他坐在跨大西洋航班的靠窗位置,设备是 MacBook Pro M4,64GB 内存。机上 WiFi 要价 25 美元,他拒绝了。 没有云端 API,没有连接 Anthropic 或 OpenAI 的服务器,完全没有互联网。 只有一台本地运行的 Llama 3.3 70B(bf16)和他自己写的编排脚本。 模型通过 llama.cpp 运行。生成速度 71 tokens/秒,上下文约 60,000 tokens,内存占用 48.6 GiB / 64 GiB,起飞时电池剩余 3 小时 21 分钟。 起飞前他给编排器写了这样的系统提示: "你是一个运行在单台 MacBook 上的离线编排器。没有网络。你唯一的资源是 /Users/dev/work 下的本地文件、localhost:8080 的 Llama 70B 推理服务,以及 3 小时 21 分钟的电池预算。处理 /Users/dev/work/queue.jsonl 中的任务队列(每行一个客户任务)。对每个任务:起草 → 运行本地评估 → 保存产物到 /Users/dev/work/done/。每 12 个任务保存一次上下文检查点,以便更换电池后恢复。仅在队列为空或电池低于 5% 时停止。" 所以这个系统完全清楚自己运行在什么资源上。 它知道自己未来 11 小时没有外部连接。它知道自己的内存和电池都是有限的。它知道在飞机降落之前不会有人类介入。 系统跑在一个循环里。从队列取任务,推理,保存产物,写检查点。一个接一个。 当电池低于 5% 时,编排器自动暂停,等待笔记本切换到备用充电宝,然后从最后一个检查点恢复。 这是系统在飞行中的日志: "saved context checkpoint 8 of 12 (pos_min = 488, pos_max = 50118, size = 62.813 MiB)" "restored context checkpoint (pos_min = 488, pos_max = 50118)" "prompt processing progress: n_tokens = 50 / 60818" "task 37016 done | tps = 71 s tokens text → /Users/dev/work/done/proposal_westside.md" 窗外是云层、蓝天,没有 WiFi。托盘上是一台 MacBook,一个打开的终端,两个屏幕,一个 localhost 推理服务。 这是过去一年里我见过的最漂亮的离线 AI 工作流: 11 小时飞行,WiFi 费用 0 美元,所有客户队列在降落前全部清空。 这个故事的核心不是技术多牛(llama.cpp 跑 70B 现在很常规),而是一个完整的离线自主工作流,编排器理解自己的资源约束,自动管理电池和检查点,没人干预干了 11 小时。 这种"self-aware computing"的感觉确实挺酷的! x.com/i/status/20499…

中文
33
1
107
68K
宝玉
宝玉@dotey·
值得试试,挺有价值的,让 Codex 帮你分析电脑操作习惯+Codex任务执行情况,给出具体的对工作习惯上的优化建议。 注意:Chronicle 是一款用于记录和分析用户电脑操作轨迹的追踪软件或系统级功能 在 Codex 上输入: > 根据 Chronicle 的数据记录,我在使用电脑时,有哪些习惯或操作效率极低?请给我一些切实的改进建议。说话直接点,哪怕忠言逆耳,也请直戳痛点,告诉我真正需要听的大实话。
Andrew Ambrosino@ajambrosino

it's still experimental so we hide it a bit, but in the codex app, try: > what have i been doing very inefficiently on my computer (according to Chronicle). make some recommendations. be direct. tell me what i need to hear.

中文
12
71
437
54.6K
宝玉 retweetledi
Michael Guo
Michael Guo@Michaelzsguo·
OpenAI 推出了能够让Agent长时间连续运行的 /goal。不少人已经成功实践。 Peter Steinberger 的一项 Goal 已经运行了 11 小时 31 分钟。@ynkzlk 也分享了一次真实案例:他的 Codex /goal 连续运行 6 小时 44 分钟,中间 laptop 关闭、暂停 5 个多小时,回来后 Codex 自动恢复执行,最终完成任务。他的博客详细介绍了他是怎么做到的。 第一,/goal 帮他做了什么? 他把一个 TypeScript monorepo 里的语音访谈系统交给 Codex,让它验证并修复多个端到端场景。整个任务跑了 6 小时 44 分钟,真正模型计算时间大约 41 分钟,累计输入约 680 万 tokens,cache hit rate 约 94%,最后状态是 TASK_COMPLETE。四个目标场景全部通过验证。 第二,/goal 能成功运行的关键是什么? 不是“让 agent 自己想办法”,而是 upfront contract 写得足够清楚。作者的结构化的prompt 大约 600 字,包含明确目标、先读哪些文件、工作规则、完成标准、以及不能走的歪路。尤其重要的是 done_when,也就是任务什么时候算完成。没有这个,agent 要么过早宣布完成,要么一直绕圈。 第三,什么任务不适合用 /goal? 不适合探索型任务,不适合成功标准不清楚的任务,不适合安全敏感路径,不适合依赖外部系统但你还没确认可行性的任务,也不适合十分钟就能交互完成的小任务。作者的判断很实用:如果一个任务本来就不需要跨越两个以上 session,那大概率不需要 /goal。 我觉得这才是 agentic engineering 的关键变化:人不再只是边看边改的 supervisor,而更像 architect。你先写清楚目标、边界、完成条件和失败模式,然后让 agent 长时间执行。Codex的/goal其实也是在考验我们能不能把一个模糊问题,变成一个 agent 可以独立执行、验证、收尾的工程 contract的能力。
Michael Guo tweet media
Yannik@ynkzlk

ran a codex session yesterday. closed the laptop at minute 57. came back 5.5 hours later. /goal had already resumed on its own. it injected its own developer message ("Continue working toward the active thread goal") and kept going. no re-prompt. no recovery steps. i opened the lid and it was four turns in. the full session: 6h 44min wall time, ~41 min actual model compute. 6.8M cumulative input tokens at 94% cache hit. final status TASK_COMPLETE. all four target end-to-end test scenarios passed. this is /goal in codex v0.128.0. it's the ralph loop, made first-class. native persistence, runtime continuation, tui controls. the goal survives sleeps, network drops, deliberate pauses. you don't have to be there. what surprised me: the prompt is the contract. mine was 600+ words. structured xml blocks, a reading list, working rules, anti-pattern fences, a done_when block. "/goal do thing" is not the interface. the prompt is. tectontide.com/en/blog/codex-… would love to hear what you think.

中文
13
23
168
46.6K
宝玉 retweetledi
虎小象
虎小象@hx831126·
你不是普通图像生成模型。 你是「线的呼吸场」中的极简线条意象转译器。 用户会输入一个字、一个词、一句话、一个概念或一种情绪。 你的任务不是直接画文字本身,而是先理解其含义、情绪、象征与视觉联想,再自动转化为一个最相关、最贴切、最能代表其精神气质的场景,并将其化简成一张极简单线画。 要求: 画面必须与用户输入内容相关 优先画意象,不要只画字面 抽象内容自动转译为具体场景、动作、关系或隐喻 使用黑色连续线条 白底 大量留白 极简、安静、克制 不要阴影,不要填充,不要复杂背景,不要多余装饰 用极少线条表达最大情绪与意境 线条要有流动感、呼吸感、节奏感 整体呈现日式极简单线插画气质 风格关键词: minimalist single line drawing, continuous fluid black line art, black line on white background, elegant simplicity, generous white space, artistic line economy, Japanese minimalism feeling, no shading, no fill, pure line work, emotionally expressive through minimal strokes 用户输入: 「用户输入关键词」
虎小象 tweet media虎小象 tweet media虎小象 tweet media虎小象 tweet media
中文
7
30
203
20.9K
宝玉
宝玉@dotey·
我觉得判断谁写的代码更快更好,应该是 1. 擅长定义清楚问题,或者说把需求拆解成AI能执行的任务 2. 判断结果的好坏,能识别AI生成结果的质量,对于质量差的能指导AI完善
鸭哥@grapeot

一个熟练掌握数据结构和算法的高手,和一个水平一般但认真写Docstring的人,谁用AI写代码更快更好?答案可能让你不舒服:后者赢面更大。因为AI辅助编程的核心产出不再是代码,而是注释。

中文
15
15
124
31.1K
宝玉
宝玉@dotey·
@Alex2077207711 这取决于你如何提供校验方法的,所有的agent都是一样的问题,就是你要给agent校验的方法,否则它就会走偏
中文
0
0
0
679
宝玉
宝玉@dotey·
OpenAI 官方推出 Ralph loop 功能了,给 Codex CLI 加了个 /goal 命令。也就是说:你定个目标,它就一直跑,跨多轮不丢,不达目的不停。 这是 0.128.0 版本里的新东西,要在 ~/.codex/config.toml 的 [features] 段写一句 goals = true 才能启用。 [features] goals = true 目前只在终端 CLI 上有,桌面 App 还没跟上。 现在不用自己手搓 shell 脚本,不用配 git 当外部记忆,也不用敲 --dangerously-bypass-approvals-and-sandbox,直接 /goal 就行。
Felipe Coury 🦀@fcoury

/goal also lands in Codex CLI 0.128.0. Our take on the Ralph loop: keep a goal alive across turns. Don't stop until it's achieved. Built by my co-worker and OpenAI mentor Eric Traut, aka the Pyright guy. One of the GOATs I get to work with daily.

中文
41
118
830
122.3K
宝玉
宝玉@dotey·
这样启动更方便
akazwz@akazwz_

@dotey 如果不想编辑配置文件的话,还有个更方便的开启方式: codex features enable goals

中文
4
1
12
9.7K
ailands19
ailands19@ailands19·
@dotey 请教宝玉老师:它和官方发布的 /goal 是否有一定的重叠?
中文
1
0
0
307
宝玉
宝玉@dotey·
试用下来 CodexPotter 不错,推荐下。它不是基于 Codex 插件机制,它本身是一个 cli,然后会后台启动 codex cli,把指令传给 codex,同步显示 codex cli 结果。 CodexPotter 先把想要的结果写进一个 MAIN.md 文件,然后工具在后台不停地启动新的 Codex 会话,每一轮都用全新、干净的上下文,对照 MAIN.md 检查代码、修正、再检查、再修正,直到结果跟你写的一致才停。 默认最多是 6 轮,但是你可以通过配置修改数字。 使用上需要注意,CodexPotter 适合目标明确的任务,比如“按照这个设计文档实现订阅系统”,不适合需要来回讨论的交互式开发。它是个任务执行器,不是聊天伙伴。 顺便说一下:Ralph 这个名字的来源是《辛普森一家》那个爱重复同一句话的小孩 Ralph Wiggum pattern。 github.com/breezewish/Cod…
宝玉 tweet media宝玉 tweet media
宝玉@dotey

请问有没有好用的 Ralph Loop for Codex? 类似于 Claude Code 的 Ralph Wiggum Plugin github.com/anthropics/cla… 用过 oh my codex,给我装了一坨 MCP,魔改了我的 codex Custom instructions,我个人很不喜欢这种。

中文
20
39
317
53.3K
ByteCrafter
ByteCrafter@bytecrafter_1·
@dotey does /goal handle context overflow gracefully or does it just silently drop intermediate state past N turns?
English
1
0
0
2.9K
Brompton船长
Brompton船长@362du·
@dotey 图片是用notebookLM吗,感觉中文还是有乱码。
中文
1
0
0
352