VoxCat

1.4K posts

VoxCat banner
VoxCat

VoxCat

@VoxcatAI

写 Prompt,玩 Gemini 3.0 (Nano Banana Pro) 🍌 画点图,写点字,顺便修理一下 AI 的坏习惯。想让机器真正听懂人话,而不是只会在那“回复任务”。

Katılım Mayıs 2019
810 Takip Edilen5K Takipçiler
VoxCat
VoxCat@VoxcatAI·
@dny384781556842 过两天我会出一篇拆解,详细讲讲这个 Prompt 的设计思路
中文
0
0
0
28
单毅
单毅@dny384781556842·
@VoxcatAI 你好,大神~能求个提示词吗?
中文
0
0
0
147
VoxCat
VoxCat@VoxcatAI·
这次用 Nano Banana 2 跑出来的古风半身像,确实让我对大厂模型的“审美理解力”有了新认识。 以前用这种模型跑古风,最怕的就是那种浓浓的“影楼风”和毫无质感的丝绸反光。但这组图里,无论是云肩的刺绣针脚,还是发髻上翠羽发饰的半透明感,细节密度高得吓人,完全不输那些需要复杂工作流的本地模型。 分享两个让 Nano Banana 2 “去 AI 味”的实操技巧: 光质解耦:不要只写 soft lighting。试着加一个 simulated studio flash with softbox,它会模拟出那种真实摄影才有的皮肤漫反射,毛孔和底妆的颗粒感会瞬间浮现。 动态定格:注意看发丝的逻辑,我加了 subtle stray hairs in the wind(微风乱发)。这种打破完美对称的小瑕疵,才是让画面看起来像“真人拍摄”而非“渲染图”的关键。 色彩断层处理:在 Prompt 里明确 muted historical tones(低饱和历史感色调),能自动过滤掉那种高饱和的廉价滤镜感。 说实话,在处理汉服刺绣这种复杂纹理上,Nano Banana 2 的空间一致性做得非常扎实。 你们觉得这两张图,是第一张偏蓝调的清冷感更有高级感,还是第二张红金配色的富贵感更抓眼?
VoxCat tweet mediaVoxCat tweet media
中文
8
9
51
2.1K
VoxCat
VoxCat@VoxcatAI·
@dreamerjingxun8 挖个小坑!过两天我会专门发文分享这个提示词是怎么写出来的
中文
0
0
0
21
VoxCat
VoxCat@VoxcatAI·
@archerren8848 这两天我会专门整理一篇文章,深入拆解这个提示词的构建思路以及具体的实现逻辑。
中文
0
0
0
30
wlei
wlei@Lumora1999·
@VoxcatAI 冷艳 提示词精美🤙
中文
0
0
0
125
VoxCat
VoxCat@VoxcatAI·
刚在 Nano Banana 2 里跑出了这张“骨相级”的东方脸,质感真的绝。 很多人问怎么用 Google 的模型跑出这种电影质感的古风肖像,其实最忌讳的就是 Prompt 堆砌一堆“绝世美女、超高清”这种废词。 真正的秘密在于对“骨相”和“妆效材质”的精准控制。 这张图之所以能从满大街的 AI 脸里脱颖而出,我复盘了一下关键点: 底妆去油化:一定要明确 matte velvet skin(雾面丝绒),避开那种塑料感的水光肌,质感立刻高级一个档次。 眼神控制:冷艳感的来源是 narrow phoenix eyes(狭长凤眼)搭配 distant gaze,那种“生人勿近”的压迫感是捏脸的灵魂。 光影留白:主光放在面中提亮,侧边用黑纱制造局部阴影,利用冷暖对比来塑造立体感,而不是靠生硬的修容。 这套捏脸数据我已经调优好了,不管是做武侠侠女还是权谋黑莲花,这张脸的兼容性都极高。 你们觉得 Nano Banana 2 在处理这种“冷感东方美”上,和 Midjourney 相比谁更稳? 捏脸数据(Prompt): 9:16竖幅,东方古风冷艳女性正面肖像,超近景贴脸特写,人物正面面对镜头,头部端正,视线直视镜头,脸部几乎充满画面,构图集中,双眼位于视觉中心,整体呈现强烈的人脸主导感。人物气质清冷、神秘、克制、危险,像黑衣侠女、门派高手、带权谋感的古风美人,安静中带轻微压迫感。 脸型为窄鹅蛋脸,脸宽较窄,纵向比例略长,整体轮廓收紧,面部留白少,五官集中。额头中等偏饱满,发际线整齐自然,额部轮廓流畅。太阳穴轻微内收但不凹陷,颧弓不外扩,苹果肌轻微,不做甜妹感饱满苹果肌,面中过渡平整流畅,鼻基底适中,法令区干净。下颌线清晰流畅,下颌角弱化,收口利落,下巴小巧偏尖但不过度锐利,骨相轻薄精致,上镜感强。 五官精致细腻。眉毛为深灰棕色细长平眉,眉头有自然毛流感,眉形平直略带轻弧,眉峰不高,眉尾细而收紧,眉眼距离适中略近。眼睛为长杏眼偏狭长凤眼感,正面视角下双眼对称,眼裂偏长,内眼角尖且清晰,外眼角轻微上扬,上眼皮薄,双眼皮较窄,下眼睑存在感清晰,卧蚕轻微精致不过分膨胀。眼神直视镜头,瞳孔稳定聚焦,目光冷静、克制、安静、疏离,带一点试探感和危险感,不要甜妹无辜感,不要夸张愤怒感。睫毛浓密纤长,上睫毛明显拉长并成束,下睫毛根根分明,眼尾与下眼睑有明显深灰棕加深,增强阴郁感、戏剧感与冷艳感。 鼻子为细直秀气鼻,山根自然顺接额头,鼻梁细直干净,鼻背平整流畅,鼻头小巧微圆,鼻尖轻收,鼻翼窄,鼻孔不外露,中轴稳定,偏东方精致古风脸,不做夸张欧美高挺鼻。嘴唇为中薄唇,唇峰清晰,上唇偏薄,下唇微饱满,唇形克制冷感,嘴角自然平直微收,不做甜美嘟唇,不做大笑表情。 皮肤为冷白皮,白皙通透但不是惨白,底妆为高完成度雾面丝绒底妆,肤质统一干净,细腻柔滑,带高级精修感。面中、鼻梁、鼻尖、眼下有轻微提亮,高光克制细腻,不做韩系油亮水光肌。面部轮廓修容精细,鼻侧影自然,颧侧轻收,下颌修容干净,立体度来自柔和明暗关系而不是夸张硬阴影。 妆容为古风影视感浓淡适中的精致妆容,明确带妆。眼妆以深灰棕、冷棕、烟灰棕为主色调,上眼影从睫毛根部向上自然晕染,层次干净细腻,内眼线填满,外眼线纤细锐利并向外轻微拉长,眼尾上扬幅度克制,下眼睑后半段加深,下睫毛纤长分明,卧蚕以窄面积柔和提亮呈现,不做甜妹膨胀卧蚕。眼下可带若有若无的情绪阴影与古风戏剧化脆弱感。眉妆自然克制,毛流感真实。唇妆为低饱和玫瑰棕、豆沙棕红、雾面红棕调,中心略深,边缘柔化,唇面保留轻微质感,整体妆容高级、冷感、古风角色化。 发型为黑色或深黑棕长发,中分或轻微偏分,发丝顺滑,发量适中偏多,头发贴近面部两侧自然垂落,修饰脸型,额前可有少量碎发,但不能遮挡眉眼主体。发顶自然蓬松,头部轮廓干净利落,不使用斗笠,不使用帽饰。可搭配少量黑色轻透薄纱从头发一侧或肩颈处垂落,形成半遮半透的神秘层次,但不能遮挡正面五官主体,保证整张正脸清晰可见。可加入低调古风发饰,如黑银色细链、暗色簪饰、小型金属坠饰,风格克制冷感,不夸张不繁复。 服饰为黑色或深灰黑色古风衣装,深色武侠风,面料柔软垂坠,黑纱披覆层叠,肩颈区域布料褶皱丰富但不凌乱,领口结构利落干净,局部可见精致银色纹饰、金属护腕或古风武侠元素,整体造型统一于深色侠女、刺客、门派高手方向。 光线为柔和定向补光,主光正面略偏上打在额头、眼周、鼻梁、唇部,让脸部中央清晰,五官干净立体。头发边缘与轻透黑纱制造轻微局部阴影,使眼睛更深邃。整体色调偏冷中性,背景压暗虚化,人物肤色保持自然冷白,唇部保留低饱和棕红,形成轻微冷暖对比。画面具有电影级真实摄影质感,细节干净,高级精修,非卡通,非插画,非二次元,偏真实摄影与影视剧照效果。 在画面右下角加入专属签名“voxcat”,签名形式为小型自然手写英文签名,笔触干净利落,尺寸较小,不抢主体,不破坏整体构图,与画面古风冷艳气质统一;签名颜色可为低饱和白色、灰白色或暗红棕色,具有高级感与作品标识感。
VoxCat tweet media
VoxCat@VoxcatAI

刚把申鹤那组 Cosplay 海报的流向从 Flux 换到 Nano Banana 2 (香蕉模型) 和 gpt模型 跑了一遍,发现视觉逻辑完全变了。 很多人觉得GPT 只能画点插画,但昨晚实测发现,在处理这种“带有极强叙事感”的复杂 Prompt 时,它的语义理解确实是独一档: · 动作精准度:Prompt 里要求的“道诀感半展开手势”,GPT 几乎一次就给对,不穿模。 · 构图服从性:仰拍大长腿的 68% 比例控制,香蕉模型配合特定参数出的透视张力非常恐怖。 · 质感差异:Midjourney 追求的是“摄影美学”,而香蕉模型现在更倾向于一种“超现实的干净感”,画面几乎没有杂质。 有个踩坑点:用香蕉模型生这种写实人像,千万别加太重的滤镜词,否则会显得“AI 味”过浓。保持 Prompt 里的材质描述(丝缎、皮革、金属),让它在自然光影下自洽,出来的质感反而高级。 大家最近有用 Nano Banana 2 出过这种高拟真角色吗?感觉它在处理二次元真人化时的“骨骼逻辑”,是不是比以前稳多了?

中文
30
70
473
33K
PlayWithAI
PlayWithAI@81680085AI·
@VoxcatAI this is my experiment based on your points in the article. It really took a few times of rewrite the prompt and generating to get a similar angle in the nano banana 😅 *Genshin Impact is not my game so I asked Gemini for help in writing down character's traits 😁
PlayWithAI tweet mediaPlayWithAI tweet media
English
1
0
0
68
VoxCat
VoxCat@VoxcatAI·
刚把申鹤那组 Cosplay 海报的流向从 Flux 换到 Nano Banana 2 (香蕉模型) 和 gpt模型 跑了一遍,发现视觉逻辑完全变了。 很多人觉得GPT 只能画点插画,但昨晚实测发现,在处理这种“带有极强叙事感”的复杂 Prompt 时,它的语义理解确实是独一档: · 动作精准度:Prompt 里要求的“道诀感半展开手势”,GPT 几乎一次就给对,不穿模。 · 构图服从性:仰拍大长腿的 68% 比例控制,香蕉模型配合特定参数出的透视张力非常恐怖。 · 质感差异:Midjourney 追求的是“摄影美学”,而香蕉模型现在更倾向于一种“超现实的干净感”,画面几乎没有杂质。 有个踩坑点:用香蕉模型生这种写实人像,千万别加太重的滤镜词,否则会显得“AI 味”过浓。保持 Prompt 里的材质描述(丝缎、皮革、金属),让它在自然光影下自洽,出来的质感反而高级。 大家最近有用 Nano Banana 2 出过这种高拟真角色吗?感觉它在处理二次元真人化时的“骨骼逻辑”,是不是比以前稳多了?
VoxCat tweet media
中文
3
10
91
37.8K
VoxCat
VoxCat@VoxcatAI·
你口中摇摇欲坠的帝国,已经屹立了一个又一个千年。
VoxCat tweet media
中文
2
0
2
310
VoxCat
VoxCat@VoxcatAI·
@y9118108099182 二次元转真人,关键不是把动漫改写实,而是先保留角色识别度。 先抓 4 个锚点:发型瞳色、脸型气质、标志服饰、整体氛围。 知名角色有时直接写名字也能出,但冷门角色、原创角色想稳一点,最好还是上参考图。 这类图最容易翻车的地方,不是词少,而是锚点丢了
中文
1
0
4
509
叶
@xiansanmi·
@VoxcatAI 你好,最近在研究二次元转真人,但是摸不着头绪,请问我应该从哪里开始?请指教,我翻阅了你过往帖子没有找到专门的帖子,如果我错过了请问能否给出链接让我可以拜读一下?
中文
3
0
0
773
VoxCat
VoxCat@VoxcatAI·
@celiawan3 直接过,这个提示词就是为不过审提供的
VoxCat tweet media
中文
0
0
1
65
celia_wan
celia_wan@celiawan3·
@VoxcatAI 这么逼真的人脸如何在seedance 2.0中过审
中文
1
0
0
51
VoxCat
VoxCat@VoxcatAI·
人像_角色设定卡_横版3x2_左2大右6头部表情 用途:上传参考图后,生成“角色设定卡/Turnaround Sheet”。 版式:左侧两张大图(全身正视+全身侧视),右侧 6 张小图(正面/背面/左右45°/开心/生气)。 约束:禁止任何可读文字/标签;统一棚拍白底与曝光;签名为右侧竖排 voxcat。 提示词(中文版) 3:2 横版角色设定卡/转面板(turnaround sheet / model sheet),纯白干净棚拍背景。以参考图人物为唯一身份锚点:脸型轮廓(下颌线、颧骨、下巴形状)、眼型、眉形、鼻梁与鼻翼、嘴唇厚薄与嘴角形状、年龄气质必须严格一致;发际线与发型尽量一致。只允许同一个角色,禁止换脸、禁止五官漂移。 版式(单张合成图,干净网格,统一光影与色彩): 左侧(约60%宽度):两张大图上下排列: 1)全身正视站姿(中性站姿,手臂自然下垂) 2)全身90°侧视站姿(中性站姿) 右侧(约40%宽度):2×3 网格六张头部小图: 1)头部正面(neutral) 2)头部背面(back of head,用于发型与头型一致性) 3)头部左45°(neutral) 4)头部右45°(neutral) 5)表情特写:开心/愉悦(happy,笑但克制不夸张) 6)表情特写:生气/愤怒(angry,眉眼紧张但不夸张变形) 质感与画质:高端写实棚拍/电影级人像质感,眼睛清晰锐利对焦,真实皮肤微观质感(毛孔与细纹,不磨皮不塑料),全图各分区曝光与色彩一致,8K细节,轻胶片颗粒,超干净白底,脚下干净柔和投影。 强约束:画面内不允许任何可读文字(不要 FRONT/SIDE 等标签),不要字幕、不要logo、不要UI叠层、不要水印块;不要卡通二次元;不要多余人物;不要畸形手指/多肢体/脸崩;六张小图必须是同一张脸同一发际线。 签名:右侧边缘添加极小竖排签名“voxcat”,超细字重,像艺术家署名(不是水印),不抢主体。
VoxCat tweet mediaVoxCat tweet mediaVoxCat tweet mediaVoxCat tweet media
VoxCat@VoxcatAI

x.com/i/article/2032…

中文
26
160
886
63.2K
VoxCat
VoxCat@VoxcatAI·
刚刚用 Nano Banana 2 (香蕉模型) 跑了一下“真实质感”的极限,这张图出来的质感确实让我有点恍惚。 很多模型在处理这种侧逆光下的肤质时,很容易把暗部糊成一片,或者高光处过度锐化。但这次的直出效果非常干净: 头发丝的细节分明但并不生硬,那种轻微的毛躁感反而是真人照片的精髓。 羊绒大衣的纹理和高领毛衣的织物感,在 Nano Banana 2 的语义下被还原得很有厚重感,不再是那种虚假的滤镜贴图。 构图上的“空气感”拿捏得很稳,窗边光线的自然漫射,让人物像是在一个真实的立体空间里,而不是贴在背景上。 我发现现在的模型越来越懂什么叫“高级感”了——不是堆砌细节,而是克制。这种冷峻、疏离但又充满细节的职像,其实比那种大开大合的奇幻场景更难跑稳。 大家觉得 AI 这种对“人类情感神态”的捕捉,现在到什么程度了?是已经能以假乱真,还是在某些微表情上依旧能一眼看穿?
VoxCat tweet media
VoxCat@VoxcatAI

竖版9:16超写实手机摄影。 【主体】 一位曲线身材的年轻亚洲女性,冷白皮肤,黑色齐刘海短波波头发型,气质自信自然。 【骨相结构】 面部骨相立体但柔和,鹅蛋脸轮廓。颧骨位置略高但不过分突出,面中部饱满。下颌线清晰但柔和,下巴小巧圆润。额头饱满光滑,太阳穴略微饱满。鼻梁细直自然,山根柔和过渡,鼻尖精致微翘。 【五官】 杏仁形大眼,双眼皮自然,眼尾略微上扬。眉毛为柔和自然的平弯眉,毛流感清晰。鼻梁纤细笔直,鼻翼小巧。嘴唇上唇略薄、下唇饱满,唇形柔和,唇峰自然。 【妆容】 底妆为通透奶油肌质感,皮肤带自然光泽,保留真实毛孔细节。 眼妆为柔和粉棕色眼影,眼尾轻微晕染,睫毛浓密卷翘。 腮红为暖桃色,轻扫在颧骨与眼下位置,带一点微醺感。 唇妆为玻璃唇质感,玫瑰粉色渐变,中心颜色更深,边缘柔和晕染。 【微表情】 表情自然放松,嘴角轻微上扬形成若有若无的微笑。脸颊轻微抬起,整体神态轻松、自信,带一点俏皮感。 【眼神】 目光直视镜头,眼神清澈明亮。瞳孔反射闪光灯高光,眼睛带一点湿润光泽。眼神氛围自信、轻松、略带调皮与魅力。 【服装】 黑色紧身吊带高开叉连衣裙,布料贴合身体曲线,突出腰臀比例,裙摆开叉露出腿部线条。 【姿势】 人物站立摆姿:双臂抬起,一只手臂向外伸展,另一只手放在后脑。胸部微微前挺,腰部收紧,臀部向一侧顶出形成明显S型身体曲线。一条腿作为重心站立,另一条腿通过裙子开叉自然伸出。 【构图】 竖构图摄影,比例9:16,全身入镜。人物居中。镜头高度在胸口位置,略带手机广角透视(约28mm镜头)。 【环境】 现代简约卧室空间。背景包含床铺、床头柜、桌面上的化妆品或护肤品、白色墙面、深色窗帘。房间带一点真实生活感,例如床铺略微凌乱。 【光线】 手机正面直闪光拍摄。强烈直射闪光灯,高对比度皮肤高光,人物背后形成短阴影。整体呈现夜拍抓拍、社交媒体手机闪光摄影质感。 【风格】 超写实摄影风格,iPhone闪光摄影质感,社交媒体网红写真风格。皮肤细节清晰可见,保留自然毛孔和皮肤光泽。 【情绪与叙事】 画面呈现一个真实生活瞬间。夜晚的卧室里,她刚结束外出或聚会。房间里仍保留生活痕迹:桌面摆着化妆品,床铺略微凌乱,窗帘半掩。她站在房间中央摆出自信而随意的姿势。闪光灯亮起的一瞬间,她微微眯眼,嘴角露出一点轻松的笑意。眼神直视镜头,带一点俏皮与挑战感,像是在享受被拍摄的感觉。整个画面像一次真实的夜晚抓拍,既随意又充满魅力。 【专属签名】 在画面右侧边缘约5%安全距离处添加创作者签名: “voxcat”(全部小写),垂直排版,从上到下排列。字体为极细现代无衬线字体(ultra-thin modern sans-serif)。在文字末尾紧跟一个青金石蓝(lapis lazuli blue)金属反射质感的实心小圆点。整体透明度20%–35%,像镜头蚀刻一样若隐若现。 【限制】 无其他水印 无其他Logo 人体比例自然 高清细节 高真实感

中文
3
2
71
4.7K
VoxCat
VoxCat@VoxcatAI·
真人主角 + 主题相关内容 + 剪纸化配角 + 经典国产动画美术空间。 画风只定义表现方式,不替代主题内容; 所有人物、场景、道具与叙事都必须围绕主题展开。 提示词👇 严格根据我的主题或参考图生成内容,所有人物角色、场景环境、道具元素、动作关系和叙事细节都必须与我的输入直接相关。《渔童》仅作为画风参考,只用于规定美术语言、造型方式、色彩体系、装饰感和动画气质,不作为题材来源,不自动引入任何《渔童》原有故事元素。保留真人主体为第一视觉核心,保持真人脸部结构、皮肤头发质感、真实比例与表演感。除真人之外的其他人物,统一采用剪纸风 + 上海美术电影制片厂经典国产动画《渔童》画风进行表现,但人物身份与内容必须来自我的主题。背景与场景也采用《渔童》式经典国产动画美术处理,但背景中出现的具体环境、建筑、道具和装饰内容同样必须与我的主题或参考图直接相关。最终形成“真人主角 + 与主题相关的剪纸化配角 + 与主题相关的上美影动画化场景”的分层融合画面。
VoxCat tweet mediaVoxCat tweet mediaVoxCat tweet mediaVoxCat tweet media
VoxCat@VoxcatAI

在你的提示词中加入这段核心风格。 并根据需求,修改提示词中的主配色,场景等元素。 极简手绘卡通插画,粗黑色线条,扁平色块上色,北欧儿童绘本风,人物比例夸张可爱,大头小五官,柔和高饱和配色,薄荷绿和芥末黄为主,轻松幽默,生活化场景,背景简洁,带一点涂鸦感和童趣。

中文
2
6
30
3.2K
VoxCat
VoxCat@VoxcatAI·
我刚发布了 openclaw-token-stats。 这是一个面向 OpenClaw 的离线 token / cost 统计 skill, 能把原始 session 日志整理成更实用的观察视角: • 按模型统计 • 按 provider 统计 • 按 session 排查热点 • 自动生成日报 / 周报 / 月报 本质上是在解决一个很朴素的问题: token 到底烧到哪去了。
VoxCat@VoxcatAI

x.com/i/article/2017…

中文
4
2
15
2.6K