紫苏子ACG

1.2K posts

紫苏子ACG banner
紫苏子ACG

紫苏子ACG

@Pixelxzen

独立动画导演 & 全栈创作人 ✨@reflyai 官方认证创作者✨

China Katılım Ekim 2010
7.3K Takip Edilen1.1K Takipçiler
肖师傅
肖师傅@xiaojietongxue·
🚀这个有点意思,专业人士的福音啊,可以手动控制相机参数和角度来虚拟拍摄
中文
4
14
67
6.3K
歸藏(guizang.ai)
Claude 非常懂事,知道周五了,又挂了
歸藏(guizang.ai) tweet media
中文
33
1
45
8.9K
Sora
Sora@soraofficialapp·
We’re saying goodbye to the Sora app. To everyone who created with Sora, shared it, and built community around it: thank you. What you made with Sora mattered, and we know this news is disappointing. We’ll share more soon, including timelines for the app and API and details on preserving your work. – The Sora Team
English
11.1K
5.8K
36.4K
44.9M
向阳乔木
向阳乔木@vista8·
最近的牛逼论文有点多啊!Meta的最新论文V-JEPA模型 Meta的研究团队训练了一个叫V-JEPA的模型,让它看大量视频,学习预测接下来会发生什么。 结果发现,这个模型竟然"懂"物理了。 什么叫"懂"物理? 研究员用了一个经典的心理学测试方法,叫"违反预期范式"。 简单说就是给模型看两段视频,一段正常,一段违反物理规律。 如果模型对不正常视频表现出更大的"惊讶",就说明它理解了这个物理概念。 结果:V-JEPA在 IntPhys 测试集上达到了98%的准确率,在其他测试中也有60%以上的表现。 而更大、更复杂多模态大语言模型(如Gemini 1.5 pro),表现却接近随机猜。 为什么V-JEPA能做到? 关键在于它的学习方式。 V-JEPA不是直接预测像素,而是在一个抽象的表征空间里预测。 这就像你看到一个人走向门口,你不会去想象他每根头发、每个像素会怎么动,而是在脑子里有个更高层次的理解:这个人会走出门。 这种方式有三个特点: 第一,学会了抽象表征 模型自己决定什么信息重要,什么可以忽略。 就像你记住的是"红色的球",而不是球表面每个像素的RGB值。 第二,通过预测来学习 这和认知神经科学里的"预测编码"假说不谋而合,大脑也是通过不断预测和修正来理解世界的。 第三,不需要硬编码先验知识 没人告诉它什么是物体、什么是重力,这些概念都是从视频中自己学出来的。 一些有意思的细节 研究团队做了很多对比实验,几个挺有启发: 数据量没那么重要。 用128小时的视频训练出来的模型,在IntPhys上的准确率还能超过70%。 这说明关键不是喂更多数据,而是学习方式对不对。 模型大小也不是决定性的。 一个只有1.15亿参数的小模型,准确率也能达到85%以上。 预测任务的具体形式影响不大。 无论是预测被遮挡的部分,还是预测未来的帧,甚至随机遮挡像素来预测,效果都不错。 重要的是在抽象空间里做预测这个框架本身。 但V-JEPA也不是万能的。 它在处理物体之间的精确交互(比如碰撞)时表现一般,在需要长期记忆的任务上也有困难。 这可能是因为: 1. 训练数据里这类交互场景不够多 2. 模型只能处理3-4秒的短视频片段 3. 可能需要更复杂的层次化表征来捕捉这些交互 这意味着什么? 研究挑战了一个长期以来的观点:要理解物理世界,AI是不是必须像人类婴儿一样,天生就有一些"核心知识"? 答案似乎是:不一定。 通过合适的学习方式,AI可以从原始的感知信号中自己学会这些概念。 这不是说"核心知识"假说错了,而是说,对于人工系统来说,可能有另一条路。 更有意思的是:我们造出了能写代码、做数学题的AI,但它们连"球不会凭空消失"这种常识都搞不清楚。 这就是著名的"莫拉维克悖论",对生物来说简单的事,对机器来说可能很难,反之亦然。 V-JEPA的成功,可能给我们指出了一个方向: 要让AI真正理解世界,也许不是喂给它更多文字和代码,而是让它像婴儿一样,通过观察和预测来学习。 当然,这只是开始。 从理解简单的物理场景,到真正像人一样理解这个复杂的世界,还有很长的路要走。 但至少,发现了一个可能的方向。 论文见评论区
中文
11
10
63
14.5K
紫苏子ACG
紫苏子ACG@Pixelxzen·
@oran_ge 哈哈,比闪电说有多了一个好选择。👍
中文
0
0
0
1.2K
Orange AI
Orange AI@oran_ge·
大多数语音输入法都在变得越来越臃肿: 要登录、要订阅、要联网、要加一堆新功能,要学习一堆新交互。 世界,不应该这样。 输入,就应该专注。 于是我们做了 TypeNo。 TypeNo 是一款面向 macOS 的极简语音输入法: - 永远免费,永远开源 - 本地模型,保护隐私 - 轻量模型,节省内存 按下 Control,开始说话; 再按一次,自动转录,自动粘贴到当前应用。 一切极简,再无其他功能。 没有账号。 没有订阅。 没有多余 UI。 没有“为了 AI 而 AI”的复杂感。 Typeless 每月 30 美金。 TypeNo 免费。 如果你愿意,欢迎试用,也欢迎给个 star: 项目地址:github.com/marswaveai/Typ…
Orange AI tweet media
中文
99
129
905
123.2K
向阳乔木
向阳乔木@vista8·
Github Trend中的这个项目不错:claude-hud 能增强你的Claude Code的状态显示,有点像汽车的抬头显示(HUD)作用。 比如能看到当前上下文占用比例 有几个MCP在运行,正在运行/已完成的工具。 子 Agent 状态和Todo进度等。 第一步,跟CC对话添加插件市场 /plugin marketplace add jarrodwatts/claude-hud 第二步,安装插件 /plugin install claude-hud (会提示重新加载插件) 第三步,配置显示 /claude-hud:setup Github见评论区
向阳乔木 tweet media
中文
19
11
66
9.9K
朵拉
朵拉@dora_lieu·
@VigoCreativeAI 大哥能解决这种需求吗,比如我拍了一张图,我需要优化它的细节,比如背景成为黑色,让它更加像珠宝的展示成图。
朵拉 tweet media
中文
5
0
2
915
Vigo Zhao
Vigo Zhao@VigoCreativeAI·
电商详情页的产品图,我不雇摄影师了 这是用 AI 生成的一套 Dyson 吹风机全套视觉素材: 主视觉光束图 / 材质纹理特写 / 品牌 logo 氛围图 大理石展台陈列 / 配件平铺拆解 / 头发动态效果 / 极简剪影 7 张图,覆盖详情页从首图到卖点的完整视觉链路 传统流程: 📅 预约摄影棚 → 布光 → 拍摄 → 后期 → 改稿 最快也要 3 天,费用四位数起 现在的流程: ⚡️ 写 Prompt → 出图 → 微调 2 小时搞定,成本接近于零 最难出的是 F5 那张 👆 头发丝飘动 + 蒸汽质感 + 侧逆光 这种有"使用场景感"的图,AI 以前很难做对 现在踩到关键词组合之后,基本一次过 完整 Prompt 框架评论区扣 1 📦 #电商视觉 #AI产品图 #Dyson #PromptEngineering #AIGC
Vigo Zhao tweet media
Vigo Zhao@VigoCreativeAI

I let AI build a full visual system for the Porsche 911 GT3 RS Not one shot. A complete product lineup 👇 Hero shot / Wheel close-up / Top-down exploded view / Track action / Front / Silhouette 8 angles. 1 prompt framework. Color palette locked: Guards Red × Carbon Black × Matte Gold wheels These three together? They don't just look good — they glow. The hardest one to nail was this 👆 Drifting smoke + backlit golden flare AI usually falls apart on dynamic motion shots This time I found the right keyword combination Drop 911 in the comments for the full prompt template 🏎️ #Porsche #911GT3RS #AIPhotography #PromptEngineering

中文
18
53
269
34.6K
Adam也叫吉米
Adam也叫吉米@Adam38363368936·
最近大家都在刷那些惊艳的 Seedance AI 视频,但我今天想泼点冷水,分享一点翻车现场,也顺带给大家看看AI视频的局限性,看看怎么解决。 今天突发奇想,做了一个大厨做羊肉的视频,看看就知道,结果不如人意,各种出错,刀法不对,空间错位,场景错乱,超级无语😅 做了两遍,依然没有达到想要的效果,不过我发现了AI的几个弱点 1.对于复杂提示词容易过载,多动作节点,很容易发生动作逻辑混淆 2.比如多物体碰撞交互,细节容易出错 3.快速高能的场景不如慢柔连贯的动作体现的好 分享几个降低抽卡率的办法 1.不要总想着一镜到底,多拆几个分镜头 2.慢就是快,提示词多用“缓慢、连贯、稳定” 3.结合后期剪辑优化,有更多的操作空间,这也很能反应技术水平
Adam也叫吉米@Adam38363368936

左:豆包Seedream4.5 右:Nano Banana 2 同样的提示词,我发现豆包的审美真的是太符合亚洲小姐姐的审美,香蕉生成的效果是好,就是感觉太老实😁 你喜欢哪一个? 提示词: 生成图片:年轻亚裔美女,冷白皮美女,黑色长卷发,穿白色吊带+酒红杂色开衫+酒红长裤,站在室内简约场景(桌面摆红酒+手机),背景墙简约挂画,夜景,室内暗光,中景构图,慵懒随性的日常穿搭氛围,画面细节真实自然。

中文
8
2
22
32.4K
紫苏子ACG
紫苏子ACG@Pixelxzen·
@msjiaozhu 其实,这个水准没有过年前的Seedance 2.0 模型表现力强。弱化了很多。
中文
1
0
0
245
MapleShaw
MapleShaw@msjiaozhu·
目前来看,Seedance 2.0 还是适合用于国漫,3D 特效等短平快的小片段,画面音效都不错,当做素材能很好的提高视频剪辑的效率。 这种基本不会触发视频未过审,以及提示词受限(只要别提及 IP 关键词)🤪 提示词👇 【风格】新国风武侠(Neo-Chinese Wuxia),水墨流体粒子特效(Ink Fluid Simulation),超高速摄影(High-speed Cinematography),真人实拍与CG结合,黑白红三色视觉冲击,节奏极快。 【时长】15秒 【角色】 黑衣墨客(Black Ink Warrior):动作刚猛,每一击都如泼墨山水般沉重。 红衣刺客(Red Assassin):动作轻灵诡异,如朱砂点漆般锐利。 【场景】一个纯白的虚无空间,地面铺满宣纸。 [00:00-00:05] 镜头1:静极思动(The Awakening)。 极静到极动。画面最初是一幅静止的黑白水墨画,两个墨点对峙。突然,古琴声炸裂。 【动作】两个墨点瞬间化为真人的残影冲向对方。黑衣人一记重拳轰出,空气中瞬间炸开一团浓重的黑色墨汁(代替烟尘),墨汁在空中凝固成刚劲的书法笔触。红衣人侧身闪避,手中匕首划出一道鲜艳的朱砂红线。 [00:05-00:10] 镜头2:狂草对决(Ink Combat Choreography)。 超高速快剪(Rapid Cuts)。两人展开令人眼花缭乱的近身格斗(武术指导级动作)。 【视觉奇观】每一次肢体碰撞(拳脚相加),都不是肉体的声音,而是墨汁飞溅的爆炸声。黑衣人的扫堂腿带起一片黑色的墨浪海啸;红衣人的腾空连环踢在空中留下红色的残影轨迹。地面上的宣纸被他们的步伐撕裂,墨迹晕染。 [00:10-00:15] 镜头3:破壁一击(Breaking the Dimension)。 慢动作升格。两人同时使出绝招对撞。黑色的墨龙拳与红色的朱雀刃在空中死死抵住。 【高能时刻】巨大的能量让整个二维的水墨世界崩塌。镜头猛地拉远,发现他们竟然打破了“次元壁”,从一幅挂在墙上被撕裂的水墨画中“跌落”到了现实世界的木地板上,周围环绕着尚未散去的墨韵和纸屑,两人保持着最后的格斗姿态定格喘息。
中文
4
14
87
9.8K
肖师傅
肖师傅@xiaojietongxue·
🔥终于找到了这种运镜的解决方法 感谢@Pixelxzen 提醒我用Qwen的多角度生成来完成首尾帧,完成运镜,看来有时候还是会陷入自己设定的框架,总是觉得要用提示词完成,条条大路通罗马啊!
肖师傅 tweet media肖师傅 tweet media肖师傅 tweet media肖师傅 tweet media
肖师傅@xiaojietongxue

🔥做AI视频要从任何地方找灵感! 不要只看两个美女,关注一下转场,我想了各种办法想要让AI理解这个转场,都失败了,谁能想出提示词来描述这个无缝转场?

中文
29
58
572
138.8K
紫苏子ACG
紫苏子ACG@Pixelxzen·
@xiaojietongxue 肖师傅估计忘记了qwen的那个任意角度模型了。直接在lovart试试看咯。反正用首尾帧方式实现。
中文
1
0
1
449
肖师傅
肖师傅@xiaojietongxue·
🔥你们猜,哪一个是肖师傅?
肖师傅 tweet media
中文
10
1
8
3.4K
Paul Sims
Paul Sims@SimslearnAi·
One of the most overlooked AI publishing systems right now? Claude AI. When paired with the right design tools, it becomes a seamless workflow for creating, formatting, and publishing premium eBooks on Amazon KDP. The real advantage is scalability. Using this exact system, our portfolio crossed $72,000 in royalties last month. With just 4–6 high-quality books, the results can snowball faster than most creators expect. 𝐈 𝐨𝐫𝐢𝐠𝐢𝐧𝐚𝐥𝐥𝐲 𝐩𝐥𝐚𝐧𝐧𝐞𝐝 𝐭𝐨 𝐩𝐚𝐜𝐤𝐚𝐠𝐞 𝐭𝐡𝐢𝐬 𝐰𝐨𝐫𝐤𝐟𝐥𝐨𝐰 𝐚𝐬 𝐚 $249 𝐭𝐫𝐚𝐢𝐧𝐢𝐧𝐠. 𝐁𝐮𝐭 𝐟𝐨𝐫 𝐭𝐡𝐞 𝐧𝐞𝐱𝐭 48 𝐡𝐨𝐮𝐫𝐬, 𝐈’𝐦 𝐬𝐡𝐚𝐫𝐢𝐧𝐠 𝐢𝐭 𝐟𝐨𝐫 𝐟𝐫𝐞𝐞. Get it: • Like & RT (This post) • Comment “Claude” [MusT] I’ll send you the full training and the AI publishing workflow. (𝐅𝐨𝐥𝐥𝐨𝐰 @SimslearnAi so 𝐈 𝐜𝐚𝐧 𝐃𝐌 𝐲𝐨𝐮 𝐭𝐡𝐞 𝐥𝐢𝐧𝐤)
Paul Sims tweet media
English
201
145
229
16.6K
Tom Huang
Tom Huang@tuturetom·
兄弟们!太炸裂了💥 正式支持「微信🐸 Openclaw 龙虾」🦞 🌟这个龙虾客户端 - Nexu 正式开源🌟 华人团队开发!一键扫码直连,将本地电脑变成微信超级智能终端🔥 最重要的,无限制免费用顶级模型 Claude、GPT 顶级模型,先到先得!✈️🌈 开源地址👉github.com/nexu-io/nexu 手把手教程如下👇
中文
30
110
431
254.7K
wong2
wong2@wong2__·
今天体验完微信的OpenClaw接入,我就在想是不是可以对接其它agent。 于是我让Claude Code把 `@tencent-weixin/openclaw-weixin` 这个库(ts源码,MIT协议)改造成了一个让微信对接任意agent的SDK: github.com/wong2/weixin-a… 已经成功对接一个基于openai的示例agent,下午试试看接入Claude Code!
中文
48
98
613
254.7K
Cas.Fyn
Cas.Fyn@FynCas·
Just generated this AI podcast-style UGC clip in 2 minutes. Dropped in a short prompt and MakeUGC handled the rest. AI generates a realistic podcast-style creator AI matches the voice + delivery Video renders ready to post No filming. No guests. No editing. Comment “Makeugc” and I’ll send you the link to try it yourself.
English
170
25
236
18.9K
枯白啃设计
枯白啃设计@Kubai087·
送 3 组 icon(过程方案),不单送 感兴趣的朋友留言~ #独立开发者
枯白啃设计 tweet media
中文
33
5
141
10.3K
kepano
kepano@kepano·
It's part of Obsidian Web Clipper, and doesn't require Obsidian. It runs on all browsers that support extensions, including mobile (Safari and Firefox). obsidian.md/clipper
English
15
27
565
31.9K
kepano
kepano@kepano·
I have been working on Obsidian Reader for a over a year. I didn't want to share it until I felt it was good enough. It's finally there. Consistent formatting for any article. Outline, syntax highlighting, nice footnotes, adjustable typography. Runs locally. Just rules, no AI.
English
175
319
5.5K
327.2K
Paul Bakaus
Paul Bakaus@pbakaus·
Introducing Radiant: 80+ production-ready shaders and visual effects for the web. 0 dependencies, MIT license. - multiple color themes - ultra-realistic simulations - webgl and 2d canvas Pick one, copy source, integrate, ship. radiant-shaders.com
English
84
189
2.5K
138.2K