火之舞
26 posts


刚在 GitHub 翻到一个 Nano Banana Pro 的提示词仓库,
一共 703 个提示词,
全部免费,复制就能用,
而且完成度已经调得很成熟。
还支持 16 种语言(含日语),
顺手附了 12 个精选玩法,
像引用卡生成、手绘风格转换、水彩地图、教育资料模板这种,
基本都是能直接拿去干活的。
github.com/YouMind-OpenLa…

中文

@hedra_labs Why are the credits purchased through your API so expensive? It's 50 US dollars for 100 credits, while the membership on the official website offers 6000 credits. Why is there such a huge price difference? And it's not even the latest model?
English

Hedra Studio and Character-3 is here. A new generation of AI-native video creation.
At its core is Character-3, the first omnimodal model in production, built to jointly reason across image, text, and audio for more intelligent video generation. This goes beyond multimodal—it’s the next evolution of AI-driven content creation.
With Hedra Studio, we’re making this technology easy to use. It brings together Character-3 and other leading AI tools in one platform, so creators can focus on ideas instead of complicated workflows.
With Hedra Studio, you can:
- Text-to-video and audio-to-video
- Character and general-purpose image and video creation
- Dynamic backgrounds, text-to-emotion, and top AI model integration
Character-3 sets a new standard for AI video. Hedra Studio makes it accessible. Both are available now.
English

🔹Comparing AI video results:
• Gen-3
• Kling AI 1.5
• Hailuo MiniMax
• Luma Dream Machine
I used a FLUX LoRA trained on my selfies as the input. Each model ran the same prompt 3 times, and I chose the best results:
"Tracking shot of a curator standing and speaking to the camera as she welcomes museum guests. Warm, inviting atmosphere."
Each model interpreted the prompt differently, and the backgrounds are interesting:
English

🌟 Check out the incredible entries for Hailuo's Prompt Challenge #1: Cross the Boundary! 🚀
Huge shoutout to everyone who joined in— your creativity and passion truly inspire us! We can't wait to see more of your amazing work!🙌😍
English

🌟 The wait is finally over ——We are excited to announce the launch of our Image-to-Video feature! 🎬✨
What distinguishes Hailuo's Image2Video experience?
- Text-and-image joint instruction following: Hailuo seamlessly integrates both text and image command inputs, enhancing your visuals while precisely adhering to your prompts.
- Powerful Processing and Precise Control: Achieve unparalleled accuracy in identifying and manipulating objects within your images to bring your artistic vision to life.
- Diverse Styles: Implement a diverse range of styles, including super-realism, Eastern, ACG, abstract, fantasy, sci-fi & more.
Elevate your creative journey here hailuoai.video
English

卧槽,来了Meta发布Meta Movie Gen视频音频生成模型系列,剪辑模型也太牛了。
具体包括:
Movie Gen Video:30B DiT 模型,单个文本提示生成高质量、高清晰度的图像和视频。
Movie Gen Audio:13B transformer模型,可以接受视频输入以及可选的文本提示用于可控性,生成与视频同步的高保真音频。
Personalized videos:可以自动剪辑视频,使用生成或现有视频以及附带的文字说明作为输入,可以执行本地化编辑,如添加、删除或替换元素。
详细信息:ai.meta.com/research/movie…
中文

字节刚刚发布了大家期待已久的豆包视频生成-Seaweed模型和豆包视频生成- PixelDance模型。
昨天做了一堆Seaweed模型的测试表现相当不错,支持各种风格提示词响应以及横竖多种比例(说你呢 Runway)。
目前已经火山引擎开启企业用户的邀请测试,在即梦开启小范围个人用户邀请测试。
很多人测试发现豆包视频模型一大优势是可以实现自然连贯的多主体复杂交互。
下面是Seaweed模型跟 Runway 和 Luma 的对比测试,综合结果比 Luma 要好很多,跟 Runway 各有优劣。
- 图生视频的时候画面稳定性很好,不会出现随着时间图片的风格或者色彩表现出现偏移的问题。
- 运动幅度应该是这几家最大的,可以实现非常激烈的运动。
- 人物或者动物的解剖形体部分表现很稳定,剧烈运动也不会很崩。
- 在水流以及云雾这类流体表现很好,不会有那种果冻感。
- 3D 一致性表现也很好。
- 在 2D 动漫高风格化的表现上比 Luma 和 Runway 也要好很多。
测试用的都是图生视频,提示词和图片都是一样的,期待尽快开放给更多人使用。
中文

前几天 Minimax 发布了他们的视频模型 abab-video-1,我还做了个小测试。
今天补了一下针对性的详细测试,发现确实非常牛批,模型综合实力是全世界最好的之一。
先说结论:
- 画质表现是现在所有视频模型最强的;
- 人物面部细节和情绪的表现是现在所有模型最好的;
- 提示词理解、运动幅度、稳定性都在第一档;
- 美学表现略差于 Luma,好于 Ruwnay;
- 物理正确性跟 Runway 差不多,好于 Luma;
真的,你们可以看一下最后一段测试视频,太牛了。
原来的提示词让一个女性的表情从喜悦到恐惧在到无奈,Minimax 完美实现了提示词描述的内容。Luma 人物直接崩了,Runway调教过于生硬开始硬切画面。
画质分部分他的视频清晰度和纹理都非常清晰和稳定,没有出现常见的模糊和网格问题。
提示词理解也很强,比如豹子武僧的部分,Luma 画出来了但是画面完全不动,runway 直接画了个人出来,只有 minimax 完全理解了提示词并且运动幅度正常。
所有的提示词都是 AI 生成,没有使用常见视频模型的演示提示词。所有测试都只跑一次。
中文



