DADADA起業タロウ
1.1K posts

DADADA起業タロウ
@kigyot
Kigyo Taro is a friend of super media creator and HCI researcher. 日本いるけどX留学中。時々日本語です。#HCI #SIGGRAPH #Veo3 #wan22 #discord #n8n #GeminiCLI #comfyUI #obsidian
Katılım Ağustos 2023
416 Takip Edilen92 Takipçiler
Sabitlenmiş Tweet

たまゆら学園。なんかノイズ入っちゃうから、ネガティブプロンプト入れないとなあ。ちなみに、この開始画像はFlex2klevinで生成してます。数十秒で1枚生成する超高速な顔一致のやつです。4枚の参照画像を合成してて、こちらもオリジナルワークフローをDiscordで配布してます。 #ComfyUI
日本語

LTX2.3の前方一致の画像から動画生成するComfyUIのワークフローを作成できました。量子化GGUFで、これをやっているワークフローはおそらくなくて、なんとVRAM8のGPUで3分で生成できます。
Discordサーバー限定で配布します。
discord.gg/ZCmh6Eurgv
日本語

LTX2.3. I have only VRAM-8, but it takes only 3 min to generate. This is original workflow. Lip sync is "I am Churchill. Actually, I am an idol!".
I love UK. I love London because I have lived in 1 year.
#ComfyUI #LTX #generativeAI
English

最後に、静止画のほうの画像生成で流行ってるFLUX.2-kleinの量子化GGUFのファイル。まあ画像なんで、量子化まではいらないかもだが。
huggingface.co/unsloth/FLUX.2…
日本語

READMEみてて、GEMMA-3ないやんってなって検索しなおした。いきなりLTX2.3の量子化GGUFからいこうとすると詰むとおもう。結構むずかしかった。
huggingface.co/unsloth/gemma-…
日本語

text to moveは、chiとかで論文ではじめてるけど、img to moveがあまりない。でも実用性を考えると、画像みて動くって、もっとも自然な人間の原始反応なので、もっとimg to moveやtouch to move増えるべきだ。
田中義弘 | taziku CEO / AI × Creative@taziku_co
「もっと右」「ゆっくり前へ」──その指示、AIには曖昧すぎた。 @DescartAIのLucy Motionはテキスト解釈を介さず、空間上のパスを直接入力として使う。だから動きがズレない、破綻しない。 画像→動画が、ついに制御可能なメディアになり始めている。リンクは🧵
日本語
DADADA起業タロウ retweetledi

AIが何でも画像を作れる時代に、なぜこの作品が刺さるのか?
トーマス・ダイニンガー(@tdeininger)の作品は、環境問題×錯視×物理空間という三重構造。データではなく「現実の物質」を再構成して意味を生む。
この非効率さ自体が、これからの価値になる気がする。
日本語


