二次元裏@ふたば

画像ファイル名:1779632475602.jpg-(10645 B)
10645 B26/05/24(日)23:21:15No.1433172510+ 01:03頃消えます
土日を使ってComfyに移行してみた
ノードUIも慣れると便利ね…
このスレは古いので、もうすぐ消えます。
126/05/24(日)23:26:36No.1433174353そうだねx1
カスタムノードでやりたいことをLLMが一瞬で形にしてくれるからComyUI使えてるみたいなとこは大いにある
226/05/24(日)23:26:49No.1433174439+
こういう風に動いてるんだってのがわかるのは面白い
ただ全然使いこなせないから結局refrge使っちゃってる
326/05/24(日)23:27:29No.1433174659+
アプデでエラーが出たり動かないときが地獄
426/05/24(日)23:29:53No.1433175447+
自分で組む分には今後の拡張性とか可読性とか色々気にしなきゃならんけど
LLMがこんだけ強力だと困ったらその都度頼めばいいやで気にせずポンポン追加しちゃう
526/05/24(日)23:35:58No.1433177559+
最低限のノードに高速化Loraと固定プロンプトの結合だけ組んでそのままだ
626/05/24(日)23:35:59No.1433177565そうだねx2
ふたばイマージュのアニマ版でたらしいな
726/05/24(日)23:36:30No.1433177753+
>高速化Lora
animaのそれは罠だぞ
826/05/24(日)23:38:55No.1433178695+
>animaのそれは罠だぞ
なんか構図がカッチリ決まりすぎるんで付けてるのと付けてないの併用してる
comfyだと両方出力して比較とかも出来るか
926/05/24(日)23:41:15No.1433179549そうだねx1
雑にやってくれぇ〜みたいなタイプならTurboいれてもいいかもわからん
1026/05/24(日)23:42:26No.1433179964+
ローカルでお願いしてる人はgema脱獄なの?
1126/05/24(日)23:44:36No.1433180712+
fu6742207.jpg
ちんこ蹴る角度を色々研究してるんだけど難しい
バトル関連の描写指定を増やすと種付けおじさんが無駄にガッツを見せてくる
1226/05/24(日)23:44:38No.1433180720そうだねx1
単純に高速化Lora入れた方が早いしな…
1326/05/24(日)23:46:40No.1433181422+
流石にプロンプト無視しすぎるから高速化は相性悪い
1426/05/24(日)23:46:47No.1433181456そうだねx1
>ローカルでお願いしてる人はgema脱獄なの?
ウチはQwen先生にお願いしてるけど
プロンプトとして与える程度の短い日→英翻訳なんて正直どのLLMに任せてもオーバースペックもいいとこだから好きなUncensoredモデル使えばいいと思う
1526/05/24(日)23:47:39No.1433181780+
RTX3060だけど高速化を使わないと1216*1536の25Stepsが2分以上かかる…
1626/05/24(日)23:48:21No.1433182065+
>単純に高速化Lora入れた方が早いしな…
表現が簡略化されたりはするけどそれを鑑みてもSTEP数1/3〜1/4くらいだからね
1726/05/24(日)23:50:37No.1433182875+
高速化loraで絵柄固定できねぇとか言ってるならあれだけどまあ抜くだけなら好きにせぇ
1826/05/24(日)23:51:34No.1433183233+
SEXだけ入れるとバック多いからバック好きだなanima
1926/05/24(日)23:51:50No.1433183318+
VRAMに収まるサイズでドバドバ作らせて気に入ったやつだけ高画質にすればええ!
2026/05/24(日)23:54:16No.1433184109+
はあ…H1008個買ってVRAM800GBくらいの環境作りたい
2126/05/24(日)23:54:45No.1433184278+
hires掛けなくても目の輪郭が崩れないのいいね
2226/05/24(日)23:55:35No.1433184560+
>>ローカルでお願いしてる人はgema脱獄なの?
>ウチはQwen先生にお願いしてるけど
>プロンプトとして与える程度の短い日→英翻訳なんて正直どのLLMに任せてもオーバースペックもいいとこだから好きなUncensoredモデル使えばいいと思う
qwenもよさそうだよね
こう…いい感じに補完してもらうのもやってもらえないかなと思ってるから翻訳以外のスペックもちょっとほしいなって
2326/05/24(日)23:56:36No.1433184892+
>高速化loraで絵柄固定できねぇとか言ってるならあれだけどまあ抜くだけなら好きにせぇ
望んだスタイルになるかは別の話だけど高速化入れた時の方が表現の幅狭まって絵柄固定されてる気がする
高速化入れてない時の方がムラを感じる
2426/05/24(日)23:56:46No.1433184943+
素の1536出力に対応したのはもちろん素晴らしいことなんだけど
何なら1024出力でも今までとはディテール全然違うからなんかサクっと抜くならこれでいいのではと思い始めてる
イラストリアスだと素の1024出力なんて明らかにディテール潰れまくってたのに
2526/05/24(日)23:56:52No.1433184985+
neoはSpectrum Integratedで
2626/05/24(日)23:59:40No.1433185869そうだねx2
単純な動作を翻訳するならともかく「バイブで亀頭を攻めるって英語でどう表現するの?」みたいなのはわりとLLMの知識が問われるところではある
2726/05/25(月)00:00:12No.1433186057+
animaってパラメータ数はSDXLより小さいんだな
なぜそんなことができるのかさっぱりわからない
2826/05/25(月)00:01:18No.1433186445+
〇〇を××に当てるをグーグル検索で教えてくれるAIに聞いて答えてもらう大体どうにかなる
2926/05/25(月)00:01:20No.1433186453+
線が汚くなるけど生成速度早くなるやつ
https://github.com/ruwwww/ComfyUI-SPEED
3026/05/25(月)00:01:58No.1433186639+
背景が意味不明な配置じゃなくなっただけでちょっとシコ度アップした気がする
3126/05/25(月)00:02:37No.1433186846+
テキストエンコーダーを外部外付けにしてる分本体は軽いみたいな感じじゃなかった?
3226/05/25(月)00:03:23No.1433187094+
めちゃくちゃな背景とか頑張って説明したら建築法に沿ったもの描けたりするのかな
3326/05/25(月)00:03:32No.1433187140+
DeepLとか意訳強くて書いてあることをわかる言語にしてもらう分には強いんだけどプロンプト用に翻訳してもらうときは大事な部分が抜けたり違う解釈したりしてる時あるからな…
3426/05/25(月)00:04:18No.1433187340+
>めちゃくちゃな背景とか頑張って説明したら建築法に沿ったもの描けたりするのかな
プロンプト多くなり過ぎて反映できなくなる気もする
Shift弄ると良くなるらしいがその検証は見ていない
3526/05/25(月)00:05:00No.1433187564+
一番確実なのは良さげなサンプル画像のプロンプトを見せてこれをアレンジして!ってやる方法
3626/05/25(月)00:05:06No.1433187600+
LLMくんは単純な翻訳というより俺には思いつかないhentai演出をひとつまみしてくれるから使ってる
3726/05/25(月)00:05:13No.1433187623+
ローカルLLMちゃんにシステムプロンプトでいい感じに指示したいが上手くいかないんだよね
3826/05/25(月)00:05:27No.1433187689+
いかにもAI産な感じのランダム背景とて別にシコる分にはそこまで気にしてなかったんだけど
ANimaだと暗い部屋の中・豪華な装飾・右後ろにベッドサイドテーブル・テーブルの上にえっちなピンク色の光のランプ・左後ろにでっかい窓・窓の外に夜景みたいな感じで毎回カッチリ固定できるからすげえ捗るようになって人間やっぱシチュエーションへの没入感って大事なんだなって
3926/05/25(月)00:08:17No.1433188470+
それを使いこなせてるかどうかは別としてキャラを3人4人ちゃんと分けて出せるのだいぶ楽しい
4026/05/25(月)00:08:21No.1433188489そうだねx1
ある程度信用できる本体ならともかくサプライチェーン攻撃が流行ってる中であんまり不用意に色々入れるの怖くない?
4126/05/25(月)00:09:12No.1433188736+
>めちゃくちゃな背景とか頑張って説明したら建築法に沿ったもの描けたりするのかな
モデル自体が完璧に整合性取れた形状を覚えてるわけじゃないからそこまでは無理
4226/05/25(月)00:10:03No.1433188969+
Animaトークン150越えると何か絵柄変わるなぁ
4326/05/25(月)00:10:35No.1433189105+
Animaはあくまで📦️語で表現できるものしか描けないからな…
それを自然言語で細かく指定できるのがえらいんだけど
4426/05/25(月)00:11:12No.1433189293そうだねx2
webui系だかcomfyでマルウェア入りの拡張は実際あったからあんまよくわからんのいれたらあかんよ
4526/05/25(月)00:11:41No.1433189437+
>Animaはあくまで⁠📦️語で表現できるものしか描けないからな…
>それを自然言語で細かく指定できるのがえらいんだけど
それ言ってるサイトがあるだけでそうでもないと思うよ
4626/05/25(月)00:13:21No.1433189880+
>ある程度信用できる本体ならともかくサプライチェーン攻撃が流行ってる中であんまり不用意に色々入れるの怖くない?
不可視文字列で仕込まれてたりするらしいがまぁそんときゃそんときだ
https://xtech.nikkei.com/atcl/nxt/column/18/00989/040100204/
4726/05/25(月)00:14:36No.1433190204そうだねx1
>Animaはあくまで📦️語で表現できるものしか描けない
んなわけない
その理屈だとちょっと珍しい色を指定しただけでオブジェクト一つ描画できなくなる
4826/05/25(月)00:15:17No.1433190391そうだねx1
>Animaはあくまで📦️語で表現できるものしか描けない
そのわりには自然言語すごく反映されるんだが
4926/05/25(月)00:15:23No.1433190425+
テキストエンコーダーって選択できるけど他のは使えないの?
5026/05/25(月)00:15:51No.1433190542+
段ボールに登録されてないたくわんとかも出るよ
5126/05/25(月)00:16:37No.1433190764+
ダンボールに登録されてなくて何か有用なのあるんだろうなぁ…
5226/05/25(月)00:17:55No.1433191107そうだねx3
LM Studio動かしながらだとVRAM足らないんぬ!!!!
5326/05/25(月)00:18:00No.1433191130+
danbooruにないタグを捏造しても結構効いてくれる感じするけどなanima
絶妙にタグがないんだよな〜って時めっちゃ適当にそれらしいの入れるとやってくれる
5426/05/25(月)00:18:52No.1433191372+
そもそもgelbooru語だしな
5526/05/25(月)00:18:57No.1433191392+
>LM Studio動かしながらだとVRAM足らないんぬ!!!!
画像生成AIの方に組み込んでプロンプト作ってくれるとかの機能あるけどこれがあるからいまいちな感じある
5626/05/25(月)00:19:02No.1433191413+
一応元となったモデルの知識もあるだろうから自然言語である程度danbooruにないものも出せるだろうね
danbooruにあるやつだと出やすいってのはあるけど
5726/05/25(月)00:19:10No.1433191442+
>ダンボールに登録されてなくて何か有用なのあるんだろうなぁ…
たくわん
5826/05/25(月)00:19:27No.1433191525+
Anima君はたとえば"pink light from penis shaped lamp"って指定するとしっかりピンク色に光るペニス型の照明をお出ししてくれる
もちろんdanbooru語にこんなタグは無いわけだが"penis" "lamp"  "pink" "light"らの単語と"light from 〇〇"というコンテキストを理解して再現してくれるわけである
タグにあるものをそのまんまお出ししているという単純なものではない
5926/05/25(月)00:19:32No.1433191542+
リアスでも色指定くらいは捏造してもわりと理解してくれてたしな
6026/05/25(月)00:19:42No.1433191572+
📦️には世の中のすべての情報が詰まってるからな…!
6126/05/25(月)00:19:49No.1433191598+
>ある程度信用できる本体ならともかくサプライチェーン攻撃が流行ってる中であんまり不用意に色々入れるの怖くない?
それはそう
というかComfyuiの有名pluginだってマルウェア仕込まれた過去あるしね
6226/05/25(月)00:21:29No.1433192028+
俺のプロンプトの問題かキャラクターにとっての左側って指定すると画面内での左側とめっちゃ混同してる気がする
6326/05/25(月)00:21:41No.1433192078+
fu6742363.jpg
fu6742358.jpg
セクハラじじいの相手する奴ばっか出してた…
6426/05/25(月)00:22:19No.1433192253+
地味にTEの制限で512トークン超えるとエラーになったりするのが少しめんどい
6526/05/25(月)00:22:25No.1433192277そうだねx1
>俺のプロンプトの問題かキャラクターにとっての左側って指定すると画面内での左側とめっちゃ混同してる気がする
右と左がAIちゃんにはめちゃめちゃ難しいってちゃっぴーが言ってた
6626/05/25(月)00:23:05No.1433192430+
たぶん学習する画像のキャプション付けをdanbooruタグとは別にテキストエンコーダーで自然言語で表現したタグも学習させてるのだろう
girl, boy,
girls and boys lined up(女の子と男の子が並んでいます)
みたいな感じで
だからdanbooruタグ以外の表現にも対応してる
代わりにテキストエンコーダーは固定化されちゃってるのではないかと
6726/05/25(月)00:24:13No.1433192722そうだねx1
>俺のプロンプトの問題かキャラクターにとっての左側って指定すると画面内での左側とめっちゃ混同してる気がする
あくまでベクトル空間上での配置を理解してるだけであってキャラクターや物体の主観・相関を把握してるわけではないので
位置を指定するときは素直にピクセル上でいう所の左側・右側を明示した方がいい
6826/05/25(月)00:24:37No.1433192835+
まだ移植してないけどいらすとやで使ってたwcは展開したら500トークンくらい余裕で使ってた気がするなあ
嫌だなあ
6926/05/25(月)00:28:19No.1433193821+
Qwen3の時点で文章を解釈する能力そのものは必要十分のはずだから後は学習でどこまで文章によるトレーニングを積めるかの問題なんだろうな
7026/05/25(月)00:28:23No.1433193841+
キャラの描き分けと位置関係はこれが参考になった
https://www.reddit.com/r/StableDiffusion/comments/1tl7tyi/charecter_in_anima_checkpoint_can_make_like/
AIにまとめて貰ったら
>[全体のクオリティタグや構図(例: masterpiece, cowboy shot)]
>Left girl: [左の女の子の表情や動き(例: naughty face, smug, leaning on person)]
>Boy: [中央の男の子の表情や動き(例: wavy mouth, embarrassed)]
>Right girl: [右の女の子の表情や動き(例: bright happy face, hugging boy arm)]
>Left girl: [左の女の子の具体的なキャラクター名、髪、服装、装飾の詳細]
>Boy: [中央の男の子の具体的なキャラクター名、髪、服装の詳細]
>Right girl: [右の女の子の具体的なキャラクター名、髪、服装の詳細]
>[背景やライティングの指定(例: sidelighting, space interior)]
みたいな書き方をしろとのこと
7126/05/25(月)00:28:36No.1433193893+
ただオリシコキャラ作りたいだけなのに髪型安定しなさ過ぎて久々にlora作るか…?ってなってる
7226/05/25(月)00:29:34No.1433194123+
今日はanimayumeとanimaElement7でいろいろ生成したけど公式版の方がプロンプトの反応いい気がする
7326/05/25(月)00:30:37No.1433194399+
>右と左がAIちゃんにはめちゃめちゃ難しいってちゃっぴーが言ってた
左手でって言ったら右手にするのに「じゃあ逆に右手指示するか」ってすると普通に右手にするのいいよねよくない
7426/05/25(月)00:30:45No.1433194429+
ちょっとした味変くらいのモデル使う理由あんまりないよね
7526/05/25(月)00:32:34No.1433194926+
>ただオリシコキャラ作りたいだけなのに髪型安定しなさ過ぎて久々にlora作るか…?ってなってる
俺はもう諦めて色と長さだけでいろんな髪型楽しんでるぜー!
7626/05/25(月)00:33:07No.1433195058+
自分はNovaAMで試したけどまあ絵柄は安定するんだろうけど細かい部分を操作するとbaseの方がよくない?って感じする
ベースの絵柄が好きなモデルがあるならいいと思うけどそうじゃないならILと違って派生使わなくていいな
7726/05/25(月)00:33:51No.1433195268+
>ちょっとした味変くらいのモデル使う理由あんまりないよね
サクッと使いたい人にはいるでしょ
初心者用anima的な立ち位置で
7826/05/25(月)00:33:54No.1433195284+
fu6742518.jpg
Lora無しでbroken condomっぽいの出せるようになったのは個人的にありがたい
7926/05/25(月)00:34:35No.1433195456+
カメラ要素を最初の方に書くのめどいなあ
ワイルドカードの設計やり直さないと
8026/05/25(月)00:34:49No.1433195535+
派生モデルの追加学習部分ってTEと関連付けされてないから
タグでの反応はするけど自然言語面だと恩恵あるのかなってなる
8126/05/25(月)00:35:24No.1433195702+
素材集めてキャプション整理してlora作りに精を出してたら一日終わってた
一応出来に満足してたがもっと綺麗な元画像用意できたかもと気付いてもう後悔してきてる
8226/05/25(月)00:36:42No.1433196050+
公式に一番クォリティ出るのは全部を自然言語にするパターンって書いてあるからanimaはタグ使わない方がいい
8326/05/25(月)00:36:42No.1433196051+
違くて…ちゃんと覆い被さってるMating press From aboveしてほしくて…
でもタグ記述するとその部分無理やり出そうとしてきて…
8426/05/25(月)00:36:52No.1433196087そうだねx2
むしろ反応というかバリエーション減らしたいから使うもんじゃないか派生モデル
8526/05/25(月)00:39:29No.1433196764+
animaの文法ミスってるマージは落とす価値無い
8626/05/25(月)00:40:24No.1433197021+
ikaちゃんはイラストや風味が強いね
8726/05/25(月)00:41:46No.1433197347+
今までのベースって叩き台って感じだったから
ベースがちゃんと基準点やってるモデルなのは偉いと思う
8826/05/25(月)00:41:58No.1433197402+
>違くて…ちゃんと覆い被さってるMating press From aboveしてほしくて…
>でもタグ記述するとその部分無理やり出そうとしてきて…
completely covering 〜で記述すればいいんじゃないの
8926/05/25(月)00:43:48No.1433197843+
before and afterとかinstant lossの着込んで普通に突っ立ってる状態ってなんだ…?ってなる
9026/05/25(月)00:44:38No.1433198049+
自然言語と言ってもleftとrightを全然分かってない気がする
さすがに求め過ぎか
9126/05/25(月)00:45:55No.1433198356+
>before and afterとかinstant lossの着込んで普通に突っ立ってる状態ってなんだ…?ってなる
即落ち2コマ的なのはタグでそれ関連のを並べたあとleftとrightで個別に記載するほうが手っ取り早い
左を堕ち後にするなら右はフツーにlooking at viewer and standing with arms at sidesとか適当に書いとけばいい
9226/05/25(月)00:47:12No.1433198680+
>自然言語と言ってもleftとrightを全然分かってない気がする
画面内での位置と前後関係はかなり指示効くよ
9326/05/25(月)00:47:15No.1433198686+
右と左言ってさ
画像って画面から見て左右か中のキャラの左右かなんて情報記録されてないじゃん?
9426/05/25(月)00:49:06No.1433199102+
>自然言語と言ってもleftとrightを全然分かってない気がする
ベースモデルはキャラが右手になになに左手になになにってやって7割はちゃんとなるけど
9526/05/25(月)00:49:11No.1433199121+
1人だとローカルLLMにあれこれ描いてもらえば楽だけどキャラ複数を描かせるのは無理あるのかなぁすげぇ混ざるわ
9626/05/25(月)00:49:46No.1433199256+
>画像って画面から見て左右か中のキャラの左右かなんて情報記録されてないじゃん?
📦️タグではそういうのないけど追加のキャプショニングや📦️以外のデータセットではそういうキャプションが含まれてる
Animaのベースになったcosmosも位置関係の情報は持ってるし
9726/05/25(月)00:50:06No.1433199325+
「左のキャラクターから見て右」とか「右のキャラクターから見て左」みたいなのはもう学習データぜんぜん関係なく物理法則を理解してないと解釈できないし
それはAnimaどころかGeminiとかGPTみたいなプロプラエタリモデルですら完ぺきではないながらもようやく可能になってきたレベルなので無茶振りすぎるのである
9826/05/25(月)00:50:27No.1433199394+
左右逆転はAI的には起こりうるのはもうしょうがない
でも分けられはするからそう指定するのがいい
9926/05/25(月)00:50:32No.1433199416+
>1人だとローカルLLMにあれこれ描いてもらえば楽だけどキャラ複数を描かせるのは無理あるのかなぁすげぇ混ざるわ
プロンプト晒してみ
10026/05/25(月)00:53:20No.1433200050+
やっとローカルでえっちな会話できるようにしたけどこれ立ち上げたままだとVRAM食われたままで画像生成できなくね…
10126/05/25(月)00:53:22No.1433200055そうだねx1
画面も「viewer」「scene」「screen」「frame」と色々あるのよね
色々試したら立ち位置は「frame」が一番通じていた感じ
>positioned on the right side of the frame edge
「画面の右端にいる」みたいな
10226/05/25(月)00:53:58No.1433200195+
複数キャラ学習させたlora作って書き分けを試したけどトリガータグが意味をほぼ成してないから左に誰々とか描いても全く効かない
それぞれ細かく特徴書けば出せるけど一方で髪型指定してもう一方は無しとかだと混ざったりする
単体だと綺麗に出るのに
10326/05/25(月)00:54:58No.1433200423+
普通にleftで画像左rightで画面右でだいたい出るけどなあ
10426/05/25(月)00:56:46No.1433200819+
画面左とキャラの右手とか入れるとごちゃる
10526/05/25(月)00:56:58No.1433200854+
多人数だと流石に要素が混ざることあるけどかなり頑張ってる
fu6742620.jpg
10626/05/25(月)00:57:05No.1433200876+
LLMは毎回アンロードするか
小さめのモデル使うか
遅さを受け入れて多くをRAMに逃がすかしかない
10726/05/25(月)00:57:56No.1433201065+
「右手に持たせる」「左手に持たせる」みたいなのは安定しない(キャラクターの主観を理解してるわけではないから当たり前)なので
強引に思えるかもしれないが"holding a 〇〇 with a hand on the right and holding a ◇◇ with the other hand on the left"みたいな指定をすればキッチリ従ってくれる
要するに最終的な画面上での位置関係で捉えろということだ
10826/05/25(月)01:00:12No.1433201528+
>色々試したら立ち位置は「frame」が一番通じていた感じ
良いこと聞いた
画面指定するときに使わせてもらうよありがとう


fu6742358.jpg fu6742363.jpg fu6742620.jpg 1779632475602.jpg fu6742207.jpg fu6742518.jpg