二次元裏@ふたば

画像ファイル名:1776526861381.jpg-(5113 B)
5113 B26/04/19(日)00:41:01No.1421678372そうだねx3 03:36頃消えます
irodoriやるにあたって絵文字めんどくせぇなあって思ったから作ってもらったんですよ!
生成そのものも楽しいけど生成を楽にするツール作るのも楽しいんですよ!
動かなかったら教えてなんですよ
fu6567144.zip
このスレは古いので、もうすぐ消えます。
126/04/19(日)00:42:30No.1421678778+
ほうirodoriをイジるのではなく台本を書く方を独立させたか
226/04/19(日)00:44:54No.1421679395そうだねx3
これはどういうツールなんですよ?
具体的なスクショとか説明が欲しいんですよ?
326/04/19(日)00:46:31No.1421679821+
irodori導入失敗した…と思ったら俺がbatまで用意されたのを使う赤ちゃんに長年なってただけだった
それはそれとしてプロンプト一緒でSeed一緒なのに声が変わる!!!
426/04/19(日)00:50:42No.1421680949+
ローカルLLMと連携してロールプレイにボイスをつけるまで行けた
まあ全部AIにやってもらったんだが
526/04/19(日)00:53:32No.1421681672そうだねx2
>これはどういうツールなんですよ?
>具体的なスクショとか説明が欲しいんですよ?
fu6567192.png
fu6567191.png
確かに説明不足でしたなんだよ
こんな感じで大本格部分を独立させてボタンで絵文字を挿入できるようにしましたんだよ
レイアウトも結構調整できるように作ってもらったんだよ
何日か前の「」が作ってくれたguiが動かなかったからこういうアプローチにしたんだよ
626/04/19(日)00:55:18No.1421682096+
>ローカルLLMと連携してロールプレイにボイスをつけるまで行けた
>まあ全部AIにやってもらったんだが
なにでどんな感じの指示出したかだけでも教えてくれ
726/04/19(日)00:57:17No.1421682641+
エロなし添い寝ボイスとか作れるようになるかしら
練るとき重宝しそう
826/04/19(日)00:58:51No.1421683013+
>エロなし添い寝ボイスとか作れるようになるかしら
>練るとき重宝しそう
囁き声とかで上手い事生成するか普通に生成した後で囁き声に加工すれば良い感じに出来ると思う
926/04/19(日)01:02:37No.1421683951+
やっぱ素材ってBGMなし喋りじゃなきゃだめ?
歌とかは無理?
1026/04/19(日)01:03:19No.1421684116+
>やっぱ素材ってBGMなし喋りじゃなきゃだめ?
>歌とかは無理?
ノイズ除去でBGMとか消したらまぁまぁいける
1126/04/19(日)01:04:16No.1421684426+
>確かに説明不足でしたなんだよ
>こんな感じで大本格部分を独立させてボタンで絵文字を挿入できるようにしましたんだよ
>レイアウトも結構調整できるように作ってもらったんだよ
>何日か前の「」が作ってくれたguiが動かなかったからこういうアプローチにしたんだよ
なるほどなんですよ
中々使いやすそうでDLしてみるんですよ
1226/04/19(日)01:04:38No.1421684535そうだねx1
>>ローカルLLMと連携してロールプレイにボイスをつけるまで行けた
>>まあ全部AIにやってもらったんだが
>なにでどんな感じの指示出したかだけでも教えてくれ
SillyTavernってやつ使っているからそこにAPIで送れるようにプログラム作ってもらっただけだよ
こういうのもあるけどLora適用できるようになってなかったから作ってもらった
https://github.com/arianpg/irodori-tts-api
1326/04/19(日)01:05:04No.1421684660+
音なしエロアニメなんかと組み合わせればいい感じになりそう
1426/04/19(日)01:05:48No.1421684873+
>>やっぱ素材ってBGMなし喋りじゃなきゃだめ?
>>歌とかは無理?
>ノイズ除去でBGMとか消したらまぁまぁいける
やっぱサンプルか…
1526/04/19(日)01:08:04No.1421685511+
書き込みをした人によって削除されました
1626/04/19(日)01:08:29No.1421685668+
SDの方の話題で悪いんだけどこういう感じに指の間で愛液が糸引いてるのを見せびらかす構図ってプロンプトで出る?
disembodied hand, pussy juice on fingers, pussy juice trail
あたりをこねくり回しても全然それっぽくならない
fu6567230.jpg
1726/04/19(日)01:08:56No.1421685805+
>SillyTavernってやつ使っているからそこにAPIで送れるようにプログラム作ってもらっただけだよ
>こういうのもあるけどLora適用できるようになってなかったから作ってもらった
>https://github.com/arianpg/irodori-tts-api
ありがとうAPIってよくわからんだったけど挑戦してみるかぁ
1826/04/19(日)01:10:14No.1421686162+
>SDの方の話題で悪いんだけどこういう感じに指の間で愛液が糸引いてるのを見せびらかす構図ってプロンプトで出る?
これ去年辺り挑戦してたけどILならloraなしじゃ絶対出ない
あにまちゃんならワンチャンあるかも?
1926/04/19(日)01:10:19No.1421686185+
irodoriとローカルLLMを使ってチャHbotを作れないか考えてる
2026/04/19(日)01:11:33No.1421686529+
>これ去年辺り挑戦してたけどILならloraなしじゃ絶対出ない
>あにまちゃんならワンチャンあるかも?
そっか…めちゃシコ構図なだけに残念だ
2126/04/19(日)01:12:43No.1421686837+
pussy juice 入れちゃうと反応しないのかねぇ
恥じらう表情と手と粘ついた液体で分けて結果そう見えるアプローチのがよさそうだけど
2226/04/19(日)01:15:07No.1421687499+
>irodoriとローカルLLMを使ってチャHbotを作れないか考えてる
まさに上でSillyTavernでやってるやつ
2326/04/19(日)01:17:33No.1421688087+
見てるかわからんけど前のスレでEmoji-TTSにボタン追加する更新版あげてくれた「」いたけどpyファイル壊れてるっぽい
2426/04/19(日)01:18:11No.1421688278そうだねx3
Webサービスの話だと思ってたけどもしかしてこの音声…ローカルなの?
2526/04/19(日)01:20:18No.1421688952+
ちょうどローカルLLM入れたからirodoriと連携はタイムリーだわ
2626/04/19(日)01:21:01No.1421689150+
TTSの進化が目まぐるしい印象だがATS?音声を別声に差し替えるのももっと発展してほしい
してるのかな…?
Applioも別に悪くはないけどirodoriみたいな喘ぎ声や舐め音は全然だし
2726/04/19(日)01:21:26No.1421689263+
irodoriが導線になってlm studio触り始めたんだけどgemma4って26Bからじゃないと話にならない?
とりあえず絵文字付きの簡単な台詞でも生成させようと思ったけど上手くできん…
2826/04/19(日)01:21:56No.1421689410+
>Webサービスの話だと思ってたけどもしかしてこの音声…ローカルなの?
そうだよ
2926/04/19(日)01:22:33No.1421689559そうだねx1
>Webサービスの話だと思ってたけどもしかしてこの音声…ローカルなの?
1分かからずに出てくるよ
fu6566163.mp3
fu6566166.mp3
fu6566172.mp3
fu6566182.mp3
>あぷにあげれなかったのでmega
>https://mega.nz/folder/n6RWjLrY#0psNXUx_TnXrUilCIr-Dcg
3026/04/19(日)01:22:35No.1421689571+
声のサンプリング音源用意して長尺の文章用意して切り分けて読み上げさせて厳選してそれらを結合ってとんでも無く面倒だな?
3126/04/19(日)01:22:45No.1421689603+
ローカルLLMはPCの要求スペック高いからね…
3226/04/19(日)01:22:52No.1421689637+
LLMとirodori同時に動かすのはうちのPCだとvramがギリギリすぎる…
3326/04/19(日)01:23:00No.1421689688+
>irodoriが導線になってlm studio触り始めたんだけどgemma4って26Bからじゃないと話にならない?
>とりあえず絵文字付きの簡単な台詞でも生成させようと思ったけど上手くできん…
文章力が…って話ならE4Bとかはちょっと…ってなると思うけど
Irodori用のテキスト出力程度だったらシステムプロンプトの問題だと思う
3426/04/19(日)01:23:07No.1421689716+
サンプル音声どうやって録音するのが効率的かね
3526/04/19(日)01:25:08No.1421690237+
ベース音声もirodoriで作る場合もシード値制御じゃなくてなんか作った方がいい感じ?
3626/04/19(日)01:25:13No.1421690254+
>声のサンプリング音源用意して長尺の文章用意して切り分けて読み上げさせて厳選してそれらを結合ってとんでも無く面倒だな?
自動化させようぜ!
3726/04/19(日)01:26:12No.1421690482+
5070TiだとローカルLLMどれぐらいまで行けるかね
3826/04/19(日)01:26:22No.1421690528+
もしかしてコナン君の蝶ネクタイ型変声機実現できる未来来そうな感じになってきたのか
3926/04/19(日)01:26:26No.1421690549+
>SDの方の話題で悪いんだけどこういう感じに指の間で愛液が糸引いてるのを見せびらかす構図ってプロンプトで出る?
>disembodied hand, pussy juice on fingers, pussy juice trail
>あたりをこねくり回しても全然それっぽくならない
ちょっと例としての画像の質はよくはないんだけど(指消えてる)一応animaで自然言語と上記のタグを併用してそれっぽいのは出た
ただ俺の自然言語が悪いだけかもしれんがガチャは必要だし多分モデル自体がこの構図をあまり学習してなくて割と不安定になりがちなのでlora作っちゃった方が早いと思う
fu6567268.jpg
4026/04/19(日)01:26:29No.1421690563+
>ベース音声もirodoriで作る場合もシード値制御じゃなくてなんか作った方がいい感じ?
シード値同じでも結構毎回声変わるんだよね
4126/04/19(日)01:26:35No.1421690576+
>自動化させようぜ!
一番面倒な厳選パートの自動化が出来ねぇ〜!
4226/04/19(日)01:26:51No.1421690649+
Proだけど今日1日でE4B嫁チャと音声再生まではclaudeくんが作ってくれた
opusや3.1proの設定ファイル横断ロールプレイに慣れてるからちょっとキャラ設定が怪しいけどそこはしょうがない
4326/04/19(日)01:27:26No.1421690796+
>5070TiだとローカルLLMどれぐらいまで行けるかね
qwen3.5の9bとかgemma4 26bをそれなりに動かす分には行けるよ
4426/04/19(日)01:27:34No.1421690820+
>サンプル音声どうやって録音するのが効率的かね
キャラが居るならラジオドラマとかテレビでもいいけど
ほしい部分前後ちょっと長めに切り取ってAIでBGMを消してもらってから正確に切り取ったり繋げたりする
オリジナルならボイスデザインで作っちゃえばその声をサンプルにして固定できる
4526/04/19(日)01:27:49No.1421690878+
irodori導入した!
動かすのはまた今度…
4626/04/19(日)01:28:01No.1421690929+
>5070TiだとローカルLLMどれぐらいまで行けるかね
31Bは無理だった
gemma-4-26B-A4B-it-uncensored-GGUFってのは動いてくれてるけどLLMの詳しいことはわからん…
4726/04/19(日)01:28:17No.1421690981+
claudeくんやっといて!って言ったらほぼ自動で仕組み整えてくれてこれは…未来…
4826/04/19(日)01:28:23No.1421691005そうだねx1
ローカルllmやるならvram16gbは欲しいところ
12gbでもやれることはやれるだろうけど
4926/04/19(日)01:28:55No.1421691100+
>5070TiだとローカルLLMどれぐらいまで行けるかね
32B
即応しないけどエロ小説書かせる文には使えるよ
5026/04/19(日)01:29:06No.1421691152+
そのうち2人に両耳から囁いてもらったりハモったりとかもできるようになるのかな
5126/04/19(日)01:30:23No.1421691390+
32bじゃなく31bだった
会社の4070でものろのろだけど動いてたよ
5226/04/19(日)01:31:01No.1421691521+
>文章力が…って話ならE4Bとかはちょっと…ってなると思うけど
>Irodori用のテキスト出力程度だったらシステムプロンプトの問題だと思う
システムプロンプトは絵文字キャプションの奴を改変して一覧の中からシチュに合いそうなの選んでねって感じで作ったんだけど平気で一覧外の絵文字ぶっこんで来るんだよね…
5326/04/19(日)01:32:00No.1421691705+
メモリ溢れさせても良いってならvram12gbでもいいけど速度がね…
5426/04/19(日)01:32:01No.1421691712+
kohya_ss guiでLora作り始めたけどパラメータ設定合ってるか不安すぎる
こういうのも何度か試してやるしかないのか
5526/04/19(日)01:32:24No.1421691777+
>そのうち2人に両耳から囁いてもらったりハモったりとかもできるようになるのかな
>>文章力が…って話ならE4Bとかはちょっと…ってなると思うけど
>>Irodori用のテキスト出力程度だったらシステムプロンプトの問題だと思う
>システムプロンプトは絵文字キャプションの奴を改変して一覧の中からシチュに合いそうなの選んでねって感じで作ったんだけど平気で一覧外の絵文字ぶっこんで来るんだよね…
ああそれっぽい文章は得意だけど
そういう推論は得意じゃないと思う
5626/04/19(日)01:32:56No.1421691887+
gemma4 31bQ4とirodoriでVRAM32GBがギリギリな感じ
5726/04/19(日)01:33:16No.1421691946+
>kohya_ss guiでLora作り始めたけどパラメータ設定合ってるか不安すぎる
>こういうのも何度か試してやるしかないのか
そうです
ただ動いてる時のログ食わせたらこれは設定良くないですね!とかはある程度Geminiとか教えてくれるよ
5826/04/19(日)01:33:24No.1421691962そうだねx1
正直絵文字なくても長めの文章だと感情かなり的確に理解して生成してて凄くね…?ってなってる
5926/04/19(日)01:33:39No.1421692002+
irodori入れてみたけど凄いね…
本物の声でキミってさーできちゃうよ…
6026/04/19(日)01:34:00No.1421692073+
>正直絵文字なくても長めの文章だと感情かなり的確に理解して生成してて凄くね…?ってなってる
👄無しでもんちゅとかから始めたら勝手にキスしてくれるしな
6126/04/19(日)01:34:10No.1421692102+
>irodori入れてみたけど凄いね…
>本物の声でキミってさーできちゃうよ…
これイラストとかよりずっとダメなやつだなって思ってる
6226/04/19(日)01:35:07No.1421692267+
結構みんな生成AIの為のアレコレを作ったりしてるもんなの?
6326/04/19(日)01:35:14No.1421692287+
>正直絵文字なくても長めの文章だと感情かなり的確に理解して生成してて凄くね…?ってなってる
絵文字は素材の声の感情から強引に感情変える必要ある時以外いらんね
しかし絵文字の効果だいぶ強いのが驚きがある
6426/04/19(日)01:35:49No.1421692399+
初歩も初歩の質問だけどLORAってどのくらいまで重ねてOKなんだっけ
絵柄LORAなんか強度1のまま3つも重ねて使っちゃうと大変なことになるけど
6526/04/19(日)01:36:01No.1421692437+
問題は絵文字盛りすぎると誇張されたおじさん構文みたいになってすごい微妙な気持ちにさせられることだな…
6626/04/19(日)01:36:24No.1421692503+
>結構みんな生成AIの為のアレコレを作ったりしてるもんなの?
絵作って動画にして声作って編集してテレ裏に上げてってやってるわ
6726/04/19(日)01:37:11No.1421692648+
>絵柄LORAなんか強度1のまま3つも重ねて使っちゃうと大変なことになるけど
何とかなる奴もあるし何とかならない奴もあるというだけ
実はタグの方で呼べるのはそれでやると数を増やせたりする
6826/04/19(日)01:37:24No.1421692696そうだねx1
自分用の10分くらいのASMRでも作るかあってやってるけどエロ文章描くのって大変だな…
6926/04/19(日)01:37:42No.1421692752+
>初歩も初歩の質問だけどLORAってどのくらいまで重ねてOKなんだっけ
>絵柄LORAなんか強度1のまま3つも重ねて使っちゃうと大変なことになるけど
こればっかは個々の環境すぎてなんとも言えない
LORAも相性とかあるし使ってるUIなんかでも変わってくるし
comfyuiだったら細かくLORAの適応タイミングズラして喧嘩しないようにとか生成ステップとi2i混ぜたりもできるが
7026/04/19(日)01:38:00No.1421692798+
>初歩も初歩の質問だけどLORAってどのくらいまで重ねてOKなんだっけ
>絵柄LORAなんか強度1のまま3つも重ねて使っちゃうと大変なことになるけど
キャラに3つ背景で2つシチュエーションで2つ陰毛に1つまんこに2つとかザラにやってるがなんぼでも行けると思う
7126/04/19(日)01:38:20No.1421692865+
gemma4 26b使いはじめたけどメインメモリ32GBが簡単にカツカツになる
コンテキストがかさむとこんなにメモリ食うの…?
7226/04/19(日)01:38:50No.1421692955+
>gemma4 26b使いはじめたけどメインメモリ32GBが簡単にカツカツになる
>コンテキストがかさむとこんなにメモリ食うの…?
消費ちょっと下げて速度落とせばいい
7326/04/19(日)01:41:15No.1421693406+
loraの効きはベースモデルの影響もモロに受けるから
個々のパラメータだけじゃ意味が無い
7426/04/19(日)01:42:14No.1421693580+
例えば騎乗位なんかはプロンプトだけでもせいせいできるけど
お気に入りの騎乗位イラスト100枚くらい用意してLORA化すれば
もっといい感じの騎乗位イラスト出せるようになったりするんだろうか
7526/04/19(日)01:43:04No.1421693721+
irodori導入してみたけどこんな簡単に好きな声で好きなセリフ喋らせられるんだ…ってなってる
7626/04/19(日)01:44:16No.1421693925+
音声生成は1年ぐらい前に触ってたけど彩りが何回も話題になるならそんなすごいんだろうな…
7726/04/19(日)01:45:23No.1421694093+
>結構みんな生成AIの為のアレコレを作ったりしてるもんなの?
AIの仕組み上どうしてもガチャ要素あるから何回も繰り返すなら効率化したいじゃん
7826/04/19(日)01:46:00No.1421694186+
Irodoriはアウトプットもいい感じだけど何より生成がすごい早い
7926/04/19(日)01:46:17No.1421694225+
全自動!!もいいけど俺のチンコはワガママだから結局手入れないとなんだよな
そうなるとツール作らざるを得ない
8026/04/19(日)01:46:19No.1421694229+
>SDの方の話題で悪いんだけどこういう感じに指の間で愛液が糸引いてるのを見せびらかす構図ってプロンプトで出る?
Waiでこんな感じが俺の限界
fu6567305.jpg
pussy juiceやsalivaにすると構図が強く影響受けて再現難しくなるから代用してる
8126/04/19(日)01:47:42No.1421694457+
音声は好きな声帯できた!
…で何を喋らせんの?
ってなっちゃう
ずりあやでも読ませるか…?
8226/04/19(日)01:47:49No.1421694476+
>Irodoriはアウトプットもいい感じだけど何より生成がすごい早い
5秒かそこらで30秒以上のセリフが出力できるのすごいよね
絵文字入れなくてもセリフだけでニュアンス汲み取ってくれるし
8326/04/19(日)01:48:25No.1421694567+
grokでemojianotation込みでエロいセリフ書いてってお願いしたらいい感じの出してくれた
8426/04/19(日)01:48:56No.1421694648+
同人音声買うと台本ついてるタイプがあって何のためにあるのかわからなかったけど今ならわかる
8526/04/19(日)01:49:21No.1421694718+
ずんだもんみたいな合成音声もそのうちこういうAI音声に置き換わっていくんかな
8626/04/19(日)01:49:36No.1421694765+
>コンテキストがかさむとこんなにメモリ食うの…?
食うよ
メインメモリ使い切るとSSDへのスワップがかなりの量になるから気にしたほうがいいかも
8726/04/19(日)01:49:44No.1421694775+
好きなキャラクターで上海飯店できるってコト!?
8826/04/19(日)01:49:53No.1421694800+
台詞次第で参照音声と似てる時と似てない時が結構あるなぁ
8926/04/19(日)01:50:29No.1421694885+
同人誌の台詞読んでもらおうかな
9026/04/19(日)01:51:00No.1421694970+
>Irodori用のテキスト出力程度だったらシステムプロンプトの問題だと思う
軽い台詞も無理かと思ってたんだけどシステムプロンプトもしっかりした奴作れば以外とそれっぽい台詞作れたわ
9126/04/19(日)01:53:31No.1421695340+
>台詞次第で参照音声と似てる時と似てない時が結構あるなぁ
音声のLORAとかどう作るんだろうね
9226/04/19(日)01:56:06No.1421695689+
>>台詞次第で参照音声と似てる時と似てない時が結構あるなぁ
>音声のLORAとかどう作るんだろうね
合計10分ぐらいの音声データ用意してEmojiTTSについてるデータセット作成タブで音声の切り分けと台詞書き出ししてもらって
Lora作成タブでなんか作れると思うよ
9326/04/19(日)01:56:18No.1421695726+
>5070TiだとローカルLLMどれぐらいまで行けるかね
GPU電力制限してるしllmの設定全然詰めてないけど
gemma-4-26B Q4_K_XL 12万コンテキスト(KVキャッシュQ8) 40トークン/秒
gemma-4-31B Q4_K_M 1万コンテキスト(KVキャッシュQ8) 4.6トークン/秒で個人的には耐えられない遅さ
9426/04/19(日)01:57:30No.1421695901+
>合計10分ぐらいの音声データ用意してEmojiTTSについてるデータセット作成タブで音声の切り分けと台詞書き出ししてもらって
>Lora作成タブでなんか作れると思うよ
そこもセットになっていたのか…何も見てなかったわ
しかし10分はまあ長めだが
教えてくれてありがとう
9526/04/19(日)01:59:53No.1421696215そうだねx1
>しかし10分はまあ長めだが
>教えてくれてありがとう
音声データの質次第だから5分前後でも良い感じになるかもだけどLora作成を解説してる人がいないからわからない…
9626/04/19(日)01:59:59No.1421696229+
設定詰めてからノベル書いてもらうなら2トークン秒でもわりと平気だな俺は
他のことしながらだからってのはある
9726/04/19(日)02:00:51No.1421696354+
色々見ててローカル環境に手を出したいなと思ったらメインメモリの貧弱さのせいで二の足を踏むことになっていっぱい悲しい
空からメモリ降り注がねえかな…
9826/04/19(日)02:01:16No.1421696425そうだねx3
32で十分だと思っていた昔の俺…
9926/04/19(日)02:01:26No.1421696444+
いよいよanimaに移住するときが来たかと思って色々こねくり回してるけど絵柄タグがめっちゃ不安定なのはどうしようもないのかなこれ
@付けるのが正しいんだよね?
10026/04/19(日)02:02:40No.1421696628+
どうせ買うなら64Gでしょって判断した去年の俺は的確だったと思う
10126/04/19(日)02:03:13No.1421696696そうだねx4
64使ってるけど128にしときゃよかったなってなってるよ
10226/04/19(日)02:06:47No.1421697256+
AnimaのLoRAパラメータ色々試してるがなんかしっくりこない
絵柄は良いけど細部がいらすとやほど覚えてくれない…
10326/04/19(日)02:08:35No.1421697621+
パラメータよくわかんないならkohya lora param guiのとこのプリセット使うのもいいぞ
10426/04/19(日)02:11:01No.1421698025+
音声からテキスト書きおこし用のアプリ作成も
書きおこした文章の校正と絵文字アノテーション付与も全部Claudeに投げる事が出来る
10526/04/19(日)02:11:09No.1421698047+
メインメモリ16GBでもなんとかなってはいるけど窮屈すぎて悩んでないで買っとけよあの時の俺ってなってる
10626/04/19(日)02:11:37No.1421698128+
>パラメータよくわかんないならkohya lora param guiのとこのプリセット使うのもいいぞ
あそこのプリセット弄って改良してきたはずなんだがな…
まあ初心に帰ってデータセット作り直してプリセットそのままやるか…
10726/04/19(日)02:12:21No.1421698238+
何もわからん状態なんだけどそこそこ喋らせてむっ!って声出せたら下地にする方法ってどんな感じなの?
10826/04/19(日)02:12:50No.1421698305+
イラストも音声も生成できて助かる…
週末シコってばっかになったが
10926/04/19(日)02:13:43No.1421698453+
>いよいよanimaに移住するときが来たかと思って色々こねくり回してるけど絵柄タグがめっちゃ不安定なのはどうしようもないのかなこれ
>@付けるのが正しいんだよね?
ここを参考にするのだ
https://thetacursed.github.io/Anima-Style-Explorer/index.html
11026/04/19(日)02:13:49No.1421698466+
AI触り始めてから無限にシコれるけど間違いなくQOLは落ちたな…
11126/04/19(日)02:14:09No.1421698520+
>何もわからん状態なんだけどそこそこ喋らせてむっ!って声出せたら下地にする方法ってどんな感じなの?
t2iガチャしてi2iと一緒よ
11226/04/19(日)02:15:53No.1421698764+
スレ「」のzipの中身どう扱えばいいの
11326/04/19(日)02:17:08No.1421698923+
IRODORIなるもの導入中だけどあんまりパイソンだのGithubだの知らずにやってるから
うまく導入できているかわからない
11426/04/19(日)02:17:50No.1421699067+
>IRODORIなるもの導入中だけどあんまりパイソンだのGithubだの知らずにやってるから
>うまく導入できているかわからない
AIに聞けばいいよ
11526/04/19(日)02:17:56No.1421699079+
>メインメモリ16GBでもなんとかなってはいるけど窮屈すぎて悩んでないで買っとけよあの時の俺ってなってる
16GBでもいけるにはいけるもんなのか…
11626/04/19(日)02:18:20No.1421699133そうだねx2
>IRODORIなるもの導入中だけどあんまりパイソンだのGithubだの知らずにやってるから
>うまく導入できているかわからない
なんかエラー吐いたらコピペしてAIになげれば解決するよ
11726/04/19(日)02:18:22No.1421699138+
>スレ「」のzipの中身どう扱えばいいの
クロームもエッジもブラウザで動くはず
ただPC前提だからスマホは無理なのともしかしたらWindowsのバージョンとかで無理かも
11826/04/19(日)02:19:31No.1421699343+
>あそこのプリセット弄って改良してきたはずなんだがな…
あそこのプリセットが万能で何でもいけるって訳じゃないから基本から探ってったほうがいいよ
個人的な結論としてはSD時代のアルファをDimの半分にするとかTEの学習率を半分にするとかはAnimaに当てはまらない
11926/04/19(日)02:20:45No.1421699566+
>t2iガチャしてi2iと一緒よ
やることはわかってもこっちで何するかがわかんねぇ段階だからもうちょっとわかりやすく言ってほしいぜ…!
12026/04/19(日)02:21:12No.1421699640そうだねx1
pythonはuvだのpipだの派閥あるしライブラリもバージョン差異で全く動かないとかザラだしごちゃごちゃしすぎ
12126/04/19(日)02:21:21No.1421699675+
>16GBでもいけるにはいけるもんなのか…
ぶっちゃけVRAMから溢れなければメインメモリは最低でもいいし…そりゃあったほうがいいけど
12226/04/19(日)02:22:49No.1421699865+
すみませんこのirodoriって推しのVtuberにえっちなことを言わせることが出来るツールで間違いないですか
12326/04/19(日)02:23:21No.1421699924+
Irodori-TTSの機能は2種類あって
・テキストから音声を作るボイスデザインモード
・音声データから学習して音声を作るボイスクローンモード
がある
ボイスデザインの方は「人妻で優しい声」「メスガキで生意気な性格」とかテキストに入れるとそれっぽい声を合成してくれる
ボイスクローンは数秒の音声データから学習して音声を作れる
ちなみにボイスデザインで作った音声をボイスクローンで学習させる事もできる
12426/04/19(日)02:24:09No.1421700025+
>やることはわかってもこっちで何するかがわかんねぇ段階だからもうちょっとわかりやすく言ってほしいぜ…!
Voice DesignとReference Audioの2種類の動作があって
前者はしゃべらせたいテキストとは別にクールな女教師とか明るく元気な声とかどんな声なのかを入力できる
後者は音声ファイルを元にそれと同じようなボイスをしゃべらせることができる
12526/04/19(日)02:24:57No.1421700182+
Webuiで生成する声のオプションみたいなの入れられるのかね
プロンプトに直せつ人妻風とか入れる?
12626/04/19(日)02:24:59No.1421700187+
Loraが思うように作れないーどうしてー
12726/04/19(日)02:25:17No.1421700226+
>Voice DesignとReference Audioの2種類の動作があって
>前者はしゃべらせたいテキストとは別にクールな女教師とか明るく元気な声とかどんな声なのかを入力できる
>後者は音声ファイルを元にそれと同じようなボイスをしゃべらせることができる
ほんとにわかりやすく説明してくれてデカパイ感謝
じゃあほくのかんがえたセクシーおねえさんボイス作ってくる!!!
12826/04/19(日)02:26:19No.1421700367+
LORA作りを覚えるとLORA作るのがメインになっちゃって
肝心のエッチイラストを作るのがおざなりになったりするぞ
12926/04/19(日)02:26:42No.1421700418+
Animaは計算量は増えるけどメモリ消費はSDXLより減るから
メモリ16GBVRAM8GBでもしっかり動いてくれるんだよね
13026/04/19(日)02:27:58No.1421700587+
キャラloraはよくわかんなくて四枚でグリグリポージングできるの作れたと思ったら
50枚ぐらい使っても服装固定でセックスタグ入れても直立で竿役が挟み込まれるのになったりよぐわかんにゃい!
13126/04/19(日)02:28:36No.1421700665+
Irodoriって初回起動時間かかったりする?
起動コマンド入力して数分くらいたってるんだけど起動しない
13226/04/19(日)02:29:06No.1421700739+
>Irodoriって初回起動時間かかったりする?
>起動コマンド入力して数分くらいたってるんだけど起動しない
モデルダウンロードしてるんでないかな
13326/04/19(日)02:29:28No.1421700768+
参照用の音声はどんな感じがいいの?
13426/04/19(日)02:29:30No.1421700772+
>pythonはuvだのpipだの派閥あるしライブラリもバージョン差異で全く動かないとかザラだしごちゃごちゃしすぎ
ForgeNeoがpythonのバージョン他と違うとかで拡張入れると起動しなくなったり
13526/04/19(日)02:29:37No.1421700784+
>Irodoriって初回起動時間かかったりする?
>起動コマンド入力して数分くらいたってるんだけど起動しない
初回はモデルデータをDLしてる
全部で10GBちょいあるからしばしまたれよ
13626/04/19(日)02:30:16No.1421700866そうだねx1
多分俺と同じタイプの赤ちゃんなんだろうけど
コマンドを実行するとローカルブラウザUIのアクセスを起動するだけで別に開いたりしないからURL打とうな!!
13726/04/19(日)02:31:15No.1421701035+
>参照用の音声はどんな感じがいいの?
ノイズが乗ってない音声を10秒〜30秒くらい
13826/04/19(日)02:31:19No.1421701062+
>参照用の音声はどんな感じがいいの?
参照する部分を指定できるから何でもいいぞ
十数分の音声でもトリミングする必要もない
範囲指定するだけでその部分から学習してくれる
13926/04/19(日)02:31:32No.1421701120+
台本書いてもらおうとlmstudioインストールまでしたが思ったよりポンコツだった
Gemma-4-E4B-Uncensored-HauhauCS-Aggressive使ってるけど指示が悪いんだろうか
屈服すんなって言ってるのにすぐ屈服しちゃう
14026/04/19(日)02:31:49No.1421701194+
>多分俺と同じタイプの赤ちゃんなんだろうけど
>コマンドを実行するとローカルブラウザUIのアクセスを起動するだけで別に開いたりしないからURL打とうな!!
これもAIに聞いたらこういうファイル作れば自動でブラウザ開くのまでやってくれるバッチ作ろう!とか教えてくれるからすごいねAI
14126/04/19(日)02:32:06No.1421701243+
0.0.0.0って書いてあるけどlocalhostに置き換えるんだぞ
14226/04/19(日)02:33:05No.1421701411+
>台本書いてもらおうとlmstudioインストールまでしたが思ったよりポンコツだった
>Gemma-4-E4B-Uncensored-HauhauCS-Aggressive使ってるけど指示が悪いんだろうか
>屈服すんなって言ってるのにすぐ屈服しちゃう
この4Bってのが戦闘力でこの数字がデカいほど凄いと思えばよい
4Bはそんな賢くはない
14326/04/19(日)02:33:07No.1421701416+
赤ちゃんはコンソール上のURLをCtrlクリックすると幸せになれると思われる
14426/04/19(日)02:33:29No.1421701461+
俺も起動コマンド叩いてなんも起きなくてあれ…?ってなってから非常にわかる
叩いたコマンドはマジで起動コマンドなので別にGUIを開いたりしてはくれないのだ…
14526/04/19(日)02:33:34No.1421701471+
>Gemma-4-E4B-Uncensored-HauhauCS-Aggressive使ってるけど指示が悪いんだろうか
E4Bはそりゃね
最低でも26b使おう
14626/04/19(日)02:34:44No.1421701638+
>>参照用の音声はどんな感じがいいの?
>参照する部分を指定できるから何でもいいぞ
>十数分の音声でもトリミングする必要もない
>範囲指定するだけでその部分から学習してくれる
マジ?どこ?
14726/04/19(日)02:35:34No.1421701775+
>マジ?どこ?
読み込んだ音声の波形のところ
14826/04/19(日)02:35:41No.1421701791+
なんだかんだAI先生に頼りっぱなしとは言え徐々にパソコン知識がついていくぜ!
14926/04/19(日)02:36:11No.1421701865+
まともにロールプレイや小説書かせるならgemma4 31bとかqwen3.5 27bとかは欲しい
15026/04/19(日)02:36:12No.1421701866+
難しい言葉わかんね!たすけてcopilot!
15126/04/19(日)02:36:33No.1421701914+
これ導入するにあたって容量何GBくらい必要?
絵と文でだいぶもうカツカツなんだよね
15226/04/19(日)02:38:00No.1421702134+
サクサク動かないだけで画像生成が出来るスペックのPCなら31Bだって動作がしてくれるハズ
クソ重いけどやっぱりクオリティは高いし思考モードオンにしたら我が家の環境だと3000文字の出力に10分ぐらいかかるけど
それでも自分で書くよりは1000倍ぐらい早いし…
15326/04/19(日)02:38:03No.1421702146+
>多分俺と同じタイプの赤ちゃんなんだろうけど
>コマンドを実行するとローカルブラウザUIのアクセスを起動するだけで別に開いたりしないからURL打とうな!!
俺は赤ちゃんだった
ようやっと起動できたよ
15426/04/19(日)02:38:10No.1421702167+
Pythonのこと何も分からんけど全部Geminiくんに聞いてインストール用のバッチファイルを作って貰ってる
凄い時代になったもんだ
15526/04/19(日)02:38:25No.1421702217+
>難しい言葉わかんね!たすけてcopilot!
高いAIはコード用にケチりたいから俺もわからない単語とかはコパイちゃんに頼んでる
雑に使えるいい女だよ
15626/04/19(日)02:38:40No.1421702266+
irodoriのlora作ってるけど音声似てくるまで学習すると過学習になってテキストを追従しなくなってなかなか難しい…
15726/04/19(日)02:39:41No.1421702425+
>>マジ?どこ?
>読み込んだ音声の波形のところ
枠あったのか…
適当にぶち込んだのが長すぎて探しに行かないとならんかった
15826/04/19(日)02:40:13No.1421702502+
>>Gemma-4-E4B-Uncensored-HauhauCS-Aggressive使ってるけど指示が悪いんだろうか
>E4Bはそりゃね
>最低でも26b使おう
なるほど…26bで出て来るやつはファイルサイズの時点でうちじゃ無理ぃってなるな
15926/04/19(日)02:41:09No.1421702651+
リファレンス音声で範囲指定した後ハサミのマーク押すとフリーズするんだけど何なの?
16026/04/19(日)02:41:23No.1421702677+
俺はemoji導入する時に<this-repo>をそのままコピペしてた赤ちゃん!
16126/04/19(日)02:42:49No.1421702906+
>なるほど…26bで出て来るやつはファイルサイズの時点でうちじゃ無理ぃってなるな
モデル全部vramにのせなくてもいいから割と動くぞ
16226/04/19(日)02:42:55No.1421702928+
バグあってもこれバグ?って聞くと直してくれる
16326/04/19(日)02:43:25No.1421703018+
lora作ってる最中でもtensorboardなるもので状況が見れると聞いたがグラフがどの時点でもNaNで動かないのは根本的になにか間違えてるな?
16426/04/19(日)02:44:36No.1421703169+
EmojiはバグあるからAI修正してもらおう
16526/04/19(日)02:44:39No.1421703172+
これって30秒が上限かな
16626/04/19(日)02:45:26No.1421703358+
>なるほど…26bで出て来るやつはファイルサイズの時点でうちじゃ無理ぃってなるな
GPUメモリからある程度逃すオフロード・KVキャッシュ量子化など使えば極端に遅くさせずに使えたりするよ
文章やロールプレイさせたいならモデルはQ4以上でないと質が担保できないけど
16726/04/19(日)02:47:16No.1421703679+
>lora作ってる最中でもtensorboardなるもので状況が見れると聞いたがグラフがどの時点でもNaNで動かないのは根本的になにか間違えてるな?
sd-scripts(そのGUIである
Kohya_lora_param_gui含む)で取得できるlossは基本的に指標としては役に立たないので気にしなくていいよ
16826/04/19(日)02:47:48No.1421703762+
>リファレンス音声で範囲指定した後ハサミのマーク押すとフリーズするんだけど何なの?
確かハサミだとトリミングして再レンダリングするから時間が掛かる
ぶっちゃけ切らなくても範囲指定したまま学習させちゃえばいいと思う
それでもいけたはず
16926/04/19(日)02:49:11No.1421703991+
>>リファレンス音声で範囲指定した後ハサミのマーク押すとフリーズするんだけど何なの?
>確かハサミだとトリミングして再レンダリングするから時間が掛かる
>ぶっちゃけ切らなくても範囲指定したまま学習させちゃえばいいと思う
>それでもいけたはず
指定しただけだとトリミングできてないと思うんだよな
50秒のやつで15秒トリミングしたけどログには50秒は長いから30秒にするね的なメッセージでてきたし
17026/04/19(日)02:51:52No.1421704440+
>>lora作ってる最中でもtensorboardなるもので状況が見れると聞いたがグラフがどの時点でもNaNで動かないのは根本的になにか間違えてるな?
>sd-scripts(そのGUIである
>Kohya_lora_param_gui含む)で取得できるlossは基本的に指標としては役に立たないので気にしなくていいよ
そうなの!?
じゃあもっかい回してみる!さんきゅー!
17126/04/19(日)02:52:59No.1421704603+
webexなりで画面まるごと共有して通話しながらどこをどう設定するって手取り足取り教えてほしい〜!
17226/04/19(日)02:56:55No.1421705105+
今はその辺の大手のAIに聞けば手取り足取り教えてくれるからいい時代よね
17326/04/19(日)02:57:30No.1421705156+
>モデル全部vramにのせなくてもいいから割と動くぞ
>GPUメモリからある程度逃すオフロード・KVキャッシュ量子化など使えば極端に遅くさせずに使えたりするよ
>文章やロールプレイさせたいならモデルはQ4以上でないと質が担保できないけど
VRAM4gbでエロ絵生成してた時にCドライブにゴリゴリ書き込みしてた記憶があってVRAM内に収めないとって思ってた
17426/04/19(日)02:58:09No.1421705221+
俺はエロい絵を作りたいだけなのになんでPython詳しくなってるんだろ…
17526/04/19(日)02:59:22No.1421705332+
>俺はエロい絵を作りたいだけなのになんでPython詳しくなってるんだろ…
俺はエロい絵を作りたいだけだからPython詳しくはなってないぜ…なんか出来てる…
17626/04/19(日)02:59:45No.1421705372+
>webexなりで画面まるごと共有して通話しながらどこをどう設定するって手取り足取り教えてほしい〜!
そう遠くない未来にはそうなりそうなのが凄い…
17726/04/19(日)03:00:02No.1421705404+
>俺はエロい絵を作りたいだけなのになんでPython詳しくなってるんだろ…
俺はいつまで経っても何やってるか理解できなくて作業ファイルの指定…?の時もvenv…?の仮想環境…?に入る時もいちいちコマンドをググッてるぞ
17826/04/19(日)03:00:35No.1421705445+
>webexなりで画面まるごと共有して通話しながらどこをどう設定するって手取り足取り教えてほしい〜!
まぁぶっちゃけAIに画像貼ってやり取りすれば似たようなことはできる
17926/04/19(日)03:01:00No.1421705493+
>>webexなりで画面まるごと共有して通話しながらどこをどう設定するって手取り足取り教えてほしい〜!
>そう遠くない未来にはそうなりそうなのが凄い…
相手がAIなだけで振り込め詐欺とおんなじだ
18026/04/19(日)03:02:20No.1421705606+
claudeのcoworkってそういうことの凄い版で使えるのかね
codeの方ばっか使ってるからわかんなくて
18126/04/19(日)03:02:23No.1421705611+
>webexなりで画面まるごと共有して通話しながらどこをどう設定するって手取り足取り教えてほしい〜!
金払えばそういうの誰かしらやってくれそう
18226/04/19(日)03:03:16No.1421705687+
エラー画面をスクショしてGeminiに見せて説明させてるわ
18326/04/19(日)03:03:52No.1421705744+
最初はコピペしてたコードも今はほんのり意味がわかる
やはり慣れは大事
18426/04/19(日)03:04:45No.1421705816+
あちこちでPython入れてねって言われていろんなバージョン入れてよくわからなくなっている
18526/04/19(日)03:05:01No.1421705837+
geminiに質問するのって有料版じゃなくてもちゃんと答えてくれる?
18626/04/19(日)03:06:05No.1421705925+
有料版使ってるからわからない
18726/04/19(日)03:08:30No.1421706099+
chatgptにいろいろ聞きながら導入はできた
18826/04/19(日)03:08:57No.1421706127+
Pythonはワンフォルダに全部入れてPC環境を汚さないvenvの仮想環境でやるのがいいぞ
18926/04/19(日)03:09:21No.1421706163+
>そうなの!?
同じ学習画像のままオプティマイザだけ変えてもグラフの折れ線パターン自体は変わらない
オプティマイザが違えばLoRAの結果は大きく変わるのに
つまり学習中の内容を見て変化してる数値ではないということ
具体的にはstepごとに選択される画像と選ばれたタイムステップの組み合わせで基本のloss値は決まってる
19026/04/19(日)03:10:02No.1421706211+
grokに聞いたりgoogleのai検索で聞いたり…前者は聞きすぎると課金するか数時間待たされるけど
19126/04/19(日)03:17:53No.1421706773+
aistudioの無料枠使えばいいよ
一般人はそれで困らない
19226/04/19(日)03:24:10No.1421707187そうだねx1
AIって前提条件考慮してくれないから適当に聞いてやってるだけだと環境ぶっ壊れたりするから気を付けてくれよな
19326/04/19(日)03:33:51No.1421707776+
出来た…俺の考えた最強セクシー低音あらあらお姉さんが…


fu6566172.mp3 fu6567268.jpg fu6567230.jpg fu6566166.mp3 fu6567192.png fu6566163.mp3 fu6566182.mp3 fu6567305.jpg 1776526861381.jpg fu6567191.png