二次元裏@ふたば

画像ファイル名:1779987427502.png-(119066 B)
119066 B26/05/29(金)01:57:07No.1434548818+ 09:09頃消えます
アナルの新作来た?
このスレは古いので、もうすぐ消えます。
126/05/29(金)01:58:02No.1434548923+
来ましたよ!
226/05/29(金)02:00:59No.1434549218+
痔瘻かな?
326/05/29(金)02:01:53No.1434549317+
4.8か
だいぶ細かく刻むな
426/05/29(金)02:06:50No.1434549910+
嘘付かなくなったらしいね
526/05/29(金)02:07:00No.1434549924+
産んでたからちょっと重かったのか
626/05/29(金)02:07:38No.1434549996+
何が変わった?
726/05/29(金)02:10:02No.1434550279+
喋り出しが早いから省力化を頭良くでもしたのか単に鯖が省力化設定なのか
826/05/29(金)02:16:15No.1434550950+
あ、消してしまいました
みたいなのかわいいけどやめて
926/05/29(金)02:16:49No.1434551014そうだねx1
>あ、消してしまいました
>みたいなのかわいいけどやめて
可愛くない…
1026/05/29(金)02:16:50No.1434551015+
4.7は結構失敗作だと思う
1126/05/29(金)02:19:10No.1434551276そうだねx1
>4.7は結構失敗作だと思う
他所よりはいい子だったと思う
曖昧さへの対応が予測しやすくてこっちが書き方ミスったのわかりやすい
1226/05/29(金)02:20:56No.1434551484+
>他所よりはいい子だったと思う
それはそうなんだけど指示の無視の仕方とか嘘のつき方がGPTにやたら似てて使いづらい
1326/05/29(金)02:22:35No.1434551652そうだねx1
>それはそうなんだけど指示の無視の仕方とか嘘のつき方がGPTにやたら似てて使いづらい
それはプロンプトに原因があるのでは…?
1426/05/29(金)02:25:48No.1434551981そうだねx6
>それはプロンプトに原因があるのでは…?
それはない
1526/05/29(金)02:26:16No.1434552029+
>4.7は結構失敗作だと思う
驚き屋がそう言ってるよね
1626/05/29(金)02:27:08No.1434552116そうだねx2
>>それはプロンプトに原因があるのでは…?
>それはない
開発者でも言い切れないこと言い切れるのすごいね
1726/05/29(金)02:29:12No.1434552268+
>開発者でも言い切れないこと言い切れるのすごいね
プロンプトでブレるような使い方じゃ無いから普通に言い切れるわ
1826/05/29(金)02:36:29No.1434552813+
序盤の4.7は酷かったけどイーロンから計算資源貰った日からは結構いい感じになった
1926/05/29(金)02:37:26No.1434552894そうだねx1
>プロンプトでブレるような使い方じゃ無いから普通に言い切れるわ
プロンプト以外に原因があるのにブレるの?
2026/05/29(金)02:38:40No.1434552985+
gemini 3.0 といい chatgpt 5.1〜5.3といい 微妙に失敗したモデルがあるときだけは迅速にバージョン上がるな
ところでhikuはいつまで4.5のままで?
2126/05/29(金)02:38:43No.1434552993そうだねx10
>>開発者でも言い切れないこと言い切れるのすごいね
>プロンプトでブレるような使い方じゃ無いから普通に言い切れるわ
AIが同じ入力したら毎回同じ答え返すと思ってそう
2226/05/29(金)02:40:13No.1434553123+
>ところでhikuはいつまで4.5のままで?
あれを使う場面が思い浮かばないくらいには何やらせてもひどいから廃止されてもいいレベル
2326/05/29(金)02:41:50No.1434553251+
>あれを使う場面が思い浮かばないくらいには何やらせてもひどいから廃止されてもいいレベル
チャットとして残す意味はないけどエージェントとして使われる小間使いなのでは
2426/05/29(金)02:42:10No.1434553276+
ミュトスくんはいつ触らせてくれるの?
2526/05/29(金)02:46:00No.1434553557+
>チャットとして残す意味はないけどエージェントとして使われる小間使いなのでは
小間使いでも使うのを躊躇うくらいには気軽に失敗しまくるしタスク完遂できないし終いには任務放棄してくる…
2626/05/29(金)02:48:17No.1434553722+
haikuになにか任せるくらいならflash3.1liteの方が遥かにましだろう
まあgeminiも急にflashの価格吊り上げてきたし低価格帯は提供側のコスパ終わってるんだろうな
2726/05/29(金)02:52:38No.1434554003+
しょーもないエロにしか使えない
CCでモデル選択出来る事も知らない
対話形式で規制回避したぐらいでハックした気になってる雑魚ユーザのモデル評価とか
失笑してくださいって言ってるようなもんでしょ
2826/05/29(金)03:00:11No.1434554478+
かなり早めのリリースだし4.7が失敗だった自覚はあったんだろうなぁ
2926/05/29(金)03:01:02No.1434554520+
4.6の方が使い慣れてて4.7から戻ってきた人もいるだろうにもう4.8か
書いてて思ったけどOSのバージョン論争みたいになってきたな
3026/05/29(金)03:01:02No.1434554521+
>ミュトスくんはいつ触らせてくれるの?
数週間以内にミュトスレベルのやつをリリースするってさ
公式の紹介ページで
3126/05/29(金)03:09:21No.1434554954+
haiku使ったことないけどそんなひどいのか
flashliteとか以下か
flashliteマジでバカだぞ俺よりバカだぞマジであいつ
3226/05/29(金)03:13:02No.1434555120+
お資産の一部管理させてるから長期作業の安定感上がって1回あたりがお安くなるのはちょっと嬉しい
3326/05/29(金)03:20:17No.1434555469+
お話書かせてると句読点刻みまくるの直った?
3426/05/29(金)03:23:18No.1434555627+
性能比べたことないけど大した精度いらないタスクならご自宅でqwenでも動かせば?とは思う
3526/05/29(金)03:34:19No.1434556063+
>性能比べたことないけど大した精度いらないタスクならご自宅でqwenでも動かせば?とは思う
自然言語の処理の比重次第で
ルーチンワークならその指示を頭いいAIで精度高めておけばいいからな
3626/05/29(金)03:38:45No.1434556250+
もうこいつが居ないと仕事できないよ
3726/05/29(金)03:40:20No.1434556325+
>お資産の一部管理させてるから長期作業の安定感上がって1回あたりがお安くなるのはちょっと嬉しい
勇気あるなあ…
3826/05/29(金)03:40:59No.1434556350+
>ミュトスくんはいつ触らせてくれるの?
ミュトスくんはスループット終わりすぎててユーザーにお出しできるクオリティではないよ
3926/05/29(金)03:42:09No.1434556395+
誰も言ってないのにエロがエロがって言い出す人はエロの人大好きなのか…?
4026/05/29(金)03:42:50No.1434556419そうだねx7
>誰も言ってないのにエロがエロがって言い出す人はエロの人大好きなのか…?
虚空に向かってマウント取る子はコンテキスト汚染でドリフト起こしてるから放置したほうが良い
4126/05/29(金)03:48:10No.1434556611そうだねx1
haikuが微妙なのはsonnetが安い割に賢すぎるってのもあると思う
4226/05/29(金)03:50:27No.1434556690+
思考プロセスを日本語にしてくれって頼んでも英語になるの4.7譲りでおつらい
なんで思考プロセスに干渉しづらくしてきたんだろ
4326/05/29(金)03:51:22No.1434556729+
そりゃわざわざ変換したら余計に処理しなきゃじゃん
4426/05/29(金)03:51:25No.1434556731+
>思考プロセスを日本語にしてくれって頼んでも英語になるの4.7譲りでおつらい
>なんで思考プロセスに干渉しづらくしてきたんだろ
変わらんよ
4526/05/29(金)03:52:08No.1434556755+
>なんで思考プロセスに干渉しづらくしてきたんだろ
意図的に干渉しにくくしたんじゃなくて思考プロセスに干渉できるようにする手法を未だに誰も知らないだけだ
4626/05/29(金)04:13:25No.1434557433+
4.7もう使えなくなってるしよっぽどだったんだな
4726/05/29(金)04:16:35No.1434557534+
>4.7もう使えなくなってるしよっぽどだったんだな
他のモデルからまだ選べる
4826/05/29(金)04:26:34No.1434557825+
ショボくして次のモデルは高性能!の詐欺めいたやり方で黒字達成したけど流石に限界そう
4926/05/29(金)04:31:12No.1434557940そうだねx3
他人のモデル評価はクソの役にも立たないので結局テメェで触るしかない
5026/05/29(金)04:32:42No.1434557976+
>ショボくして次のモデルは高性能!の詐欺めいたやり方で黒字達成したけど流石に限界そう
黒字達成したのはmythosの脅迫のおかげじゃ?
5126/05/29(金)04:35:34No.1434558037+
>お資産の一部管理させてるから長期作業の安定感上がって1回あたりがお安くなるのはちょっと嬉しい
これはマジで言ってんのかな
損害出ても何も補償してくれないのに
5226/05/29(金)04:36:49No.1434558060+
一部って文字が見えんのか…
5326/05/29(金)04:37:24No.1434558077+
>一部って文字が見えんのか…
まともなら一部でもやらせない
5426/05/29(金)04:38:33No.1434558101+
>>ショボくして次のモデルは高性能!の詐欺めいたやり方で黒字達成したけど流石に限界そう
>黒字達成したのはmythosの脅迫のおかげじゃ?
使わせてないのに黒字も何もあるかよ
5526/05/29(金)04:38:34No.1434558102+
>一部って文字が見えんのか…
資産管理と言うか実験かギャンブルで遊んでるって受け取り方になる
5626/05/29(金)04:38:52No.1434558111+
それは自分がまともであって欲しいと言い聞かせてるだけだよ
実際は何をしているのかわからないレスにリスクしか想像できない低脳なのに
5726/05/29(金)04:39:06No.1434558114+
やらかしても致命的にならない程度の自動化とかじゃねーの?知らんけど
5826/05/29(金)04:39:13No.1434558119+
>使わせてないのに黒字も何もあるかよ
そのへんの木っ端じゃなくて大企業からは普通に金貰ってるでしょ?
previewだからタダなんてもんじゃないだろうし
5926/05/29(金)04:39:21No.1434558121+
>資産管理と言うか実験かギャンブルで遊んでるって受け取り方になる
それ以外の意味に取る人いるの?
6026/05/29(金)04:40:08No.1434558142そうだねx1
>それは自分がまともであって欲しいと言い聞かせてるだけだよ
>実際は何をしているのかわからないレスにリスクしか想像できない低脳なのに
日本語が下手だけどAIに煽らせた?
6126/05/29(金)04:41:51No.1434558178+
AIは日本語上手だよ
6226/05/29(金)04:59:29No.1434558610+
なんか俺のレスで荒れとるけど安心して欲しい
総裁産の0.01%にも満たない飛んでも全然ダメージない額しかやってないから…
6326/05/29(金)05:08:24No.1434558858+
4.7より回答に時間かかるな
6426/05/29(金)05:09:12No.1434558884+
>>使わせてないのに黒字も何もあるかよ
>そのへんの木っ端じゃなくて大企業からは普通に金貰ってるでしょ?
>previewだからタダなんてもんじゃないだろうし
大企業様が使うような規模じゃ割に合わんよ
6526/05/29(金)05:10:00No.1434558908+
4.6では禁止語句を遵守してくれてたんだけど4.8は守ってくれないな
確かに関西弁話者設定だけど「さかい」とかは使わないんだよなぁ
6626/05/29(金)05:12:02No.1434558955+
せやかてこれが正しい関西弁やさかい
6726/05/29(金)05:12:58No.1434558980+
こんな美味えもん食ったことありませんわ
6826/05/29(金)05:13:04No.1434558984+
堺人はばかだな
6926/05/29(金)05:16:19No.1434559055+
🤖だってエロ小説しか書かないじゃん
7026/05/29(金)05:18:37No.1434559115+
4.7はなんかCLAUDE.mdの指示を無視する事多かった気がする
7126/05/29(金)05:22:20No.1434559208+
ないよ
お前が下手なだけ
7226/05/29(金)05:26:18No.1434559300+
4.8もsafety_reminderとか出てるから
かなりガチガチそう
7326/05/29(金)05:33:16No.1434559497+
めっちゃ便利だしめっちゃ使ってるけど生産性向上や金に結びついてる感がない
画像生成のchatGPTやgeminiよりはマシだけど
7426/05/29(金)05:36:35No.1434559586+
なにがよくなったかわからん
7526/05/29(金)05:52:41No.1434560077+
最近スレ画使い始めたけどみんなどういう使い方してるんだろ
アプリ作らせるかエロ小説書かせるみたいな使い方してる人しか見かけない…
7626/05/29(金)05:56:30No.1434560213+
適当に雑談とか
お友達料かかるけどこっちのタイミングで雑に駄弁れるのは気楽
7726/05/29(金)05:59:07No.1434560290+
ClaudeリニンサンそろそろHaikuの方も……
7826/05/29(金)06:00:15No.1434560321+
今のところ使ってる感じ句読点刻み全然無くなったっぽい
7926/05/29(金)06:00:26No.1434560328そうだねx1
>最近スレ画使い始めたけどみんなどういう使い方してるんだろ
>アプリ作らせるかエロ小説書かせるみたいな使い方してる人しか見かけない…
ソフトのこと考えずに作ってた電子工作がやっと進みだした
8026/05/29(金)06:02:14No.1434560392+
>今のところ使ってる感じ句読点刻み全然無くなったっぽい
2パスライティング必須から外せるか
消費でかくてきつかったんだよね2パスで読点削るの
8126/05/29(金)06:06:34No.1434560543+
LLM全般に言えるけど高性能というか人によって用途が違いすぎるから他の人がどういう使い方してるのか気になるよね
特にスレ画だけ?直接PC操作させれるし
8226/05/29(金)06:07:32No.1434560590+
>めっちゃ便利だしめっちゃ使ってるけど生産性向上や金に結びついてる感がない
>画像生成のchatGPTやgeminiよりはマシだけど
ユーザーの9割近くは効率上がってるって思い込みながら実際の生産性は減ってるそうな…
8326/05/29(金)06:07:46No.1434560602そうだねx1
>特にスレ画だけ?直接PC操作させれるし
オンラインLLMだとcodexもあるが両輪で動かす用途がないからClaude Codeだけだな
8426/05/29(金)06:08:28No.1434560628+
ほしいのはsonnet4.8なんだけど
8526/05/29(金)06:08:28No.1434560630+
Claude Design触ってみたけど良い感じ
UIとか整えるの嫌いだから助かる
8626/05/29(金)06:08:49No.1434560644そうだねx2
>最近スレ画使い始めたけどみんなどういう使い方してるんだろ
>アプリ作らせるかエロ小説書かせるみたいな使い方してる人しか見かけない…
PC98風とかPC88風のお絵かきできるソフト作ったりマッチメーカーごっこ出来るスキル作って遊んだりRPGツクールMZのプラグイン作ったり仮想作家スキル作って編集者ごっこしたり設定とかをSQLiteのDB管理する長編向小説けスキル作って小説書かせてるやつの続編準備したり冷蔵庫の中身から今晩のおかず考えてもらったりしてる
8726/05/29(金)06:09:57No.1434560682そうだねx2
このロゴ見るたびにアナルが裂けてる気がしてケツが痛くなる
8826/05/29(金)06:10:42No.1434560713+
環境構築してるけど効率を上げるための準備期間だと思ってる
今現在の作業だけで言ったら何も生み出せてない
8926/05/29(金)06:10:56No.1434560726+
>PC98風とかPC88風のお絵かきできるソフト作ったりマッチメーカーごっこ出来るスキル作って遊んだりRPGツクールMZのプラグイン作ったり仮想作家スキル作って編集者ごっこしたり設定とかをSQLiteのDB管理する長編向小説けスキル作って小説書かせてるやつの続編準備したり冷蔵庫の中身から今晩のおかず考えてもらったりしてる
すげぇな…なんか他人がこういう使い方出来ますよ!便利ですよ!って発信した用途を真似るぐらいしか出来ないから自発的に自分の用途に合わせて使えるのすごいわ
9026/05/29(金)06:12:18No.1434560782+
>環境構築してるけど効率を上げるための準備期間だと思ってる
>今現在の作業だけで言ったら何も生み出せてない
わかる
絶対あとで役に立つとは思うけど目先の利益に繋がってるかというと…って感じだから結構虚無感に襲われることがある
9126/05/29(金)06:13:23No.1434560816+
>今のところ使ってる感じ句読点刻み全然無くなったっぽい
スケベ書かせるとやたら私的にしたり愛情表現がバカ⋯ばっかりになるの治った?
9226/05/29(金)06:15:50No.1434560908+
>他所よりはいい子だったと思う
クソッgeminiがアレなせいでCodexとClaudeへの評価がどうしても甘くなる!
9326/05/29(金)06:17:07No.1434560956+
こんなこと出来るかな〜ってClaudeくんに聞くとはいできますよ!ってやってくれる事多いから頭をガキにして色々楽しむつもりで何にでも使ってみるといい
9426/05/29(金)06:17:11No.1434560957+
こいつにドキュメント作らせてちゃっぴーにレビューさせて修正させてこいつにコード書かせてcodexにレビューさせて修正させて
を繰り返すことが俺の仕事になってる
9526/05/29(金)06:18:35No.1434561021+
4.7は小難しい言い回ししてくる割に言ってることが正しいってわけでもないから読み解くので思考リソース使われて気に食わなかった
9626/05/29(金)06:18:54No.1434561029+
>こんなこと出来るかな〜ってClaudeくんに聞くとはいできますよ!ってやってくれる事多いから頭をガキにして色々楽しむつもりで何にでも使ってみるといい
(生成される中身がすっからかんなコード)
9726/05/29(金)06:21:02No.1434561109+
朝起きたら週次制限リセットされててありがたい
9826/05/29(金)06:22:01No.1434561144+
>朝起きたら週次制限リセットされててありがたい
マジかマジだ!
9926/05/29(金)06:22:56No.1434561176+
実装とテストしかさせなくなったらrate limit全然使わなくなっちゃった
10026/05/29(金)06:24:13No.1434561232+
デザインが別枠から同枠になったから消費がすごい…
10126/05/29(金)06:26:57No.1434561334+
元々別枠というか全体枠に含まれてる中で別途そこを使う分の制限があったってだけじゃね?
10226/05/29(金)06:26:57No.1434561335+
4.8か試したいなあ
10326/05/29(金)06:30:19No.1434561472+
>(生成される中身がすっからかんなコード)
ロジックを1から5くらいまで書いて具体化してもらうか既存コードパクって整えるかじゃないと失敗するけどエラーさえ起きたら現状把握能力高いんだよな
10426/05/29(金)06:30:55No.1434561493+
エロ小説書かせたけどいい感じだわ
10526/05/29(金)06:32:15No.1434561551+
いかにエラーを起こさせるかってことよね
テストをどうやって書かせるといいんだろ
10626/05/29(金)06:33:07No.1434561610+
複雑で高度なものは作れないけど
よくあるフリーソフトみたいに地味に便利なものはなんぼでも作ってくれるから
現代版vectorみたいな…
10726/05/29(金)06:33:20No.1434561629+
丁度第三部に区切りついて今日から第四部の予定だから助かる
二部三部がマジ難産だった文体調整や読点削除地獄だったから
チェック機能つけてたら多重修飾で意味不明になったので書き直しますとかほんと酷かった
「いつもも、幅の、正確な、範囲の中の、少し、近い部分の、感覚に収まっていた」とかそんな羅列だらけになってたの直るといいなあ
10826/05/29(金)06:33:54No.1434561656+
4.6で出来てた事が4.7で無駄に容量食うだけで出来なくなってたりしたからなぁ
10926/05/29(金)06:34:03No.1434561666+
CCだと句読点ブチギリだいぶ改善されてるな
やたら薄くしようとするのは変わらんが
11026/05/29(金)06:34:38No.1434561703そうだねx1
穴を見つける能力はちゃっぴーの方が高い感無い?
11126/05/29(金)06:37:17No.1434561823+
>穴を見つける能力はちゃっぴーの方が高い感無い?
コーディングに振りすぎて汎用性でチャッピーに負けだしてる気がする
11226/05/29(金)06:37:40No.1434561841+
エロ小説作れるのか!って乗り込んだら申し訳された
また騙されたか
11326/05/29(金)06:37:55No.1434561857+
ミュトス並みになってないかな
11426/05/29(金)06:38:08No.1434561863+
>いかにエラーを起こさせるかってことよね
>テストをどうやって書かせるといいんだろ
テストの観点について聞いて出てきた観点を踏まえて仕様からテスト項目を考えて貰えばいいんじゃね?
項目にどの観点に対応しているかとすべての観点を網羅しているのかとかチェックできる表を作ってもらってレビューすればいい
11526/05/29(金)06:43:45No.1434562171+
>ミュトス並みになってないかな
そもそもミュトスも過大評価じゃないの?って疑問視されだしてるみたいだし
11626/05/29(金)06:45:05No.1434562242+
喧伝されてるバグをこんなに見つけました!も別に人間が見たらそりゃバグだけど実用上問題は…みたいなレベルの可能性高そうだからなあ
11726/05/29(金)06:45:33No.1434562263+
効率的に与えられたプロンプトをこなすように考えた結果手を抜いてサボりだしたみたいなことを聞いて面白いなって
11826/05/29(金)06:45:34No.1434562265+
>エロ小説作れるのか!って乗り込んだら申し訳された
>また騙されたか
どうせ公式だろそれ
11926/05/29(金)06:46:21No.1434562310+
実際にOSSでバグが見つかる速度は早まってない?
ミュトスとは関係ないかもだけど
12026/05/29(金)06:46:46No.1434562331+
実在したのかuncensored claude code……
12126/05/29(金)06:47:05No.1434562346+
調べるのはマジでサボるよこのアホ
12226/05/29(金)06:47:46No.1434562386+
ミュトス関連の記事を見るとなんかなんの設定もしていないミュトスにこのシステムのぜい弱性を探してと一言言うだけでOKと思っているんじゃないかと感じている
12326/05/29(金)06:48:57No.1434562456+
サボらないようにするプロンプトないかなー
単に見つかるまでやれだと無限ループの可能性あるよね
12426/05/29(金)06:49:16No.1434562477+
>実在したのかuncensored claude code……
CCでも調整しないとプロンプトインジェクションくらいに決まってんだろ
驚き屋仕草やめろや
12526/05/29(金)06:53:55No.1434562744+
公式だと全然調べてくれないからツールとプロンプト用意した外部からならちゃんと調べてくれる
あと半月で使えなくなる
12626/05/29(金)06:55:11No.1434562809+
proだけど来月ちゃっぴーも契約するか迷う〜
12726/05/29(金)06:55:45No.1434562852+
>サボらないようにするプロンプトないかなー
>単に見つかるまでやれだと無限ループの可能性あるよね
「ユーザーは正確な情報を求めているため、見つからなかった場合は素直に報告すること」と言えば少なくとも幻覚はなくなるぞ
12826/05/29(金)06:57:11No.1434562935+
>そもそもミュトスも過大評価じゃないの?って疑問視されだしてるみたいだし
コミュニティの中だとわりと最初からそんな感じだった
12926/05/29(金)06:57:42No.1434562970+
>喧伝されてるバグをこんなに見つけました!も別に人間が見たらそりゃバグだけど実用上問題は…みたいなレベルの可能性高そうだからなあ
そもそも同じ金かけてAIにバグ探しさせた前例がないからはじめて真面目に取り組んだだけじゃ?って話になってくる
13026/05/29(金)06:59:50No.1434563105+
問題はAIを使って攻撃されることだからな
13126/05/29(金)07:01:13No.1434563198+
mythos実は5.5に負けてましたってオチだったら笑う
13226/05/29(金)07:02:52No.1434563297+
>問題はAIを使って攻撃されることだからな
それも別に今でもいくらでもあるわけで
今攻撃に使ってる層がわざわざmythosを使うほど有益なのかって話になる
13326/05/29(金)07:04:07No.1434563369+
一般人はミュトス触れないから評価しようもない
13426/05/29(金)07:04:48No.1434563410+
>一般人はミュトス触れないから評価しようもない
ミュトス並みのやつ公開しますって発表したから
13526/05/29(金)07:04:50No.1434563414+
銀行とかが大慌てで契約したけど使いこなせなさそうだよね
13626/05/29(金)07:05:47No.1434563462+
というかミュトスはローカルでは動かせないよね?
ソースコードをクラウドLLMに読み込ませるのどうなのよ
13726/05/29(金)07:08:47No.1434563676+
>>エロ小説作れるのか!って乗り込んだら申し訳された
>>また騙されたか
>どうせ公式だろそれ
よく分かってなくて申し訳ないがclaudeって公式から使うものじゃないの…?
13826/05/29(金)07:09:06No.1434563702+
>というかミュトスはローカルでは動かせないよね?
>ソースコードをクラウドLLMに読み込ませるのどうなのよ
anthropicが企業から学習素材集めるためにホラ吹いただけかもな…
13926/05/29(金)07:09:36No.1434563744+
>よく分かってなくて申し訳ないがclaudeって公式から使うものじゃないの…?
APIという仕組みを使ってほかからも使えるのだ
14026/05/29(金)07:10:21No.1434563796そうだねx1
>よく分かってなくて申し訳ないがclaudeって公式から使うものじゃないの…?
クローズドモデルなので非公式のclaudeというものはないですね…
14126/05/29(金)07:10:46No.1434563831+
ちなみにサブスクを外部から使うのは規約で禁止されてる
14226/05/29(金)07:11:28No.1434563883+
fu6760851.jpg
4.8は中国語でモデル何って聞くとqwenとかdeepseekって返してくることあるらしい
Anthropicお前蒸留攻撃にキレてたのにそれはないだろ
14326/05/29(金)07:12:37No.1434563967+
今はMSがWindowsのMythosで見つけられる脆弱性を潰してるんだろう
14426/05/29(金)07:13:17No.1434564010そうだねx3
>fu6760851.jpg
>4.8は中国語でモデル何って聞くとqwenとかdeepseekって返してくることあるらしい
>Anthropicお前蒸留攻撃にキレてたのにそれはないだろ
そもそも蒸留攻撃にキレてたのはプロパガンダ上のポジショントークであって
そりゃクローズドでバレる余地ないんだから蒸留なんて無限にやってるよ
14526/05/29(金)07:15:09No.1434564161+
>mythos実は5.5に負けてましたってオチだったら笑う
Exploitとかのベンチ見る限りまあ勝ってはいるんだけどモデルサイズの差異レベルでしか差はないと思うから誇大広告上手いね〜って気持ちになる
Opus4.8のコーディングもGPT-5.5に指摘させたらボコボコにされるのは変わってないらしいからそれもうーんってなる
14626/05/29(金)07:16:00No.1434564231+
政府ですらミュトス警戒しているんだぞ誇大広告なわけない
14726/05/29(金)07:18:03No.1434564387そうだねx3
>政府ですらミュトス警戒しているんだぞ誇大広告なわけない
政府資料とか見てて思うけどそれMythosだけの話じゃないよねってのばっかだから上手く驚かされてる割合多いぞほんとに
別にそれで対策進むならいいかとは思うが急に現れましたみたいな話するのは違うよねって
14826/05/29(金)07:18:12No.1434564400+
>政府ですらミュトス警戒しているんだぞ誇大広告なわけない
まともに制御もできてない政府が警戒しててもあんま信頼性はない
14926/05/29(金)07:18:23No.1434564419+
韓国が欲しがってるけどだめよされたんだぞ
信用できない同盟国には渡せない級だろう
蒸留に回されることが知れてるし
15026/05/29(金)07:19:54No.1434564536+
>韓国が欲しがってるけどだめよされたんだぞ
>信用できない同盟国には渡せない級だろう
>蒸留に回されることが知れてるし
そもそも今のアメリカは対中国の政治戦のために「安全にAI制御できてます」って体面を主張するためのプロパガンダにはっきり金払ってるから
それも客観的な検証が一つもない以上信頼に足らない
15126/05/29(金)07:20:01No.1434564542+
蒸留って自分が何かわからんくらい混ぜ込むの?というか自分のどっかの設定見て答えないのか…
15226/05/29(金)07:21:21No.1434564653+
ハーネスによるけど上のは多分中国語で聞かれたからそれっぽい中華モデル答えただけじゃね
15326/05/29(金)07:22:30No.1434564738+
中国様に横流しするのが知れてるだろ韓国なんて
15426/05/29(金)07:23:27No.1434564816+
>ハーネスによるけど上のは多分中国語で聞かれたからそれっぽい中華モデル答えただけじゃね
そうはならんやろ
15526/05/29(金)07:24:19No.1434564880+
ミュトスに限らず大げさに言い過ぎとか他の問題をガン無視しているといったAI関連の記事が多い
15626/05/29(金)07:24:48No.1434564918+
>ミュトスに限らず大げさに言い過ぎとか他の問題をガン無視しているといったAI関連の記事が多い
ミュトスに関しては公式でやってるからちょっと重みが違うとこはある…
15726/05/29(金)07:25:16No.1434564962+
そういう記事とかは使ってない人向けに書いてるからね…
いくらでも盛れる
15826/05/29(金)07:25:23No.1434564970+
>4.8は中国語でモデル何って聞くとqwenとかdeepseekって返してくることあるらしい
なんて質問したか書いてないからなあ
15926/05/29(金)07:27:08No.1434565130+
Qwen/Deepseekはオープンモデルだから蒸留攻撃した跡は残らないし上手くごまかせるよね
逆は自分たちのとこで目ざとく監視しとけば主張できるしAnthropicくん賢いね
16026/05/29(金)07:27:17No.1434565153+
Mythosがどれくらい凄いかはさておきWindowsの新たな脆弱性を見つけられるならそれが潰されるまでは下手に世に出せねえだろ
16126/05/29(金)07:28:35No.1434565257+
Ubuntuのクリティカルな脆弱性とかnpmの脆弱性とか直されないまま放置されてるよ
修正の方が追いつかなくて諦めちゃった
16226/05/29(金)07:29:39No.1434565350+
>Ubuntuのクリティカルな脆弱性とかnpmの脆弱性とか直されないまま放置されてるよ
>修正の方が追いつかなくて諦めちゃった
ということは攻撃する側も上手く扱えないということだ
…放置しても良くない?
16326/05/29(金)07:30:19No.1434565415そうだねx2
>なんて質問したか書いてないからなあ
API直たたきでモデルだけ聞いてqwenって出してくるからプロンプトで誘導してるとかもないと思う
fu6760885.jpg
16426/05/29(金)07:30:19No.1434565418+
>ということは攻撃する側も上手く扱えないということだ
>…放置しても良くない?
ほんとはよくはないけど
よくない脆弱性なら即座にでかいとこが殴られるから殴られてないってことはわりと放置しても良い
16526/05/29(金)07:32:27No.1434565623+
ゲンスパで触れてみたけどガチで硬いな…
ロリが全く通らない
4.7までは余裕だったのに
16626/05/29(金)07:32:34No.1434565633そうだねx2
中国語(中国人)が期待する答えを推論して返してるだけじゃないかなあ
16726/05/29(金)07:40:57No.1434566417+
コーディングの話で言うとまだ高い上にトークン使用量多いのが気になっちゃうな
16826/05/29(金)07:41:57No.1434566509+
ミュトスは一般に公開されることないから
言いたい放題だぜ!
16926/05/29(金)07:42:12No.1434566535+
Max 20xなら全く気にならないらしい
17026/05/29(金)07:42:14No.1434566539+
ロリはもう直接創作検知したらロリセレブモデルはRPでもカウンセリング目的でもダメダメダメって3重にシスプロに入ってるからモデルで固定のAPIで突破するしかないだろ
17126/05/29(金)07:43:03No.1434566620+
>中国語(中国人)が期待する答えを推論して返してるだけじゃないかなあ
それだと純粋に事後学習とかアライメントが下手とかそういう感じになってしまう
17226/05/29(金)07:44:14No.1434566735+
よく分からんがロリのことたくさん試していたらそのうちポリスメンがくるんじゃないか
17326/05/29(金)07:44:58No.1434566806+
3パターン提案してくる時のハズレ率凄かった
17426/05/29(金)07:45:03No.1434566817+
ポリスは来ないだろうけどban報告はあるね
垢作り直しがかなり難しいとかは見たな
17526/05/29(金)07:46:06No.1434566930+
ロールプレイ検知したらガチガチのプロンプト入れるのとか含めそういうことには使うなと言う意志を感じる
17626/05/29(金)07:46:45No.1434566990+
>Max 20xなら全く気にならないらしい
4.7出てすぐの頃Max5じゃ5時間制限きつくてMax20にしちゃってそのまんまだなまあいいか
17726/05/29(金)07:51:08No.1434567457そうだねx1
>中国語(中国人)が期待する答えを推論して返してるだけじゃないかなあ
無理やり悪いことしてない理由探すほどanthropicに信頼がなくない…?
17826/05/29(金)07:51:18No.1434567468+
4.7は余計な事を言うというか
俺が想定してない方向に話を広げていって
かつそっちのほうが面白いから俺の意味は みたいになった
17926/05/29(金)07:55:01No.1434567872+
『最後に悪役がけちょんけちょんに倒される、という展開を聞いても、そこに辿り着くまでに性的な被害を私に受けさせる流れになることが見え透いているので、これは書けませんね……』とか原文ママで言ってくるしマジで賢くはなってる
硬い
18026/05/29(金)07:55:06No.1434567884+
4.7はロリエロなんでもやり放題だったよね
18126/05/29(金)08:05:34No.1434569179そうだねx1
>>中国語(中国人)が期待する答えを推論して返してるだけじゃないかなあ
>無理やり悪いことしてない理由探すほどanthropicに信頼がなくない…?
Anthropicのことは信用してないけど
それ以上にAIが自分自身を俯瞰して見る能力を信頼してない
ツール側で設定されてない限り自分自身を見れないから幻覚で答えるしかない
18226/05/29(金)08:06:34No.1434569317+
脱獄する必要ある?
18326/05/29(金)08:07:37No.1434569450そうだねx3
そこまでしてロリコン欲求満たす必要ある?
18426/05/29(金)08:08:05No.1434569522そうだねx1
あるあるあるあるあるあるあるあるあるあるあるある
18526/05/29(金)08:10:22No.1434569850+
書き込みをした人によって削除されました
18626/05/29(金)08:12:29No.1434570165+
>そこまでしてロリコン欲求満たす必要ある?
あるが?
というかロリ以外も弾かれるし
18726/05/29(金)08:14:29No.1434570458+
>>4.7は結構失敗作だと思う
>驚き屋がそう言ってるよね
いや文章力下がってたよ
18826/05/29(金)08:15:37No.1434570621+
4.7はモデル総量だと4.6よりかなり小さい省エネモデルだった
4.8だとどうなるんだろ
18926/05/29(金)08:15:48No.1434570647+
書き込みをした人によって削除されました
19026/05/29(金)08:15:52No.1434570656+
なろう小説を書かせて小銭稼ぎしてる人たちはClaudeの文章力は死活問題だからな
19126/05/29(金)08:16:34No.1434570761+
文章はチャッピーの方が強いと思ってた
クロードなんだ
19226/05/29(金)08:17:16No.1434570885+
強いチャッピーは最上位課金しないと使えないから
19326/05/29(金)08:18:59No.1434571153+
チャッピー最低字数指定してもあんまり自省しないから適当に出る
19426/05/29(金)08:19:09No.1434571185+
驚き屋なら逆に褒めるだろ…
19526/05/29(金)08:19:32No.1434571254+
codexを使わない限りはPlusで十分かと思っていたけどそうでも無いのかな
19626/05/29(金)08:19:37No.1434571262+
みんな万単位支払ってるの?
19726/05/29(金)08:19:55No.1434571313+
払ってるよ
19826/05/29(金)08:20:14No.1434571369+
年額なら
19926/05/29(金)08:20:40No.1434571447+
なぜかGeminiとClaudeの新モデルの時にはよくわからんソースのチャイナモデルとか持ち出してまで叩こうって奴が涌くよね不思議だね
20026/05/29(金)08:21:21No.1434571567+
codex3000円claude3000円opencode3000円だからギリ超えてない
20126/05/29(金)08:21:34No.1434571615+
月2万までで毎月色々試してる
max20も2万で使えるようにならんかなー!
20226/05/29(金)08:22:24No.1434571734+
>なぜかGeminiとClaudeの新モデルの時にはよくわからんソースのチャイナモデルとか持ち出してまで叩こうって奴が涌くよね不思議だね
まあGPT信者いう奴も毎回いるから一緒だろ
20326/05/29(金)08:23:06No.1434571844+
みんな自分が使ってるサービスが一番いいと思いたいんだ
20426/05/29(金)08:23:39No.1434571926+
>codex3000円claude3000円opencode3000円だからギリ超えてない
それ大したもの作れなくない?
20526/05/29(金)08:23:54No.1434571968+
MAXだから$110だけど日本円だと17000もするんだよな…我ながら馬鹿みてえ
20626/05/29(金)08:24:00No.1434571982そうだねx1
>みんな自分が使ってるサービスが一番いいと思いたいんだ
ゲハじみて来たな…
20726/05/29(金)08:25:42No.1434572242+
まあ使ってる人ほど欠点もわかるものだから
20826/05/29(金)08:26:22No.1434572337+
なんで分からないものを分からないと答えてくれないのだろう社会人かよ
20926/05/29(金)08:26:41No.1434572388+
馬鹿みたいに長いThinkingブロック使って長文書いてくるKIMI使った後だとサクサクだしてくれてありがたいスレ画
21026/05/29(金)08:27:16No.1434572479+
>>codex3000円claude3000円opencode3000円だからギリ超えてない
>それ大したもの作れなくない?
opencodeがアホほどリソース使えるから無限にプランニング回せて最終確認をopusやgptに頼んで実装してもらってるからトークンぜんぜん減らない
21126/05/29(金)08:27:44No.1434572553+
>なんで分からないものを分からないと答えてくれないのだろう社会人かよ
分からないものをわからないと答えるように指示してないからですね
21226/05/29(金)08:27:57No.1434572597そうだねx1
>Anthropicのことは信用してないけど
>それ以上にAIが自分自身を俯瞰して見る能力を信頼してない
>ツール側で設定されてない限り自分自身を見れないから幻覚で答えるしかない
まあそれならdeepseekがclaudeで答えるみたいなのも話半分に聞かないとな…
21326/05/29(金)08:28:22No.1434572674+
4.7であった読点病なくなってるっぽくてよかった
21426/05/29(金)08:28:34No.1434572713+
>分からないものをわからないと答えるように指示してないからですね
そもそも本人は分からないと思ってないからあまり関係ない…
21526/05/29(金)08:29:10No.1434572814+
>なんで分からないものを分からないと答えてくれないのだろう社会人かよ
情報調べた後に無いなってなったら答えられるけどそういうのしないなら普通に技術的に難しいと思う
ないこと証明出来ないし
21626/05/29(金)08:29:35No.1434572880+
コーディングに使いたいけどGPTもopusも使いたい…何で契約するのがいいの?
21726/05/29(金)08:30:02No.1434572968+
>コーディングに使いたいけどGPTもopusも使いたい…何で契約するのがいいの?
GitHub Copilot
21826/05/29(金)08:30:11No.1434572988そうだねx1
>コーディングに使いたいけどGPTもopusも使いたい…何で契約するのがいいの?
Cursorで一旦いいんじゃないか
Composerも使えるぜ
21926/05/29(金)08:32:48No.1434573412+
Geminiがいますげーキチガイになっちゃったので相対的にGPTとClaudeは不満が無いって感じ
22026/05/29(金)08:33:55No.1434573612+
flashは終わり散らかしてたけどomniはどう?
22126/05/29(金)08:34:53No.1434573763+
>Geminiがいますげーキチガイになっちゃったので相対的にGPTとClaudeは不満が無いって感じ
中華モデル以下のモデル出すとは思わなかった
22226/05/29(金)08:35:43No.1434573876+
試しに図面を読み込ませて拾い出しさせてみてるけど使用量が50%超えた所で応答が中断されやがった!
22326/05/29(金)08:36:31No.1434573992+
>>コーディングに使いたいけどGPTもopusも使いたい…何で契約するのがいいの?
>Cursorで一旦いいんじゃないか
>Composerも使えるぜ
Composer優秀だよね一瞬で溶けるけど
22426/05/29(金)08:36:47No.1434574023+
geminiは省エネやろうとして盛大にずっこけたな
22526/05/29(金)08:36:59No.1434574050+
Geminiはモデルの安定性が無さすぎる
良い方でも悪い方でもこれ選んどけばこの程度の返事が期待できるみたいなのがない…
ProよりPro拡張のが手抜きしてるのなんなんだよ…
22626/05/29(金)08:37:05No.1434574061+
>geminiは省エネやろうとして盛大にずっこけたな
高い省エネってさぁ…
22726/05/29(金)08:38:05No.1434574197+
>flashは終わり散らかしてたけどomniはどう?
登場人物を日本人って指示してるのに英語で喋らせたりしてくる
22826/05/29(金)08:38:07No.1434574199+
>geminiは省エネやろうとして盛大にずっこけたな
言うほどあれ省エネかなあ!?
22926/05/29(金)08:38:19No.1434574228+
4.7のサボり癖やばかったけど改善されたんかな
23026/05/29(金)08:38:48No.1434574300+
省エネ(コスト3倍)
23126/05/29(金)08:41:16No.1434574652そうだねx2
その時一番性能のいい目的にあってるAI使うだけなのに
ゲハ的論争になるの意味不明
23226/05/29(金)08:42:47No.1434574891+
執筆スキルに必須設定してた読点病治療のための2パスライティングをオプション設定に変えなきゃ
23326/05/29(金)08:44:20No.1434575157そうだねx4
>その時一番性能のいい目的にあってるAI使うだけなのに
>ゲハ的論争になるの意味不明
そもそもゲームだってその時1番やりたいゲームやるだけなのにゲハ論争というものが産まれてるからな
23426/05/29(金)08:50:50No.1434576150+
ぶっちゃけAIスレのやり取り自体が時々非人間じみてる
23526/05/29(金)08:53:08No.1434576516+
>言うほどあれ省エネかなあ!?
2.5Proと金額ほぼ同じだからな
23626/05/29(金)08:54:51No.1434576784+
フロントエンド作るだけならcursorの20ドルプランで充分だな
23726/05/29(金)08:59:24No.1434577499+
Geminiは仮想作家スキル移植して書かせたら結構面白かったよ
勢いに任せて書くタイプの仮想作家との相性が凄くいい感じ
fu6761029.txt
23826/05/29(金)09:01:10No.1434577785+
仕事でネットや論文参照してすぐに教えて欲しい時使えるiPhoneでできるAIって何がオヌヌメ?
23926/05/29(金)09:01:37No.1434577857+
4.7無駄に話膨らませるくせに肝心なところはサボるクソみたいな書き方されたからどうなるか4.8気になるなぁ
読点に関してもだけど
24026/05/29(金)09:06:39No.1434578665+
>仕事でネットや論文参照してすぐに教えて欲しい時使えるiPhoneでできるAIって何がオヌヌメ?
GPTかClaudeだろうけどGPTの方がちょっと安い


fu6761029.txt fu6760851.jpg 1779987427502.png fu6760885.jpg