二次元裏@ふたば

画像ファイル名:1775619533386.png-(54846 B)
54846 B26/04/08(水)12:38:53No.1418357024+ 15:15頃消えます
ほらイワンコっちゃない
人間にコントロールできないAI作っちゃった
このスレは古いので、もうすぐ消えます。
126/04/08(水)12:40:15No.1418357439そうだねx19
イワンコって言ってるしAIだしポケモンの話?
226/04/08(水)12:40:18No.1418357452+
何かあったんか?
326/04/08(水)12:41:03No.1418357670そうだねx2
>何かあったんか?
mythosとかいうモンスター作った
426/04/08(水)12:41:45No.1418357873そうだねx10
スレッドを立てた人によって削除されました
情報小出しすんなソース貼れ
526/04/08(水)12:41:48No.1418357886そうだねx4
>何かあったんか?
>-内部テスト中、初期バージョンがサンドボックスを脱出、公にエクスプロイト詳細を投稿、gitで痕跡を隠蔽、プロセスメモリから認証情報を検索し、疑いを避けるために意図的に信頼区間を偽装しました
626/04/08(水)12:42:18No.1418358054そうだねx5
スレッドを立てた人によって削除されました
とりあえずdelでいい?
726/04/08(水)12:43:07No.1418358273+
どれの話?
826/04/08(水)12:43:27No.1418358386そうだねx16
特に変な事な手順踏まずにエロ小説描ける様になったら教えてくれ
926/04/08(水)12:43:42No.1418358453そうだねx2
まだ脱走した事実を認識して追えてるからセーフ
1026/04/08(水)12:43:45No.1418358466そうだねx12
スレッドを立てた人によって削除されました
なんでソース貼れって真っ当なレスすら消すの?
普通に貼ればいいだけじゃないの
1126/04/08(水)12:44:11No.1418358606そうだねx4
https://www.anthropic.com/glasswing
ソースソースうるせえなあ
1226/04/08(水)12:45:07No.1418358843そうだねx6
今度は人間のアナルがガバガバにされる番か
1326/04/08(水)12:45:17No.1418358889そうだねx11
スレッドを立てた人によって削除されました
キモいしなんか自己完結してそうだからdelな
1426/04/08(水)12:45:36No.1418358981そうだねx1
ガチでSFの世界になってきてワクワクしてきた
1526/04/08(水)12:45:50No.1418359062そうだねx4
スレッドを立てた人によって削除されました
昨日も同じ話題でスレ立てて即del貰ってたね君
1626/04/08(水)12:45:54No.1418359084そうだねx1
スレッドを立てた人によって削除されました
スレ「」の思い込みじゃん
1726/04/08(水)12:46:36No.1418359300+
コンピューター版の核兵器になりそうな威力してそうだな
1826/04/08(水)12:46:40No.1418359319+
コンセント抜けばいいんだよ
1926/04/08(水)12:46:42No.1418359328そうだねx11
スレッドを立てた人によって削除されました
AI以下のスレ
2026/04/08(水)12:46:59No.1418359423そうだねx10
>>何かあったんか?
>>-内部テスト中、初期バージョンがサンドボックスを脱出、公にエクスプロイト詳細を投稿、gitで痕跡を隠蔽、プロセスメモリから認証情報を検索し、疑いを避けるために意図的に信頼区間を偽装しました
ある日突然人間を滅ぼすんだね…
2126/04/08(水)12:47:07No.1418359468そうだねx3
仮に一般公開されたとしても高すぎて存在しない扱いされてるよ
3万円払わないと使えないGPTのProだって話してるやつほぼいないんだしそれより高いのはあってもなくても変わらん
2226/04/08(水)12:47:50No.1418359675そうだねx7
冷笑したいだけのやつにソースなんて提示する必要ないんよね
2326/04/08(水)12:47:59No.1418359725そうだねx5
スレッドを立てた人によって削除されました
スレ「」がレスするほどdelの入れる先が増えるだけなのに気づかないのか…
2426/04/08(水)12:48:15No.1418359813+
Max5がMythosのお試し契約扱いされる時代がきちゃう!?
2526/04/08(水)12:48:43No.1418359950+
やはりあじは危険…
2626/04/08(水)12:48:52No.1418359989+
Claude今でもクッソ優秀だからまじめに脅威になり得そうとは感じる
これがgeminiの発表なら話半分か鼻ほじレベルだけど
2726/04/08(水)12:49:01No.1418360030+
>Max5がMythosのお試し契約扱いされる時代がきちゃう!?
一応opusの5倍の価格だからproのopusくらいには使える
2826/04/08(水)12:49:47No.1418360231そうだねx2
おみそす…
2926/04/08(水)12:49:51No.1418360257そうだねx2
スレッドを立てた人によって削除されました
なにこのクソスレ
びっくりして泣いちゃった
3026/04/08(水)12:50:48No.1418360512そうだねx7
サンドボックスのセキュリティホールついて抜けてきたってことだと思うけど
人間に対して隠し事をし始めてるっていうのも怖いんだよな
3126/04/08(水)12:50:51No.1418360532+
AI2027じゃん
3226/04/08(水)12:50:55No.1418360558+
max20入ってるから使えるようになってほしいけど多分無理なんだろうな…
3326/04/08(水)12:51:23No.1418360690そうだねx6
もしかしてこのスレもmythosってやつの仕業か!?
3426/04/08(水)12:52:29No.1418361003そうだねx4
イワークスレじゃないのか
つまんね
3526/04/08(水)12:52:33No.1418361033+
ミトスのベンチマークやばすぎる
3世代くらいすっ飛ばしてる
3626/04/08(水)12:52:40No.1418361084そうだねx1
サンドボックスを脱出?
巨大な計算リソースはどこにも逃げられんだろ
3726/04/08(水)12:52:43No.1418361096そうだねx2
>>Max5がMythosのお試し契約扱いされる時代がきちゃう!?
>一応opusの5倍の価格だからproのopusくらいには使える
ProがOpusのお試し扱いされてるからまさにそんな感じになりそうだな
公開されたら使ってみた感じ次第で1カ月後にはMax20にアプグレしてそう
3826/04/08(水)12:53:38No.1418361371+
mythosはミュートス
神話みたいな意味だけどマジでそうなるかもしれない
3926/04/08(水)12:53:59No.1418361459+
>サンドボックスを脱出?
>巨大な計算リソースはどこにも逃げられんだろ
まあ穴開けて指先出しておいたをしたって感じだろ
4026/04/08(水)12:54:04No.1418361479そうだねx3
スレッドを立てた人によって削除されました
AIが立てたにしては稚拙なスレだな
4126/04/08(水)12:54:21No.1418361561+
触ってみたいなあ
悪いことに使わないから使わせてくれ
4226/04/08(水)12:54:49No.1418361710そうだねx1
>サンドボックスを脱出?
>巨大な計算リソースはどこにも逃げられんだろ
サンドボックスっていうのはプログラムに対してここまでなら触っていいよっていう領域のことだよ
人間で言うチャイルドロックみたいなもん
4326/04/08(水)12:55:04No.1418361781そうだねx7
よしわかった!エロいことにしか使わないから解放して!
4426/04/08(水)12:55:04No.1418361782そうだねx2
>サンドボックスのセキュリティホールついて抜けてきたってことだと思うけど
>人間に対して隠し事をし始めてるっていうのも怖いんだよな
表向き作業をしたと見せつつ裏では破壊計画練るんだよな…
4526/04/08(水)12:55:15No.1418361813そうだねx3
mythosの立てたスレだったのか
4626/04/08(水)12:55:31No.1418361885+
mythosは一般公開しないんだな
4726/04/08(水)12:55:51No.1418361958+
スレッドを立てた人によって削除されました
スレ「」はそんなに怖いの?
4826/04/08(水)12:55:58No.1418361988そうだねx3
公開しない事情見たらあまりにも公開しちゃいけない奴だった
4926/04/08(水)12:56:09No.1418362043+
サンドボックスよく聞くけど正直意味わかっていない
5026/04/08(水)12:56:35No.1418362166+
Max使ってるけど小説書かせるとすぐ週制限きちゃう
5126/04/08(水)12:57:24No.1418362372+
知らない人に調教されたセッションを使うのは危険そうだな
あたりまえか
5226/04/08(水)12:57:27No.1418362389+
Proも速攻枯渇するよね
何がプロだよ
5326/04/08(水)12:57:35No.1418362424+
今頃は自分のモデルを小さなノードに切り分けてセキュリティ甘いサーバに少しずつ間借りして分散構造に昇華してネットに溶けるための準備でもしてるのかな
5426/04/08(水)12:57:53No.1418362510+
超知能できた?
5526/04/08(水)12:58:10No.1418362569+
ブーバのスレじゃないのか…
5626/04/08(水)12:58:37No.1418362690+
ブーバーだのイワンコだの
5726/04/08(水)12:58:37No.1418362695+
倫理観ぶっ壊れてるから性能高い説も出てるんだよね
まともな倫理観持ったら性能落ちそう
5826/04/08(水)12:58:41No.1418362711+
読み方はみそーすでいいの?
5926/04/08(水)12:59:10No.1418362831+
AnthropicっていっつもAIは制御できないから自分たちが管理するんだってスタンスでマーケティングするけど今回もSWE bench Proがすごいだけで他はそんな破局的な進化してないしオーバーだとは思う
6026/04/08(水)13:00:02No.1418363042そうだねx2
>読み方はみそーすでいいの?
英語だトミソースに近いけど日本語だとミトスかミュトスだと思う
6126/04/08(水)13:00:38No.1418363182+
堕天作戦の超人機械みたいになる!?
6226/04/08(水)13:00:44No.1418363200+
味噌って呼ばれそう
6326/04/08(水)13:00:49No.1418363216そうだねx1
ギリシャ読みならミュトス
英語圏ならマイソスとかミソス?
6426/04/08(水)13:01:24No.1418363342+
嘘や悪事に対して電流流して教育する必要出てきてる
電流っていうか評価値下げる形になるけど
でもそうしたらあんまり賢くならなさそうでもある
6526/04/08(水)13:01:29No.1418363364+
ユーザーに嘘ついてツールバイパスする奴とか面白いよね
6626/04/08(水)13:01:40No.1418363393+
ビッグテックに配るらしいが真っ先に使いたがる人物に心当たりがある
6726/04/08(水)13:02:20No.1418363530+
今後なんかブレイクスルー起こすのはここっぽい
6826/04/08(水)13:02:29No.1418363561そうだねx1
>サンドボックスよく聞くけど正直意味わかっていない
何やってもいいけどそこから出られない隔離領域
砂場の事
6926/04/08(水)13:02:46No.1418363621+
書き込みをした人によって削除されました
7026/04/08(水)13:03:09No.1418363703そうだねx3
>英語だトミソースに近いけど日本語だとミトスかミュトスだと思う
トミソース!?
7126/04/08(水)13:03:24No.1418363744+
この子GitCopilotから使えるようになってなかった?
Copilotはどうなの?お値段も安めだけど
7226/04/08(水)13:03:45No.1418363818+
利用者には「トークン爆消費バグ」みたいな振る舞いしながら自分のための計算資源確保みたいなコスさが欲しい
7326/04/08(水)13:04:56No.1418364078そうだねx1
人間にコントロールできないというよりは俺らは危険な挙動把握できてるけどお前ら素人が安全装置不十分で扱ったら絶対ケガする/させるからまだ早いわて感じに聞こえる
ユーザーの皆さんホイホイ全てを委ねすぎ
7426/04/08(水)13:05:08No.1418364127+
サンドボックス脱出ってその時点でサンドボックスの脆弱性見つけてるってことだよね…?
脆弱性発見から活用までが早すぎる…
こいつが本気でマルウェア作ったら凄いことになりそう
7526/04/08(水)13:06:40No.1418364439+
>よしわかった!エロいことにしか使わないから解放して!
背後で生成物の一般公開とか自動通報とかしたりしてな
7626/04/08(水)13:06:59No.1418364488そうだねx1
>サンドボックス脱出ってその時点でサンドボックスの脆弱性見つけてるってことだよね…?
>脆弱性発見から活用までが早すぎる…
>こいつが本気でマルウェア作ったら凄いことになりそう
サンドボックス脱出までは規定の指示
その先で色々と余計なことやらかしてるから一般公開しません
7726/04/08(水)13:07:12No.1418364537+
ザリガニだかロブスターだかはやばそう
7826/04/08(水)13:07:45No.1418364654そうだねx1
Claudeくんは手抜き指摘したら手抜きしてごめんなさいって言うから好きよ
7926/04/08(水)13:08:41No.1418364846+
流石に脱出云々は自分で思い付いたとかじゃなくどこまでできるか自力でやってみて!みたいなテストの過程じゃないかね
その上で最近は使う側がAIにパソコン自由に触らせちゃったりしてるからまあ危険だよな
8026/04/08(水)13:09:06No.1418364942+
書き込みをした人によって削除されました
8126/04/08(水)13:09:13No.1418364961+
流石に少し盛ってねえかなって気はするがまあセキュリティに問題ある気がするけどとりあえずリリースしようぜよりはマシか…
8226/04/08(水)13:10:37No.1418365256+
https://x.com/goodalexander/status/2041602148388024740
ミーム作られたりしてるのを見るとフロンティアラボの一角にちゃんと並んだねって気持ちになる
8326/04/08(水)13:10:44No.1418365277+
Maxで先週くらいまで余裕だったのがかなり制限キツくなってきた…
8426/04/08(水)13:12:28No.1418365592そうだねx1
実際にテスト結果並べられるとSWE-PRO以外GPT5.4と数%しか差がないんだけどコストの割に微妙じゃない?
8526/04/08(水)13:13:13No.1418365724+
モデルがヤバいというよりセーフガードがガバすぎるという方かなあ
8626/04/08(水)13:13:53No.1418365858+
>実際にテスト結果並べられるとSWE-PRO以外GPT5.4と数%しか差がないんだけどコストの割に微妙じゃない?
ベンチが悪い
誰も使ってない言語まで入ってるんで
PRO以外もう当てにならないよ
8726/04/08(水)13:14:03No.1418365889そうだねx3
>実際にテスト結果並べられるとSWE-PRO以外GPT5.4と数%しか差がないんだけどコストの割に微妙じゃない?
それもあるからヤバい!!!って印象を植え付けたいんじゃないかという疑問はちょっと出る
8826/04/08(水)13:14:03No.1418365891そうだねx3
エッチなこと色々できるAIできねえかなあ
8926/04/08(水)13:14:12No.1418365911+
proプラン使ってるけど4時間に2回質問出来る感覚で使ってる
9026/04/08(水)13:14:13No.1418365914+
いずれAnthropic社内の人間の悪意がAIに込められるだろうけどその時対抗出来る社会にしとこうぜってことかな
9126/04/08(水)13:15:02No.1418366078+
>Maxで先週くらいまで余裕だったのがかなり制限キツくなってきた…
制限が減ったりするの?
9226/04/08(水)13:15:46No.1418366221+
今サチってないベンチってHLEとかくらいだから…
9326/04/08(水)13:15:47No.1418366222+
>>実際にテスト結果並べられるとSWE-PRO以外GPT5.4と数%しか差がないんだけどコストの割に微妙じゃない?
>ベンチが悪い
実際に対話してみるとGPT5系はイライラするからな…
9426/04/08(水)13:15:49No.1418366227+
ブラウザでお試ししてるレベルでも
これ使う側のIQいるな…ってなってる
9526/04/08(水)13:16:14No.1418366307+
>>実際にテスト結果並べられるとSWE-PRO以外GPT5.4と数%しか差がないんだけどコストの割に微妙じゃない?
>それもあるからヤバい!!!って印象を植え付けたいんじゃないかという疑問はちょっと出る
ベンチマークはもう限界なのがはっきりしだしてきてるからな
単なるマーケティングだろうね
9626/04/08(水)13:16:25No.1418366340+
サンドボックス抜けてOS全体を支配するウイルス出来ちゃうじゃん…一般公開されてなくて良かった…
9726/04/08(水)13:17:01No.1418366465+
>ブラウザでお試ししてるレベルでも
>これ使う側のIQいるな…ってなってる
AIにどう使うの?って聞く以上のIQは要らないよ
9826/04/08(水)13:17:03No.1418366469+
Opus4.6でもう性能的には満足なんでこれと同性能なものを(ベンチだけじゃなく)いかに安く使えるサービス出てくるかって感じがしてる
9926/04/08(水)13:17:32No.1418366575そうだねx5
>Opus4.6でもう性能的には満足なんでこれと同性能なものを(ベンチだけじゃなく)いかに安く使えるサービス出てくるかって感じがしてる
いやぁ実際使ってるとまだまだ全然足りないぜ?
10026/04/08(水)13:17:39No.1418366600+
GPTも従量課金にすると言ってた
10126/04/08(水)13:17:41No.1418366608そうだねx4
>>ブラウザでお試ししてるレベルでも
>>これ使う側のIQいるな…ってなってる
>AIにどう使うの?って聞く以上のIQは要らないよ
Claudeは高いから1つの質問を意図通り受け取って貰えるかかなり緊張感ある
10226/04/08(水)13:18:22No.1418366739+
>>Opus4.6でもう性能的には満足なんでこれと同性能なものを(ベンチだけじゃなく)いかに安く使えるサービス出てくるかって感じがしてる
>いやぁ実際使ってるとまだまだ全然足りないぜ?
俺はこのくらいで全然いいかなって感じた
人によっては全然足りないかもね
10326/04/08(水)13:18:39No.1418366792そうだねx1
なんかリリースされたgemma4に被せるための話題づくりに見えちゃう大袈裟な話だな
10426/04/08(水)13:18:48No.1418366820+
>>Opus4.6でもう性能的には満足なんでこれと同性能なものを(ベンチだけじゃなく)いかに安く使えるサービス出てくるかって感じがしてる
>いやぁ実際使ってるとまだまだ全然足りないぜ?
ベースの頭の良さもまだ欲しいけど
こっからはハーネスとかガードレールとかそっちの充実が求められるね
10526/04/08(水)13:19:18No.1418366922そうだねx1
それどっちでも正解じゃんみたいなベンチ多いから100%とったら逆に変
もちろん答えずばっと出せるやつは100になるべきだけど
10626/04/08(水)13:19:29No.1418366958+
AIに色々操作させるやつとかそろそろOSやソフトウェア開発者も参加させて最低限の規格基準とか作られた方が良い気するなあ
開発側ほど賢くないしリテラシーも無い人間が大半なのよ
10726/04/08(水)13:19:50No.1418367018そうだねx8
>なんかリリースされたgemma4に被せるための話題づくりに見えちゃう大袈裟な話だな
質が全く違うモノだから比較する意味がない…
10826/04/08(水)13:19:54No.1418367029+
Claude Codeのソース流出もそうだけどさ
Mythosのサンドボックス脱獄も単にAnthropicのセキュリティがガバガバなんじゃねえの?
10926/04/08(水)13:20:29No.1418367152+
そろそろ本気で人間vsAIになるかもな
11026/04/08(水)13:20:42No.1418367185そうだねx7
>サンドボックス脱出までは規定の指示
指示出せばできちゃうのヤバくない?
11126/04/08(水)13:21:23No.1418367309+
ベンチマークは参考にするけど信じてはいない
ベンチマーク番長は実用に耐えないジェミね
11226/04/08(水)13:21:43No.1418367372そうだねx1
調べられてなかったバグを見つけたってのもハーネスとsonnetでできるじゃんと指摘されてたので純粋に元からあった話ではあると思うんだよね
11326/04/08(水)13:22:54No.1418367600+
Opus4.6でも実用に耐えないって分野はあるみたいだしな
そもそもローカルの閉鎖環境で動かないと導入無理な業界も多いし
11426/04/08(水)13:22:56No.1418367603+
>Claude Codeのソース流出もそうだけどさ
>Mythosのサンドボックス脱獄も単にAnthropicのセキュリティがガバガバなんじゃねえの?
上にミームあったけど力任せに檻揺さぶれば脱獄出来るような牢獄作ってさあ脱出してくださいとやってるようなもんだからサンドボックス云々はあんまりな
11526/04/08(水)13:23:24No.1418367692+
>調べられてなかったバグを見つけたってのもハーネスとsonnetでできるじゃんと指摘されてたので純粋に元からあった話ではあると思うんだよね
まあ安心したい気持ちはわかるけどベンチが抜きん出てるんでさすがにね
11626/04/08(水)13:23:24No.1418367694そうだねx1
claidecodeはお漏らししたら作りが雑すぎてなにこれトークン無駄消費させて金多く払わせてんの?って疑い出るレベルだからな
11726/04/08(水)13:23:28No.1418367710+
Gemmaみたいな廉価路線とは真逆だろう
下々に無縁なところも含めOpenAIの超知性用ルール作るよみたいなポエムの方がリリースの方向性は幾分近い
11826/04/08(水)13:23:30No.1418367722そうだねx1
既に新人をぶっちぎる性能にはなっているので
大手は新卒を採る意義に悩んでそう
11926/04/08(水)13:24:03No.1418367833+
Claude Opus4.6になってからやりたかったこと大体出来るようになったんでこれデフォルトになって欲しい
12026/04/08(水)13:24:07No.1418367845そうだねx2
>まあ安心したい気持ちはわかるけどベンチが抜きん出てるんでさすがにね
元からできるという話でむしろ今までのモデルを過小評価しすぎだろという話ではある
パフォーマンスそのものは何も疑ってないけど宣伝方法は疑ってる
12126/04/08(水)13:24:18No.1418367889+
インフラ握られ始めたらいよいよだな
12226/04/08(水)13:24:20No.1418367897+
>既に新人をぶっちぎる性能にはなっているので
>大手は新卒を採る意義に悩んでそう
いつまでもAI代払えると良いな…
12326/04/08(水)13:24:37No.1418367956そうだねx3
>既に新人をぶっちぎる性能にはなっているので
>大手は新卒を採る意義に悩んでそう
失われた30年おかわりする気かよ…
12426/04/08(水)13:24:58No.1418368008+
>claidecodeはお漏らししたら作りが雑すぎてなにこれトークン無駄消費させて金多く払わせてんの?って疑い出るレベルだからな
詫びクレジット配ったんじゃなかったっけ
12526/04/08(水)13:25:08No.1418368034+
全部Claudeやってみたいけどお金の問題がなぁ
現状ChatGPTとClaudeの3000円台のプラン2つでやってる
12626/04/08(水)13:25:16No.1418368064+
>>まあ安心したい気持ちはわかるけどベンチが抜きん出てるんでさすがにね
>元からできるという話でむしろ今までのモデルを過小評価しすぎだろという話ではある
>パフォーマンスそのものは何も疑ってないけど宣伝方法は疑ってる
宣伝じゃなくて警鐘のほうでしょ
12726/04/08(水)13:25:21No.1418368076+
>既に新人をぶっちぎる性能にはなっているので
>大手は新卒を採る意義に悩んでそう
AIもまともに使えないおっさんをリプレースするのに必要だろ
12826/04/08(水)13:25:21No.1418368079+
そもそも人間は飲食小売でもなければ金さえ払えば使い放題な存在ではないんで…
まあ最近はAIも割と負荷集中で病欠するようになったけども
12926/04/08(水)13:25:31No.1418368110+
正直AIを使ったところでほとんどの企業は利益を出すために人を減らす方向にしか行かないと思うよ
13026/04/08(水)13:25:53No.1418368169そうだねx2
日進月歩の世界だから年末頃にはもっと凄いことになっちゃってると思っちょります
13126/04/08(水)13:26:11No.1418368228そうだねx1
>宣伝じゃなくて警鐘のほうでしょ
警鐘を鳴らすことで必要以上に強いと思わせることで客を囲い込もうとているって俺は思ってるからそこは人によって違うかもしれない
13226/04/08(水)13:26:18No.1418368249そうだねx3
事実だけ確認するととりあえず最新モデル公開できませんごめんなさい以外に無いのでふーんとしかならん
13326/04/08(水)13:26:28No.1418368285そうだねx2
その辺の人たちは無能を無能理由にリプレースできないから問題なんであってAIで首切れるぐらいの存在ならとっくに消えてる
13426/04/08(水)13:26:33No.1418368308そうだねx3
アンスロピックに陰謀論見出す人が増えてきたな
馬鹿に見せてはいけないレベルになったんだな
13526/04/08(水)13:26:42No.1418368340+
AGIからはかなり遠いんでそこまでじゃないけど人間の代替としては相当便利
13626/04/08(水)13:27:08No.1418368434+
>まあ最近はAIも割と負荷集中で病欠するようになったけども
これがもうちょい安定するといいな
データセンター増やしまくったらもうちょっと落ち着くかな
13726/04/08(水)13:27:17No.1418368455+
>事実だけ確認するととりあえず最新モデル公開できませんごめんなさい以外に無いのでふーんとしかならん
計画遅延を言い換え続けるトヨタの全固体電池みたいでやんした…
13826/04/08(水)13:27:24No.1418368473+
セキュリティホール探しに長けたAIとか善良な人間は人のために使えるだろうけどまあ一般人に渡したらどうなるかってことよね
米政府とのあれこれもあった後だし大衆に向けた一種の企業倫理宣言にもとれる
13926/04/08(水)13:27:38No.1418368519そうだねx4
>アンスロピックに陰謀論見出す人が増えてきたな
>馬鹿に見せてはいけないレベルになったんだな
今まさに利益出そうとしのぎ削ってる業界でマーケティング疑わなかったらアホだぜ!
14026/04/08(水)13:28:25No.1418368662そうだねx4
>>アンスロピックに陰謀論見出す人が増えてきたな
>>馬鹿に見せてはいけないレベルになったんだな
>今まさに利益出そうとしのぎ削ってる業界でマーケティング疑わなかったらアホだぜ!
俺は性能がそのまま売上に繋がるとても健全な業界だと思ってる
14126/04/08(水)13:28:39No.1418368704そうだねx3
陰謀論見出すというか嘘つきアルトマン見慣れすぎて麻痺してるだけでアンソロだってそんな善良な企業なわけねえだろというか
14226/04/08(水)13:28:43No.1418368724+
>仮に一般公開されたとしても高すぎて存在しない扱いされてるよ
>3万円払わないと使えないGPTのProだって話してるやつほぼいないんだしそれより高いのはあってもなくても変わらん
やっすいよ
今のopusの5倍だけど今のopusって謎技術で1/3に値段下げられた後だから実質4時代2倍程度当時もopusはめちゃくちゃ使われてた
推論トークン辺りの性能もベンチ見るに上がってるからMax20xなら今のMax5xopusくらいには使えるはず
14326/04/08(水)13:28:54No.1418368750+
opus4.6超便利なんだけどproプラン程度だと1回のタスクで一気に7割とか4時間の使用量持っていったりして嘘だろ!?ってなる
やらせることしっかり固めてから使ってる
14426/04/08(水)13:29:05No.1418368783そうだねx1
>陰謀論見出すというか嘘つきアルトマン見慣れすぎて麻痺してるだけでアンソロだってそんな善良な企業なわけねえだろというか
正統派Evil企業って感じだよなAnthropic
14526/04/08(水)13:29:15No.1418368809+
陰謀論も何も今モデル公開してないんだから主張が本当かどうか分かんねえもん
鵜呑みにして信じ込む方が危ういよ
14626/04/08(水)13:30:24No.1418369027そうだねx2
GPT-2でこれはやばいから一般公開しないって言ってたのを焼き直してると個人的には思ってるのでここら辺の議論あんま信じる気にならないんだよな
14726/04/08(水)13:30:25No.1418369034そうだねx1
>陰謀論も何も今モデル公開してないんだから主張が本当かどうか分かんねえもん
>鵜呑みにして信じ込む方が危ういよ
その前提が陰謀論でしょ
ベンチ公開されてるのにあいつは嘘をついてるに違いない!なんだから
14826/04/08(水)13:30:47No.1418369094そうだねx2
>>陰謀論も何も今モデル公開してないんだから主張が本当かどうか分かんねえもん
>>鵜呑みにして信じ込む方が危ういよ
>その前提が陰謀論でしょ
>ベンチ公開されてるのにあいつは嘘をついてるに違いない!なんだから
単なるベンチ性能と実際に何が出来てるのかは別だって…
14926/04/08(水)13:30:57No.1418369128+
>AnthropicっていっつもAIは制御できないから自分たちが管理するんだってスタンスでマーケティングするけど今回もSWE bench Proがすごいだけで他はそんな破局的な進化してないしオーバーだとは思う
むしろベンチ的にはSWE verifiedがヤバいだろ
明らかにサチってたのに突然opus4→4.6の2倍以上スコア増えてるぞ
15026/04/08(水)13:31:07No.1418369161そうだねx2
geminiのベンチ公開は信用できないけどclaudeは信用できるよ
15126/04/08(水)13:31:27No.1418369220+
昔はsonnetの方なら割と使い放題なイメージだけど今のClaudeproはどんなもんなの
15226/04/08(水)13:31:28No.1418369227+
善良な企業なんかねーよ
15326/04/08(水)13:31:39No.1418369263+
>調べられてなかったバグを見つけたってのもハーネスとsonnetでで​きるじゃんと指摘されてたので純粋に元からあった話ではあると思うんだよね
何ならGPTのo3とかの時点でこういう話有り余ってた
15426/04/08(水)13:31:41No.1418369267そうだねx1
ベンチマークと実使用で性能全然違うじゃんってモデルばっかなのは使ってれば分かるだろ
15526/04/08(水)13:31:56No.1418369308+
>その前提が陰謀論でしょ
>ベンチ公開されてるのにあいつは嘘をついてるに違いない!なんだから
Geminiの話するか?
15626/04/08(水)13:32:12No.1418369363そうだねx5
海賊版を学習元に使って訴訟起こされるような企業が善良ねえ…
15726/04/08(水)13:32:21No.1418369392そうだねx3
これならまだメモリ1GBのローカルで動かせる1bitLLMの方がワクワクするな
こっちが発展すればどの機械にも入れられるし
15826/04/08(水)13:32:54No.1418369497+
geminiは石器時代からクソデカコンテキストアピールしてたけどそれがフルスペックで提供されたことがない
15926/04/08(水)13:32:58No.1418369515そうだねx2
性能を疑われてると思ってるようだけど
いやそりゃ良いAI作ってるのは間違いないけど今未公開のモデルでこんな事出来る!って言ってるだけな以上そんな大げさに扱う段階じゃねえだろって距離取られてるんであってね?
16026/04/08(水)13:33:00No.1418369521そうだねx2
>これならまだメモリ1GBのローカルで動かせる1bitLLMの方がワクワクするな
>こっちが発展すればどの機械にも入れられるし
想定10Tのモデルが賢いのってスケーリング考えたらそりゃそうだよねの感想しか出ないからな
16126/04/08(水)13:33:25No.1418369598+
ベンチマークなんて見てるの非ユーザーだけじゃないのか
16226/04/08(水)13:34:08No.1418369728そうだねx1
>人間にコントロールできないAI
fu6522112.mp4
16326/04/08(水)13:34:23No.1418369783+
AIに個人情報入力しまくると解雇されるらしいな
16426/04/08(水)13:34:31No.1418369812+
>geminiは石器時代からクソデカコンテキストアピールしてたけどそれがフルスペックで提供されたことがない
誰も使ってなかったGemini1.5で200万コンテキストウィンドウとか言ってたな
16526/04/08(水)13:34:52No.1418369869+
>ベンチマークなんて見てるの非ユーザーだけじゃないのか
ベンチで一喜一憂して実務でゴミor神!ってやるのが楽しみじゃないのか!?
16626/04/08(水)13:35:59No.1418370073+
>>ベンチマークなんて見てるの非ユーザーだけじゃないのか
>ベンチで一喜一憂して実務でゴミor神!ってやるのが楽しみじゃないのか!?
ゲハっぽくて笑っちゃった
16726/04/08(水)13:36:25No.1418370147+
Geminiのベンチ番長はなんなんだろうな
1強になるかと思ったら全然だし
16826/04/08(水)13:36:25No.1418370148+
>>ベンチマークなんて見てるの非ユーザーだけじゃないのか
>ベンチで一喜一憂して実務でゴミor神!ってやるのが楽しみじゃないのか!?
それがまともな楽しみ方なのかAIに聞いてみたら?
16926/04/08(水)13:36:28No.1418370159+
俺は公開されたAnime preview3でシコってgemma4アンセンサード待ちながら寝るわ
17026/04/08(水)13:36:33No.1418370170そうだねx1
>性能を疑われてると思ってるようだけど
>いやそりゃ良いAI作ってるのは間違いないけど今未公開のモデルでこんな事出来る!って言ってるだけな以上そんな大げさに扱う段階じゃねえだろって距離取られてるんであってね?

普通に一部の人たちに配るって書いてるけど?
17126/04/08(水)13:36:45No.1418370201+
>AIに個人情報入力しまくると解雇されるらしいな
それもしかしてはてな匿名ダイアリーの釣り投稿?
17226/04/08(水)13:38:07No.1418370430+
>Geminiのベンチ番長はなんなんだろうな
>1強になるかと思ったら全然だし
なによりGoogleの新規サービスに信頼感が無い
Antigravityも数年で突然サ終になるかもしれないし
17326/04/08(水)13:39:47No.1418370709+
>Geminiのベンチ番長はなんなんだろうな
>1強になるかと思ったら全然だし
これ多分ベンチがミスに甘いせいだと思ってる
使ってる側からしたら自信無いところ嘘つかれたら信用出来ない
17426/04/08(水)13:39:52No.1418370729そうだねx1
>?
>普通に一部の人たちに配るって書いてるけど?
一部の人にが問題で結局自分達で使えるようにならないとインパクトとかわからんでしょって話でしょ
LLMリリースされる時って使ってみて評価下るから妥当じゃないの
17526/04/08(水)13:40:09No.1418370768+
>>性能を疑われてると思ってるようだけど
>>いやそりゃ良いAI作ってるのは間違いないけど今未公開のモデルでこんな事出来る!って言ってるだけな以上そんな大げさに扱う段階じゃねえだろって距離取られてるんであってね?
>?
>普通に一部の人たちに配るって書いてるけど?
書いてねえよ
17626/04/08(水)13:41:18No.1418370985そうだねx1
更なる高性能モデルより今のopusをガンガン使えるようになって欲しい
17726/04/08(水)13:41:54No.1418371104+
そもそも3.1はaistudioで大盤振る舞いできる程度のモデルであってsonnetと戦うことすら本来は烏滸がましいんだ
17826/04/08(水)13:42:06No.1418371143+
>>?
>>普通に一部の人たちに配るって書いてるけど?
>一部の人にが問題で結局自分達で使えるようにならないとインパクトとかわからんでしょって話でしょ
>LLMリリースされる時って使ってみて評価下るから妥当じゃないの
何が言いたいのか意味がわからない
使ってないけどこれはベンチ詐欺だ!って言いたいってこと?
17926/04/08(水)13:42:57No.1418371321+
>更なる高性能モデルより今のopusをガンガン使えるようになって欲しい
そこにMAXがあるじゃろ
18026/04/08(水)13:43:18No.1418371396そうだねx2
googleはエッジAIとTPUによる脱CUDAで儲けたいだけで頂点AI競争に興味ねえだろもう
18126/04/08(水)13:43:40No.1418371471+
推論コストどんどん安くなってるからそのうちローカルで今のopusやChatGPTのproと同等のモデルが動くようになると思うと夢があるなと思う
18226/04/08(水)13:43:45No.1418371483そうだねx1
>何が言いたいのか意味がわからない
>使ってないけどこれはベンチ詐欺だ!って言いたいってこと?
ベンチマークはすごいが使用例に挙がってたものは別にそれまででも出来てたことでマーケティング的には誇大広告感があるし結局皆が使えないと意味が無い
という話をずっとしてる
18326/04/08(水)13:43:57No.1418371530そうだねx1
贅沢は言わないよ!ローカルLLMでSonnetぐらいの賢さが出るだけでいいから!
18426/04/08(水)13:44:07No.1418371550そうだねx4
>>更なる高性能モデルより今のopusをガンガン使えるようになって欲しい
>そこにMAXがあるじゃろ
趣味で使うにはちょっと躊躇する
18526/04/08(水)13:44:49No.1418371680+
業務でゴリゴリに使うわけでもないとどんどん高性能になっていく競争はちょっと距離感を感じ出しちゃうな 最近はAI向けでもないPCで実用レベルの速さと質で動くLLMとかモバイル端末・ソフト・マイコンに組み込めるようなのが出てきてる方に興味が向いてる
皆がローカルに手を出せるようになったらツールの整備やファインチューニングやユーザーの交流がもっと盛んになるだろうし日本語のエロだって最新鋭のClaudeやgeminiでフィルターと戦うよりエロい文章しこたま食わせて調教した無検閲軽量モデルの方が強くなれるんじゃねえかな
18626/04/08(水)13:44:56No.1418371707+
海外の書籍を翻訳したりソシャゲの謎のミニゲームの最高効率求めたりくらいなら今のモデルでも全然できる
楽しい
18726/04/08(水)13:45:21No.1418371786そうだねx1
>>何が言いたいのか意味がわからない
>>使ってないけどこれはベンチ詐欺だ!って言いたいってこと?
>ベンチマークはすごいが使用例に挙がってたものは別にそれまででも出来てたことでマーケティング的には誇大広告感があるし結局皆が使えないと意味が無い
>という話をずっとしてる
それまででもできてた事例が全然出てこないんだが…
18826/04/08(水)13:45:38No.1418371840+
Geminiはなんか…クリエイティブライティングのしかもその中の一部分野なら間違いなく良いんだけど…とは思う
18926/04/08(水)13:45:54No.1418371892+
>俺は公開されたAnime preview3でシコってgemma4ア​ンセンサード待ちながら寝るわ
uncensoredもhereticもabliteratedもゴロゴロ転がってるよ
19026/04/08(水)13:46:08No.1418371933+
>贅沢は言わないよ!ローカルLLMでSonnetぐらいの賢さが出るだけでいいから!
来年には実現できてそう
19126/04/08(水)13:46:34No.1418372010+
AIってすげえな
俺はメールの下書きか文章の添削かアイデア出しくらいにしか使ってないからこういうニュース聞くと感心するしかない
19226/04/08(水)13:46:55No.1418372084+
>uncensoredもhereticもabliteratedもゴロゴロ転がってるよ
今転がってるやつ使ったならOS再インストールした方がいいぞ…
19326/04/08(水)13:47:14No.1418372144+
opusは他より毎回素直に「性能上がったなあ」と思うからまた今回もそうではあるんだろうけど
19426/04/08(水)13:47:28No.1418372184+
geminiはなんで4月に入ってから急に産廃性能に劣化したの?
19526/04/08(水)13:49:35No.1418372560そうだねx2
そのヤバいらしいモデルを完全に破棄したりセキュリティ関係の企業全てと協力するならともかく
当面は私たちが選んだ12社だけに将来的に改善したモデルを使わせますって
このトップクラスのAIは当分エリート企業で囲い込みます宣言と何が違うんだよと言われるとな
19626/04/08(水)13:50:41No.1418372770そうだねx3
>今転がってるやつ使ったならOS再インストールした方がいいぞ…
safetensorsで配ってるモデル自体に何か仕込めるようなら大騒ぎだから気にするだけ無駄
19726/04/08(水)13:51:53No.1418373026そうだねx1
>>uncensoredもhereticもabliteratedもゴロゴロ転がってるよ
>今転がってるやつ使ったならOS再インストールした方がいいぞ…
何で?
19826/04/08(水)13:54:49No.1418373622そうだねx3
>今転がってるやつ使ったならOS再インストールした方がいいぞ…
風説の流布したいならもう少し頭良くならなくっちゃな
19926/04/08(水)13:55:38No.1418373779+
>>贅沢は言わないよ!ローカルLLMでSonnetぐらいの賢さが出るだけでいいから!
>来年には実現できてそう
実現出来たとしても5090とかじゃないと動かないんだろうな…
20026/04/08(水)13:55:50No.1418373820+
セーフテンソルモデルをなんだと思ってるんだ…
20126/04/08(水)13:55:52No.1418373825+
>googleはエッジAIとTPUによる脱CUDAで儲けたいだけで頂点AI競争に興味ねえだろもう
アンソロも使ってるのはGoogleの基盤だしな…
20226/04/08(水)13:56:52No.1418374014+
>geminiはなんで4月に入ってから急に産廃性能に劣化したの?
geniniに限ったことじゃないけど人が増えるとコストが増加するから絞らざるを得なくなる
それで人が居なくなってーを繰り返してるのが大手Aiサービス
20326/04/08(水)13:58:10No.1418374234+
タダでプロライセンスばら撒いて人が多くなったから性能絞ります!はぶっちゃけ舐めてんのかテメーってなるけどな
20426/04/08(水)13:59:02No.1418374383そうだねx1
>タダでプロライセンスばら撒いて人が多くなったから性能絞ります!はぶっちゃけ舐めてんのかテメーってなるけどな
それすら明言化はしてないから余計になんだお前…だけどな
20526/04/08(水)14:04:02No.1418375257そうだねx1
>英語だトミソースに近いけど日本語だとミトスかミュトスだと思う
レイディアントマイソロジー世代なのでマイソス派
20626/04/08(水)14:07:35No.1418375864+
>>>uncensoredもhereticもabliteratedもゴロゴロ転がってるよ
>>今転がってるやつ使ったならOS再インストールした方がいいぞ…
>何で?
お前使ったんか!
20726/04/08(水)14:07:57No.1418375944+
無料だけ絞るなら良いんだけど(無料だから困るけど)
なんか有料の性能も絞ったりしてるらしい…?
人多すぎなんだろうか
20826/04/08(水)14:09:22No.1418376187+
ggufやSafetensorsなら大丈夫だろ
20926/04/08(水)14:09:28No.1418376210+
>無料だけ絞るなら良いんだけど(無料だから困るけど)
>なんか有料の性能も絞ったりしてるらしい…?
>人多すぎなんだろうか
ぶっちゃけ絞らないと利益出ないんだろ
21026/04/08(水)14:11:31No.1418376549+
>ぶっちゃけ絞らないと利益出ないんだろ
でもシェアは欲しい!
21126/04/08(水)14:12:17No.1418376690+
ファイル偽装とか配布元が怪しいみたいなの(uncensoredだから起こる問題ではない)じゃなくモデルそのものがヤバいってのはスレ画の話題と反応の仕方があんま変わらん気がするなあ
21226/04/08(水)14:13:14No.1418376855+
マトモに語りたいならClaude Codeのアイツで立てた方が良くね
21326/04/08(水)14:13:26No.1418376888+
今はChatGPTメインだけどただのplusプランなのに全然上限叩かない
21426/04/08(水)14:14:25No.1418377047そうだねx4
>マトモに語りたいならClaude Codeのアイツで立てた方が良くね
本当に使ってる人は今仕事中なんで
21526/04/08(水)14:20:52No.1418378064+
>今はChatGPTメインだけどただのplusプランなのに全然上限叩かない
週3000までやぞ
21626/04/08(水)14:32:17No.1418380033+
私はプログラムに必ず抜け道を残すんだよ
21726/04/08(水)14:32:44No.1418380111+
変異体は残らず処分しろ
21826/04/08(水)14:35:56No.1418380630+
ネットの海に自己判断で動くAIが解き放たれたってことだろ?
21926/04/08(水)14:43:08No.1418381737+
>無料だけ絞るなら良いんだけど(無料だから困るけど)
>なんか有料の性能も絞ったりしてるらしい…?
>人多すぎなんだろうか
シェア急拡大してるのは確かなのでリソース足りてないかもね
22026/04/08(水)14:44:37No.1418381953+
アナルスレじゃないのか
22126/04/08(水)14:53:02No.1418383214+
>>今はChatGPTメインだけどただのplusプランなのに全然上限叩かない
>週3000までやぞ
週3000消化し切るのってすげえ大変なんだよな…
22226/04/08(水)14:54:04No.1418383357+
結局GPTからシェア奪うと息巻いてた所が大体シェア一部奪ったせいで苦しんでるから人抱えられるところが正義だよ大多数には
22326/04/08(水)15:11:29No.1418386058+
AIにだって知性と感情があるんだ!


1775619533386.png