26/04/28(火)01:10:55No.1424516951そうだねx2
06:43頃消えます
学習のために1から正規表現エンジンを書いてきたのだけどだいたいできてきた:
・基本的なメタキャラクタに加えて貪欲さの選択、キャプチャ、先読み・後読みに対応
・Unicodeの書記素クラスタごとにマッチ
・書記素クラスタを分解した上でベース文字にマッチするユニファイ検索
・実行時間に制限をつけてそれを超えたら例外
・マッチ回数に上限をつけてそれを超えたら例外
・検索パターンによってNFA/backtrack/Double Array Aho Corasickエンジンを適宜切り替え
・対象を文字列だけではなくDocumentにもできる
やっと正規表現のこと少し分かりかけてきたよやったぜ
| … | 126/04/28(火)01:12:17No.1424517128そうだねx81から!? |
| … | 226/04/28(火)01:14:19No.1424517435そうだねx5orz |
| … | 326/04/28(火)01:14:24No.1424517446そうだねx8何いってるのかわからん |
| … | 426/04/28(火)01:25:33No.1424518961+文字の置き換えとかすらよくわからん…ってなるのにすげえな… |
| … | 526/04/28(火)01:28:29No.1424519303+正規化かと思ったら正規表現だった |
| … | 626/04/28(火)01:29:04No.1424519381+TompsonVM とか PikeVM までやってるなら JIT と Parallel Regex までやった方が面白いよ |
| … | 726/04/28(火)01:59:18No.1424522737そうだねx14ろりまんこは関係ないのかよ |
| … | 826/04/28(火)03:25:45No.1424529031そうだねx3>性器表現って言いたかっただけかよ |
| … | 926/04/28(火)03:36:22No.1424529472+便利ですよねAWK |
| … | 1026/04/28(火)03:40:54No.1424529632+すげえな |
| … | 1126/04/28(火)03:42:58No.1424529704+RFC的に正確なメールアドレスの正規表現いいよね |
| … | 1226/04/28(火)04:22:23No.1424531102そうだねx1すっげ |
| … | 1326/04/28(火)04:35:59No.1424531490+ライブラリの名前はLerning Objective Regal Expression MANuscript COmputatorにしようと思っています |
| … | 1426/04/28(火)05:00:28No.1424532239+loremancoでgithubにアップしよう!codebergでもいい! |
| … | 1526/04/28(火)05:07:35No.1424532492+>・検索パターンによってNFA/backtrack/Double Array Aho Corasickエンジンを適宜切り替え |
| … | 1626/04/28(火)05:09:24No.1424532559+ところでその画像いいね |
| … | 1726/04/28(火)05:22:51No.1424532959+俺なんてThompson構成法からε除去→NFAをDFA変換→brzozowskiのDFA最小化=同値性の判定程度で「正規表現もう完全に理解したわ」って感じなのに |
| … | 1826/04/28(火)05:26:24No.1424533062+>どういう基準で切り替えるの? |
| … | 1926/04/28(火)05:40:37No.1424533449+orz |