正規表現テスター
MATCH日本語プリセット20種・パターンの日本語自動解説・置換ビフォーアフター並列表示。初心者からプロまで使える日本語特化の正規表現テスター。
$1 $2 ... でキャプチャグループ参照、$& でマッチ全体、$$ でリテラル「$」
正規表現テスターの使い方
上の「PATTERN」欄に正規表現を入力すると、自動的に「TEST TEXT」のテキスト全体に対してリアルタイムでマッチング判定が実行されます。フラグスイッチで g(全マッチ)i(大小無視)m(複数行)s(dotall)u(Unicode)y(sticky)の各動作を切替えできます。マッチ結果は「MATCHES」にリスト表示され、それぞれの位置・キャプチャグループ内容まで確認可能。何から書けばいいか分からない場合は「PRESET」から日本語プリセットを選んでください — 正規表現とサンプルテスト文字列が同時に読み込まれて、すぐに動作を確認できます。
\d{3}-\d{4} → 「数字3桁、ハイフン、数字4桁」のように、入力した正規表現を日本語で説明。他人の正規表現を読み解くときにも便利。メールアドレスの正規表現サンプル
メールアドレスの厳密な正規表現は RFC 5321/5322 を読み解く必要がありフォーム入力チェックでは過剰です。実務では「緩めの判定」がよく使われます。例:^[\w.+-]+@[\w-]+(\.[\w-]+)+$ なら taro@example.com user+tag@sub.example.co.jp のような一般的なメールアドレスを判定できます。プリセット「メールアドレス」から読み込んで動作確認してみてください。完全準拠の判定は実用上めったに必要ありません — 送信時にエラーが返ってくる仕組みのほうが運用ラクです。
電話番号・郵便番号の正規表現
日本の電話番号は 0 始まりで、携帯(090/080/070)と固定電話(市外局番1〜4桁)とフリーダイヤル(0120/0800)でフォーマットが異なります。プリセット「電話番号」では ^0(?:[789]0-?\d{4}-?\d{4}|\d{1,4}-?\d{1,4}-?\d{4})$ で3パターンを統合判定。郵便番号は ^\d{3}-?\d{4}$ でハイフン有無の両方に対応します。住所入力フォームではハイフン無しでも受け付けるのが親切です。
ひらがな・カタカナ・漢字の判定
Unicode のコードポイント範囲で文字種を判定できます。ひらがな(ぁ-ゖ)、カタカナ(ァ-ヺ)、CJK統合漢字(一-鿿)が代表的な範囲です。長音記号「ー」は ー で、ひらがな・カタカナどちらでも使われるため範囲外に置くケースもあります。プリセット「ひらがなのみ」「カタカナのみ」「漢字を含む」を読み込めば、サンプル文字列でこれらの動作差を確認できます。フリガナ入力フォームのバリデーションや、文字種別の集計に頻用されるパターンです。
| 文字種 | Unicode範囲 | 正規表現 |
|---|---|---|
| ひらがな | U+3041–U+3096 | [ぁ-ゖ] |
| カタカナ | U+30A1–U+30FA | [ァ-ヺ] |
| 長音記号 | U+30FC | [ー] |
| CJK統合漢字 | U+4E00–U+9FFF | [一-鿿] |
| 全角英数字 | U+FF10–U+FF5A | [0-9A-Za-z] |
正規表現の読み解き方(日本語解説機能)
本ツールの「解説」機能は、入力した正規表現を Token に分解して日本語で意味を表示します。\d{3}-\d{4} なら「数字3桁、ハイフン、数字4桁」、^[a-zA-Z][a-zA-Z0-9_]{2,15}$ なら「行頭、英大小文字、英大小文字または数字またはアンダースコアが2〜15回、行末」のように、Token単位で日本語フレーズに変換。完全網羅ではなく頻出パターン80%カバー+未対応は「複雑なパターン」とフォールバックする方針です。他人の書いた正規表現を読み解くとき、自分の書いた正規表現が意図通りか確認するときに便利です。
正規表現の基本フラグ
正規表現のフラグは末尾に付与する1文字のオプションで、マッチ動作を制御します。本ツールの「FLAGS」では6種類すべてに対応:
| フラグ | 名称 | 意味 |
|---|---|---|
g | global | 全マッチ。指定しない場合は最初の1件のみ |
i | ignoreCase | 大文字・小文字を区別しない |
m | multiline | ^$が各行頭・行末にマッチ |
s | dotAll | . が改行文字にもマッチ |
u | unicode | Unicodeコードポイント単位で扱う(絵文字・サロゲートペア対応) |
y | sticky | lastIndex の位置からのみマッチを試みる |
複数行のテキストに対して全マッチを取りたい場合は gm、大文字小文字を区別せず全マッチなら gi のように組み合わせて指定します。
すべてブラウザ内で処理 / プライバシー安心
本ツールは JavaScript の RegExp エンジンをブラウザ内で実行します。入力した正規表現・テスト文字列・置換文字列の一切はサーバーに送信されません。社内データや個人情報を含むテキストで正規表現を検証する場合でも、安全にお使いいただけます。共有URL機能ではパターンとテキスト先頭2000文字を Base64 エンコードして URL に埋め込みますが、これも生成のみブラウザ内で完結し、何処にも送信されません。共有URLをコピーして他人に渡した場合のみ、その相手が URL を開いたときにブラウザ内でデコードされます。