ichiroc subset

書きながら考える・考えをまとめる場所

Emacs 正規表現シンタックス

\s- という正規表現はスペース

Emacs正規表現を見ていたら "\s-" という表現が出て来た。 良くわからなかったが、何となくスペースが入る位置だったので、 Emacs 正規表現 スペース で検索したら一発で出た。

"\s-" が示すのは 空白、 \t , \n かな。

ついでに他の正規表現を調べた。

EmacsWiki: Regular Expression

シンタックス

分かりきってるのは省いてある。

表現 英語説明 意味
\w word constituent 文字列(文字、数字)
\b word boundary 文字列の区切り文字(空白とか、改行)
\sc character with c syntax (e.g. \s- for whitespace char) わからん C言語での文字列?
\< \> start\end of word 文字列の始まり、終わり
\_< \_> start\end of symbol シンボルの終わり
` \' start\end of buffer\string buffer の終わり
{3} previous character or group, repeated 3 times 3回繰り返し
{3,} previous character or group, repeated 3 or more times 3回以上繰り返し
{3,6} previous character or group, repeated 3 to 6 times 3回から6回の繰り返し

シンタックスクラス

表現 英語説明 意味
\ca ascii character ASCII 文字
\Ca non-ascii character (newline included) ASCII 文字以外
\cl latin character ラテン文字
\cg greek character ギリシャ文字
[:digit:] a digit, same as [0-9] 数字
[:alpha:] an alphanumeric character アルファベット
[:upper:] a letter in uppercase アルファベット大文字
[:space:] a whitespace character, as defined by the syntax table スペース文字
[:xdigit:] an hexadecimal digit 16進数
[:cntrl:] a control character 制御文字
[:ascii:] an ascii character ASCII 文字
\s- whitespace character 空白文字 タブ 改行
\sw word constituent 文字列
\s_ symbol constituent シンボル
\s. punctuation character 句読点 (英語の)
\s( open delimiter character 開き括弧類
\s) close delimiter character 閉じ括弧類
\s" string quote character 文字列のクォーテーション " とか '
\s\ escape character エスケープ文字 \
\s/ character quote character わからん
\s$ paired delimiter わからん ペアになった区切り文字?
\s' expression prefix わからん 式の接頭辞?
\s< comment starter コメント開始っぽいけど、ヒットしない
\s> comment ender コメント終了っぽいけど、行末にヒットする
\s! generic comment delimiter わからん コメントの区切り
\s generic string delimiter わからん 文字列の区切り

[:digit:] などの形式は,実際には [[:digit:]] としないといけないので注意

まとめ

今後活用したいが、絶対使わなそうなものも多数あるな。

参考

EmacsWiki: Regular Expression