正規表現でUnicode文字列を処理したい | 正規表現 | JavaScript 目的別リファレンス

現在作成中です。今後加筆修正してまいります。
スポンサーリンク

このプログラムは、Unicode文字列を処理し、特定のパターンにマッチする部分を抽出します。

スポンサーリンク

Unicode文字列処理プログラム

実行例

抽出前の文字列: “Hello, 世界! 🌏”

JavaScriptとHTMLコード


<div id="output"></div>

window.onload = function() {
    const text = "Hello, 世界! 🌏";
    // Unicode文字を含む文字列から英字と絵文字を抽出する正規表現
    const regex = /[\u{0000}-\u{007F}|\u{1F300}-\u{1F5FF}]+/gu;
    const matches = text.match(regex);
    const result = matches ? matches.join(', ') : "マッチするものはありませんでした。";
    // 結果をHTMLに表示する
    document.getElementById('output').innerHTML = `抽出前: ${text} <br> 抽出結果: ${result}`;
};
    

このプログラムの解説

このプログラムでは、与えられたUnicode文字列から次の手順で特定の文字を抽出します:

  • Unicodeの範囲を指定した正規表現を用います。
  • 文字列に対して正規表現を適用し、一致した部分を取得します。
  • 取得した結果をHTMLに表示します。

注意点:

  • Unicodeの範囲は正規表現において明示的に指定する必要があります。
  • マッチしない場合の処理を行うことをお勧めします。

使用したオブジェクトとメソッド

  • String.prototype.match(): 文字列に対して正規表現を適用し、一致する部分を取得します。
  • RegExp: 正規表現オブジェクトを作成します。

Stringオブジェクト メソッドの機能一覧

Stringオブジェクト メソッドの機能一覧 | JavaScript リファレンス
JavaScriptのStringオブジェクトは、文字列を操作するための強力なオブジェクトです。文字列はJavaScriptにおいて非常に重要なデータ型であり、文字の並びを表します。Stringオブジェクトは、プリミティブな文字列をラップするオブジェクトであり、文字列に対するさまざまな操作を行うメソッドを提供します。た...

RegExpオブジェクト メソッドの機能一覧

RegExpオブジェクト メソッドの機能一覧 | JavaScript リファレンス
JavaScriptのRegExpオブジェクトは、正規表現を使用して文字列のパターンを検出、操作するためのオブジェクトです。以下に、RegExpオブジェクトのメソッドをインスタンスメソッドと静的メソッドに分け、アルファベット順にまとめています。 RegExpオブジェクトのインスタンスメソッド メソッド名 説明と注意点 ...