🛠️ FreeTool.jp JP
Categories

Unicode Normalizer

Normalize Unicode text and inspect how each normalization form changes it.

Unicode Utility

Unicode Normalizer

Normalize text with NFC, NFD, NFKC, or NFKD and compare whether characters actually changed.

Normalization form

Choose how canonical or compatibility differences should be handled.

0 chars

Change status

-

Input size

-

Output size

-

Code points

-

UTF-8 Bytes

-

Unicode正規化で出来る事

Unicode正規化ツールは、テキストを NFC・NFD・NFKC・NFKD の各方式で変換し、見た目は同じでも内部のコードポイント構成が異なる文字列を整理して確認できるブラウザ完結型ユーティリティです。たとえば `é` のような合成済み文字と、`e` + 結合アクセントのような分解済み表現は、画面上ではほぼ同じに見えても、検索、比較、重複チェック、ファイル名処理、データベース照合、正規表現マッチングでは別物として扱われることがあります。 また、全角英数字、丸数字、半角カナ、互換文字、合字などは、互換正規化を通すかどうかで一致判定が変わります。このツールでは、入力文字列を 4 種類の正規化フォームで切り替えながら、出力結果だけでなく文字数・コードポイント数・UTF-8バイト数の変化も確認できます。テキスト前処理、検索インデックス作成、ID 比較、CSV や JSON のクレンジング、システム間の文字列差分調査、コピー元不明の文字化け確認などに役立ちます。 処理はすべてブラウザ内で完結するため、社内データや個人情報を含む文字列でも外部に送信せず確認できます。正規化後のテキストはコピーだけでなくテキストファイルとしてダウンロードでき、他システムへの取込みや検証に活用できます。

Unicode正規化の使い方

  1. 正規化したい文字列を入力欄へ貼り付けます。
  2. NFC・NFD・NFKC・NFKD のいずれかを選び、出力結果を比較します。
  3. 文字数やコードポイント数の変化を見ながら、どの方式が用途に合うか判断します。
  4. 必要なら正規化後の文字列をコピーして、検索、比較、保存前処理に使います。

Unicode正規化を使うメリット

  • 見た目では分かりにくい Unicode の内部差分を、正規化フォームごとに整理して確認できます。
  • 全角・半角・互換文字・結合文字の扱いを比較でき、検索や一致判定の前処理に役立ちます。
  • コードポイント数の変化も見られるため、比較失敗や重複判定ミスの原因調査がしやすくなります。
  • ブラウザ内完結なので、機密データを含む文字列でも外部送信せず扱えます。

Developer Tools のすべてのツール (4件)