Unicode Normalizer
Normalize Unicode text and inspect how each normalization form changes it.
Unicode Utility
Unicode Normalizer
Normalize text with NFC, NFD, NFKC, or NFKD and compare whether characters actually changed.
Normalization form
Choose how canonical or compatibility differences should be handled.
0 chars
Change status
-
Input size
-
Output size
-
Code points
-
UTF-8 Bytes
-
Unicode正規化で出来る事 About Unicode Normalizer
Unicode正規化ツールは、テキストを NFC・NFD・NFKC・NFKD の各方式で変換し、見た目は同じでも内部のコードポイント構成が異なる文字列を整理して確認できるブラウザ完結型ユーティリティです。たとえば `é` のような合成済み文字と、`e` + 結合アクセントのような分解済み表現は、画面上ではほぼ同じに見えても、検索、比較、重複チェック、ファイル名処理、データベース照合、正規表現マッチングでは別物として扱われることがあります。
また、全角英数字、丸数字、半角カナ、互換文字、合字などは、互換正規化を通すかどうかで一致判定が変わります。このツールでは、入力文字列を 4 種類の正規化フォームで切り替えながら、出力結果だけでなく文字数・コードポイント数・UTF-8バイト数の変化も確認できます。テキスト前処理、検索インデックス作成、ID 比較、CSV や JSON のクレンジング、システム間の文字列差分調査、コピー元不明の文字化け確認などに役立ちます。
処理はすべてブラウザ内で完結するため、社内データや個人情報を含む文字列でも外部に送信せず確認できます。正規化後のテキストはコピーだけでなくテキストファイルとしてダウンロードでき、他システムへの取込みや検証に活用できます。
The Unicode Normalizer is a browser-based tool for applying NFC, NFD, NFKC, and NFKD to text so you can inspect strings that appear identical but are stored with different internal code point sequences. This matters in many real workflows: search indexes, deduplication, user ID matching, filename cleanup, imported CSV or JSON records, validation pipelines, and text comparison tools can behave unexpectedly when one string uses composed characters while another uses decomposed sequences.
Compatibility normalization adds another layer, because full-width letters, circled numbers, ligatures, half-width kana, and other compatibility characters may need to be unified before matching or analysis. This tool lets you paste text, switch normalization forms instantly, compare the resulting output, and check how code-unit length, code-point count, and UTF-8 byte count change after normalization. That makes it useful for debugging data issues, preparing text for consistent storage, cleaning user input, standardizing content before slug generation or keyword matching, and understanding why seemingly equal strings fail equality checks.
Everything runs locally in the browser, so sensitive text remains on your device. The normalized result can be copied to the clipboard or downloaded as a text file, making it easy to transfer the output to other systems or services for validation and processing.
Unicode正規化の使い方 How to use Unicode Normalizer
- 正規化したい文字列を入力欄へ貼り付けます。
- NFC・NFD・NFKC・NFKD のいずれかを選び、出力結果を比較します。
- 文字数やコードポイント数の変化を見ながら、どの方式が用途に合うか判断します。
- 必要なら正規化後の文字列をコピーして、検索、比較、保存前処理に使います。
- Paste the text you want to normalize into the input field.
- Switch between NFC, NFD, NFKC, and NFKD to compare the results.
- Use the size and code-point summaries to understand how the chosen form changes the text.
- Copy the normalized result for search preprocessing, matching, storage cleanup, or debugging.
Unicode正規化を使うメリット Benefits of Unicode Normalizer
- 見た目では分かりにくい Unicode の内部差分を、正規化フォームごとに整理して確認できます。
- 全角・半角・互換文字・結合文字の扱いを比較でき、検索や一致判定の前処理に役立ちます。
- コードポイント数の変化も見られるため、比較失敗や重複判定ミスの原因調査がしやすくなります。
- ブラウザ内完結なので、機密データを含む文字列でも外部送信せず扱えます。
- Shows Unicode normalization differences that are hard to spot by eye alone.
- Helps compare canonical and compatibility handling for full-width, half-width, combining, and compatibility characters.
- Makes string-matching and deduplication issues easier to debug by exposing size and code-point changes.
- Keeps sensitive text local because all normalization happens in the browser.
Developer Tools のすべてのツール (4件) All Developer Tools Tools (4)
該当するツールが見つかりませんでした No matching tools found