Skip to content
Mbox Viewer

Encoded-word (RFC 2047)

RFC 2047

Subject や From などのメールヘッダーフィールドに非 ASCII 文字を使用できるようにする RFC 2047(「Encoded-Word」)で定義されたエンコーディング方式で、=?charset?encoding?text?= トークンとしてエンコードします。

メールヘッダーは RFC 5322 により7ビット ASCII 文字のみを含むことが要求されています。RFC 2047 はこれを回避する方法を提供します:ヘッダー内の非 ASCII テキストは =?charset?B?...?=(Base64)または =?charset?Q?...?=(quoted-printable)の形式の「エンコードワード」として表現されます。たとえば日本語の件名は生のメッセージ内では =?ISO-2022-JP?B?...?= として表示され、表示前にデコードが必要です。

RFC 2047 デコードなしでは、アクセント付き文字、CJK 文字、アラビア語、その他の非 ASCII スクリプトを含む件名や送信者名が生のエンコード文字列として表示され、エンドユーザーにはまったく読めません。正しい実装には、ヘッダー値内で法的に現れる可能性のある場所でエンコードワードトークンを検出し、指定された文字セットとエンコーディングを使用してそれぞれをデコードすることが必要です。

Mbox Viewer はメッセージリストと検索インデックスを構築する際にすべてのヘッダーフィールドの RFC 2047 エンコードワードをデコードします。これにより、日本語の送信者名など元のスクリプトで書かれた名前を検索すると、基礎の MBOX ファイルがエンコード形式で名前を保存していても正しくマッチします。

関連用語

Mac で MBOX ファイルを開く