Encoded-word (RFC 2047)
RFC 2047이메일 헤더 필드에서 비 ASCII 문자를 허용하기 위해 RFC 2047("Encoded-Word")에 정의된 인코딩 체계로, =?charset?encoding?text?= 토큰으로 인코딩합니다.
이메일 헤더는 RFC 5322에 의해 7비트 ASCII 문자만 포함해야 합니다. RFC 2047은 우회 방법을 제공합니다: 헤더의 비 ASCII 텍스트는 =?charset?B?...?=(Base64) 또는 =?charset?Q?...?=(quoted-printable) 형식의 "인코딩된 단어"로 표현됩니다. 예를 들어 일본어 제목 줄은 원시 메시지에서 =?ISO-2022-JP?B?...?=로 나타날 수 있으며 표시하기 전에 디코딩해야 합니다.
RFC 2047 디코딩이 없으면 악센트 문자, CJK 문자, 아랍어 또는 기타 비 ASCII 스크립트가 포함된 제목 줄과 발신자 이름이 원시 인코딩 문자열로 나타납니다. 이는 최종 사용자가 전혀 읽을 수 없습니다. 올바른 구현에는 헤더 값에 합법적으로 나타날 수 있는 인코딩된 단어 토큰을 감지하고 지정된 문자셋과 인코딩을 사용하여 각각을 디코딩하는 것이 필요합니다.
Mbox Viewer는 메시지 목록과 검색 인덱스를 구축할 때 모든 헤더 필드에서 RFC 2047 인코딩된 단어를 디코딩합니다. 즉, 원래 스크립트로 작성된 이름(예: 일본어 발신자 이름)을 검색하면 기본 MBOX 파일이 이름을 인코딩된 형식으로 저장하더라도 올바르게 매칭됩니다.