Encoded-word (RFC 2047)
RFC 2047Schemat kodowania zdefiniowany w RFC 2047 ("Encoded-Word"), który pozwala na znaki nie-ASCII w polach nagłówkowych wiadomości e-mail, takich jak Subject i From, kodując je jako tokeny =?charset?kodowanie?tekst?=.
Nagłówki e-mail są wymagane przez RFC 5322 do zawierania tylko 7-bitowych znaków ASCII. RFC 2047 zapewnia obejście: tekst nie-ASCII w nagłówkach jest reprezentowany jako "zakodowane słowo" w formie =?charset?B?...?= (Base64) lub =?charset?Q?...?= (quoted-printable). Na przykład japoński temat może pojawić się w surowej wiadomości jako =?ISO-2022-JP?B?...?= i musi być zdekodowany przed wyświetleniem.
Bez dekodowania RFC 2047, tematy i nazwy nadawców zawierające znaki z akcentami, znaki CJK, arabskie lub jakikolwiek inny skrypt nie-ASCII pojawiają się jako surowe zakodowane ciągi — zupełnie nieczytelne dla końcowego użytkownika. Prawidłowa implementacja wymaga wykrywania tokenów zakodowanych słów wszędzie tam, gdzie mogą legalnie pojawić się w wartości nagłówka, i dekodowania każdego z nich przy użyciu określonego zestawu znaków i kodowania.
Mbox Viewer dekoduje zakodowane słowa RFC 2047 we wszystkich polach nagłówkowych podczas budowania listy wiadomości i indeksu wyszukiwania. Oznacza to, że wyszukiwanie nazwy napisanej w jej oryginalnym piśmie — na przykład japońskiej nazwy nadawcy — będzie prawidłowo dopasowywać, mimo że podstawowy plik MBOX przechowuje nazwę w zakodowanej formie.
Powiązane pojęcia
Kodowanie znaków określające sposób mapowania bajtów w części tekstowej na czytelne znaki. Popularne zestawy znaków to UTF-8, ISO-8859-1 i Shift_JIS; niezgodność powoduje zniekształcony tekst znany jako mojibake.
Blok metadanych na początku wiadomości e-mail, zawierający pola takie jak From, To, Subject, Date oraz liczne pola techniczne opisujące sposób kompozycji, trasowania i kodowania wiadomości.