Encoded-word (RFC 2047)
RFC 2047Esquema de codificación definido en el RFC 2047 («Encoded-Word») que permite caracteres no ASCII en campos de cabecera de correo como Subject y From, codificándolos como tokens =?juego-de-caracteres?codificación?texto?=.
Las cabeceras de correo deben contener según el RFC 5322 únicamente caracteres ASCII de 7 bits. El RFC 2047 proporciona una solución alternativa: el texto no ASCII en las cabeceras se representa como una «palabra codificada» con la forma =?juego-de-caracteres?B?...?= (Base64) o =?juego-de-caracteres?Q?...?= (quoted-printable). Por ejemplo, una línea de asunto en japonés puede aparecer en el mensaje sin procesar como =?ISO-2022-JP?B?...?= y debe decodificarse antes de poder mostrarse.
Sin la decodificación RFC 2047, las líneas de asunto y los nombres de remitentes que contienen caracteres acentuados, caracteres CJK, árabe o cualquier otro carácter no ASCII aparecen como cadenas codificadas sin procesar, completamente ilegibles para el usuario final. La implementación correcta requiere detectar los tokens de palabra codificada en cualquier lugar donde puedan aparecer legalmente en un valor de cabecera y decodificar cada uno usando el juego de caracteres y la codificación especificados.
Mbox Viewer decodifica las palabras codificadas del RFC 2047 en todos los campos de cabecera al construir su lista de mensajes e índice de búsqueda. Esto significa que buscar un nombre escrito en su escritura original —por ejemplo, el nombre de un remitente en japonés— coincidirá correctamente aunque el archivo MBOX subyacente almacene el nombre en forma codificada.
Términos relacionados
Codificación de caracteres que especifica cómo se mapean los bytes de una parte de texto a caracteres legibles. Los juegos de caracteres habituales incluyen UTF-8, ISO-8859-1 y Shift_JIS; una discordancia provoca texto ilegible conocido como mojibake.
Bloque de metadatos estructurado al inicio de un mensaje de correo, que contiene campos como From, To, Subject, Date y numerosos campos técnicos que describen cómo se compuso, enrutó y codificó el mensaje.