Skip to content
Mbox Viewer

Encoded-word (RFC 2047)

RFC 2047

Esquema de codificação definido na RFC 2047 ("Encoded-Word") que permite caracteres não-ASCII em campos de cabeçalho de e-mail como Assunto e De, codificando-os como tokens =?charset?codificação?texto?=.

Os cabeçalhos de e-mail são exigidos pela RFC 5322 a conter apenas caracteres ASCII de 7 bits. A RFC 2047 fornece uma solução alternativa: texto não-ASCII em cabeçalhos é representado como uma "palavra codificada" na forma =?charset?B?...?= (Base64) ou =?charset?Q?...?= (quoted-printable). Por exemplo, uma linha de assunto em japonês pode aparecer na mensagem bruta como =?ISO-2022-JP?B?...?= e deve ser decodificada antes de poder ser exibida.

Sem a decodificação RFC 2047, linhas de assunto e nomes de remetentes contendo caracteres acentuados, caracteres CJK, árabe ou qualquer outro script não-ASCII aparecem como strings codificadas brutas — completamente ilegíveis para o usuário final. A implementação correta requer detectar tokens de palavra codificada em qualquer lugar onde possam aparecer legalmente em um valor de cabeçalho e decodificar cada um usando o charset e a codificação especificados.

O Mbox Viewer decodifica palavras codificadas RFC 2047 em todos os campos de cabeçalho ao construir sua lista de mensagens e índice de pesquisa. Isso significa que pesquisar por um nome escrito em seu script original — por exemplo, um nome de remetente em japonês — corresponderá corretamente mesmo que o arquivo MBOX subjacente armazene o nome em forma codificada.

Termos relacionados

Leia seus arquivos MBOX no seu Mac