Woordenlijst
E-mail- en MBOX-woordenlijst
Sleutelbegrippen voor e-mailarchieven, formaten, protocollen en de anatomie van een bericht — elk met een eigen pagina, uitgelegd in begrijpelijke taal.
Bestandsformaten
Een tekstbestand dat meerdere e-mailberichten achter elkaar opslaat, elk beginnend met een scheidingsregel "From ". Dit is het formaat dat Google Takeout produceert bij het exporteren van je Gmail-archief.
Een bestand met één bericht in MIME-indeling, inclusief kopteksten, inhoud en bijlagen. EML-bestanden worden door veel e-mailclients ondersteund en zijn handig voor het archiveren of delen van afzonderlijke berichten.
Het eigen binaire formaat van Microsoft Outlook voor één e-mailbericht, inclusief kopteksten, inhoud en bijlagen opgeslagen in een samengestelde documentstructuur. In tegenstelling tot EML is MSG geen open tekststandaard.
Personal Storage Table — het containerbestand van Microsoft Outlook voor een volledige mailbox, inclusief mappen, berichten, contactpersonen en agendaonderdelen. Ook bekend als OST bij offline synchronisatie met Exchange of Microsoft 365.
Een mailboxformaat dat elk e-mailbericht als afzonderlijk bestand in een mappenhiërarchie opslaat, in plaats van alle berichten samen te voegen in één bestand zoals MBOX.
Protocollen & diensten
Internet Message Access Protocol — het standaardprotocol voor toegang tot e-mail die is opgeslagen op een server, waarbij berichten gesynchroniseerd blijven op meerdere apparaten zonder ze te downloaden en te verwijderen.
Post Office Protocol 3 — een ouder protocol voor het ophalen van e-mail dat berichten van een server downloadt naar een lokaal apparaat en ze daarna doorgaans van de server verwijdert.
Simple Mail Transfer Protocol — het standaardprotocol voor het verzenden en doorsturen van e-mailberichten tussen mailservers. Het wordt uitsluitend gebruikt voor uitgaande mail; voor het lezen van e-mail zijn IMAP of POP3 vereist.
De officiële dienst van Google voor het exporteren van persoonlijke gegevens, waaronder Gmail. Voor e-mail worden één of meer MBOX-bestanden geproduceerd met alle berichten en Gmail-labels.
Het tagginssysteem van Gmail dat één of meer labels aan elk bericht koppelt, waarmee labels de rol vervullen die mappen innemen in traditionele e-mailclients. Eén bericht kan tegelijkertijd meerdere labels dragen.
Berichtstructuur
Het gestructureerde metadatablok aan het begin van een e-mailbericht, met velden zoals From, To, Subject, Date en talrijke technische velden die beschrijven hoe het bericht is samengesteld, gerouteerd en gecodeerd.
Multipurpose Internet Mail Extensions — de standaard die definieert hoe e-mailberichten niet-ASCII-tekst, HTML-inhoud, bijlagen en andere binaire inhoud coderen binnen de tekststructuur van e-mail.
Een MIME-berichtstructuur die meerdere inhoudsonderdelen combineert — zoals platte tekst, HTML en bijlagen — in één bericht, elk gescheiden door een unieke grensreeks.
Een wereldwijd unieke identificatie die aan elk e-mailbericht wordt toegewezen, opgegeven in de Message-ID-koptekst. Het wordt gebruikt om berichten te traceren, gespreksthreads op te bouwen en duplicaten te detecteren bij het samenvoegen van archieven.
E-mailkopteksten (In-Reply-To en References) die een antwoord koppelen aan het bericht waarop het reageert, waardoor e-mailclients en archiefsystemen gerelateerde berichten kunnen groeperen in gespreksthreads.
De bezorgingsmetadata die SMTP-servers gebruiken om een e-mailbericht te routeren — met name de envelopafzender (MAIL FROM) en envelopont vangers (RCPT TO) — die kunnen afwijken van de zichtbare From- en To-kopteksten.
Een bestand — zoals een PDF, afbeelding of spreadsheet — ingesloten in een e-mailbericht en gecodeerd als een MIME-onderdeel, los van de berichttekst, bestemd om door de ontvanger te worden opgeslagen of geopend.
Een afbeelding die rechtstreeks in de HTML-berichttekst is ingesloten via een Content-ID-referentie (cid:), in plaats van als afzonderlijk downloadbaar bestand te zijn bijgevoegd. De afbeeldingsgegevens zijn opgeslagen als een MIME-onderdeel in hetzelfde bericht.
Codering & tekensets
De tekencodering die aangeeft hoe bytes in een tekstonderdeel worden omgezet naar leesbare tekens. Gangbare tekensets zijn UTF-8, ISO-8859-1 en Shift_JIS; een onjuiste tekenset veroorzaakt onleesbare tekens die bekendstaan als mojibake.
Een binair-naar-tekst-coderingsschema dat willekeurige binaire gegevens vertegenwoordigt met slechts 64 afdrukbare ASCII-tekens, veel gebruikt in e-mail voor het veilig verzenden van bijlagen en binaire inhoud.
Een MIME-overdrachtscodering die tekst met voornamelijk ASCII-tekens vertegenwoordigt door niet-ASCII-bytes te escapen als =XX hexadecimale reeksen. Hierdoor blijft het grootste deel van de tekst leesbaar in de onbewerkte berichtbron.
Een coderingsschema gedefinieerd in RFC 2047 ("Encoded-Word") dat niet-ASCII-tekens in e-mailkoptekstvelden zoals Subject en From mogelijk maakt door ze te coderen als =?tekenset?codering?tekst?=-tokens.
Concepten & functies
Het groeperen van gerelateerde e-mailberichten in gesprekken door de koppelingsketens van In-Reply-To- en References-kopteksten te volgen, doorgaans met het JWZ-algoritme dat maximaal vier niveaus van nesting ondersteunt.
Het opsporen en verwijderen van dubbele e-mailberichten uit een archief, doorgaans door Message-ID-waarden te vergelijken, om redundantie te voorkomen bij het samenvoegen van meerdere MBOX-bestanden.
Een parsetechniek die een bestand stapsgewijs in kleine stukken leest in plaats van het volledige bestand in één keer in het geheugen te laden, waarmee tools zeer grote MBOX-bestanden van tientallen of honderden gigabytes kunnen openen en indexeren met een laag geheugengebruik.
Een compact indexbestand dat Mbox Viewer naast een MBOX-archief schrijft na de eerste verwerking, waarin byte-offsets en metadata van berichten zijn opgeslagen voor een vrijwel direct heropenen zonder het volledige bestand opnieuw te scannen.
Een e-mailbericht waarvan de inhoud is opgemaakt met HTML en CSS, voor rijke typografie, lay-out, kleuren en afbeeldingen. De meeste moderne e-mail is HTML, maar privacy- en beveiligingsoverwegingen vereisen zorgvuldige weergave.
Een macOS-applicatiebundel die native gecompileerde code bevat voor zowel Apple Silicon (ARM64) als Intel (x86_64)-architecturen, en op beide processors native draait zonder emulatie.
App Sandbox is een macOS-beveiligingsfunctie die de toegang van een toepassing tot systeembronnen, bestanden en netwerkverbindingen beperkt, waardoor de potentiële schade wordt beperkt als de app of zijn afhankelijkheden een kwetsbaarheid bevatten.