Message-ID
Eine global eindeutige Kennung, die jeder E-Mail-Nachricht zugewiesen wird und im Message-ID-Header angegeben ist. Sie wird verwendet, um Nachrichten zu verfolgen, Konversations-Threads aufzubauen und Duplikate beim Zusammenführen von Archiven zu erkennen.
Der Message-ID-Header (RFC 5322, Abschnitt 3.6.4) enthält eine Zeichenkette, die über alle jemals gesendeten E-Mails hinweg eindeutig sein soll. Sie ist typischerweise als lokaler-Teil@Domain-Zeichenkette formatiert, z. B. <CABcde12345@mail.gmail.com>. Der sendende Mailserver generiert diese Kennung zum Zeitpunkt der Übertragung. Antworten enthalten die Message-ID der Originalnachricht in ihren In-Reply-To- und References-Headern, um die Konversation zu verknüpfen.
Message-ID ist der primäre Schlüssel, den Threading-Algorithmen verwenden, um Konversationen zu rekonstruieren. Sie wird auch bei der Deduplizierung eingesetzt: Beim Zusammenführen zweier MBOX-Dateien, die sich überschneiden können – beispielsweise zwei Google-Takeout-Exporte von unterschiedlichen Datumsangaben –, ermöglicht der Vergleich von Message-IDs der Anwendung, bereits vorhandene Nachrichten zu erkennen und zu überspringen.
In seltenen Fällen können Message-IDs fehlen (bei sehr alten Nachrichten) oder doppelt vorkommen (durch fehlerhafte Sendesoftware). Ein robustes Archivwerkzeug behandelt diese Sonderfälle, indem es auf eine heuristische Übereinstimmung anhand anderer Kopfzeilen wie Date, From und Subject zurückgreift, wenn eine Message-ID fehlt oder unzuverlässig ist.
Verwandte Begriffe
E-Mail-Kopfzeilen (In-Reply-To und References), die eine Antwort mit der Nachricht verknüpfen, auf die sie antwortet. Sie ermöglichen es Mail-Clients und Archivwerkzeugen, zusammengehörige Nachrichten zu Konversations-Threads zu gruppieren.
Der Prozess des Erkennens und Entfernens doppelter E-Mail-Nachrichten aus einem Archiv, typischerweise durch Vergleich von Message-ID-Werten, um Redundanz beim Zusammenführen mehrerer MBOX-Dateien zu vermeiden.
Der Prozess, zusammengehörige E-Mail-Nachrichten zu Konversationen zu gruppieren, indem In-Reply-To- und References-Kopfzeilenverknüpfungen verfolgt werden, typischerweise mit dem JWZ-Algorithmus, der bis zu vier Verschachtelungsebenen unterstützt.