Analyseur en flux continu
Une technique d'analyse qui lit un fichier de manière incrémentale en petits blocs plutôt que de charger l'intégralité du fichier en mémoire, permettant aux outils d'ouvrir et d'indexer des fichiers MBOX très volumineux — des dizaines ou centaines de gigaoctets — avec une faible utilisation de la mémoire.
Un analyseur en flux continu traite un fichier comme une séquence d'octets ou de lignes, maintenant seulement un petit tampon et l'état d'analyse courant à tout moment. Cela contraste avec une approche tamponnée qui lit l'intégralité du fichier en mémoire avant que l'analyse ne commence. Pour les fichiers MBOX, un analyseur en flux continu peut identifier les délimiteurs de messages (les lignes de séparation « From »), extraire les en-têtes et enregistrer les décalages en octets sans jamais conserver plus d'un message en mémoire à la fois.
L'avantage pratique est que la taille du fichier cesse d'être une limitation. Un export MBOX de 50 Go provenant d'une archive Gmail de plusieurs années s'ouvre de la même manière qu'un fichier de test de 1 Mo — l'analyseur le parcourt séquentiellement, construisant un index léger des positions des messages, puis accède directement à n'importe quel message lorsque vous le sélectionnez. L'utilisation de la mémoire reste approximativement constante quelle que soit la taille de l'archive.
L'analyseur en flux continu de Mbox Viewer est conçu pour ce cas d'usage. Lors de la première ouverture d'un fichier MBOX, il parcourt le fichier en flux pour construire un index binaire enregistrant le décalage en octets et les métadonnées clés de chaque message. Lors des ouvertures ultérieures, l'index est chargé en moins d'une seconde, de sorte que l'analyseur n'a besoin de re-parcourir que les messages que vous ouvrez réellement.
Termes liés
Un fichier d'index compact que Mbox Viewer écrit à côté d'une archive MBOX après la première analyse, stockant les décalages en octets des messages et les métadonnées pour permettre des réouvertures quasi instantanées sans re-parcourir l'intégralité du fichier.
Un format de fichier en texte brut qui stocke plusieurs messages électroniques concaténés, chacun commençant par une ligne de séparation « From ». C'est le format produit par Google Takeout lors de l'export d'une archive Gmail.