Analizador en streaming
Técnica de análisis que lee un archivo de forma incremental en pequeños fragmentos en lugar de cargar todo el archivo en memoria de una vez, permitiendo a las herramientas abrir e indexar archivos MBOX muy grandes —decenas o cientos de gigabytes— con un uso reducido de memoria.
Un analizador en streaming procesa un archivo como una secuencia de bytes o líneas, manteniendo en todo momento solo un pequeño búfer y el estado actual del análisis. Esto contrasta con un enfoque en búfer que lee el archivo completo en memoria antes de comenzar el análisis. Para los archivos MBOX, un analizador en streaming puede identificar los límites de los mensajes (las líneas separadoras «From »), extraer las cabeceras y registrar los desplazamientos de bytes sin tener nunca más de un mensaje en memoria a la vez.
El beneficio práctico es que el tamaño del archivo deja de ser una limitación. Una exportación MBOX de 50 GB de un archivo de Gmail de años se abre de la misma manera que un archivo de prueba de 1 MB: el analizador lo recorre secuencialmente, construyendo un índice ligero de posiciones de mensajes, y luego accede directamente a cualquier mensaje cuando se selecciona. El uso de memoria permanece aproximadamente constante independientemente del tamaño del archivo.
El analizador en streaming de Mbox Viewer está diseñado para este caso de uso. En la primera apertura de un archivo MBOX, recorre el archivo para construir un índice binario que registra el desplazamiento de bytes y los metadatos clave de cada mensaje. En aperturas posteriores, el índice se carga en menos de un segundo, por lo que el analizador solo necesita volver a recorrer los mensajes que se abran realmente.
Términos relacionados
Archivo de índice compacto que Mbox Viewer escribe junto al archivo MBOX tras el primer análisis, almacenando desplazamientos de bytes de los mensajes y metadatos para permitir reaperturas casi instantáneas sin volver a escanear el archivo completo.
Formato de archivo de texto plano que almacena múltiples mensajes de correo concatenados, cada uno precedido por una línea separadora «From ». Es el formato que produce Google Takeout al exportar tu archivo de Gmail.