Ya hemos comentado sobre los tipos de archivos existentes, codecs, formatos, extensiones, y más. Ahora toca hablar de otra información que permanece oculta para la mayoría de usuarios, pero que es realmente importante. Me estoy refiriendo a los metadados.
También te puede interesar conocer más sobre la recuperación de datos
¿Qué son los metadatos?
En términos técnicos, los metadatos son datos sobre datos, aunque pueda parecer eso raro… o mejor dicho, información adicional sobre los archivos o carpetas. En el contexto de archivos, los metadatos describen cosas como:
- Atributos básicos: nombre del archivo, tamaño, extensión, y tipo.
- Propiedades de sistema: ubicación en el sistema de archivos, permisos de acceso, y propietario.
- Marcas de tiempo: como las fechas de creación, modificación, y último acceso.
- Metadatos específicos del contenido: datos incrustados como etiquetas en fotografías (EXIF), información de autoría en documentos, información del dispositivo que creó la imagen, o subtítulos en videos.
Algunos de estos metadatos se pueden usar para, por ejemplo, poder ordenar archivos por fecha en una carpeta, o para dar ciertos permisos o denegarlos, realizar pruebas forenses, localizar la autoría, etc.
Dicho esto, existen dos categorías principales de metadatos:
- Metadatos estructurales: son aquellos que informan cómo está organizado un archivo, como puede ser el código de un HTML, o la definición de la estructura interna de un PDF, etc. Y estos pueden ser usados por el software que puede abrir o modificar este tipo de archivos o para reconocer del tipo de archivo que se trata.
- Metadatos descriptivos: simplemente proveen información adicional sobre el contenido del archivo (e.g., palabras clave o etiquetas en un archivo multimedia).
Sea cual sea el tipo de metadatos, esta información se almacena de varias maneras, dependiendo del tipo de archivo, sistema operativo, y sistema de archivos utilizado. Por ejemplo, lo normal es que puedan estar repartidos en distintas zonas:
- Sistemas de archivos (FS): en la mayoría de los sistemas de archivos modernos, los metadatos se almacenan como parte de la estructura del sistema de archivos, como puede ser NTFS que almacena los metadatos en una zona denominada MFT (Master File Table) y que contiene entradas para cada archivo, los inodes de sistemas tipo Unix como Linux, o los nodos B-tree en sistemas como APFS y HFS+ de Apple para macOS.
- Dentro del archivo: en algunos formatos, los metadatos están incrustados directamente en el archivo. Ejemplos de esto son los que ya antes nombré, como los EXIF generadas por las cámaras fotográficas con su marca, modelo, configuración, ubicación geográfica de dónde se hizo la foto, etc., o los llamados ID3 Tags para archivos de audio MP3 que almacenan información del título, artista, álbum, etc.
- Fuera del archivo: en algunos casos podría incluso almacenarse en bases de datos asociadas, como pueden ser algunas galerías multimedia, etc.
¿Para qué sirven los metadatos?
Como ya he adelantado anteriormente, los metadatos se pueden usar para multitud de cosas, desde las propias de la gestión de archivos del sistema operativo, pasando por información necesaria para las aplicaciones, y más. Entre los usos más destacados están:
- Organización y gestión: facilitan la organización de archivos al proporcionar información estructurada. Por ejemplo, para ordenar los archivos en una carpeta por su fecha de creación, por nombre, tipo, etc. También pueden servir para herramientas de búsqueda, localizando ciertas palabras clave o etiquetas.
- Seguridad y control de acceso: atributos como permisos, propietario y listas de control de acceso (ACLs) aseguran que solo los usuarios autorizados puedan interactuar con un archivo. Por ejemplo, como los modos o permisos de los archivos en Linux, o los atributos de Windows, para determinar si un archivo se puede ejecutar, si es de solo lectura, si se puede también escribir, etc.
- Preservación y trazabilidad: en entornos legales o empresariales, los metadatos ayudan a rastrear el historial de un archivo, como quién lo creó, cuándo fue modificado, y cómo ha cambiado a lo largo del tiempo. Esto lo usan los forenses de datos para juicios, pero también puede ser usando en otros casos, por ejemplo, para detectar el origen de un archivo, para temas de ciberseguridad, backups, etc.
- Compatibilidad e integridad: los de tipo estructurales garantizan que un archivo pueda abrirse correctamente en aplicaciones compatibles. Por ejemplo, los encabezados en archivos multimedia permiten a los reproductores identificar cómo decodificarlos, sabiendo si un archivo es de texto, de audio, de vídeo, etc.
¿Se pueden modificar o borrar los metadatos?
Los metadatos pueden ser modificados o eliminados dependiendo del tipo y del nivel de acceso que tenga el usuario o aplicación. Por ejemplo, en Windows puedes hacerlo desde propiedades de un archivo o carpeta, mientras que en Linux/Unix lo puedes hacer con comandos como chown o chmod que cambian permisos, propietarios, grupos, etc., entre otras herramientas.
Por otro lado, existen herramientas específicas como puede ser ExifTool, TagEditor, etc., con los que se puede trabajar para modificar o eliminar estos datos de de archivos muy diversos. Para usos más profesionales o para forensía de datos, se pueden emplear herramientas avanzadas como puede ser FOCA, desarrollada por el conocido Chema Alonso, u otras como pueden ser Metadata++, MAT2 (Metadata Anonymization Toolkit), Filemind, PDF-XChange Editor, BleachBit, JPEGCleaner, Doc Scrubber, Metashield, XnView MP, y más.
Riesgos y privacidad asociados con los metadatos
Por último, hay que saber que no solo interesa modificar o eliminar los metadatos por cuestiones técnicas, también puede interesarte por cuestiones de seguridad y privacidad. Como he dicho, los metadatos tienen gran cantidad de información y que puede usar por terceros que tengan algún archivo tuyo para usos ilícitos o conocer más sobre la víctima.
Por ejemplo:
- Filtración de información sensible, ya que pueden contener datos privados como la ubicación geográfica o el historial de modificaciones, lo que representa un riesgo en contextos de seguridad.
- Ataques basados en metadatos, que pueden aprovechar metadatos mal configurados para obtener información sobre sistemas o usuarios. Por ejemplo, los flujos de datos alternativos en NTFS pueden ocultar código malicioso.
- Uso en forense digital por parte de investigaciones forenses, los metadatos son clave para analizar evidencia digital, lo que también puede plantear problemas si un archivo cae en manos no autorizadas o si está implicado en algún delito.
Ya sabes, comenta, tus comentarios serán bienvenidos siempre…