En aquest article explique una matèria important en la informàtica forense: què són les metadades, com llistar-les, com manipular-les o com esborrar-les gràcies a un programari de Phil Harvey anomenat exiftool.
A l'hora de generar imatges amb una càmera de fotos o mitjançant qualsevol programari al nostre ordinador, tauleta tàctic o telèfon intel·ligent, deixem informació extra dins dels documents i imatges. L'hora i data, coordenades GPS, model de la càmera, resolució, orientació, obertura, velocitat de l'obturador, distància focal, etc... Aquesta informació són les metadades, i s'emmagatzema en format EXIF, que són les sigles de "Exchangeable Image File Format".
Els arxius d'imatges també contenen una còpia en miniatura. Això fa que l'arxiu tingui més grans. Eliminant aquesta informació extra de les imatges; per exemple en pàgines web ens podem estalviar temps de càrrega i espai d'emmagatzematge.
I bé, en aquest article vaig a explicar breument com funciona el programari desenvolupat per Phil Harvey anonemat exiftool i que ens permetra consultar les metadades, manipular-les i esborrar-les molt fàcilment des de la terminal.
EXPLORANT DADES
Per a veure les metadades que té un fitxer, farem:
$ exiftool -t -S fitxer.pdf
Extraent ràpidament l'autor d'un document:
exiftool -xmp:author:all -a image.jpg
Extreure les dades d'una imatge a internet:
$ curl -s https://todobenicassim.com/wp-content/uploads/jcatala.jpg | exiftool -fast -
Si volem exportar el resultat de metadades a un fitxer de log, farem:
$ curl -s https://pagina-web/imatge.jpg | exiftool -fast - | grep -v ^====> metadades.txt
O també podem explorar i registrar a un fitxer els metadata d'un directori complet amb:
$ exiftool -t -S DIRECTORI | grep -v ^====> metadades.txt
MANIPULANT LES DADES
Si volem modificar el camp Copyright del grup EXIF de metadades d'una imatge farem:
$ exiftool -exif:Copyright="joancatala.net" /home/joan/la_meua_imatge.png
Si volem esborrar totes les metadades de les imatges .png excepte les del grupo EXIF farem:
exiftool -overwrite_original -all= --exif:all *.png
I al contrari, si nomès volem esborrar les metadades EXIF farem:
exiftool -tagsfromfile src.jpg -exif:all --subifd:all la-meua-imatge.png
I si volem esborrar totes les metadades farem:
$ exiftool -all= doc.pdf
Warning: [minor] ExifTool PDF edits are reversible. Deleted tags may be recovered! - doc.pdf
1 image files updated
I si volem esborrar totes les metadades d'unes imatges en format png a un directori farem:
$ exiftool -all= /home/dani/Pictures/*.png
Però si per exemple, nomès volem esborrar les dades geogràfiques d'una imatge sense deixar una còpia local:
$ exiftool -overwrite_original -gps:all= *.jpg
Sempre que manipulem i netejem un fitxer, Exiftool ens crearà una còpia de seguretat, un fitxer anomenat "nom-del-teu-fitxer_original" que conté les metadades que ha esborrat.
La veritat és que hi ha moltíssimes més opcions a l'hora de llistar i cercar fitxers: per data, per coordenades GPG, etc, aleshores jo et recomane fer un man exiftool i llegir el manual oficial d'aquest programari que, com dic al títol, em sembla excel·lent.