Come estrarre i metadati da un file PDF

Cos'è un Metadato?

Un metadato è una sorta di "dati sui dati". In altre parole, i metadati forniscono informazioni sul contenuto, la qualità, la condizione e altre caratteristiche dei dati. I metadati possono essere utilizzati per descrivere sia risorse fisiche (come libri o prodotti) sia risorse digitali (come file audio, video o documenti).

Esempi di Metadati nei documenti PDF:

  • Metadati Standard: Autore, titolo, data di creazione, dimensione del file.
  • Analisi di Sicurezza: Rilevamento di JavaScript, URI pericolosi, comandi di sistema, oggetti nascosti.
  • Verifiche di Integrità: Calcolo di hash multipli (SHA-256, SHA-512, SHA3, MD5, SHA1).
  • Analisi dei Contenuti: Statistiche sul testo, rilevamento della lingua, parole frequenti.
  • Elementi Incorporati: Rilevamento di file incorporati potenzialmente pericolosi e contenuti 3D/U3D.

I risultati dell'analisi sono utili per:
  1. Sicurezza Preventiva: Identificazione di potenziali minacce prima di aprire documenti sospetti, tra cui JavaScript malevolo, URI pericolosi, e comandi di sistema nascosti.
  2. Verifica dell'Integrità: Gli hash multipli permettono di verificare che il documento non sia stato alterato e di confrontarlo con copie di riferimento.
  3. Analisi Forense: Estrazione di dati nascosti, oggetti stream, moduli XFA e altre caratteristiche utili per analisi investigative.
  4. Conformità e Autenticità: Verifica della presenza di firme digitali e validazione dei metadati per garantire la conformità a requisiti legali.
  5. Analisi Statistica: Comprensione approfondita dei contenuti attraverso statistiche su testo, immagini e struttura del documento.

Nessuna informazione del file è memorizzata nel server di acquisizioniforensi.it.

Nessun file selezionato
Elaborazione in corso...

Analisi di sicurezza avanzata

Questo strumento esegue controlli di sicurezza avanzati per rilevare potenziali minacce nei file PDF, fornendo un'analisi forense completa:

Rilevamento JavaScript

Identifica e analizza codice JavaScript potenzialmente dannoso.

URI Pericolosi

Rileva URL con schemi e domini sospetti o potenzialmente dannosi.

Comandi di Sistema

Identifica azioni che potrebbero eseguire comandi sul sistema ospite.

Oggetti Nascosti

Rileva stream e oggetti potenzialmente nascosti o offuscati.

File Incorporati

Identifica e analizza file incorporati potenzialmente pericolosi.

Contenuti 3D e Moduli XFA

Rileva contenuti 3D e moduli XML Forms che possono contenere script dannosi.