Vai al contenuto principale

v1 — Versione stabile

25 febbraio 2026 La Jmail Data API è ora stabile e pronta per l’utilizzo in produzione. Gli schemi non verranno modificati senza un cambio di versione.

Cosa include la v1

  • 1,78M email — Archivio completo di email di Epstein (Gmail, Yahoo, dataset DOJ 8-11)
  • 1,41M documenti — Volumi DOJ 8-11, House Oversight, atti giudiziari, tutti con metadati
  • 531K+ frammenti di testo integrale dei documenti — Testo estratto da tutti i volumi DOJ tramite Reducto
  • 18K foto con Descrizioni generate dall’IA
  • 473 persone identificate tramite riconoscimento facciale con AWS Rekognition
  • 4,5K iMessage recuperati da estrazioni forensi dei dispositivi
  • 414K valutazioni a stelle crowd-sourced dagli utenti di jmail.world

Formati

Ogni dataset è disponibile in formato Parquet (analisi colonnare) e in NDJSON (compressi con gzip, per lo streaming). Sono tutti supportati: client Python, DuckDB e download diretto.

Infrastruttura

  • Distribuito tramite Cloudflare R2 — nessun costo di egress, nessun rate limit, nessuna API key
  • Caching basato su ETag per polling efficienti
  • Content negotiation (i path senza estensione reindirizzano a file Parquet per impostazione predefinita)
  • L’alias di versione /latest/* punta sempre alla versione corrente