Passer au contenu principal

v1 — Version stable

25 février 2026 L’API de données Jmail est désormais stable et prête pour une utilisation en production. Les schémas ne changeront pas sans changement de version.

Ce que contient la v1

  • 1,78 M d’emails — Archive complète des emails d’Epstein (Gmail, Yahoo, jeux de données du DOJ 8-11)
  • 1,41 M de documents — Volumes 8-11 du DOJ, House Oversight, archives judiciaires, tous avec métadonnées
  • 531 K+ fragments de texte intégral de documents — Texte extrait de tous les volumes du DOJ via Reducto
  • 18 K photos avec des descriptions générées par l’IA
  • 473 personnes identifiées via la reconnaissance faciale AWS Rekognition
  • 4,5 K iMessages récupérés à partir d’extractions forensiques d’appareils
  • 414 K notations par étoiles de la part des utilisateurs de jmail.world

Formats

Chaque jeu de données est disponible à la fois en Parquet (format colonnaire pour l’analytique) et en NDJSON (compressé en gzip, pour le streaming). Le client Python, DuckDB et le téléchargement direct sont pris en charge.

Infrastructure

  • Servi depuis Cloudflare R2 — aucun frais de sortie, aucune limitation de débit, aucune clé API
  • Mise en cache basée sur les ETag pour des requêtes périodiques efficaces
  • Négociation de contenu (les chemins sans extension redirigent vers Parquet par défaut)
  • L’alias de version /latest/* pointe toujours vers la dernière version