Zum Hauptinhalt springen

v1 — Stabile Version

25. Februar 2026 Die Jmail Data API ist jetzt stabil und für den produktiven Einsatz bereit. Schemas werden nicht ohne einen Versionssprung geändert.

Was in v1 enthalten ist

  • 1,78 Mio. E-Mails — vollständiges Epstein-E-Mail-Archiv (Gmail, Yahoo, DOJ Datasets 8–11)
  • 1,41 Mio. Dokumente — DOJ-Bände 8–11, House Oversight, Gerichtsakten, alle mit Metadaten
  • 531.000+ Dokument-Volltext-Datenfragmente — mithilfe von Reducto aus allen DOJ-Bänden extrahierter Text
  • 18.000 Fotos mit KI-generierten Beschreibungen
  • 473 identifizierte Personen über AWS Rekognition (Gesichtserkennung)
  • 4.500 iMessages aus forensischen Geräteextraktionen wiederhergestellt
  • 414.000 per Crowdsourcing vergebene Sternebewertungen von jmail.world-Nutzer:innen

Formate

Jeder Datensatz ist sowohl in Parquet (spaltenorientierte Analysen) als auch in NDJSON (gzipped, für Streaming) verfügbar. Python-Client, DuckDB und direkter Download werden unterstützt.

Infrastruktur

  • Bereitgestellt über Cloudflare R2 — keine Egress-Gebühren, keine Rate-Limits, keine API-Schlüssel
  • ETag-basiertes Caching für effizientes Polling
  • Content Negotiation (Pfad ohne Dateiendung leitet standardmäßig auf Parquet um)
  • /latest/*-Versionsalias zeigt immer auf die aktuelle Version