跳转到主要内容
v1 — 2026 年 2 月 25 日发布。 Jmail Data API 已趋于稳定,可放心用于生产环境。详见 更新日志
Jmail Data API 为 Jeffrey Epstein 电子邮件存档提供免费、开放的访问——包括 House Oversight 委员会、司法部(Department of Justice)以及 Yahoo 账号披露的邮件数据。所有数据都以静态 Parquet 文件形式从 data.jmail.world 提供——无需 API 密钥、无访问频率限制、无需认证。访问 data.jmail.world 可手动访问这些数据。
Jmail 电子邮件存档界面

可用内容

数据集描述记录数约大小
Emails完整邮件存档,包含正文、发件人、收件人和日期1.78M334 MB
Emails (slim)仅网络视图——不含正文,体积更小1.78M41 MB
Documents文档元数据(文件名、描述、页数)1.41M25 MB
Documents (full text)从所有文档中提取出的全文分片1.41M较大
Photos带有 AI 生成的描述的照片元数据18K~1 MB
People通过人脸识别识别出的人物473<100 KB
Photo Faces将照片与人物关联的人脸边界框975<100 KB
Star Counts众包的星标/兴趣计数414K~2 MB
Release Batches发布批次元数据(名称、日期)<10 KB

如何访问

Jmail 生态系统

Data API 为你提供对支撑完整 Jmail 套件的同一份数据的编程访问能力:

数据来源

Jmail 中的所有数据都来自三个主要来源:

基础 URL

所有数据集均从以下 URL 提供:
https://data.jmail.world/v1/

格式

每个数据集都提供以下两种格式:
  • Parquet (.parquet) — 列式二进制文件格式,更适合分析
  • NDJSON (.ndjson.gz) — 经过 gzip 压缩的按行分隔 JSON,适合流式处理和脚本化使用