跳转到主要内容

v1 — 稳定版发布

2026 年 2 月 25 日 Jmail Data API 现已稳定,可在生产环境中使用。除非版本号升级,否则 schema(模式)不会更改。

v1 包含内容

  • 178 万封电子邮件 — 完整的 Epstein 邮件存档(Gmail、Yahoo、DOJ 数据集 8–11)
  • 141 万份文档 — DOJ 卷 8–11、House Oversight、法院记录,全部带有元数据
  • 53.1 万+ 文档全文分片 — 使用 Reducto 从所有 DOJ 卷中提取的文本
  • 1.8 万张照片,带有 AI 生成的描述
  • 473 名已识别人物,通过 AWS Rekognition 人脸识别获得
  • 4,500 条 iMessage 消息,从设备取证数据中恢复
  • 41.4 万条众包星级评分,来自 jmail.world 用户

格式

每个数据集都同时提供 Parquet(列式分析格式)和 NDJSON(gzip 压缩,便于流式处理)两种格式。支持通过 Python 客户端、DuckDB,以及直接下载的方式访问。

基础设施

  • 由 Cloudflare R2 提供服务——零出口流量费用、无请求速率限制、无需 API 密钥
  • 基于 ETag 的缓存,用于高效轮询
  • 内容协商(无扩展名的路径默认重定向到 Parquet)
  • /latest/* 版本别名始终指向当前版本