v1 — 2026 年 2 月 25 日发布。 Jmail Data API 已趋于稳定,可放心用于生产环境。详见 更新日志。
data.jmail.world 提供——无需 API 密钥、无访问频率限制、无需认证。访问 data.jmail.world 可手动访问这些数据。

可用内容
| 数据集 | 描述 | 记录数 | 约大小 |
|---|---|---|---|
| Emails | 完整邮件存档,包含正文、发件人、收件人和日期 | 1.78M | 334 MB |
| Emails (slim) | 仅网络视图——不含正文,体积更小 | 1.78M | 41 MB |
| Documents | 文档元数据(文件名、描述、页数) | 1.41M | 25 MB |
| Documents (full text) | 从所有文档中提取出的全文分片 | 1.41M | 较大 |
| Photos | 带有 AI 生成的描述的照片元数据 | 18K | ~1 MB |
| People | 通过人脸识别识别出的人物 | 473 | <100 KB |
| Photo Faces | 将照片与人物关联的人脸边界框 | 975 | <100 KB |
| Star Counts | 众包的星标/兴趣计数 | 414K | ~2 MB |
| Release Batches | 发布批次元数据(名称、日期) | — | <10 KB |
如何访问
Python Client

uv run 实现零安装。DuckDB / SQL
通过 HTTP 使用 SQL 直接查询 Parquet 文件。无需下载。
Direct URLs
直接下载 Parquet 或 NDJSON 文件。
Jmail 生态系统
Jmail

JDrive

JPhotos

JFlights

JMessages

数据来源
- House Oversight Committee(2025 年 11 月)— 来自 Gmail 的邮件,由 PDF 转换为结构化文本
- Department of Justice(2025 年 12 月–2026 年 1 月)— 根据 Epstein Files Transparency Act 发布的文档、照片和邮件
- DDoSecrets — 与 Drop Site News 合作发布的 Yahoo 邮件,每周批量添加
基础 URL
格式
- Parquet (
.parquet) — 列式二进制文件格式,更适合分析 - NDJSON (
.ndjson.gz) — 经过 gzip 压缩的按行分隔 JSON,适合流式处理和脚本化使用
