v1 — 稳定版发布
v1 包含内容
- 178 万封电子邮件 — 完整的 Epstein 邮件存档(Gmail、Yahoo、DOJ 数据集 8–11)
- 141 万份文档 — DOJ 卷 8–11、House Oversight、法院记录,全部带有元数据
- 53.1 万+ 文档全文分片 — 使用 Reducto 从所有 DOJ 卷中提取的文本
- 1.8 万张照片,带有 AI 生成的描述
- 473 名已识别人物,通过 AWS Rekognition 人脸识别获得
- 4,500 条 iMessage 消息,从设备取证数据中恢复
- 41.4 万条众包星级评分,来自 jmail.world 用户
格式
基础设施
- 由 Cloudflare R2 提供服务——零出口流量费用、无请求速率限制、无需 API 密钥
- 基于 ETag 的缓存,用于高效轮询
- 内容协商(无扩展名的路径默认重定向到 Parquet)
/latest/*版本别名始终指向当前版本
