v1 — 2026 年 2 月 25 日リリース。 Jmail Data API は安定しており、本番環境で安心して利用できます。詳細は changelog を参照してください。
data.jmail.world から提供される静的な Parquet ファイルとして配布されます。API キーは不要で、レート制限や認証もありません。data.jmail.world にアクセスすると、ブラウザから直接データにアクセスできます。

利用可能なデータ
| Dataset | 説明 | レコード数 | おおよそのサイズ |
|---|---|---|---|
| Emails | 本文テキスト、送信者、受信者、日付を含む完全なメールアーカイブ | 1.78M | 334 MB |
| Emails (slim) | ネットワーク情報のみのビュー(本文なしで、サイズは大幅に小さい) | 1.78M | 41 MB |
| Documents | ドキュメントのメタデータ(ファイル名、説明、ページ数) | 1.41M | 25 MB |
| Documents (full text) | すべてのドキュメントから抽出された全文テキスト(シャードに分割済み) | 1.41M | 大容量 |
| Photos | AI生成の説明付きの写真メタデータ | 18K | 約 1 MB |
| People | 顔認識によって特定された人物 | 473 | <100 KB |
| Photo Faces | 写真と人物を結びつける顔のバウンディングボックス | 975 | <100 KB |
| Star Counts | クラウドソースによるスター数/関心度カウント | 414K | 約 2 MB |
| Release Batches | リリースバッチのメタデータ(名称、日付) | — | <10 KB |
アクセス方法
Python クライアント

uv run から実行。DuckDB / SQL
SQL を使って HTTP 経由で Parquet ファイルに直接クエリ。ダウンロード不要。
ダイレクト URL
Parquet または NDJSON ファイルを直接ダウンロード。
Jmail エコシステム
Jmail

JDrive

JPhotos

JFlights

JMessages

データソース
- House Oversight Committee(2025年11月)— PDF から変換された Gmail メール(構造化テキスト)
- Department of Justice (DOJ)(2025年12月〜2026年1月)— Epstein Files Transparency Act に基づき公開された文書、写真、メール
- DDoSecrets — Drop Site News と共同で公開された Yahoo メールが、毎週バッチ単位で追加される
ベース URL
フォーマット
- Parquet (
.parquet) — 列指向のバイナリ形式で、分析用途に最適 - NDJSON (
.ndjson.gz) — gzip 圧縮された newline-delimited JSON 形式で、ストリーミングやスクリプト処理向け
