30秒でデータを取得
uv
# 最初の5件のメールを表示 uv run clients/python/jmail.py emails --head 5 # ネットワーク情報のみ表示(本文なし、サイズが大幅に小さい) uv run clients/python/jmail.py emails --slim --head 10 # すべてのデータセットURLをリスト表示 uv run clients/python/jmail.py urls
from jmail import JmailClient client = JmailClient() df = client.emails(slim=True) print(df.head())
SELECT sender, COUNT(*) as n FROM read_parquet('https://data.jmail.world/v1/emails-slim.parquet') GROUP BY sender ORDER BY n DESC LIMIT 20;
# Parquet curl -O https://data.jmail.world/v1/emails-slim.parquet # NDJSON(gzip圧縮) curl -O https://data.jmail.world/v1/emails-slim.ndjson.gz