client.emails(slim=False) -> pd.DataFrame
将邮件存档下载为 pandas DataFrame。
为 True 时,将返回一个不包含正文文本列(content_markdown、content_html)的精简数据集。适合用于网络分析、发件人/收件人关系图以及时间线可视化。
pd.DataFrame,其中的列取决于 slim 参数。
from jmail import JmailClient
client = JmailClient()
# 完整数据集,包含邮件正文
df = client.emails()
# 精简版:无邮件正文,下载量更小
df = client.emails(slim=True)
# 筛选 Epstein 发送的邮件
sent = df[df.epstein_is_sender == True]
print(f"Epstein sent {len(sent)} emails")
| 列名 | 类型 | 描述 |
|---|
id | int | 唯一邮件 ID |
doc_id | string | 线程/会话分组 ID |
sender | string | 发件人邮箱/姓名 |
subject | string | 邮件主题 |
to_recipients | json | 收件人列表(收件人数据) |
cc_recipients | json | 抄送收件人列表(收件人数据) |
bcc_recipients | json | 密送收件人列表(收件人数据) |
sent_at | timestamp | 发送时间 |
account_email | string | 源账户邮箱地址 |
email_drop_id | string | 源标识符 |
epstein_is_sender | bool | 是否由 Epstein 发送此邮件 |
| 列 | 类型 | 描述 |
|---|
content_markdown | string | 邮件正文(Markdown 格式) |
content_html | string | 邮件正文(HTML 格式) |
attachments | int | 附件数量 |
https://data.jmail.world/v1/emails.parquet
https://data.jmail.world/v1/emails-slim.parquet
https://data.jmail.world/v1/emails.ndjson.gz
https://data.jmail.world/v1/emails-slim.ndjson.gz