跳转到主要内容
client.emails(slim=False) -> pd.DataFrame
将邮件存档下载为 pandas DataFrame。

参数

slim
bool
默认值:"False"
True 时,将返回一个不包含正文文本列(content_markdowncontent_html)的精简数据集。适合用于网络分析、发件人/收件人关系图以及时间线可视化。

返回值

pd.DataFrame,其中的列取决于 slim 参数。

示例

from jmail import JmailClient

client = JmailClient()

# 完整数据集,包含邮件正文
df = client.emails()

# 精简版:无邮件正文,下载量更小
df = client.emails(slim=True)

# 筛选 Epstein 发送的邮件
sent = df[df.epstein_is_sender == True]
print(f"Epstein sent {len(sent)} emails")

列(精简版)

列名类型描述
idint唯一邮件 ID
doc_idstring线程/会话分组 ID
senderstring发件人邮箱/姓名
subjectstring邮件主题
to_recipientsjson收件人列表(收件人数据)
cc_recipientsjson抄送收件人列表(收件人数据)
bcc_recipientsjson密送收件人列表(收件人数据)
sent_attimestamp发送时间
account_emailstring源账户邮箱地址
email_drop_idstring源标识符
epstein_is_senderbool是否由 Epstein 发送此邮件

其他列(完整数据集)

类型描述
content_markdownstring邮件正文(Markdown 格式)
content_htmlstring邮件正文(HTML 格式)
attachmentsint附件数量

直接访问 URL

https://data.jmail.world/v1/emails.parquet
https://data.jmail.world/v1/emails-slim.parquet
https://data.jmail.world/v1/emails.ndjson.gz
https://data.jmail.world/v1/emails-slim.ndjson.gz