client.emails(slim=False) -> pd.DataFrame
Téléchargez l’archive d’e-mails au format DataFrame pandas.
Lorsque la valeur est True, renvoie un ensemble de données plus réduit sans les colonnes de texte du corps de message (content_markdown, content_html). Idéal pour l’analyse de réseaux, les graphes expéditeur/destinataire et les visualisations de chronologies.
pd.DataFrame avec des colonnes qui dépendent du paramètre slim.
from jmail import JmailClient
client = JmailClient()
# Jeu de données complet avec le corps des messages
df = client.emails()
# Slim : sans corps de message, téléchargement beaucoup plus léger
df = client.emails(slim=True)
# Filtrer pour ne garder que les e-mails envoyés par Epstein
sent = df[df.epstein_is_sender == True]
print(f"Epstein sent {len(sent)} emails")
| Colonne | Type | Description |
|---|
id | int | ID d’e-mail unique |
doc_id | string | ID de regroupement de fil de discussion |
sender | string | E-mail/nom de l’expéditeur |
subject | string | Objet de l’e-mail |
to_recipients | json | Destinataires principaux |
cc_recipients | json | Destinataires en copie (CC) |
bcc_recipients | json | Destinataires en copie cachée (BCC) |
sent_at | timestamp | Date d’envoi |
account_email | string | Compte source |
email_drop_id | string | Identifiant de source |
epstein_is_sender | bool | Indique si Epstein a envoyé cet e-mail |
Colonnes supplémentaires (complètes)
| Colonne | Type | Description |
|---|
content_markdown | string | Corps de l’email au format Markdown |
content_html | string | Corps de l’email au format HTML |
attachments | int | Nombre de pièces jointes |
https://data.jmail.world/v1/emails.parquet
https://data.jmail.world/v1/emails-slim.parquet
https://data.jmail.world/v1/emails.ndjson.gz
https://data.jmail.world/v1/emails-slim.ndjson.gz