Sauvegarder un post Substack en Markdown (paywall géré, sans cross-promo)
Substack ne veut pas que vous partiez avec le contenu. Pas d’export natif, pas de bouton « télécharger ce post », pas d’API publique pour que les abonnés payants puissent sauvegarder les essais qu’ils ont achetés. Chaque post que vous ouvrez est emballé dans des overlays de modale d’abonnement, des blocs de cross-promotion d’autres newsletters du réseau, et un pied de page qui mendie une adresse email. Si vous avez déjà essayé de glisser un essai Substack dans Claude ou Obsidian, vous connaissez le problème --- copier depuis la page traîne le bruit avec.
Ce guide couvre toutes les méthodes pour convertir un post Substack en Markdown propre --- d’un seul essai à un long-read derrière un paywall avec audio intégré.
Pourquoi sauvegarder des posts Substack en Markdown ?
Markdown est le format qui fonctionne partout où une newsletter doit aller :
- Archivez vos essais préférés --- les auteurs quittent Substack, les posts passent derrière des paywalls, les comptes se font suspendre. Vos notes ne devraient pas dépendre de la disponibilité d’une plateforme
- Construisez une bibliothèque de recherche --- un dossier de fichiers
.mdpropres est consultable en quelques secondes à travers des centaines de newsletters - Alimentez un LLM --- Claude, ChatGPT, Gemini et les modèles locaux lisent tous le Markdown nativement comme contexte
- Échappez au verrouillage par plateforme --- un abonnement payant vous achète l’accès, pas la propriété. Markdown vous donne la copie pour laquelle vous avez déjà payé
- Citer un passage précis --- trouver « ce paragraphe sur les intérêts composés » dans un essai de 5 000 mots est à une recherche près
- Traduire un post en langue étrangère --- une fois sous forme de texte, n’importe quel outil de traduction fonctionne dessus
Le cas d’usage qui pousse l’essentiel du trafic Substack-vers-Markdown en 2026, ce sont les deux premiers : les gens veulent une copie permanente et portable des essais qui les intéressent, découplée de la plateforme.
Méthode 1 : Minibase (le plus rapide, en un clic)
Minibase est une extension Chrome qui transforme n’importe quel post Substack en fichier Markdown en un clic. Elle lit le corps du post directement depuis le DOM, supprime chaque modale d’abonnement et bloc de cross-promo, et produit quelque chose qui se lit comme l’essai original, pas comme une page scrapée.
Comment ça marche :
- Ouvrez le post Substack dans Chrome
- Cliquez sur l’icône de l’extension Minibase dans votre barre d’outils
- Un fichier
.mdse télécharge instantanément (ou atterrit dans votre Minibase Vault si connecté)
Ce que vous obtenez :
- Titre et sous-titre du post en tant que titres Markdown
- Nom de l’auteur, date de publication et nom de la newsletter dans le frontmatter
- Corps complet avec tous les titres, citations en exergue et images intégrées préservés
- Citations en bloc conservées comme citations Markdown
>, pas rendues comme styles de page - Épisodes de podcast intégrés en tant que références audio Markdown avec l’URL originale
- Notes de bas de page intégrées là où elles vont
- Frontmatter avec titre, auteur, newsletter, date de publication et URL canonique
Ce qui est supprimé :
- Overlays de modale d’abonnement qui apparaissent au milieu du scroll
- Blocs de cross-promotion « From X’s Substack » en haut et bas du post
- Bannières d’appel à l’action « Share this post » / « Pledge your support » / « Restack »
- Formulaires d’inscription en pied de page et grilles de recommandation
- Le chrome de navigation Substack et la barre flottante de progression de lecture
Idéal pour : chercheurs, rédacteurs, toute personne avec des abonnements payants qu’elle veut réellement posséder, utilisateurs d’IA qui fournissent du contexte à Claude ou ChatGPT. Si vous avez besoin d’un essai propre que vous collerez dans un LLM ou que vous lirez dans Obsidian, c’est le chemin le plus propre.
Exemple de sortie
Sauvegarder un essai de Packy McCormick produit :
---
title: "The Substack Renaissance"
subtitle: "How creator-led media is rebuilding the internet from the bottom up"
author: Packy McCormick
newsletter: Not Boring
url: https://www.notboring.co/p/the-substack-renaissance
date: 2026-02-14
---
# The Substack Renaissance
## How creator-led media is rebuilding the internet from the bottom up
Five years ago, the idea that a single writer could sustain a six-figure
business from a newsletter sounded absurd. Today there are hundreds of
them, and the model is starting to eat traditional media from the edges.
> "The best journalism of the next decade won't come from newsrooms.
> It'll come from one person, a Substack, and a community of 20,000
> readers who actually care."
## Why Now
Three things converged...
Ce fichier est à un collage d’être un contexte Claude utilisable, à une frappe de touche d’être une note Obsidian permanente.
Méthode 2 : email + reformatage manuel
Chaque post Substack est aussi livré sous forme d’email. Vous pouvez sauvegarder l’email et le convertir en Markdown à la main.
Étapes :
- Ouvrez le post dans votre Gmail ou Apple Mail
- Voir la source ou « Afficher l’original », copiez le HTML
- Passez-le dans un convertisseur HTML-vers-Markdown (Pandoc, turndown, html2md)
- Supprimez manuellement la bannière d’en-tête, le formulaire d’inscription du pied de page et les blocs de cross-promo
Problèmes avec cette approche :
- Les emails Substack sont enveloppés dans du HTML lourd à base de tableaux qui se convertit en Markdown moche
- Les blocs de cross-promo (« Subscribe to X who also writes on Substack ») sont profondément imbriqués et difficiles à supprimer avec une seule regex
- Les podcasts intégrés arrivent en tant que lecteurs audio inline qui ne se traduisent pas en Markdown
- Les notes de bas de page sont dupliquées entre le corps et le pied de page de l’email
- Les images sont référencées par des URLs de tracking qui expirent
- Les posts derrière paywall arrivent sous forme d’aperçus tronqués dans l’email, donc l’essai complet n’est même pas là
Faisable pour un seul post court. S’effondre sur du long ou du contenu payant.
Méthode 3 : flux RSS + script
Chaque Substack public a un flux RSS à <newsletter>.substack.com/feed. Vous pouvez le sonder et convertir chaque élément en Markdown.
curl https://newsletter.substack.com/feed | \
pandoc -f html -t markdown -o post.md
Idéal pour : les équipes d’ingénierie qui archivent des newsletters à grande échelle, ou toute personne qui construit un pipeline de lecture automatisé. Nécessite un environnement de scripting et un cron.
Problèmes avec cette approche :
- RSS n’expose que les posts gratuits. Les essais derrière paywall n’apparaissent pas dans le flux
- Le flux retourne le HTML formaté pour email, donc vous héritez de tout le bruit de cross-promo et de formulaire d’inscription
- Pas de métadonnées d’auteur au-delà du nom du canal --- les posts invités sont attribués à la newsletter, pas à l’auteur
- Les podcasts intégrés sont supprimés du payload RSS
- Les citations en exergue perdent leur style et fusionnent dans le texte du corps
- La passe de nettoyage (supprimer les blocs d’abonnement, corriger les URLs d’images) est une étape séparée
C’est la bonne méthode si vous construisez un pipeline pour une newsletter publique pour laquelle vous avez les droits. C’est overkill pour un seul post, et ça ne peut pas atteindre le contenu payant que la plupart des lecteurs veulent réellement archiver.
Méthode 4 : Minibase As (PDF) du navigateur + OCR
Le « Enregistrer en PDF » de Chrome fonctionne sur n’importe quelle page, y compris les posts Substack derrière paywall auxquels vous êtes connecté.
Étapes :
- Ouvrez le post dans Chrome
Cmd+P, choisissez « Enregistrer en PDF »- Passez le PDF dans un outil OCR (Adobe Acrobat, Tesseract, ou
pdftotext) - Nettoyez la sortie en Markdown
Problèmes pour le cas d’usage Markdown :
- La sortie est formatée en pages, pas en document --- les titres perdent leur hiérarchie, les paragraphes coupent à la limite des pages
- Les overlays de modale d’abonnement s’affichent souvent dans le PDF, donc le bruit vient avec
- Citations en exergue, citations en bloc et exemples de code perdent tous leur structure
- Les images sont gravées dans la page en pixels, pas référencées --- pas moyen de récupérer les originaux
- L’OCR introduit des coquilles sur la typographie serif lourde des newsletters
- Les podcasts intégrés et les liens ne survivent pas à l’aller-retour PDF
Méthode de dernier recours quand rien d’autre ne peut atteindre le contenu. Pas un workflow principal.
Quelle méthode utiliser ?
| Scénario | Meilleure méthode |
|---|---|
| Coller un essai Substack dans Claude ou ChatGPT | Minibase --- un clic, sortie structurée |
| Archiver vos abonnements payants | Minibase --- fonctionne sur les posts derrière paywall auxquels vous êtes connecté |
| Construire une bibliothèque de recherche personnelle de newsletters | Minibase --- frontmatter cohérent, facile à rechercher |
| Auto-archiver une newsletter gratuite à grande échelle | RSS + script --- programmatique, mais posts gratuits seulement |
| Workflow par email avec triage manuel | Email + reformatage --- fonctionne si vous ne sauvegardez que 1-2 essais par semaine |
| Capture de dernier recours d’une page illisible | Minibase As PDF + OCR --- bruyant mais marche toujours |
Pour la plupart des gens --- surtout ceux avec des abonnements payants ou qui utilisent Substack comme entrée de recherche --- Minibase est la réponse. Il produit le Markdown le plus propre sans setup, et il gère les essais derrière paywall de la même façon qu’il gère les posts gratuits : à partir de ce que le navigateur connecté peut voir.
Cas limites que Minibase gère
- Posts derrière paywall. Minibase voit ce que votre navigateur connecté voit. Si vous êtes abonné payant, vous obtenez l’essai complet. Sinon, vous obtenez l’aperçu public, exactement comme il apparaît sur la page. Pas de craquage, pas de scraping --- juste une copie propre de ce à quoi vous avez déjà accès.
- Blocs cross-promotionnels. Substack injecte des blocs de recommandation « From X’s Substack » en haut et bas de la plupart des posts. Minibase les supprime automatiquement. Le Markdown exporté ne contient que l’essai lui-même, attribué à l’auteur réel.
- Épisodes de podcast intégrés. Les posts Substack incluent de plus en plus de l’audio. Minibase capture l’épisode en tant que référence audio Markdown avec l’URL originale, pour que vous puissiez ré-écouter ou l’envoyer à un outil de transcription plus tard.
- Sections de commentaires. Les commentaires de premier niveau sont capturés avec le nom du commentateur et la date. Les fils profondément imbriqués sont résumés plutôt que déversés bruts, pour qu’une discussion de 400 commentaires ne fasse pas exploser le fichier.
- Threads (la fonctionnalité de Substack à la Twitter). Sauvegardés comme une liste Markdown chronologique avec auteur et horodatage, la même forme qu’un export de thread Twitter.
- Notes. Les micro-posts de Substack fonctionnent aussi. Le Markdown est plus court mais a la même forme de frontmatter, donc ils côtoient les posts longs dans le même dossier.
- Plusieurs newsletters du même auteur. Chaque post reçoit son nom de newsletter dans le frontmatter, donc un auteur qui publie sur trois Substacks différents finit dans trois seaux consultables sans tagging manuel.
- Domaines personnalisés. Beaucoup de Substacks tournent sur leur propre domaine (
stratechery.com,notboring.co,noahpinion.blog). Minibase détecte le backend propulsé par Substack quel que soit l’URL et applique le même export propre. - Posts avec beaucoup d’images. Les images restent référencées par leurs URLs originales, avec le texte alt et les légendes préservés. Le fichier reste petit et portable.
Couplez-le à votre workflow
La sortie Markdown fonctionne partout où vous en avez besoin :
- Claude / ChatGPT / Gemini --- collez le fichier, posez des questions de suivi sur l’essai
- Obsidian --- déposez-le dans votre vault, liez-le aux notes connexes, recherchez dans toutes vos newsletters sauvegardées
- Notion --- collez directement, les titres et citations se rendent correctement
- Apple Notes --- import propre via l’extension de partage Markdown
- Readwise / Reader --- le Markdown s’importe proprement sans le bruit de cross-promo et d’inscription qui vient d’un save d’URL brut
- Minibase Vault --- si vous en avez connecté un, chaque sauvegarde Substack y atterrit automatiquement avec backlinks et tags
FAQ
Minibase fonctionne-t-il sur les posts Substack derrière paywall ? Oui, sur les posts auxquels votre compte a accès. Minibase lit ce que votre navigateur connecté peut voir. Si vous êtes abonné payant, vous obtenez l’essai complet. Sinon, vous obtenez l’aperçu public, exactement comme Substack vous le montre.
Minibase fonctionne-t-il sur les Substacks à domaine personnalisé ?
Oui. Les Substacks qui tournent sur leur propre domaine (Stratechery, Not Boring, Noahpinion) s’exportent de la même façon que les sites *.substack.com. L’extension détecte le backend propulsé par Substack.
Puis-je sauvegarder les Substack Notes et Threads ? Oui. Les Notes s’exportent en tant que fichiers Markdown courts. Les Threads s’exportent comme listes Markdown chronologiques avec auteur et horodatage sur chaque entrée.
Et la section commentaires ? Les commentaires de premier niveau sont capturés avec le nom du commentateur et la date. Les fils profondément imbriqués sont résumés pour garder le fichier lisible. Si vous voulez chaque commentaire mot pour mot, c’est une option en une ligne dans les paramètres de l’extension.
Minibase supprime-t-il les modales « Subscribe now » et les blocs de cross-promo ? Oui. Les overlays de modale d’abonnement, les blocs de cross-promotion « From X’s Substack », les bannières « Pledge your support » et les formulaires d’inscription en pied de page sont tous supprimés. Le Markdown exporté ne contient que le post lui-même.
Préserve-t-il les images et les citations en exergue ?
Oui. Les images sont référencées par leurs URLs originales avec texte alt et légendes intacts. Les citations en exergue s’exportent en tant que citations en bloc Markdown (>).
Et les épisodes de podcast intégrés ? Capturés comme référence audio Markdown avec l’URL d’épisode originale. Si vous voulez une transcription, envoyez l’URL à votre outil de transcription préféré ensuite.
Sauvegarder un post Substack partage-t-il mon compte avec quelqu’un ? Non. L’extension tourne localement dans votre navigateur. Elle lit le post de la même façon que votre navigateur le fait et écrit le Markdown sur votre machine. Aucune donnée de connexion ne quitte votre ordinateur.
Combien ça coûte ? Minibase a un palier gratuit pour que vous puissiez l’essayer sur quelques posts. Au-delà, un petit abonnement couvre l’usage continu.
Guides Minibase associés
- Sauvegarder les articles Medium en Markdown --- le post derrière paywall que vous avez ouvert en navigation privée, capturé proprement
- Sauvegarder les vidéos YouTube en Markdown --- transcription, résumé, horodatages, tout dans un seul fichier
- Sauvegarder les threads Twitter / X en Markdown --- chaque tweet, dans l’ordre, avec attribution
- Sauvegarder les pages Notion en Markdown --- toggles dépliés, bases de données en tableaux
Continue reading
Comment enregistrer une conversation Claude en Markdown (Artifacts, citations, Projects)
Convertissez vos conversations Claude en Markdown propre : chaque tour, les Artifacts en blocs de code, les citations préservées. Guide complet pour chercheurs et utilisateurs d'IA.
Comment sauvegarder une conversation ChatGPT en Markdown (chaque tour, blocs de code intacts)
Convertissez n'importe quelle conversation ChatGPT en Markdown propre : chaque tour, blocs de code, tableaux, citations. Guide complet 2026.
Comment sauvegarder un fil Reddit en Markdown (avec commentaires et contexte)
Convertissez n'importe quel fil Reddit en Markdown propre avec commentaires imbriqués, karma, flair et marqueurs OP préservés. Guide complet 2026 pour chercheurs et utilisateurs d'IA.
Comment sauvegarder un thread Twitter / X en Markdown (thread complet, dans l'ordre)
Convertissez n'importe quel thread Twitter ou X en Markdown propre : chaque tweet dans l'ordre, avec attribution, horodatages et quote-tweets imbriqués. Guide 2026.