Substack投稿をMarkdownで保存する方法(ペイウォール対応、クロスプロモなし)

·

Substackはあなたにコンテンツを持ち出させたくありません。ネイティブのエクスポート機能はなく、「この投稿をダウンロード」ボタンもなく、有料購読者がお金を払ったエッセイをバックアップできる公開APIもありません。開く投稿はすべて、サブスクモーダルのオーバーレイ、ネットワーク内の他のニュースレターからのクロスプロモーションブロック、メールアドレスを懇願するフッターに包まれています。Substackのエッセイを Claude や Obsidian に入れようとしたことがあるなら、問題はわかるでしょう --- ページからコピーするとノイズも一緒についてきます。

このガイドでは、Substack投稿をクリーンなMarkdownに変換するすべての方法を扱います --- 1つのエッセイから、埋め込み音声付きのペイウォール越しのロングリードまで。

なぜSubstack投稿をMarkdownで保存するのか?

Markdownは、ニュースレターを持っていく必要があるどこででも機能する形式です:

  • お気に入りのエッセイをアーカイブ --- 作家はSubstackを去り、投稿はペイウォールの裏に隠れ、アカウントは停止されます。あなたのノートはプラットフォームの稼働時間に依存すべきではありません
  • 研究ライブラリを構築 --- クリーンな .md ファイルが1つのフォルダにあれば、数百のニュースレターを数秒で検索できます
  • LLMに与える --- Claude、ChatGPT、Gemini、ローカルモデルはすべてMarkdownをコンテキストとしてネイティブに読み込みます
  • プラットフォームロックインから逃れる --- 有料サブスクリプションはアクセスを買うのであり、所有権ではありません。Markdownは、すでにお金を払ったコピーをあなたに与えます
  • 特定の一節を引用 --- 5,000語のエッセイの中で「複利についてのあの段落」を見つけるのは検索1回で済みます
  • 外国語の投稿を翻訳 --- テキストになれば、どんな翻訳ツールでも動作します

2026年にSubstack-to-Markdownのトラフィックを牽引している主なユースケースは最初の2つです:人々は、プラットフォームから切り離された、自分が気にかけているエッセイの永続的で持ち運べるコピーを欲しがっています。

方法1: Minibase(最速、ワンクリック)

Minibase は、任意のSubstack投稿をワンクリックでMarkdownファイルに変換するChrome拡張機能です。DOMから直接投稿本文を読み取り、すべてのサブスクモーダルとクロスプロモブロックを取り除き、スクレイプされたページではなく元のエッセイのように読めるものを生成します。

仕組み:

  1. ChromeでSubstack投稿を開く
  2. ツールバーのSave拡張機能アイコンをクリック
  3. .md ファイルが即座にダウンロードされる(接続されていればMinibase Vaultに着地)

得られるもの:

  • 投稿タイトルとサブタイトルがMarkdown見出しとして
  • フロントマターに著者名、公開日、ニュースレター名
  • 見出し、引用、インライン画像がすべて保持された本文全体
  • ブロック引用は > のMarkdown引用として保持され、ページスタイルとしてレンダリングされない
  • 埋め込みポッドキャストエピソードは元のURL付きのMarkdownオーディオ参照として
  • フットノートは然るべき場所にインライン化
  • タイトル、著者、ニュースレター、公開日、正規URLを含むフロントマター

取り除かれるもの:

  • スクロール中にポップアップするサブスクモーダルオーバーレイ
  • 投稿の上下にある「From X’s Substack」クロスプロモーションブロック
  • 「Share this post」/「Pledge your support」/「Restack」のCTAバナー
  • フッターの登録フォームと推奨グリッド
  • Substackのナビゲーションクロームと浮遊する読書進捗バー

最適な対象: 研究者、ライター、有料サブスクリプションを本当に所有したい人、ClaudeやChatGPTにコンテキストを与えるAIユーザー。LLMに貼り付けたりObsidianで読んだりするためのクリーンなエッセイが必要なら、これが最もクリーンな道です。

出力例

Packy McCormickのエッセイを保存すると以下が生成されます:

---
title: "The Substack Renaissance"
subtitle: "How creator-led media is rebuilding the internet from the bottom up"
author: Packy McCormick
newsletter: Not Boring
url: https://www.notboring.co/p/the-substack-renaissance
date: 2026-02-14
---

# The Substack Renaissance

## How creator-led media is rebuilding the internet from the bottom up

Five years ago, the idea that a single writer could sustain a six-figure
business from a newsletter sounded absurd. Today there are hundreds of
them, and the model is starting to eat traditional media from the edges.

> "The best journalism of the next decade won't come from newsrooms.
> It'll come from one person, a Substack, and a community of 20,000
> readers who actually care."

## Why Now

Three things converged...

そのファイルは、貼り付け1回でClaudeコンテキストとして使え、キーストローク1回で永続的なObsidianノートになります。

方法2: メール + 手動再フォーマット

すべてのSubstack投稿はメールとしても配信されます。メールを保存して手動でMarkdownに変換することができます。

手順:

  1. GmailかApple Mailで投稿を開く
  2. ソースを表示または「元のメッセージを表示」、HTMLをコピー
  3. HTML-to-Markdownコンバータ(Pandoc、turndown、html2md)に通す
  4. ヘッダーバナー、フッターの登録フォーム、クロスプロモブロックを手動で取り除く

このアプローチの問題点:

  • Substackメールは重いテーブルベースのHTMLに包まれており、醜いMarkdownに変換される
  • クロスプロモブロック(「Subscribe to X who also writes on Substack」)は深くネストされており、単一のregexで取り除くのが難しい
  • 埋め込みポッドキャストはインラインオーディオプレーヤーとして来るが、Markdownに翻訳されない
  • フットノートが本文とメールフッターの間で重複する
  • 画像は期限切れになるトラッキングURLで参照される
  • ペイウォール投稿はメールで切り詰められたプレビューとして届くので、完全なエッセイがそこにすらない

短い投稿1つには使える。長いものや有料コンテンツでは崩壊します。

方法3: RSSフィード + スクリプト

すべての公開Substackは <newsletter>.substack.com/feed にRSSフィードを持っています。それをポーリングして各アイテムをMarkdownに変換できます。

curl https://newsletter.substack.com/feed | \
  pandoc -f html -t markdown -o post.md

最適な対象: 大規模にニュースレターをアーカイブするエンジニアリングチーム、または自動化された読書パイプラインを構築する人。スクリプティング環境とcronジョブが必要です。

このアプローチの問題点:

  • RSSは無料投稿しか公開しません。ペイウォール越しのエッセイはフィードに表示されない
  • フィードはメール形式のHTMLを返すので、クロスプロモと登録フォームのノイズをすべて引き継ぐ
  • チャンネル名以外の著者メタデータなし --- ゲスト投稿はライターではなくニュースレターに帰属される
  • 埋め込みポッドキャストはRSSペイロードから取り除かれる
  • 引用はスタイルを失い、本文テキストに溶け込む
  • クリーンアップパス(サブスクブロックの削除、画像URLの修正)は別のステップ

これは、権利を持っている公開ニュースレターのためのパイプラインを構築している場合の正しい方法です。1つの投稿にはやり過ぎで、ほとんどの読者が実際にアーカイブしたい有料コンテンツには届きません。

方法4: ブラウザの「PDFとして保存」 + OCR

Chromeの「PDFとして保存」は、ログインしているペイウォールSubstack投稿を含め、任意のページで機能します。

手順:

  1. Chromeで投稿を開く
  2. Cmd+P、「PDFとして保存」を選択
  3. OCRツール(Adobe Acrobat、Tesseract、または pdftotext)にPDFを通す
  4. 出力をMarkdownに整える

Markdownのユースケースに対する問題点:

  • 出力はページ形式で、ドキュメント形式ではない --- 見出しは階層を失い、段落はページ境界をまたいで途切れる
  • サブスクモーダルオーバーレイはしばしばPDFレンダリングされるので、ノイズもついてくる
  • 引用、ブロック引用、コードサンプルはすべて構造を失う
  • 画像はピクセルとしてページに焼き込まれ、参照されない --- オリジナルを回復する方法はない
  • OCRはセリフ重めのニュースレターのタイポグラフィにタイプミスを導入する
  • 埋め込みポッドキャストやリンクはPDFラウンドトリップを生き延びない

他に何もコンテンツに届かないときの最後の手段。主要なワークフローではありません。

どの方法を使うべきか?

シナリオ最適な方法
SubstackエッセイをClaudeかChatGPTに貼り付けるMinibase --- ワンクリック、構造化された出力
有料サブスクリプションをアーカイブするMinibase --- ログイン済みのペイウォール投稿で動作する
個人のニュースレター研究ライブラリを構築するMinibase --- 一貫したフロントマター、検索が容易
無料ニュースレターを大規模に自動アーカイブするRSS + スクリプト --- プログラマブル、ただし無料投稿のみ
手動トリアージのメールのみフローメール + 再フォーマット --- 週に1〜2件のエッセイしか保存しないなら機能する
読めないページの最後の手段の捕捉PDFとして保存 + OCR --- ノイジーだが常に動作

ほとんどの人にとって --- 特に有料サブスクリプションを持つ人や、研究入力としてSubstackを使う人にとって --- Saveが答えです。セットアップゼロで最もクリーンなMarkdownを生成し、ペイウォールエッセイを無料投稿と同じように扱います:ログイン済みブラウザが見えるものから。

Saveが処理するエッジケース

  • ペイウォール投稿。 Saveはあなたのログイン済みブラウザが見るものを見ます。有料購読者なら、完全なエッセイを得ます。そうでなければ、ページに表示されるとおりの公開プレビューを得ます。クラッキングなし、スクレイピングなし --- すでにアクセス権があるもののクリーンなコピーだけ。
  • クロスプロモーションブロック。 Substackはほとんどの投稿の上下に「From X’s Substack」推奨ブロックを注入します。Saveはそれらを自動的に取り除きます。エクスポートされたMarkdownには、実際の著者に帰属されたエッセイ自体のみが含まれます。
  • 埋め込みポッドキャストエピソード。 Substack投稿には音声がますます含まれるようになっています。Saveはエピソードを元のURL付きのMarkdownオーディオ参照として捕捉するので、後で再聴したり、転写ツールに渡したりできます。
  • コメントセクション。 トップレベルのコメントはコメント投稿者名と日付とともに捕捉されます。深くネストされたスレッドは生のままダンプされるのではなく要約されるので、400コメントの議論がファイルを膨らませません。
  • Threads(SubstackのTwitter的機能)。 著者とタイムスタンプ付きの時系列Markdownリストとして保存され、Twitterスレッドエクスポートと同じ形をしています。
  • Notes。 Substackのマイクロポストも機能します。Markdownは短いですが同じフロントマター形状を持つので、同じフォルダ内でロングフォームの投稿と並びます。
  • 同じ著者の複数のニュースレター。 各投稿のフロントマターにニュースレター名が入るので、3つの異なるSubstackで公開する作家は、手動タグ付けなしで3つの検索可能なバケットに収まります。
  • カスタムドメイン。 多くのSubstackは独自ドメインで運営されています(stratechery.comnotboring.conoahpinion.blog)。SaveはURLに関係なくSubstack駆動のバックエンドを検出し、同じクリーンなエクスポートを適用します。
  • 画像の多い投稿。 画像は元のURLで参照されたまま、altテキストとキャプションも保存されます。ファイルは小さく、持ち運び可能なままです。

あなたのワークフローと組み合わせる

Markdown出力は必要な場所どこでも機能します:

  • Claude / ChatGPT / Gemini --- ファイルを貼り付けて、エッセイについてフォローアップ質問する
  • Obsidian --- vaultに入れ、関連ノートにリンクし、保存したすべてのニュースレターを検索する
  • Notion --- 直接貼り付け、見出しと引用が正しくレンダリングされる
  • Apple Notes --- Markdown共有拡張機能経由でクリーンにインポート
  • Readwise / Reader --- 生URLセーブから来るクロスプロモと登録ノイズなしで、Markdownはクリーンにインポートされる
  • Minibase Vault --- 接続していれば、すべてのSubstackセーブが自動的にそこにバックリンクとタグ付きで着地します

FAQ

Saveはペイウォール越しのSubstack投稿で動作しますか? はい、アカウントがアクセス権を持つ投稿で動作します。Saveはログイン済みブラウザが見られるものを読み取ります。有料購読者なら完全なエッセイを得ます。そうでなければ、Substackが表示するとおりの公開プレビューを得ます。

Saveはカスタムドメインのsubstackで動作しますか? はい。独自ドメインで運営されるSubstack(Stratechery、Not Boring、Noahpinion)は *.substack.com サイトと同じように動作します。拡張機能がSubstack駆動のバックエンドを検出します。

Substack NotesとThreadsを保存できますか? はい。Notesは短いMarkdownファイルとしてエクスポートされます。Threadsは各エントリに著者とタイムスタンプ付きの時系列Markdownリストとしてエクスポートされます。

コメントセクションはどうですか? トップレベルのコメントはコメント投稿者名と日付とともに捕捉されます。深くネストされたスレッドはファイルを読みやすく保つため要約されます。すべてのコメントを逐語で欲しい場合、それは拡張機能設定のワンライン オプションです。

Saveは「Subscribe now」モーダルとクロスプロモブロックを取り除きますか? はい。サブスクモーダルオーバーレイ、「From X’s Substack」クロスプロモーションブロック、「Pledge your support」バナー、フッター登録フォームはすべて削除されます。エクスポートされたMarkdownには投稿自体のみが含まれます。

画像と引用を保持しますか? はい。画像は元のURLで参照され、altテキストとキャプションも無傷です。引用はMarkdownブロック引用(>)としてエクスポートされます。

埋め込みポッドキャストエピソードはどうですか? 元のエピソードURLを含むMarkdownオーディオ参照として捕捉されます。転写が欲しければ、後で好みの転写ツールにURLを送ってください。

Substack投稿を保存すると、私のアカウントが誰かと共有されますか? いいえ。拡張機能はあなたのブラウザでローカルに実行されます。ブラウザと同じ方法で投稿を読み、Markdownをあなたのマシンに書き込みます。ログインデータはコンピュータから出ません。

いくらかかりますか? Saveには無料ティアがあるので、いくつかの投稿で試すことができます。それ以降は、小さなサブスクリプションが継続的な使用をカバーします。

関連するSaveガイド

Continue reading

S

Written by

Save Team

Learn more about Minibase

よりスマートに保存しませんか?

あらゆるウェブページをワンクリックでMarkdownに変換。

Chromeに追加