ブラウザでPDFからプレーンテキストを抽出します - 検索、引用、またはAIツールへの投入に最適です。アップロードは不要です。
レイアウトではなく本文が必要なときは、PDFをTXTにするのが最適です。論文から引用を抜き取る研究者、教科書からノートを準備する学生、長いPDFをChatGPTや検索インデックスに投入する人々 — 彼らは皆本文だけを必要としています。手作業で取り出すにはページごとにコピー&ペーストする必要がありますが、これはワンクリックで行えます。
抽出はMozillaのPDF.jsエンジンを介してローカルで実行されます: 各ページのテキスト層(PDFビューアが選択&コピーに使用するのと同じもの)を読み取り、ページ区切りで連結します。内容がスキャン画像として格納されているPDFはテキストを出力しません - それらはOCRが必要で、別のワークフローになります。すべてブラウザ内で行われ、PDFがアップロードされることはありません。
PDFはユニバーサルなドキュメント形式です - 全てのデバイスで同じ見た目になり、確実に印刷でき、レイアウトを固定したまま共有すべき画像を渡すための標準的な方法です.
書式なしのプレーンなUTF-8テキストファイルです。あらゆるデバイスのあらゆるエディタで開けます。他のツールへのパイプ、grepでの検索、LLMへの入力に最適です。
上のコンバータに PDF をドラッグするか、ボックスをクリックしてデバイスから選択してください.
TXTを出力形式に事前選択しています。別の形式にしたい場合はドロップダウンで変更してください.
「Convert」をクリックして、プログレスバーが完了するまで待ちます。準備ができたら TXT をダウンロードしてください.