在瀏覽器中從 PDF 擷取純文字 — 非常適合搜尋、引用或輸入到 AI 工具。無需上傳。
當您需要的是文字內容而非版面時,從 PDF 轉為 TXT 就是您要的。研究者從論文擷取引文、學生從教科書整理筆記、或任何要將長篇 PDF 輸入到 ChatGPT 或搜尋索引的人——他們都只需要文字。手動抽取意味著要逐頁複製貼上;而這個功能只需一鍵即可完成。
擷取作業在本機透過 Mozilla 的 PDF.js 引擎執行:我們讀取每一頁的文字圖層(也就是您的 PDF 檢視器用來選取並複製的那一層),並以分頁符號將其串接。以掃描影像形式儲存內容的 PDF 不會產生文字 - 這類檔案需要 OCR,屬於另一套流程。所有動作都在您的瀏覽器中進行;不會上傳任何 PDF。
PDF 是通用的文件格式 - 在每個裝置上長得一樣、列印可靠,也是分享需保持版面固定之影像的標準方式。
一個不含格式的純 UTF-8 純文字檔。可在每個裝置的任何編輯器中開啟。非常適合串接到其他工具、使用 grep 搜尋,以及餵入 LLMs。
將 PDF 拖到上方的轉換器,或點擊方框從你的裝置選取。
我們已預先選定 TXT 作為輸出格式。如要不同的目標,請從下拉選單變更。
點選 Convert 並等候進度條完成。當 TXT 準備好後下載 TXT。