在浏览器中从 PDF 提取纯文本 - 非常适合搜索、引用或输入到 AI 工具。无需上传.
当你需要的是文字而不是版面时,从 PDF 转为 TXT 就是你想要的。研究人员从论文抓取引用、学生准备教科书笔记、或任何将长 PDF 输入 ChatGPT 或搜索索引的人——他们都只需要文本。手动逐页复制粘贴来抽取文本;而这可以一键完成.
提取在本地通过 Mozilla 的 PDF.js 引擎运行:我们读取每页的文本层(与你的 PDF 查看器用于选择并复制的相同文本层),并用页分隔符将其连接起来。将内容以扫描图像存储的 PDF 不会产生文本 - 这类文件需要 OCR,这是一个单独的工作流程。一切都在你的浏览器中完成; 没有任何 PDF 被上传.
PDF 是通用的文档格式 - 在每台设备上外观一致,打印可靠,也是分享应保持固定版式的图像的规范方式。
一个不含格式的纯 UTF-8 文本文件. 可在所有设备的任意编辑器中打开. 非常适合管道传输到其他工具、可用 grep 搜索,以及供 LLM 输入.
将 PDF 拖到上方的转换器,或点击该框从你的设备中选择一个。
我们已预选 TXT 作为输出格式。如果你想要不同的目标,请从下拉菜单中更改它。
点击 Convert 并等待进度条完成。准备好后下载 TXT.