Trích xuất văn bản thuần từ PDF ngay trong trình duyệt của bạn - lý tưởng cho việc tìm kiếm, trích dẫn, hoặc đưa vào các công cụ AI. Không cần tải lên.
Chuyển từ PDF sang TXT là điều bạn muốn khi bạn cần nội dung chữ, không phải bố cục. Các nhà nghiên cứu lấy trích dẫn từ một bài báo, sinh viên chuẩn bị ghi chú từ một sách giáo khoa, bất kỳ ai đưa một PDF dài vào ChatGPT hoặc vào một chỉ mục tìm kiếm - tất cả họ đều chỉ cần văn bản. Việc tách thủ công có nghĩa là sao chép-dán từng trang; công cụ này làm điều đó chỉ với một cú nhấp.
Quá trình trích xuất chạy cục bộ thông qua engine Mozilla's PDF.js: chúng tôi đọc lớp văn bản của từng trang (cùng lớp mà trình xem PDF của bạn dùng để chọn và sao chép) và nối chúng lại với các ngắt trang. Các PDF lưu nội dung dưới dạng ảnh quét sẽ không cung cấp văn bản - những trường hợp đó cần OCR, là một quy trình riêng. Mọi thứ diễn ra trong trình duyệt của bạn; không có PDF nào được tải lên.
PDF là định dạng tài liệu phổ quát - trông giống nhau trên mọi thiết bị, in ấn đáng tin cậy, và là cách chuẩn để chia sẻ hình ảnh cần giữ cố định bố cục.
Một tệp văn bản thuần UTF-8 không có định dạng. Mở được trong mọi trình soạn thảo trên mọi thiết bị. Hoàn hảo để đưa vào các công cụ khác, tìm kiếm bằng grep và đưa vào các LLM.
Kéo một PDF vào bộ chuyển đổi phía trên, hoặc nhấp vào ô để chọn một tệp từ thiết bị của bạn.
Chúng tôi đã chọn trước TXT làm định dạng xuất. Thay đổi nó từ menu thả xuống nếu bạn muốn mục tiêu khác.
Nhấp vào Chuyển đổi và chờ thanh tiến trình kết thúc. Tải xuống TXT khi nó sẵn sàng.
Chuyển PDF thành ảnh JPG - một ảnh cho mỗi trang, đóng gói dưới dạng ZIP cho các PDF nhiều trang.
Kết xuất các trang PDF thành ảnh PNG không mất dữ liệu - lý tưởng để chia sẻ sơ đồ, slide, hoặc các trang kiểu ảnh chụp màn hình.
Biến một tệp văn bản thuần thành PDF có thể in chỉ trong vài giây - miễn phí, chỉ trên trình duyệt, không cần đăng ký.