Extraheer platte tekst uit een PDF in je browser - perfect voor zoeken, citeren of als invoer voor AI-tools. Geen upload.
Sleep één of meerdere - alles wordt geconverteerd naar TXT. Voortgang per rij, batchconversie, ZIP-download.
PDF naar TXT gaan is wat je wilt wanneer je de woorden nodig hebt, niet de opmaak. Onderzoekers die citaten uit een artikel halen, studenten die aantekeningen voorbereiden uit een leerboek, iedereen die een lang PDF in ChatGPT of een zoekindex stopt - zij hebben allemaal alleen de tekst nodig. Die handmatig eruit halen betekent pagina voor pagina kopiëren en plakken; dit doet het met één klik.
De extractie draait lokaal via de PDF.js-engine van Mozilla: we lezen de tekstlaag van elke pagina (dezelfde die je PDF-viewer gebruikt voor select-and-copy) en plakken die samen met pagina-einden. PDF's die hun inhoud als gescande afbeeldingen opslaan, leveren geen tekst op - die hebben OCR nodig, wat een apart proces is. Alles gebeurt in je browser; er wordt geen PDF geüpload.
De grote use case in 2025 is AI-invoer voorbereiding. LLM's zijn uitstekend in het samenvatten van tekst, maar hebben moeite met ruwe PDF's (ze moeten eerst het bestandsformaat decoderen, wat vaak hallucinaties of overgeslagen inhoud veroorzaakt). Vooraf extraheren naar platte tekst geeft het model precies de woorden op de pagina in de volgorde waarin ze verschijnen, wat aanzienlijk betere samenvattingen, Q&A-antwoorden en analyses oplevert. Als je regelmatig onderzoekspapers, juridische documenten of financiële rapporten aan ChatGPT of Claude geeft, is dit de schoonste pijplijn.
Academische en juridische workflows vormen de andere belangrijke categorie. Onderzoekers citeren papers door passages te quoten; de eenvoudigste weg is 'extraheer naar tekst, zoek met grep naar het trefwoord, kopieer de omringende paragraaf'. Paralegals en advocaten doen iets soortgelijks voor contracten en dossiers. De tekstextractiestap verwijdert opmaak- en lay-outruis, zodat platte-teksttools (grep, ripgrep, de zoekfunctie van een editor) werken zoals ze bedoeld zijn.
Een opmerking over wat niet goed zal extraheren: gescande documenten (alleen afbeeldingen van tekst - hebben OCR nodig), kopieerbeveiligde PDF's (zeldzaam maar bestaan - sommige uitgevers leveren 'geen kopie'-PDF's), PDF's met ingebedde lettertypen die aangepaste glyph-toewijzingen gebruiken (sommige Aziatische taal-PDF's, sommige wiskundig zware academische PDF's - de zichtbare tekst komt niet overeen met standaard Unicode). Het slagingspercentage voor consumenten- en zakelijke PDF's is bijna 100%; voor academische en overheids-PDF's is het ongeveer 95%. Probeer het - in het ergste geval is de uitvoer leeg, geen schade aangericht.
LLM's verwerken platte tekst veel beter dan ruwe PDF-uploads. Extraheer eerst, plak de tekst vervolgens in een chat of verstuur via API voor samenvatting, Q&A of analyse.
Onderzoekers zoeken in geëxtraheerde tekst naar trefwoorden en kopiëren vervolgens de omringende paragraaf als citaat. Sneller dan pagina voor pagina door een PDF-lezer scrollen.
Juridisch assistenten zoeken naar specifieke clausules of nummers in lange overeenkomsten. Platte tekst is doorzoekbaar; PDF zelden.
Elasticsearch, Algolia en Postgres full-text search verbruiken allemaal platte tekst. Eén keer extraheren, voor altijd indexeren.
ML-pipelines die documenten verfijnen, hebben onbewerkte tekst nodig. Verwijder de visuele opmaak zodat het model alleen de woorden ziet.
Sommige schermlezers hebben moeite met PDF's, maar verwerken platte tekst of HTML soepel. Eerst extraheren, dan herstijlen voor lezen.
PDF is het universele documentformaat - ziet er hetzelfde uit op elk apparaat, print betrouwbaar, en is de aangewezen manier om afbeeldingen te delen die in hun lay-out vast moeten blijven.
Een simpel UTF-8-tekstbestand zonder opmaak. Opent in elke editor op elk apparaat. Perfect om door te sturen naar andere tools, grepbare zoekopdrachten en als input voor LLM's.
Sleep een PDF naar de converter hierboven, of klik op het vak om er een vanaf uw apparaat te kiezen.
We hebben TXT vooraf geselecteerd als uitvoerformaat. Wijzig het in het dropdown-menu als je een ander doelformaat wilt.
Klik op Converteren en wacht tot de voortgangsbalk klaar is. Download de TXT wanneer deze klaar is.
Converteer een PDF naar JPG-afbeeldingen - één afbeelding per pagina, verpakt als een ZIP voor meerpagina-PDF's.
Zet PDF-pagina's om in verliesloze PNG-afbeeldingen - perfect om diagrammen, dia's of pagina's in screenshot-stijl te delen.
Zet een platte tekstbestand binnen enkele seconden om in een afdrukbaar PDF - gratis, alleen in de browser, geen aanmelding.