Extreu text pla d'un PDF al teu navegador - perfecte per cercar, citar o donar d'entrada a eines d'IA. No cal pujar res.
Arrossegueu-ne un o molts - tots es convertiran a TXT. Progrés per fila, conversió per lots, descàrrega ZIP.
Passar de PDF a TXT és el que vols quan necessites les paraules, no la maquetació. Investigadors que agafen cites d'un article, estudiants que preparen apunts d'un llibre de text, o qualsevol que vulgui alimentar un PDF llarg a ChatGPT o a un índex de cerca - tots ells només necessiten el text. Treure'l manualment vol dir copiar i enganxar pàgina per pàgina; això ho fa en un sol clic.
L'extracció s'executa localment mitjançant el motor PDF.js de Mozilla: llegim la capa de text de cada pàgina (la mateixa que el teu visor de PDF utilitza per seleccionar i copiar) i la concatenem amb salts de pàgina. Els PDFs que emmagatzemen el seu contingut com a imatges escanejades no proporcionaran text - aquests necessiten OCR, que és un flux de treball separat. Tot passa al teu navegador; no s'envia cap PDF.
El gran cas d'ús el 2025 és la preparació d'entrada per a IA. Els LLM són excel·lents per resumir text, però s'ofeguen amb PDF en brut (primer han de descodificar el format del fitxer, cosa que sovint al·lucina o omet contingut). L'extracció prèvia a text pla dóna al model exactament les paraules de la pàgina en l'ordre en què apareixen, la qual cosa produeix resums, respostes a preguntes i anàlisis dràsticament millors. Si alimentes regularment articles de recerca, documents legals o informes financers a ChatGPT o Claude, aquesta és la pipeline més neta.
Els fluxos de treball acadèmics i legals són l'altre gran grup. Els investigadors citen articles citant passatges; el camí més fàcil és "extreure a text, cercar la paraula clau amb grep, copiar el paràgraf circumdant". Els paralegals i advocats fan alguna cosa similar per a contractes i expedients. El pas d'extracció de text elimina el soroll de format i disseny perquè les eines de text pla (grep, ripgrep, la funció de cerca d'un editor) funcionin com se suposa.
Una nota sobre el que no s'extraurà bé: documents escanejats (només imatges de text, necessiten OCR), PDFs protegits contra còpia (rars però existeixen, alguns editors envien PDFs "sense còpia"), PDFs amb fonts incrustades que utilitzen mapatges de glifs personalitzats (alguns PDFs en idiomes asiàtics, alguns PDFs acadèmics amb moltes matemàtiques; el text visible no es correspon amb Unicode estàndard). La taxa d'èxit en PDFs de consum i empresarials és gairebé del 100%; en PDFs acadèmics i governamentals és aproximadament del 95%. Prova-ho: el pitjor cas és una sortida buida, sense cap dany.
Els LLM gestionen el text pla molt millor que les càrregues de PDF en brut. Extreu primer, després enganxa el text en un xat o envia'l mitjançant API per a resum, preguntes i respostes o anàlisi.
Els investigadors cerquen text extret per paraules clau i després copien el paràgraf circumdant com a cita. Més ràpid que desplaçar-se per un lector de PDF pàgina per pàgina.
Els paralegals busquen clàusules o números específics en acords llargs. El text pla és cercable; el PDF rarament ho és.
La cerca de text complet d'Elasticsearch, Algolia i Postgres consumeix text pla. Extreu una vegada, indexa per sempre.
Les pipelines d'aprenentatge automàtic que s'ajusten a documents necessiten text sense format. Elimina l'estil visual perquè el model només vegi les paraules.
Alguns lectors de pantalla tenen dificultats amb els PDF, però gestionen el text pla o HTML sense problemes. Extreu primer, redissenya per a la lectura.
PDF és el format de document universal - té el mateix aspecte en tots els dispositius, s'imprimeix de manera fiable i és la manera canònica de compartir imatges que han de romandre fixes al disseny.
Un fitxer de text pla en UTF-8 sense formatar. S'obre en qualsevol editor a qualsevol dispositiu. Perfecte per encaminar a altres eines, cerca amb grep i per alimentar LLMs.
Arrossega un PDF al convertidor de dalt, o fes clic a la caixa per seleccionar-ne un del teu dispositiu.
Hem preseleccionat TXT com a format de sortida. Canvieu-lo des del menú desplegable si voleu un destí diferent.
Fes clic a Converteix i espera que la barra de progrés acabi. Descarrega el TXT quan estigui llest.
Converteix un PDF a imatges JPG - una imatge per pàgina, empaquetades en un ZIP per a PDFs de diverses pàgines.
Converteix pàgines PDF a imatges PNG sense pèrdua - perfecte per compartir diagrames, diapositives o pàgines tipus captura de pantalla.
Converteix un fitxer de text pla en un PDF imprimible en segons - gratuït, només al navegador, sense registre.