ដកអក្សរសាមញ្ញពី PDF នៅក្នុងកម្មវិធីរុករករបស់អ្នក - ល្អឥតខ្ចោះសម្រាប់ស្វែងរក ការដកអត្ថបទឬបញ្ចូនទៅឧបករណ៍ AI. មិនចាំបាច់ផ្ទុកឡើង.
ការផ្លាស់ពី PDF ទៅ TXT គឺអ្វីដែលអ្នកត្រូវការនៅពេលអ្នកចង់បានពាក្យ មិនមែនការរៀបចំទំរង់ទេ។ អ្នកស្រាវជ្រាវដែលយកសម្រង់ពីអត្ថបទ, និស្សិតរៀបចំកំណត់ចំណាំពីសៀវភៅ, ឬនរណាមួយដែលបញ្ចូល PDF វែងទៅក្នុង ChatGPT ឬសន្ទស្សន៍ស្វែងរក - ពួកគេទាំងអស់ត្រូវការតែអត្ថបទប៉ុណ្ណោះ។ ការដកវាដោយដៃមានន័យថាត្រូវចម្លង-ចុចបិទលើមួយទំព័រ; ខណៈដែលនេះធ្វើវាបានក្នុងចុចមួយ។
ការដកអត្ថបទបំពេញនៅលើកុំព្យូទ័រអ្នកតាមរយៈម៉ូឌុល PDF.js របស់ Mozilla: យើងអានស្រទាប់អត្ថបទនៃមួយទំព័រ (ដូចដែលកម្មវិធីមើល PDF របស់អ្នកប្រើសម្រាប់ជ្រើស និងចម្លង) ហើយភ្ជាប់វាជាមួយការបំបែកទំព័រ។ PDF ដែលផ្ទុកមាតិកាជារូបភាពស្កេនមិនផ្តល់អត្ថបទទេ - ពួកវាត្រូវការការធ្វើ OCR ដែលជាដំណើរការផ្សេងទៀត។ អ្វីៗទាំងអស់កើតឡើងនៅក្នុងកម្មវិធីរុករករបស់អ្នក; គ្មានការផ្ទុក PDF ឡើង.
PDF គឺជាទ្រង់ទ្រាយឯកសារសកល - មើលដូចគ្នានៅលើរាល់ឧបករណ៍, បោះពុម្ពបានយ៉ាងទុកចិត្ត, និងជាវិធីស្ដង់ដាសម្រាប់ចែករំលែករូបភាពដែលត្រូវរក្សាទ្រង់ទ្រាយ។
ឯកសារអក្សរ UTF-8 សាមញ្ញ គ្មានការរៀបចំ។ អាចបើកបានក្នុងកម្មវិធីកែសម្រួលគ្រប់យ៉ាងលើរាល់ឧបករណ៍។ ល្អឥតខ្ចោះសម្រាប់បញ្ជូនទៅឧបករណ៍ផ្សេងៗ, ស្វែងរកដោយ grep, និងផ្គត់ផ្គង់ទៅ LLMs.
អូស PDF មួយទៅលើរបងបម្លែងខាងលើ ឬចុចប្រអប់ដើម្បីជ្រើសពីឧបករណ៍របស់អ្នក។
យើងបានជ្រើសរើស TXT ជាទ្រង់ទ្រាយបញ្ចេញ។ ផ្លាស់វាពីបញ្ជីចុះក្រោម ប្រសិនបើអ្នកចង់គោលដៅផ្សេង។
ចុច Convert និងរង់ចាំរបារដំណើរការឲ្យបញ្ចប់។ ទាញយក TXT ពេលវាធ្វើរួច។
បម្លែង PDF ទៅជា រូបភាព JPG - រូបភាពមួយសម្រាប់មួយទំព័រ បញ្ចប់ជា ZIP សម្រាប់ PDF ដែលមានច្រើនទំព័រ.
បម្លែងទំព័រ PDF ទៅជារូបភាព PNG ដែលគ្មានការបាត់បង់គុណភាព - សាកសមសម្រាប់ចែករំលែក គំនូរ ស្លាយ ឬទំព័រដូចការថតស្ក្រីន។
បម្លែងឯកសារអត្ថបទធម្មតាទៅជា PDF ដែលអាចបោះពុម្ពបានក្នុងរយៈពេលប៉ុន្មានវិនាទី - ឥតគិតថ្លៃ, ប្រតិបត្តិតែបណ្ដាញដោយកម្មវិធីរុករក, មិនចាំបាច់ចុះឈ្មោះ។