Тогтмол хуулах замаар PDF файлаас текст гаргаж авах нь үргэлж хол байдаг. Ихэнхдээ ийм баримт бичгийн хуудсыг цаасан хувилбаруудынхаа агуулгыг сканнердсан байдаг. Ийм файлыг бүрэн засварлах боломжтой текстийн мэдээлэл болгон хувиргахын тулд Optical Character Recognition (OCR) функцтэй тусгай програмуудыг ашигладаг.
Ийм шийдвэрийг хэрэгжүүлэхэд маш хэцүү тул маш их мөнгө шаардагдана. Хэрэв та PDF-ээс текстийг байнга таних шаардлагатай бол тохирох програмыг худалдаж авахыг зөвлөж байна. Ховор тохиолдолд, ижил төстэй функц бүхий онлайн үйлчилгээнүүдийн аль нэгийг ашиглах нь илүү логиктой байх болно.
PDF-аас онлайнаар текстийг хэрхэн таних вэ
Мэдээжийн хэрэг OCR-ийн онлайн үйлчилгээний онцлог шинж чанарууд нь бүрэн хэмжээний ширээний шийдлүүдтэй харьцуулахад илүү хязгаарлагдмал байдаг. Гэхдээ та ийм нөөцтэй хамт үнэгүй эсвэл нэрлэсэн төлбөртэй хамтран ажиллах боломжтой. Хамгийн гол зүйл бол тэдний үндсэн ажил болох текстийг танихтай холбоотой тохирох вэб програмууд үүнийг даван туулж чаддаг.
Арга 1: ABBYY FineReader Online
Үйлчилгээг хөгжүүлэгч компани нь оптик баримт таних чиглэлээр тэргүүлэгчдийн нэг юм. Windows болон Mac-д зориулсан ABBYY FineReader бол PDF-г текст рүү хөрвүүлэх, цаашлаад үргэлжлүүлэн ажиллах хүчтэй шийдэл юм.
Програмын вэб дээр суурилсан аналог нь мэдээжийн хэрэг үйл ажиллагааны хувьд үүнээс доогуур байдаг. Гэсэн хэдий ч уг үйлчилгээ нь 190 гаруй хэл дээрх сканнердах зураг, зургаас текстийг таних боломжтой юм. PDF файлыг Word, Excel рүү хөрвүүлэх баримт бичиг дэмжигддэг.
ABBYY FineReader онлайн үйлчилгээ
- Энэ хэрэгсэлтэй ажиллахаасаа өмнө сайт дээр данс үүсгэх эсвэл Facebook, Google эсвэл Microsoft дансаа ашиглан нэвтрэх хэрэгтэй.
Зөвшөөрлийн цонх руу очихын тулд товчин дээр дарна уу "Орц" дээд цэсний мөрөнд. - Нэвтэрсний дараа хүссэн PDF баримтаа FineReader руу оруулж товчин дээр дарна уу "Файл байршуулах".
Дараа нь дарна уу "Хуудасны дугаар сонгох" текстийг таних хүссэн интервалыг зааж өгнө. - Дараа нь баримт бичигт байгаа хэлийг, үүссэн файлын хэлбэрийг сонгоод товчийг дарна уу “Хүлээн зөвшөөрөх”.
- Боловсруулсны дараа үргэлжлэх хугацаа нь баримт бичгийн хэмжээнээс шууд хамаарч бэлэн байгаа файлаа түүний нэр дээр дарж текст мессежээр татаж авах боломжтой.
Эсвэл боломжит үүлэн үйлчилгээнүүдийн аль нэгэнд нь экспортолно уу.
Энэхүү үйлчилгээ нь зураг, PDF файл дээрх текстийг хамгийн зөв таних алгоритмаар ялгагдана. Гэхдээ харамсалтай нь, түүний үнэгүй хэрэглээ нь сард таван хуудас боловсруулагддаг. Илүү их хэмжээтэй баримт бичигтэй ажиллахын тулд та жилийн захиалгыг худалдаж авах хэрэгтэй болно.
Гэсэн хэдий ч хэрэв OCR нь ховор шаардлагатай бол ABBYY FineReader Online нь жижиг PDF файлуудаас текстийг задлах маш сайн сонголт юм.
Арга 2: Үнэгүй онлайн OCR
Текстийг дугаарлах энгийн бөгөөд тохиромжтой үйлчилгээ. Бүртгүүлэхгүйгээр нөөц нь цагт 15 бүрэн PDF хуудсыг таних боломжийг олгодог. Free Online OCR нь 46 хэл дээрх бичиг баримтуудад бүрэн ажилладаг бөгөөд зөвшөөрөлгүй гурван текст экспортлох форматыг дэмждэг - DOCX, XLSX, TXT.
Бүртгүүлэх үед хэрэглэгч олон хуудас баримт боловсруулах боломжтой болдог, гэхдээ эдгээр ижил хуудасны үнэгүй тоог 50 нэгжээр хязгаарладаг.
Үнэгүй онлайн OCR онлайн үйлчилгээ
- PDF дээрх текстийг "зочин" гэж таниулахын тулд сайтын үндсэн хуудсанд байгаа маягтыг ашиглана уу.
Товчлуур ашиглан хүссэн баримтаа сонгоно уу Файл, текстийн үндсэн хэл, гаралтын форматыг зааж өг, дараа нь файлыг ачаалахыг хүлээгээд дар Хөрвүүлэх. - Дижиталчлах үйл явцын төгсгөлд дарна уу "Гаралтын файлыг татаж авах" дууссан бичиг баримтыг компьютер дээр текстээр хадгалах.
Эрх бүхий хэрэглэгчдийн хувьд үйлдлийн дараалал арай өөр байна.
- Товчийг ашиглана уу "Бүртгэл" эсвэл "Орц" үүний дагуу цэсний дээд хэсэгт Free Free OCR акаунт үүсгэнэ үү.
- Таних самбар дээр зөвшөөрөл авсны дараа түлхүүрийг барина уу CTRL програм, өгөгдсөн жагсаалтаас эх хэлний хоёр хэлийг сонгоно уу.
- PDF-с текст оруулах нэмэлт сонголтуудыг тодорхойлж, дээр дарна уу Файлыг сонгоно уу үйлчилгээнд баримт байршуулах.
Дараа нь, таних эхлэхийн тулд дарна уу Хөрвүүлэх. - Баримт бичгийг боловсруулж дууссаны дараа холбогдох баган дээрх гаралтын файлын нэр бүхий холбоосыг дарна уу.
Таних үр дүн даруй таны компьютерийн санах ойд хадгалагдах болно.
Хэрэв та жижиг PDF баримт бичгээс текстийг гаргах шаардлагатай бол дээр дурдсан хэрэгслийг ашиглан аюулгүйгээр хандаж болно. Их хэмжээний файлуудтай ажиллахын тулд та Free Online OCR дээр нэмэлт тэмдэгтүүд худалдаж авах эсвэл өөр шийдлийг ашиглах хэрэгтэй болно.
Арга 3: NewOCR
DjVu, PDF зэрэг бараг бүх график болон электрон документээс текстийг гаргаж авах боломжийг олгодог OCR-ийн бүрэн үнэгүй үйлчилгээ. Нөөц нь хүлээн зөвшөөрөгдсөн файлын хэмжээ, тоонд хязгаарлалт тавьдаггүй, бүртгүүлэх шаардлагагүй бөгөөд холбогдох функцүүдийн өргөн хүрээг санал болгодог.
NewOCR нь 106 хэлийг дэмждэг бөгөөд чанар муутай документ сканердсан тохиолдолд ч зөв боловсруулж чаддаг. Файл хуудсан дээр текст таних хэсгийг гараар сонгох боломжтой.
NewOCR онлайн үйлчилгээ
- Тиймээс, шаардлагагүй үйлдлийг хийхгүйгээр та нэн даруй нөөцтэй ажиллаж эхлэх боломжтой.
Баруун талд байрлах хуудсан дээр баримт бичгийг сайтад импортлох маягт байдаг. NewOCR-д файл байршуулахын тулд товчийг ашиглана уу "Файл сонгоно уу" хэсэгт "Файлаа сонгоно уу"Байна. Дараа нь талбайд "Хүлээн зөвшөөрөх хэл (үүд)" Эх баримт бичгийн нэг буюу хэд хэдэн хэлийг зааж өгөөд дээр нь дарна уу "Байршуулах + OCR". - Сонгосон таних тохиргоогоо тохируулаад текстээс гаргаж авах хуудсыг сонгоод товчийг дарна уу OCR хийх.
- Хуудсыг бага зэрэг доош гүйлгээд товчлуураа олоорой "Татаж авах".
Үүнийг товшоод, доош буулгах жагсаалтаас татаж авахад шаардлагатай баримт бичгийн форматыг сонгоно уу. Үүний дараа олборлосон тексттэй файл нь таны компьютерт татагдах болно.
Хэрэгсэл нь тохиромжтой бөгөөд нэлээд өндөр чанар нь бүх тэмдэгтийг таних болно. Гэхдээ импортын PDF баримт бичгийн хуудас бүрийг боловсруулах ажлыг бие даан эхлүүлэх ёстой бөгөөд энэ нь тусдаа файлд харагдана. Та мэдээж таних үр дүнг шууд санах ойд хуулж, бусадтай нь нэгтгэж болно.
Гэсэн хэдий ч дээр дурьдсан мэдрэмжийг харгалзан NewOCR ашиглан их хэмжээний текст гаргаж авах нь маш хэцүү байдаг. Жижиг файлуудын тусламжтайгаар үйлчилгээ нь bang-тай харьцдаг.
Арга 4: OCR.Space
Текстийг тоон утгатай болгоход хялбар, ойлгомжтой нөөц бөгөөд энэ нь PDF баримт бичгийг таних, үр дүнг TXT файл руу гаргах боломжийг олгоно. Хуудасны тоонд хязгаарлалт өгөхгүй. Цорын ганц хязгаарлалт бол оролтын баримт бичгийн хэмжээ 5 мегабайтаас хэтрэхгүй байх ёстой.
OCR.Space онлайн үйлчилгээ
- Хэрэгсэлтэй ажиллахын тулд бүртгүүлэх шаардлагагүй.
Дээрх линкээр ороод, PDF товчийг компьютер дээрээс вэбсайтад байршуулж болно "Файл сонгоно уу" буюу сүлжээнээс - лавлагаагаар. - Унждаг жагсаалтад "OCR хэлийг сонгоно уу" Импортын баримт бичгийн хэлийг сонгоно уу.
Дараа нь товчлуур дээр дарж текст таних процессыг эхлүүлнэ үү "OCR эхлүүлэх!". - Файл боловсруулалтын төгсгөлд үр дүнг талбараас уншина уу OCR-ийн үр дүн дээр дарна уу "Татаж авах"дууссан TXT документыг татаж авах.
Хэрэв та текстийг PDF-ээс гаргаж авах хэрэгтэй бөгөөд үүний зэрэгцээ түүний эцсийн форматлах нь тийм ч чухал биш бол OCR.Space бол маш сайн сонголт юм. Цорын ганц зүйл бол уг баримт бичигт хоёр хэлийг нэгэн зэрэг таних нь үйлчилгээнд тусгагдаагүй тул "нэг хэл дээр" байх ёстой.
Мөн үзнэ үү: FineReader-ийн үнэгүй аналоги
Нийтлэлд оруулсан онлайн хэрэгслийг үнэлэхдээ ABBYY-ийн FineReader Online нь OCR функцийг хамгийн нарийвчлалтай, үр дүнтэй гүйцэтгэдэг болохыг тэмдэглэх нь зүйтэй. Хэрэв текстийг таних өндөр нарийвчлал нь танд чухал бол энэ сонголтыг тусгайлан авч үзэх нь зүйтэй. Гэхдээ магадгүй та үүнийг төлөх шаардлагатай болно.
Хэрэв та жижиг баримт бичгийг дижитал болгох шаардлагатай бол үйлчилгээ дээрх алдааг бие даан засахад бэлэн байгаа бол NewOCR, OCR.Space эсвэл Free Online OCR ашиглахыг зөвлөж байна.