Оваа статија ќе биде во прилог на претходниот (и подетално ќе ја открие суштината на директно препознавање на текстот.
Да почнеме со суштината, која многу корисници не ги разбираат целосно.
Откако ќе скенирате книга, весник, списание, итн, добивате сет на слики (што е, графички фајлови, а не текстуални датотеки) кои треба да бидат препознаени во посебна програма (еден од најдобрите за ова е ABBYY FineReader). Признавање - ова е процесот на добивање на текст од графика, и тоа е овој процес што ние ќе напишеме подетално.
Во мојот пример, ќе направам слика од екранот на оваа страница и ќе се обидам да го добијам текстот од него.
1) Отворање на датотека
Отворете ја сликата (ите) што планираме да ја препознаеме.
Патем, тука треба да се забележи дека можете да отворите не само формати на слики, туку, исто така,, на пример, DJVU и PDF датотеки. Ова ќе ви овозможи брзо да ја препознаете целата книга, која, преку мрежата, обично се дистрибуира во овие формати.
2) Уредување
Веднаш се согласувам со авто-признавање нема многу смисла. Ако, се разбира, имате книга во која само текст, нема слики и таблети, плус скенирани со одличен квалитет, тогаш можеш. Во други случаи, подобро е рачно да ги поставите сите области.
Обично, прво треба да ги отстраните непотребните области од страната. За да го направите ова, кликнете на копчето за уредување на панелот.
Потоа треба да го оставите само просторот со кој сакате да работите подолго. За ова постои алатка за намалување на непотребните граници. Изберете го режимот во десната колона. да се отсече.
Следно, одберете ја областа што сакате да ја напуштите. На сликата подолу, тој е обележан со црвено.
Патем, ако имате неколку слики отворени, можете да аплицирате со сечење на сите слики одеднаш! Практично да не се исечете одделно. Имајте на ум дека на дното на овој панел има уште една одлична алатка -гума. Со помош на тоа, можете да ги избришете непотребните разводи, броеви на страници, скали, непотребни специјални знаци и поединечни делови од сликата.
Откако ќе кликнете за да ги исечете рабовите, оригиналната слика треба да се промени: само работниот простор ќе остане.
Потоа можете да излезете од уредувачот на слики.
3) Избор на области
На панелот, над отворената слика, постојат мали правоаголници кои ја дефинираат областа на скенирање. Има неколку од нив, ајде да ги разгледаме најчестите.
Сликата - програмата нема да ја препознае оваа област, таа едноставно ќе го копира наведениот правоаголник и ќе го залепи во признатата документ.
Текстот е главната област на која програмата ќе се фокусира и ќе се обиде да добие текст од сликата. Ние ќе ја истакнеме оваа област во нашиот пример.
По избор, областа е обоена во светло зелена боја. Потоа можете да продолжите на следниот чекор.
4) препознавање на текст
Откако ќе се постават сите области, кликнете на менито за да препознаете. За среќа, во овој чекор, ништо повеќе не е потребно.
Времето за препознавање зависи од бројот на страници во документот и од моќта на компјутерот.
Во просек, една целосна страница скенирана со добар квалитет трае 10-20 секунди. во просек компјутер моќ (според денешните стандарди).
5) Проверка на грешка
Без оглед на оригиналниот квалитет на сликите, обично постојат секогаш грешки по препознавањето. Сепак, досега ниту една програма не може целосно да ја елиминира работата на една личност.
Кликнете на опцијата за исцртување и ABBYY FineReader ќе започне да ви ги прикажува местата во документот каде што се сопна. Вашата задача, споредувајќи ја оригиналната слика (патем, ќе ви го покаже ова место во зголемена верзија) со варијанта на препознавање - да одговориш на афирмативен, или да се поправи и одобри. Потоа, програмата ќе оди на следното тешко место и сл додека не се провери целиот документ.
Во принцип, овој процес може да биде долг и здодевен ...
6) зачувување
ABBYY FineReader нуди неколку опции за заштеда на вашата работа. Најчесто користен е "точна копија". Односно целиот документ, текстот во него, ќе биде форматиран на ист начин како во изворот. Погодна опција е да ја пренесете на Word. Така направивме во овој пример.
После тоа ќе го видите вашиот препознатлив текст во познат Word документ. Мислам дека нема смисла понатаму да опише што да прави со него ...
Така, анализиравме со конкретен пример како да преведеме слика во обичен текст. Овој процес не е секогаш едноставен и брз.
Во секој случај, сè ќе зависи од оригиналниот квалитет на сликата, вашето искуство и брзината на вашиот компјутер.
Имајте добра работа!