Признавање на текстот. Бесплатна програма - аналоген FineReader

Порано или подоцна, сите оние кои често работат со канцелариски програми се соочуваат со типична задача - да го скенираат текстот од книга, списание, весник, едноставно летоци, а потоа да ги преведат овие слики во текст формат, на пример, во Word документ.

За да го направите ова ви треба скенер и специјална програма за препознавање на текст. Оваа статија ќе дискутира за бесплатниот аналог на FineReader -Клинесто писмо (за признавање во FineReader - видете ја оваа статија).

Да почнеме ...

Содржината

  • 1. Карактеристики на програмата CuneiForm, карактеристики
  • 2. Пример за препознавање текст
  • 3. Сериски текст признавање
  • 4. Заклучоци

1. Карактеристики на програмата CuneiForm, карактеристики

Клинесто писмо

Можете да преземете од страната на инвеститорот: //cognitiveforms.com/

Софтвер за откривање на текст со отворен код. Покрај тоа, таа работи во сите верзии на Windows: XP, Vista, 7, 8, што е угодно. Плус, додадете го целиот руски превод на програмата!

Позитивни:

- препознавање на текст на 20-те најпопуларни јазици на светот (англискиот и рускиот јазик е вклучен во овој број);

- огромна поддршка за различни фонтови за печатење;

- проверете го речникот признат текст;

- способноста да се спасат резултатите од работата на неколку начини;

- одржување на структурата на документот;

- Одлични табели за поддршка и препознавање.

Конс:

- не поддржува премногу големи документи и датотеки (повеќе од 400 dpi);

- не поддржува некои видови скенери директно (добро, ова не е страшно, специјален скенер е вклучен со драјверите на скенерот);

- дизајнот не свети (но кој е потребен ако програмата целосно го реши проблемот).

2. Пример за препознавање текст

Претпоставуваме дека веќе сте ги добиле потребните слики за признавање (скенирани таму, или ја преземале книгата во pdf / djvu формат на интернет и ги добивте потребните слики од нив.) Како да го направите ова - видете го овој напис).

1) Отворете ја потребната слика во програмата CuineForm (датотека / отворен или "Cntrl + O").

2) За да започнете признавање - прво мора да изберете различни области: текст, слики, табели итн. Во програмата Крејформер ова може да се направи не само рачно, туку и автоматски! За да го направите ова, кликнете на копчето "Селектирај" во горниот дел на прозорецот.

3) По 10-15 секунди. програмата автоматски ќе ги истакне сите области со различни бои. На пример, текстуална област е обележана со сина боја. Патем, таа ги истакна сите области правилно и прилично брзо. Искрено, не очекував таков брз и точен одговор од неа ...

4) За оние кои немаат доверба во автоматската марка, можете да го користите прирачникот. За ова постои лента со алатки (видете ја сликата подолу), благодарение на што можете да изберете: текст, табела, слика. Поместување, зголемување / намалување на почетната слика, намалување на рабовите. Во принцип, добар сет.

5) Откако сите области се означени, можете да продолжите признание. За да го направите ова, едноставно кликнете на копчето со исто име, како на сликата подолу.

6) буквално за 10-20 секунди. Ќе видите документ во Microsoft Word со препознатливиот текст. Она што е интересно, во текстот за овој пример, се разбира имаше грешки, но многу малку од нив! Особено, со оглед на тоа како обичен оригиналниот материјал беше - сликата.

Брзината и квалитетот е сосема споредлива со FineReader!

3. Сериски текст признавање

Оваа функција на програмата може да ни се најде кога треба да препознаете една слика, но неколку одеднаш. Кратенката за отпочнување на сериско препознавање обично е скриена во менито за старт.

1) Откако ќе ја отворите програмата, треба да креирате нов пакет или да отворите претходно зачувана. Во нашиот пример - креирајте нова.

2) Во следниот чекор ќе му дадеме име, по можност така што шест месеци подоцна ќе се сетиме што се чува во него.

3) Следно, одберете го јазикот на документот (руско-англиски), наведете дали има слики и табели во вашиот скениран материјал.

4) Сега треба да ја наведете папката во која се наоѓаат датотеките за препознавање. Патем, интересно е што самата програма ќе ги пронајде сите слики и други графички датотеки што може да ги препознае и да ги додаде во проектот. Исто така треба да го отстраните дополнителното.

5) Следниот чекор не е важно - одберете што да правите со изворните датотеки, по препознавањето. Препорачувам да го одберете полето за избор "не прави ништо".

6) Останува само да се избере формат во кој признатиот документ ќе биде зачуван. Постојат неколку опции:

- rtf - датотеката од зборот документ е отворена од сите популарни канцеларии (вклучувајќи ги и бесплатните, линк до програми);

- txt - формат на текст, можете да зачувате само текст, слики и табели;

- htm - Хипертекст страница, погодно ако скенирате и препознаете датотеки за страната. Него и изберете во нашиот пример.

7) Откако ќе кликнете на копчето "Finish", ќе започне обработката на вашиот проект.

8) Програмата работи прилично брзо. По препознавањето, ќе видите јазиче со htm датотеки. Ако кликнете на таква датотека, прелистувачот започнува каде што можете да ги видите резултатите. Патем, пакетот може да се спаси за понатамошна работа со неа.

9) Како што можете да видите резултатите работата е многу импресивна. Програмата лесно ја препознава сликата и лесно го препознава текстот под него. Додека програмата е бесплатна, генерално е супер!

4. Заклучоци

Ако често не скенирате и препознавате документи, тогаш купувањето на FineReader веројатно нема смисла. CuneiForm лесно се справува со повеќето задачи.

Од друга страна, таа има и недостатоци.

Прво, има премалку алатки за уредување и проверка на добиениот резултат. Второ, кога треба да препознаете многу слики, тогаш во FineReader поудобно е веднаш да се види што е додадено на проектот во колоната од десната страна: брзо да ги отстраните непотребните, да направите промени итн. И трето, на документи со апсолутно лош квалитет, CuneiForm губи признание: треба да го внесувате документот на ум - исправиме грешки, ставаме интерпункциски знаци, цитати итн.

Тоа е сè. Дали знаете кој било друг пристоен слободен софтвер за препознавање на текст?

Погледнете го видеото: Декларацијата на Движењето Ние Сме Македонија (Април 2024).