Pag-ila sa teksto. Free nga programa - analogue nga FineReader

Sa dili madugay, ang tanan nga kanunay nga nagtrabaho sa mga programa sa opisina nag-atubang sa usa ka tipikal nga buluhaton - i-scan ang teksto gikan sa usa ka libro, magasin, pamantalaan, mga leaflet lamang, ug dayon i-translate kini nga mga hulagway ngadto sa format sa teksto, pananglitan, ngadto sa usa ka dokumento sa Pulong.

Sa pagbuhat niini kinahanglan nimo ang usa ka scanner ug usa ka espesyal nga programa alang sa pag-ila sa teksto. Hisgutan niining artikuloha ang libreng analogue sa FineReader -Cuneiform (mahitungod sa pag-ila sa FineReader - tan-awa kining artikuloha).

Magsugod kita ...

Ang sulod

  • 1. Mga kinaiya sa programa sa CuneiForm, mga feature
  • 2. Usa ka pananglitan sa pag-ila sa teksto
  • 3. Batch text recognition
  • 4. Mga konklusyon

1. Mga kinaiya sa programa sa CuneiForm, mga feature

Cuneiform

Mahimo ka maka-download gikan sa site sa developer: //cognitiveforms.com/

Usa ka open source text recognition software. Dugang pa, nagtrabaho kini sa tanang bersyon sa Windows: XP, Vista, 7, 8, nga makapahimuot. Dugang, idugang ang bug-os nga Russian nga paghubad sa programa!

Sugilanon:

- Ang pagkilala sa mga teksto sa 20 pinakapopular nga mga pinulongan sa kalibutan (ang Ingles ug Ruso mismo gilakip niini nga gidaghanon);

- Daghang suporta alang sa nagkalain-laing mga print nga mga font;

- susiha ang giila nga teksto sa diksyonaryo;

- ang abilidad sa pagluwas sa mga resulta sa trabaho sa daghang paagi;

- pagmintinar sa istruktura sa dokumento;

- Maayo nga suporta ug mga lamesa sa pag-ila.

Kahinumduman:

- wala mosuporta sa dagkong mga dokumento ug mga file (kapin sa 400 dpi);

- wala mosuporta sa pipila ka mga matang sa mga scanner nga direkta (maayo, dili kini makahahadlok, usa ka espesyal nga scanner ang nalakip sa mga drayber sa scanner);

- ang disenyo wala magdan-ag (apan kinsa ang nagkinahanglan niini kon ang programa hingpit nga magsulbad sa problema).

2. Usa ka pananglitan sa pag-ila sa teksto

Gikonsiderar namo nga nakadawat ka na sa gikinahanglan nga mga hulagway aron makilala (i-scan didto, o mag-download sa libro sa pdf / djvu format sa Internet ug makuha ang gikinahanglan nga mga hulagway gikan kanila.

1) Ablihi ang gikinahanglan nga larawan sa programa sa CuineForm (file / open o "Cntrl + O").

2) Sa pagsugod sa pag-ila - kinahanglan una nga mopili ka og lain-laing mga dapit: teksto, mga hulagway, mga lamesa, ug uban pa. Sa Cuneiform nga programa, kini mahimo dili lamang sa manwal, apan usab awtomatiko! Aron mahimo kini, i-klik ang "markup" button sa ibabaw nga pane sa bintana.

3) Human sa 10-15 segundo. ang programa sa awtomatik nga pag-highlight sa tanan nga mga lugar nga adunay lain-laing mga kolor. Pananglitan, ang usa ka lugar sa teksto gipunting sa asul. Pinaagi sa dalan, iyang gipasiugda ang tanan nga mga dapit sa husto ug sa madali. Sa matinuoron, wala ako magdahum nga ang usa ka dali ug husto nga tubag gikan kaniya ...

4) Alang niadtong wala mosalig sa awtomatikong marka, mahimo nimo gamiton ang usa ka manwal. Alang niini adunay usa ka toolbar (tan-awa ang hulagway sa ubos), salamat nga mahimo nimo pagpili: teksto, lamesa, hulagway. Pagbalhin, pag-uswag / pagkunhod sa inisyal nga imahe, pagputol sa mga sulud. Sa kinatibuk-an, usa ka maayo nga set.

5) Human nga ang tanan nga mga dapit gimarkahan, mahimo ka mopadayon sa pag-ila. Aron mahimo kini, i-klik lamang ang butones sa sama nga ngalan, sama sa hulagway sa ubos.

6) Literal sa 10-20 segundos. Makita nimo ang usa ka dokumento sa Microsoft Word uban ang giila nga teksto. Unsa ang makapaikag, sa teksto alang niini nga panig-ingnan, siyempre adunay mga sayop, apan adunay pipila lamang kanila! Ilabi na, naghunahuna kung unsa ka yano ang orihinal nga materyal - ang hulagway.

Ang katulinon ug kalidad nahisama sa FineReader!

3. Batch text recognition

Kini nga function sa programa mahimong magamit sa diha nga kinahanglan nimo nga maila ang usa ka hulagway, apan ubay-ubay sa usa ka higayon. Ang shortcut aron paglunsad sa batch recognition sagad gitago sa start menu.

1) Human sa pag-abli sa programa, kinahanglan nga maghimo ka og bag-ong pakete, o pag-abli sa usa nga naluwas. Sa among panig-ingnan - paghimo og usa ka bag-o.

2) Sa sunod nga lakang atong gihatag kini nga usa ka ngalan, labing maayo nga ingon sa unom ka bulan sa ulahi atong mahinumduman kung unsa ang gitipigan niini.

3) Sunod, pilia ang dokumento nga pinulongan (Ruso-Iningles), ipakita kung adunay mga litrato ug mga lamesa sa imong scan nga materyal.

4) Karon kinahanglan nimo nga mahibal-an ang folder diin nahimutang ang mga file alang sa pagkilala. Pinaagi sa dalan, unsa ang makapaikag mao nga ang programa mismo makakaplag sa tanan nga mga hulagway ug uban pang mga graphic nga mga file nga kini makaila ug idugang kini sa proyekto. Kinahanglan usab nga kuhaon ang sobra.

5) Ang sunod nga lakang dili importante - pagpili unsa ang buhaton sa mga source file, pagkahuman pagkilala. Ginarekomendar ko nga pilion ang checkbox nga "wala'y buhaton".

6) Kini nagpabilin lamang sa pagpili sa format diin ang giila nga dokumento maluwas. Adunay daghang mga kapilian:

- rtf - ang file gikan sa pulong nga dokumento giablihan sa tanang inila nga mga buhatan (lakip ang mga libre, usa ka sumpay sa mga programa);

- txt - format sa teksto, mahimo ka makaluwas lamang sa teksto, mga hulagway ug mga lamesa niini;

- htm - Hypertext nga panid, sayon ​​kon imong i-scan ug ilhon ang mga file alang sa site. Iya ug gipili ang atong panig-ingnan.

7) Human sa pag-klik sa "Finish" button, ang pagproseso sa imong proyekto magsugod.

8) Ang programa dali nga milihok. Human sa pag-ila, imong makita ang tab nga adunay mga htm file. Kon nag-klik ka sa usa ka file, magsugod ang usa ka browser asa nimo makita ang mga resulta. Pinaagi sa dalan, ang mga package mahimo nga maluwas alang sa dugang nga buhat uban niini.

9) Sama sa imong makita ang mga resulta Ang trabaho nindot kaayo. Ang programa dali nga nakaila sa hulagway, ug dali nga nakaila sa teksto ubos niini. Samtang libre ang programa, kini kasagaran sobra ra!

4. Mga konklusyon

Kon sa kasagaran dili mo scan ug makaila sa mga dokumento, nan ang pagpalit sa FineReader tingali dili makatarunganon. Ang CuneiForm dali nga nagdumala sa kadaghanan nga mga buluhaton.

Sa laing bahin, siya usab adunay disadvantages.

Una, diyutay ra ang mga himan alang sa pag-usab ug pagsusi sa resulta nga resulta. Ikaduha, kung kinahanglan nimo nga makilala ang daghang mga hulagway, nan sa FineReader mas sayon ​​nga makita dayon ang tanan nga gidugang sa proyekto sa kolum sa tuo: pagdali dayon sa wala kinahanglana, pag-edit, ug uban pa. Ug ikatulo, sa mga dokumento nga dili maayo ang kalidad, CuneiForm mawad-an og pag-ila: kinahanglan nga imong ibutang sa hunahuna ang dokumento - hustong mga sayop, ibutang ang mga marka sa panulbok, mga kinutlo, ug uban pa.

Kana tanan. Nahibal-an mo ba ang bisan unsang laing desente nga libre nga text recognition software?