LT   EN   RU  
2024 m. kovo 19 d., antradienis Straipsniai.lt - Teminis naujienų ir straipsnių katalogas
  Skaneriai
  Technologijos > Kompiuterinės technologijos > Kompiuteriniai žaidimai
Lankomumo reitingas Publikuota: 2005-02-28 Spausdinti Spausdinti
Kompiuterinis teksto atpažinimas

Kompiuterijoje plačiai naudojama santrumpa OCR (Optical Character Recognition) – kompiuterizuotas tekstinių dokumentų atpažinimas. Kompiuterinės programos palyginti gerai atpažįsta knyginį ir laikraštinį tekstą, ypač gerai susidoroja su kompiuterinių spausdintuvų išspausdintais lapais – visu tuo, kur naudojamos standartinės, vienodos raidės ir kiti visuotinai priimti simboliai. Atrodytų, taip pat gerai turėtų būti nuskaitomas ir mašinraštis, juk jame taip pat standartizuotas raidynas. Deja, šioje srityje kol kas rezultatai labai prasti – rašomosios mašinėlės klavišus žmonės spaudė skirtinga jėga, dažanti juostelė visu savo ilgiu turėjo skirtingą nusidėvėjimo laipsnį, ir šiuolaikinių skanerių optika dar nesitvarko su šiomis problemomis. Gaunamų klaidų procentas paprastai būna toks didžiulis, kad kompiuterinis mašinraščio atpažinimas tampa beprasmis. Tuo labiau anksti kalbėti apie automatizuotą rankraščių, rašytų unikaliu kiekvienam žmogui braižu, atpažinimą.

Net ir esant tokiems akivaizdiems apribojimams, kompiuterinis tekstų atpažinimas tebėra puikia galimybe greitai perkelti informaciją iš senų spaudinių į lengvai redaguojamą ir platinamą kompiuterinį formatą. Šiam darbui reikalingos tokios priemonės, kaip kad pakankamai jautrus skaneris (ne mažiau 300 dpi) ir kuri nors kompiuterinė, daugelį kalbų palaikanti teksto atpažinimo programa. Šiuo metu plačiausiai žinoma ir pakankamai paprasta vartoti yra ABBY Finereader, paprastai platinama kompaktiniuose diskuose kartu su įsigyjamais skaneriais. Paprastai ji sutinkama dviem variantais – Profesional ir Sprint.

Lengva atspėti, kad Profesional talpina savyje kur kas didesnes galimybes, tačiau yra mokamas, tuo tarpu Sprint platinamas veltui, todėl jis labiau ribotas, bet vis dėlto atitinka būtiniausius vartotojo poreikius.

Įjungus Sprint programą pirmiausia būtina pasirinkti, kokia kalba yra parašytas tekstas, kuris bus skanuojamas. Programa atpažįsta kelias dešimtis kalbų, apribojimas tik tas, kad viename puslapyje ji atpažins tik vieną kalbą – t.y. jei nustatėme lietuvių kalbą ir šiame puslapyje pasitaikė rusiškas, kirilicos abėcėle rašytas teksto fragmentas, jis nebus atpažintas. Vienas iš profesionalaus Finereaderio pranašumų ir yra tai, kad jis viename puslapyje gali analizuoti kelių skirtingų kalbų tekstus.

Sekantis žingsnis – paspaudus mygtuką Scan&Read atsidarys papildomų programos nustatymų langas, kuriame galima pasirinkti:

Portrait arba Landscape – popieriaus lapas skaneryje yra įdėtas stačiais arba gulsčias;

Paper format – lapo dydis, standartinis kanceliarinis popierius yra A4 dydžio, knygos lapas dažniausiai mažesnis per pusę, bet dydžio nustatymą būtų geriau keisti geriau ne čia, o kaip ir skanuojant nuotraukas, perkeliant punktyrinį rėmelį Preview režime.

Brightness – šviesos balansas, akivaizdu, kad skanuojant senus, papilkėjusius knygos lapus vertėtų vaizdą šiek tiek iš anksto pašviesinti.

Pictures scaning mode – iliustracijų tekste skanavimo režimas. Jeigu jos mums nereikalingos, galima šį parametrą ignoruoti, jeigu norime išsaugoti ir jas, teks pasirinkti tinkamiausią režimą – linijinis, nespalvotas, spalvotas.

Resolution – skanavimo skiriamoji geba. Jei skanuojamas tekstas ryškiai matomas, atspausdintas didelėmis raidėmis, gali pakakti ir už 300 dpi mažesnės rezoliucijos, jeigu prasčiau įžiūrimas – ją teks didinti iki 400 dpi ir daugiau.

Paspaudus OK, tekstas bus nuskanuotas ir pagal programos galimybes atpažintas. Jį belieka persiųsti į kurį nors tekstinį redaktorių, pvz. Microsoft Word ir jame ištaisyti programos padarytas atpažinimo klaidas.

Griežtai draudžiama Straipsniai.lt paskelbtą informaciją panaudoti kitose interneto svetainėse, tradicinėse žiniasklaidos priemonėse ar kitur arba platinti mūsų medžiagą kuriuo nors pavidalu be sutikimo. Cituojant būtina aiški nuoroda į Straipsniai.lt kaip informacijos šaltinį.

Atsitiktinės gairės:    Užsienyje (2)    Meninė gimnastika (14)    Matematika (2)    NSO (33)    Laivyba (17)    Kelionių įspūdžiai (26)    Bendravimas (743)    Logistika (12)    Joga (56)    Ekonomika (5)    Nekilnojamasis turtas (22)    Kalbos kultūra (39)    Mobilūs ryšiai (193)    Mityba (43)    Istorija (154)    Gyvūnai (174)    Taksas (2)    Pyktis (6)    Kabala (6)    Politika (363)    Arkliai (12)    Partizanai (12)    Skolininkai (12)    Poltergeistai (2)    Visuotinė istorija (44)    Įvaikinimas (3)    Modemai (8)    Šventasis Pranciškus (3)    Knygos (23)    Nokia (24)    Skamp (16)    Susitaikymas (9)    Turizmo agentūros (10)    Chiromantija (3)    Elektroninės šiukšlės (10)    Pramoginiai šokiai (2)    Viešieji ryšiai (20)    IT parodos (10)    Sportas (8)    Hobi (106)    Žvejyba (30)    Šunų veislės (52)    Konditerija (10)    Šaudymas iš lanko (2)    Emo (10)    Rinkimai (23)    Netolerancija (6)    Atviras kodas (23)    Krikščionybė (135)    Komunikacija (166)
1. Pietų Korėjos valdžia uždraudė nepilnamečiams žaisti kompiuterinius žaidimus naktimis
2. Internetiniame žaidime vaikams – seksualūs apatiniai ir „egzotiško“ įvaikio pirkimas
3. „Windows 7“ žaidimų mėgėjams: pliusai ir minusai
4. Kompiuterinių žaidimų entuziastai rinksis Kaune
5. Žaidimui "Žuvies kelionė" - prizas už netradicines viešųjų ryšių priemones
6. Baltijos šalių kompiuterinių žaidimų asai iš WCG finalo medalių neparsiveža
7. Nusipirkau pasaulį
8. Kaip apsaugoti savo akis žaidžiant kompiuteriu?
9. Vivisektorius. Žvėris viduje
10. Oddworld Inhabitants keičia profilį
   
 
     
Prisijunk prie gerbėjų rato Google Plus! Mūsų jau 500. Skelbk informaciją, dalinkis naujienomis. Būk matomas!