Skenovanie a digitalizácia

1. Čo mám vlastne chápať pod pojmom digitalizácia?

Digitalizácia záznamov je aplikácia, ktorá slúži na uchovávanie dokumentov v digitalizovanej forme. Súčasťou funkcionality je riadené extrahovanie dát z digitalizovaných dokumentov prostredníctvom OCR podľa vopred definovaných profilov. Extrahované dáta a digitalizované dokumenty sú automaticky ukladané do atribútov a príloh záznamov.

2. Čo je to OCR a ako nastaviť OCR pri skenovaní?

OCR je skratkou pre optical character recognition, t.j. preklad textu z grafického formátu do textového formátu. Jednoducho povedané, skenovacie zariadenie skenuje dokumenty ako obrázok, resp. pdf, čo nie sú editovateľné upravovateľné dokumenty. OCR slúži na prevod do editovateľného záznamu. Používateľ teda pri skenovaní zadá OCR oblasť – teda vyznačené miesto na stránke, ktorého dáta sa použijú na naplnenie atribútov. Pre prehľad a jednoduché vyhľadávanie je dôležité napr. označiť číslo faktúry, resp. IČO dodávateľa a jeho adresu. Akonáhle je už raz nastavená daná oblasť, aplikácia sama rozozná, o ktorého dodávateľa sa jedná a automaticky priradí daný naskenovaný dokument konkrétnemu dodávateľovi, čím zrýchľuje vnútro firemné procesy.

3. Ako dlho trvá skenovanie?

DMS Greeny umôžňuje hromadné skenovanie dokumentov. V praxi to znamená, že skenovanie bude trvať podľa potreby zákazníka. Napr. v prípade, že zákazník potrebuje naskenovať za jeden deň 40 rôznych dokumentov o rôznej dĺžke (napr. zmluva môže obsahovať rôzne prílohy a samotná môže mať napr. 20 strán), označí čiarovým kódom prvú stránku konkrétneho typu dokumentu. Po ukončení procesu skenovania, môže používateľ skontrolovať správnosť naskenovaných dokumentov a uložiť ich do repozitára. V prípade, že neboli správne na stavené, môže ich manuálne meniť. OCR proces môže byť vykonávaný automaticky, resp. manuálne používateľom. Výhoda hromadného skenovania spočíva v tom, že používateľ vloží všetky tieto už označené dokumenty čiarovým kódom do skenovacieho zariadenia. Počas skenovania môže vykonávať akékoľvek iné pracovné úlohy. Jeho prítomnosť nie je požadovaná, čím sa urýchľujú pracovné procesy vo firme. Skenovacie zariadenie medzitým naskenuje všetky vložené dokumenty do aplikácie DMS Greeny.

4. Aké skenovacie zariadenie je vhodné?

 

Pre digitalizáciu dokumentov na skenovacom zariadení, ktoré je pripojené priamo k používateľovmu počítaču, je potrebné disponovať skenovacím zariadením podporujúcim WIA rozhranie - Windows Image Acqusition (WIA – niekedy nazývaný aj ako obrázková architektúra Windows). Rozhraním WIA disponujú i multifunkčné zariadenia.

V prípade, že skenovacie zadiadenie nie je pripojené priamo k počítaču používateľa, je potrebný taký typ zariadenia, ktorý dokáže ukladať naskenované dokumenty na štandardné pamäťové médium ako je napríklad USB disk alebo zdieľaný adresár (v prípade zapojenia zariadenia do počitačovej siete).

Cena týchto skenovacích zariadení sa pohybuje v závislosti od výrobcu, dodatočných funkcionalít a ich vlastností. Pri výbere skenovacieho zariadenia je dôležité brať do úvahy napr. aj veľkosť zásobníka papiera. Niekomu môže stačiť 50-hárkový zásobník papiera, inej firme zas 500-hárkový zásobník papiera a viac. Cena týchto zariadení sa pohybuje od 100,- Eur vyššie, v závislosti od požadovaného výkonu a iných funkcionalít.

 

5. OCR profil?

V správe OCR profilov sa nachádza nástrojová lišta a strom otvorených OCR profilov. V prípade potreby, môže používateľ vykonať operácie ako napr. uložiť, zmazať, zrušiť, vytvoriť nový OCR profil a iné. OCR profil reprezentuje práve jeden typ záznamu. Každý typ záznamu (napr. faktúra) musí mať definovaný OCR profil, aby mohol byť pri skenovaní správne rozpoznaný. OCR profil obsahuje strany a oblasti. Práve preto je dôležité, aby prvá strana skenovaného dokumentu mala na sebe nalepený čiarový kód.

6. Čo sú to OCR strany a OCR oblasti a ako ich správne nastaviť?

Jedna OCR strana definuje jeden skenovaný dokument, takže ak má napr. očakávaná faktúra 3 strany, musí používateľ definovať 3 OCR strany. Pri definovaní novej OCR strany musí používateľ definovať nový vzorový sken, ktorý má na disku, a ktorý bude použitý pre definovanie OCR oblastí. Je potrebné definovať strany v správnom poradí a to tak, že prvá strana skenovaného dokumentu obsahuje čiarový kód. Na každej OCR strane sa môžu nachádzať OCR oblasti, ktoré definujú miesto na naskenovanom dokumente. Na vytváranie OCR oblastí slúži ikona na nástrojovej lište. Používateľ si teda jednoduchým rámikom označí podľa svojich potrieb OCR oblasť, napr. kolónku IČO dodávateľa, resp. iné.

 
 
 
 

HP internetový obchod HP Market Oracle Certified Partner HP 2013 GOLD Specialist - Personal Computing StatSoft

Facebook