CSEH GERGŐ BENDEGÚZ–Körmendy Lajos–RÁCZ GYÖRGY

DIGITALIZÁLÁS A LEVÉLTÁRAKBAN

1. Bevezetés

A 20. sz. végén a levéltárak előtt álló számos kihívás közül minden bizonnyal a legnagyobb az informatika robbanásszerű fejlődése, az elektronikus iratkezelés — Nyugat-Európában vagy Észak-Amerikában gyorsabb, a régiónkban lassabb — terjedése, a számítógépes hálózatoknak az államigazgatás, a gazdaság és a kultúra mind szélesebb köreiben végbemenő térhódítása. Az információs társadalom újszerű követelményrendszere a levéltárak számára egyszerre ellenállhatatlan kényszer és óriási lehetőség.

Az informatika terén végbement átalakulásnak rendkívül fontos levéltári vonatkozása, hogy a közérdekű iratok mind szélesebb köréhez kívánnak a felhasználók — ügyfelek, kutatók, államigazgatási szervek, oktatási intézmények, sajtó — digitalizált formában hozzájutni. Ennek a mára valóban megkerülhetetlen igénynek csak rendkívül átgondolt, az ezirányú hazai és külföldi tapasztalatokat hasznosító programok révén felelhetnek meg a levéltárak. Sok kockázatot rejt magában egy nagyszabású digitalizálási program megindítása, ráadásul ezen kockázati elemek némelyikére igen nehéz előre felkészülni. Egy komoly pénzügyi forrást és évekig tartó munkát egyaránt felemésztő digitalizálási program könnyen futhat zsákutcába a nem megfelelő stratégia, a rossz előkészítés, a digitalizálandó iratok átgondolatlan kiválasztása, az eljárás szakszerűtlensége, vagy akár a hardver, akár a szoftverek terén történt változások miatt. Mindezek a kockázatok természetesen nem jelenthetik azt, hogy a levéltáraknak el kellene vagy el lehetne zárkózniuk az információs robbanás kihívásai elől. Ebben az esetben ugyanis nem csak az általuk őrzött iratok gyorsabb, kényelmesebb és sokoldalúbb hozzáférhetőségét tennék kockára, de az iratkezelés és -megőrzés terén zajló változások közepette hamarosan alapfeladataik ellátására is alkalmatlanokká válnának.

Bár mind az iratok jellege, mind a használatukkal kapcsolatban jelentkező igények, mind az egyes levéltárak anyagi és emberi feltételei jelentősen eltérőek, az iratok digitalizálását szolgáló programok tervezésekor és kivitelezésekor néhány — minden levéltárra érvényes — alapvető levéltártani, gazdasági, társadalmi és munkaszervezési szempontot mindenképpen figyelembe kell venni.

 

2. A digitalizálás

A digitális képek párhuzamba állíthatók az analóg képekkel (fénymásolat, fénykép, mikrofilm), funkciói az esetek többségében vagy teljesen azonosak vagy nagyon hasonlóak. Mivel a levéltárakban évtizedek óta ismertek az analóg másolatok, tanulmányunkban — már csak a jobb megértés miatt is — gyakran fogunk hivatkozni a digitális-analóg párhuzamokra.

Digitalizálás során analóg információkat (pl. egy irat képét) kettes számrendszerben (azaz digitális módon) rögzítünk számítógép segítségével. A kettes számrendszer azt jelenti, hogy a számítógép igen-nem információk alapján építi fel a képet. Például egy fekete–fehér digitális kép úgy készül, hogy a szkenner sorról-sorra, egy-egy soron belül pontról-pontra haladva „letapogatja” a másolandó képet, és az adott képpontra vonatkozó információt digitális formában küldi el a számítógépnek, amely azt feldolgozza a memóriájában és elraktározza a háttértárában (merev lemez). Az irat teljes képe tehát az egyes képpontokhoz rendelt digitális információkból áll össze.

A digitalizáló készülékek általában képesek a pontsűrűséget változtatni, tehát beállítástól függően több vagy kevesebb pontra bontják a „letapogatott” képet (iratot). Kevés ponttal szkennelve kontrasztos képet kapunk, a kép élessége azonban nem nagyon jó, tehát a vékony vonalak és az árnyalatok eltűnhetnek. A sok pontot tartalmazó (nagy felbontású) digitális kép általában kevésbé kontrasztos, viszont a vékony vonalak és az árnyalatok jól látszanak. Értelemszerűen ha a számítógépnek sok pontra vonatkozó információt kell elraktároznia, akkor egy kép, pontosabban az azt tartalmazó fájl mérete nagy lesz. Kisszámú kép esetén ennek nincs jelentősége, de sok ezer nagy felbontású képnél már nagyon sok helyre van szükségünk a számítógépünk háttértárában.

Egyre több digitalizáló készülék képes színes képet készíteni. A színes digitalizálás technikai leírása meghaladja ennek a tanulmánynak kereteit, annál is inkább, mert a színes elektronikus képek jelentősége a levéltárban — jelenleg — kb. ugyanolyan marginális, mint az analóg megfelelőjüknek, a színes filmnek és nagyításnak. Azt azonban meg kell említeni, hogy a színes digitalizáló berendezések és munkafolyamatok bonyolultabbak, lassabbak és drágábbak, mint a fekete–fehér technológiájúak, a háttértárigényük pedig óriási.

Megkülönböztethetünk digitális fényképezést és szkennelést. A különbség ugyanaz, mint ami az analóg világban a fényképező- és a fénymásoló gép között fennáll: a fényképezőgépnél az egész tárgyról (iratról) egyszerre, lencsén keresztül jut a fény a fényérzékeny anyagra (filmre, lemezre), a fénymásoló gépnél pedig egy szerkezet sorról-sorra világítja meg az iratot, és a visszavert fényt a fentebb leírt módon feldolgozza. A technika jelenlegi állása szerint a digitális fényképezőgép megfelelője a klasszikus (analóg) fényképezőgép, amivel elsősorban tárgyképet készítünk, nem pedig dokumentumfotót. (Ha egy iratot tárgyként fotózunk — megfelelő nyersanyaggal és felszereléssel —, akkor az irat egészét fényképezzük az árnyalatokkal és a forma hangsúlyozásával, míg az írás szürke és kissé elmosódott lesz. A dokumentumfotónál viszont a forma részletei vagy elvesznek vagy jellegtelenné válnak, az írás viszont rendkívül éles, a kontrasztos lesz. A levéltárakban leggyakrabban alkalmazott tárgyfotók a pecsétfelvételek.) A digitális fénykép árnyalatgazdag képe rengeteg pontból áll össze — általában sokkal több pontból, mint a szkenner képe — ennek megfelelően óriási a háttértárigénye.

Manapság már kaphatók olyan mikrofilmkamerák, amelyek egyaránt készítenek hagyományos és elektronikus felvételeket: az egyik (a mikrofilm) készülhet biztonsági céllal, a másik (a digitális felvétel) pedig kommunikációs alkalmazásokra. Bár ez a berendezés ideálisan ötvözi a két technológiát, a jövője kétséges, mert egyrészt behatárolt az alkalmazási területe — csak az adott kamerán készült mikrofilmeknek van digitális párjuk, míg egy mikrofilm-szkennerrel bármely mikrofilmről készíthető elektronikus másolat —, másrészt valószínűleg a jövőben is túlságosan drága marad, mert szűk a felhasználói kör (könyvtárak, levéltárak), ezért csak alacsony szériaszámban gyártják.

A digitalizálás történhet kép formájában (erről beszéltünk a fentiekben), valamint „intelligens” módon, és a kettő között lényeges különbség van. Az „intelligens” digitalizálás két fázisban történik: először a fényképezőgép vagy a szkenner digitálissá alakítja az analóg képet, majd egy speciális karakter-felismerő szoftver (OCR, azaz Optical Character Recognition) a pontokból összeálló betűket, egyéb írásjeleket, számokat felismeri, és azokat a megfelelő számítógépes kódokhoz rendeli. Így létrejön egy szövegfájl, amiben szavakat kereshetünk, amit szövegszerkesztővel átalakíthatunk, adatbázissá konvertálhatunk. A kép formájában történő digitalizálásnál az említett második fázis elmarad, és a képet, illetve azon belül a karaktereket a számítógép pontok halmazaként kezeli, azaz bár megjeleníti őket, nem „tudja”, hogy milyen betűkről van szó, ezért a szövegben nem tudunk géppel keresni, és azt szövegszerkesztővel sem tudjuk módosítani. Kétségtelen előnye viszont a kép-dokumentumnak az „intelligens” szöveggel szemben, hogy az eredeti irat fakszimile képét adja, így az iraton láthatók a pecsétek, aláírások, lapszéli jegyzetek stb., amelyek karakterfelismerő programok számára teljesen értelmezhetetlenek lennének. A digitális képeket is tehetjük — korlátozott módon — „intelligenssé”, ha összekötjük azokat egy adatbázissal vagy adatbázisként működő fájllal. (Ennek kifejtését l. alább.)

A technika jelenlegi állása szerint csak jó minőségű nyomtatott iratok alkalmasak OCR-rel történő feldolgozásra. Az évtizedekig használatban volt, hagyományos írógéppel írt szövegeknél — nem beszélve a sérült, foltos, kézzel javított gépelésekről — olyan sok a rosszul felismert karakter (a tévesztés), hogy egyszerűbb újragépelni a szöveget mint javítani. Azt mondani sem kell, hogy a kézzel írt levéltári iratok belátható időn belül nem lesznek feldolgozhatók OCR-rel, csak képként.

A digitális információ hallatlan előnye az analóggal szemben a szinte korlátlan kommunikálhatóság, ami levéltári anyagnál egyet jelent a széleskörű hozzáférhetőséggel. Van azonban néhány nem lebecsülendő hátránya és fogyatékossága is, amit csak a levéltári követelmények és alapelvek szigorú betartásával, ill. alkalmazásával kezelhetünk.

Folytatás

Vissza