Nemrég még be kellett gépelniük mindent, ma már napi 10 ezer oldalt szkennelnek be

Nemrég még be kellett gépelniük mindent, ma már napi 10 ezer oldalt szkennelnek be

Egy régi szakkönyvet digitalizál az Arcanum munkatársa (Fotó: Lukács Csaba/Magyar Hang)

Támogassa a Magyar Hangot!

Legyen Ön is előfizetőnk, rendelje házhoz a Magyar Hangot! Ha más módon támogatná a lapot ebben a nehéz helyzetben, azt is megteheti (PayPal és bankkártya is)! Köszönjük! ELŐFIZETEK

Egyre komolyabb könyvtári állománnyal rendelkezik az Arcanum Digitális Tudománytár. A cég munkatársával, Biszak Bogátával beszélgettünk az Arcanum és a Hungaricana adatbázisáról.

– A hónap elején, mint mindig új anyagok kerültek fel az Arcanum Digitális Tudománytár, az ADT gyűjtőoldalára. Mekkora most az állomány?
– Egész pontosan meg tudom mondani: pillanatnyilag 32 millió 205 ezer 710 oldal áll az olvasók rendelkezésére. Ezek persze nem mind újságok és szakfolyóiratok; található köztük könyv, leginkább lexikonok, nyomtatott adatbázisok.

– Például?
– Például régi telefonkönyvek, Borovszky Samu Magyarország vármegyéi és városai sorozata és Budapest lakcímjegyzéke az 1928-as utolsó megjelenésig. Bele lehet nézni a Magyar Mezőgazdasági Múzeum képzőművészeti gyűjteményének katalógusába, a budapesti Egyetemi Könyvtár alapkatalógusába, illetve a Magyar Zsidó Levéltár iktatókönyveibe is akár, de az oldalra látogatók fellapozhatják többek között a Czuczor-Fogarasi-féle nyelvszótárt, az életrajzi, a néprajzi, a világirodalmi lexikont, a Magyar tájszótárt, a Magyar nyelvtörténeti szótárt, A magyar nyelv történeti-etimológiai szótárát, az általános lexikonok közül pedig a Pallast és a Révait. Olvashatók az országgyűlések naplói és irományai is 1861-től napjainkig.

– Ismernek-e külföldön hasonló méretű vállalkozást?
– Ausztriában a nemzeti könyvtár digitalizálja az ott elérhető anyagokat, de érdemes rákattintani a newspapers.com oldalra is, ha valakit hasonló gyűjtemény érdekel.

– Honnan jött az ötlet a digitális tár létrehozására?
– Az Arcanum még a rendszerváltozás idején alakult azzal a céllal, hogy létrehozza az akkori Magyar Szabadalmi Hivatal elektronikus szabadalmi adatbázisát. A cég szolgáltatásai hamarosan kibővültek, munkatársaink CD-re, illetve DVD-re írták át a Bibliát, illetve néhány jelentősebb szépirodalmi művet. Akkoriban még legépeltük a régi anyagokat, a gyakorlat azonban a technika fejlődésével, az internet térhódításával 2008-ban megváltozott, azóta a régi újságokat, könyveket beszkenneljük.

– Ha beérkezik a céghez egy szkennelendő újság vagy könyv, az mennyi idő múlva juthat el az Arcanum előfizetőihez?
– Ahhoz, hogy a legjobb minőséget el tudjuk érni, szét kell szednünk lapokra a különböző anyagokat. Már amire a tulajdonosok engedélyt adnak. Egy lap két oldalát egyszerre és színesben szkenneljük. Ha a tulajdonos nem járul hozzá, hogy a bekötött újságokat, könyveket lapjaira szedjük, akkor két oldalról fényképező készülékkel digitalizálunk. Az így nyert képformátumot PDF-fé alakítjuk, és átfuttatjuk egy szövegellenőrző rendszeren. A könyvtári felcímkézés, a bookmarkolás után kerülhet az olvasó elé. Naponta mintegy 10 ezernyi oldalt tudunk beszkennelni.

– Mennyi az előfizetőjük?
– Pontos számot hirtelenjében nem tudok mondani, de néhány év óta a duplájára növekedett. Nem véletlen, hiszen a kutatók munkáját jelentősen segíti az adatbázis. Lassan egy éve elérhető arcfelismerő rendszerünk, bízunk benne, hogy az általunk üzemeltetett Szaktars.hu könyvei között áprilistól magánszemélyek is böngészhetnek. Ezek előfizetésesek, az ADT testvéroldala, a Hungaricana ugyanakkor ingyenes. Itt leginkább a térképeket keresik. Tudni kell, hogy munkatársaink az ELTE geofizikai és űrtudományi tanszéke segítségével a Föld görbületét figyelembe véve illesztették össze a most látható, több ezer szelvényes katonai térképeket.

– Miért ingyenes a Hungaricana és miért kell fizetni az Arcanum adatbázisáért?
– Az előbbin található projekteket a Nemzeti Kulturális Alap vagy a megbízó intézmény finanszírozza, az utóbbit viszont mi.

– Havonta kerülnek új anyagok a Arcanum adatbázisába. Mire számíthatunk legközelebb?
– Nagy nehezen sikerült megszereznünk a háború előtt Erdélyben, a negyvenes évek második felétől pedig Izraelben megjelenő Új Kelet című napilapot, amelynek 1949 és 1977 példányai már kutathatók. Hamarosan elérhető lesz a többi, a háború előtt és a hetvenes évek végétől megjelent számok is. Rövidesen közzétesszük a Műszaki Katonai Közlönyt és a szegedi Reggeli Délvilág kilencvenes évekbeli példányait. Fájóan hiányzik viszont az adatbázisból az engedély hiánya miatt többek között a Nők Lapja, az Élet és Irodalom, a Magyar Narancs és a Magyar Hírek.