Nemrég még be kellett gépelniük mindent, ma már napi 10 ezer oldalt szkennelnek be

Egy régi szakkönyvet digitalizál az Arcanum munkatársa (Fotó: Lukács Csaba/Magyar Hang)

Egyre komolyabb könyvtári állománnyal rendelkezik az Arcanum Digitális Tudománytár. A cég munkatársával, Biszak Bogátával beszélgettünk az Arcanum és a Hungaricana adatbázisáról.

– A hónap elején, mint mindig új anyagok kerültek fel az Arcanum Digitális Tudománytár, az ADT gyűjtőoldalára. Mekkora most az állomány?
– Egész pontosan meg tudom mondani: pillanatnyilag 32 millió 205 ezer 710 oldal áll az olvasók rendelkezésére. Ezek persze nem mind újságok és szakfolyóiratok; található köztük könyv, leginkább lexikonok, nyomtatott adatbázisok.

– Például?
– Például régi telefonkönyvek, Borovszky Samu Magyarország vármegyéi és városai sorozata és Budapest lakcímjegyzéke az 1928-as utolsó megjelenésig. Bele lehet nézni a Magyar Mezőgazdasági Múzeum képzőművészeti gyűjteményének katalógusába, a budapesti Egyetemi Könyvtár alapkatalógusába, illetve a Magyar Zsidó Levéltár iktatókönyveibe is akár, de az oldalra látogatók fellapozhatják többek között a Czuczor-Fogarasi-féle nyelvszótárt, az életrajzi, a néprajzi, a világirodalmi lexikont, a Magyar tájszótárt, a Magyar nyelvtörténeti szótárt, A magyar nyelv történeti-etimológiai szótárát, az általános lexikonok közül pedig a Pallast és a Révait. Olvashatók az országgyűlések naplói és irományai is 1861-től napjainkig.

– Ismernek-e külföldön hasonló méretű vállalkozást?
– Ausztriában a nemzeti könyvtár digitalizálja az ott elérhető anyagokat, de érdemes rákattintani a newspapers.com oldalra is, ha valakit hasonló gyűjtemény érdekel.

Az internet felejt
Lakner Dávid

Az internet felejt

Amit egyszer kinyomtattak, azt akár száz évvel később is elő lehet bányászni – ahogy ezt az Arcanum példája is mutatja. De leszünk-e ilyen szerencsések az internetes tartalmakkal?

– Honnan jött az ötlet a digitális tár létrehozására?
– Az Arcanum még a rendszerváltozás idején alakult azzal a céllal, hogy létrehozza az akkori Magyar Szabadalmi Hivatal elektronikus szabadalmi adatbázisát. A cég szolgáltatásai hamarosan kibővültek, munkatársaink CD-re, illetve DVD-re írták át a Bibliát, illetve néhány jelentősebb szépirodalmi művet. Akkoriban még legépeltük a régi anyagokat, a gyakorlat azonban a technika fejlődésével, az internet térhódításával 2008-ban megváltozott, azóta a régi újságokat, könyveket beszkenneljük.

– Ha beérkezik a céghez egy szkennelendő újság vagy könyv, az mennyi idő múlva juthat el az Arcanum előfizetőihez?
– Ahhoz, hogy a legjobb minőséget el tudjuk érni, szét kell szednünk lapokra a különböző anyagokat. Már amire a tulajdonosok engedélyt adnak. Egy lap két oldalát egyszerre és színesben szkenneljük. Ha a tulajdonos nem járul hozzá, hogy a bekötött újságokat, könyveket lapjaira szedjük, akkor két oldalról fényképező készülékkel digitalizálunk. Az így nyert képformátumot PDF-fé alakítjuk, és átfuttatjuk egy szövegellenőrző rendszeren. A könyvtári felcímkézés, a bookmarkolás után kerülhet az olvasó elé. Naponta mintegy 10 ezernyi oldalt tudunk beszkennelni.

– Mennyi az előfizetőjük?
– Pontos számot hirtelenjében nem tudok mondani, de néhány év óta a duplájára növekedett. Nem véletlen, hiszen a kutatók munkáját jelentősen segíti az adatbázis. Lassan egy éve elérhető arcfelismerő rendszerünk, bízunk benne, hogy az általunk üzemeltetett Szaktars.hu könyvei között áprilistól magánszemélyek is böngészhetnek. Ezek előfizetésesek, az ADT testvéroldala, a Hungaricana ugyanakkor ingyenes. Itt leginkább a térképeket keresik. Tudni kell, hogy munkatársaink az ELTE geofizikai és űrtudományi tanszéke segítségével a Föld görbületét figyelembe véve illesztették össze a most látható, több ezer szelvényes katonai térképeket.

Arckép alapján is kereshetünk majd a régi újságokban
Lukács Csaba

Arckép alapján is kereshetünk majd a régi újságokban

Az Arcanum budafoki központjában jártunk, hogy megnézzük, hogy készül a több mint negyvenmillió folyóirat- és újságoldalas adatbázis.

– Miért ingyenes a Hungaricana és miért kell fizetni az Arcanum adatbázisáért?
– Az előbbin található projekteket a Nemzeti Kulturális Alap vagy a megbízó intézmény finanszírozza, az utóbbit viszont mi.

– Havonta kerülnek új anyagok a Arcanum adatbázisába. Mire számíthatunk legközelebb?
– Nagy nehezen sikerült megszereznünk a háború előtt Erdélyben, a negyvenes évek második felétől pedig Izraelben megjelenő Új Kelet című napilapot, amelynek 1949 és 1977 példányai már kutathatók. Hamarosan elérhető lesz a többi, a háború előtt és a hetvenes évek végétől megjelent számok is. Rövidesen közzétesszük a Műszaki Katonai Közlönyt és a szegedi Reggeli Délvilág kilencvenes évekbeli példányait. Fájóan hiányzik viszont az adatbázisból az engedély hiánya miatt többek között a Nők Lapja, az Élet és Irodalom, a Magyar Narancs és a Magyar Hírek.