Biszak Sándor, az Arcanum cég alapítója és vezetője két évvel ezelőtt keresett meg, hogy felajánlja: az archívumunkban lévő Háromszék- és Megyei Tükör-kollekciókat digitalizálja. Több egyeztetés után a csapat a cégvezetővel az élen meg is érkezett Budapestről, s az óriás szkennerekkel berendezkedtek a megyei tanács vendégházában. Egy hétig tartott, amíg a jobbára elsárgult újságlapokat az elektronikus tárhelyek memóriájába rögzítették, s még néhány hónap, amíg az adatbázis évjáratok és kulcsszavak segítségével elérhető lett az ADT-Arcanum rendszerében több magyar újság, folyóirat, szaklap, periodika, lexikon stb. társaságában.

A mintegy 28 millió oldalt tartalmazó, több intézmény adatbázisát elérhetővé tevő digitális szolgáltatásokról az alapítót és máig mindenest, a bukovinai székely gyökerekkel rendelkező Biszak Sándort kérdeztük.

A kezdetek

– Mikor és hogyan indult az adatbázisok kiépítése?

– A szabadalmi hivatallal közösen ’89-ben kezdtük a munkát, és akkor még a CD-ROM elterjesztése volt a cél. Aztán a technológiát felhasználtuk bibliakiadásra, verstárat készítettünk ötven magyar költő verseivel, illetve a klasszikus irodalom megannyi remekműve jelent meg, és volt is rá szépen kereslet. Úgy 2000-ig, amikor ez a technológia kifutotta magát.

– De honnan származik az ötlet?

– Vegyészként végeztem még a nyolcvanas évek elején, egy ideig a Richter Gedeon gyógyszergyárban dolgoztam, ott akkor már fantasztikus dolgokat lehetett csinálni, hogy úgy mondjam, interneten kértem le az adatokat Kaliforniá­ból, hatalmas adatbázisok voltak, s a magyar szabadalmak is ott voltak rögzítve, itthon viszont nem. Később egy szövetkezetben már egyfajta vállalkozásként flopilemezre kezdtünk adatbázist csinálni, s erre figyelt fel a szabadalmi hivatal. Így lettem vegyészből könyvtár-informatikus.

– Visszatérve a 2000-es évekre, akkor már megjelentek a nagy világcégek valamilyen formában elérhető adatbázisai...

– Igen, tulajdonképpen a Google Books megjelenése forradalmasította ezt a szakmát, hiszen már nem arról szólt a dolog, hogy egy-két könyvet kell legépelni, korrektúrázni, kereshetővé tenni, hanem tömegesen kell mindent csinálni. Mi érdekes módon nem a könyvek irányába indultunk el – ez utólag nagyon jó döntésnek bizonyult –, kezdetben a tudományos folyóiratokat kezdtük adatbázisba venni, mert akkor még úgy tűnt, hogy nem lehetséges a nagy terjedelmű napilapokat digitalizálni. A fejlődés aztán hozta magával, hogy egyre nagyobb adatbázisokat tudtunk kiépíteni, s az is kiderült, hogy a napilapok egyre több embernek jelentenek forrás­anyagot, hiszen mindenkinek a barátjáról, az ellenségéről vagy éppen a családtagjáról írtak már napilapban, vagyis egy rendkívül személyes műfajt tudtunk elérhetővé tenni. Amikor már volt 15 millió oldalnyi adatbázisunk, úgy két-három évvel ezelőtt, akkor értük el azt a kritikus tömeget, ami nagyon népszerűvé tette az adatbázist. A keresési funkciókkal együtt, azt lehet mondani, hogy nélkülözhetetlen lett mindenféle helytörténeti, család- vagy művelődéstörténeti, de bármilyen jellegű kutatáshoz.

Milliós nagyságrend

– Holt tartanak most az adatbázis számai?

– Huszonnyolcmillió oldalunk van, ez persze egy nagyon szép szám, ugyanakkor csalóka, mert nem veszi figyelembe az oldalak méretét, így sok milliárd szóról, mondatról beszélhetünk a tudományos lapoktól a nagy méretű napilapokig. Földrajzilag ez Magyarországon kívül az egész Kárpát-medencében, de bárhol a világon magyarul megjelent lapokat jelent. Igyekszünk az egész világon felkutatni és digitálisan hozzáférhetővé tenni a magyar lapokat, tartalmakat. És nem csupán a magyar nyelven megjelent lapokról van szó, hiszen – főleg a tudományos folyóiratok tekintetében – több idegen nyelvűt is rögzítettünk. Azt gondoljuk, hogy az anyaggyűjtés kétharmadán túl vagyunk, a fellelhető anyag mintegy harmada van még hátra, de egyre nehezebb hozzájutni.



Motivációk

– Hatalmas anyagról van szó. Mi kell ahhoz, hogy magánvállalkozásként ezt meg lehessen valósítani, hiszen több állami intézmény, könyvtár még saját állományát sem tudta digitalizálni? Hogyan lehet ezt finanszírozni?

– Elsősorban nagyfokú elkötelezettség kell, hiszen mániákusan érdekel a dolog, néha talán túlzottan is rámenős vagyok. Aztán rendkívül fontos a szakértelem, nemcsak az adatbázisok kiépítésének a tudománya, hanem a realitásérzék. Na meg óvatos vállalkozók vagyunk, csak azt csináljuk, amire lehetőségünk van, ütemesen haladunk. Tulajdonképpen az előfizetésekből – magán- és intézményes előfizetésekből – tudjuk finanszírozni a munkát, a fejlesztéseket. Például 2016 óta a teljes magyar felsőoktatási, kutatói és közgyűjteményszférát egy közös előfizetés keretében szolgáljuk ki.

– Milyen szolgáltatások érhetőek el most?

– Van az ADT, vagyis a lapok és folyóiratok adattára, van a Hungaricana, vagyis festmények, oklevelek, folklórgyűjtemény (több mint húszezer óra hanganyag), ez utóbbi a Nemzeti Kulturális Alap és az állam finanszírozásában készült, van a térkép datbázisunk, a MAPIRE, vagyis az a lehetőség, hogy mondjuk egy város térképét online különböző korokban meg lehessen nézni, egymásra tenni, és elindult a Szaktárs szolgáltatásunk, ahol 15 kiadó összes könyvét szolgáltatjuk, egyelőre csak intézmények részére. Maga a keresési szolgáltatások rendszere, nyugodtan mondhatom, világszínvonalú, gyors, kényelmes és látványos, a szolgáltatás egy pillanatra sem állhat le, még akkor sem, ha napi százezer látogatónk van. Egyébként a világ legnagyobb felhőszolgáltatójával, az Amazonnal van szerződésünk, hiszen mi vagyunk itt, Kelet-Európában az egyik legnagyobb felhasználójuk. Ebben a munkában nagy szerepe van Előd fiamnak, aki matematikusként az egész informatikai rendszert, illetve fejlesztéseket átfogja. Egyébként mind az öt gyermekem ideig-óráig itt dolgozott vagy dolgozik, a céget is közösen birtokoljuk.

A jövő már itt van

– Milyen tervek, jövőbeni megoldások körvonalazódnak?

– Most teszteljük például az arcfelismerő rendszert, ami már a mesterséges intelligencia felhasználása felé vezető út. Ez praktikusan azt jelenti, hogy beadod a nagypapa fényképét, és a rendszer megtalálja azokat a fotókat, illusztrációkat, amelyeken ő képi formában megjelent valamikor. Aztán magyar nyelvmodelleket készítünk, ami egy emeltebb szintű szövegjavítást és -felismerést tesz lehetővé. A cél, hogy a keresés intelligenciáját fokozzuk, például a képkeresésnél már most működik az, hogy egy állatfaj képével a rendszer megkeresi azokat a fotókat, amelyeken mondjuk elefánt található. Alapelv, hogy a szolgáltatásaink felhasználóközpontúak és minél változatosabbak legyenek. Azt is mondhatom, hogy egyre növekszünk, de ez egy szerves, több mint három évtizedet fel­ölelő fejlődés eredménye. Na meg a hosszú távú együttműködés a szakmai partnereinkkel. S ami a legfontosabb: az üzletfeleink a barátaink, ugyanolyan elkötelezettséggel teszik a dolgukat, mint mi. És továbbra is keressük a partnereket, az intézményeken kívül egyre több magánszemély is felajánl nekünk dokumentációt, forrásokat, gyűjteményeket, újságokat, hiszen rájöttek, hogy akkor hasznosulnak a legjobban, ha digitálisan is elérhetőek.