A koronavírus-járvány még inkább a digitalizáció fontosságára irányította a figyelmet, de van olyan cég, amely már több mint harminc éve foglalkozik digitális, illetve elektronikus archívum kialakításával és közzétételével. Igaz, a különböző korokban alkalmazott technológiák különböző megoldásokat kínáltak. Rovatunkban rendhagyó módon egy Magyarországon bejegyzett vállalkozást, illetve annak vezetőjét mutatjuk be. Szolgáltatásaik köre azonban, na meg az általuk kínált tartalom az egész Kárpát-medence, sőt, az egész világ magyarságát szolgálja. S amint megtudtuk, nem csupán a magyarságét.
Biszak Sándor, az Arcanum cég alapítója és vezetője két évvel ezelőtt keresett meg, hogy felajánlja: az archívumunkban lévő Háromszék- és Megyei Tükör-kollekciókat digitalizálja. Több egyeztetés után a csapat a cégvezetővel az élen meg is érkezett Budapestről, s az óriás szkennerekkel berendezkedtek a megyei tanács vendégházában. Egy hétig tartott, amíg a jobbára elsárgult újságlapokat az elektronikus tárhelyek memóriájába rögzítették, s még néhány hónap, amíg az adatbázis évjáratok és kulcsszavak segítségével elérhető lett az ADT-Arcanum rendszerében több magyar újság, folyóirat, szaklap, periodika, lexikon stb. társaságában.
A mintegy 28 millió oldalt tartalmazó, több intézmény adatbázisát elérhetővé tevő digitális szolgáltatásokról az alapítót és máig mindenest, a bukovinai székely gyökerekkel rendelkező Biszak Sándort kérdeztük.
A kezdetek
– Mikor és hogyan indult az adatbázisok kiépítése?
– A szabadalmi hivatallal közösen ’89-ben kezdtük a munkát, és akkor még a CD-ROM elterjesztése volt a cél. Aztán a technológiát felhasználtuk bibliakiadásra, verstárat készítettünk ötven magyar költő verseivel, illetve a klasszikus irodalom megannyi remekműve jelent meg, és volt is rá szépen kereslet. Úgy 2000-ig, amikor ez a technológia kifutotta magát.
– De honnan származik az ötlet?
– Vegyészként végeztem még a nyolcvanas évek elején, egy ideig a Richter Gedeon gyógyszergyárban dolgoztam, ott akkor már fantasztikus dolgokat lehetett csinálni, hogy úgy mondjam, interneten kértem le az adatokat Kaliforniából, hatalmas adatbázisok voltak, s a magyar szabadalmak is ott voltak rögzítve, itthon viszont nem. Később egy szövetkezetben már egyfajta vállalkozásként flopilemezre kezdtünk adatbázist csinálni, s erre figyelt fel a szabadalmi hivatal. Így lettem vegyészből könyvtár-informatikus.
– Visszatérve a 2000-es évekre, akkor már megjelentek a nagy világcégek valamilyen formában elérhető adatbázisai...
– Igen, tulajdonképpen a Google Books megjelenése forradalmasította ezt a szakmát, hiszen már nem arról szólt a dolog, hogy egy-két könyvet kell legépelni, korrektúrázni, kereshetővé tenni, hanem tömegesen kell mindent csinálni. Mi érdekes módon nem a könyvek irányába indultunk el – ez utólag nagyon jó döntésnek bizonyult –, kezdetben a tudományos folyóiratokat kezdtük adatbázisba venni, mert akkor még úgy tűnt, hogy nem lehetséges a nagy terjedelmű napilapokat digitalizálni. A fejlődés aztán hozta magával, hogy egyre nagyobb adatbázisokat tudtunk kiépíteni, s az is kiderült, hogy a napilapok egyre több embernek jelentenek forrásanyagot, hiszen mindenkinek a barátjáról, az ellenségéről vagy éppen a családtagjáról írtak már napilapban, vagyis egy rendkívül személyes műfajt tudtunk elérhetővé tenni. Amikor már volt 15 millió oldalnyi adatbázisunk, úgy két-három évvel ezelőtt, akkor értük el azt a kritikus tömeget, ami nagyon népszerűvé tette az adatbázist. A keresési funkciókkal együtt, azt lehet mondani, hogy nélkülözhetetlen lett mindenféle helytörténeti, család- vagy művelődéstörténeti, de bármilyen jellegű kutatáshoz.
Milliós nagyságrend
– Holt tartanak most az adatbázis számai?
– Huszonnyolcmillió oldalunk van, ez persze egy nagyon szép szám, ugyanakkor csalóka, mert nem veszi figyelembe az oldalak méretét, így sok milliárd szóról, mondatról beszélhetünk a tudományos lapoktól a nagy méretű napilapokig. Földrajzilag ez Magyarországon kívül az egész Kárpát-medencében, de bárhol a világon magyarul megjelent lapokat jelent. Igyekszünk az egész világon felkutatni és digitálisan hozzáférhetővé tenni a magyar lapokat, tartalmakat. És nem csupán a magyar nyelven megjelent lapokról van szó, hiszen – főleg a tudományos folyóiratok tekintetében – több idegen nyelvűt is rögzítettünk. Azt gondoljuk, hogy az anyaggyűjtés kétharmadán túl vagyunk, a fellelhető anyag mintegy harmada van még hátra, de egyre nehezebb hozzájutni.
Motivációk
– Hatalmas anyagról van szó. Mi kell ahhoz, hogy magánvállalkozásként ezt meg lehessen valósítani, hiszen több állami intézmény, könyvtár még saját állományát sem tudta digitalizálni? Hogyan lehet ezt finanszírozni?
– Elsősorban nagyfokú elkötelezettség kell, hiszen mániákusan érdekel a dolog, néha talán túlzottan is rámenős vagyok. Aztán rendkívül fontos a szakértelem, nemcsak az adatbázisok kiépítésének a tudománya, hanem a realitásérzék. Na meg óvatos vállalkozók vagyunk, csak azt csináljuk, amire lehetőségünk van, ütemesen haladunk. Tulajdonképpen az előfizetésekből – magán- és intézményes előfizetésekből – tudjuk finanszírozni a munkát, a fejlesztéseket. Például 2016 óta a teljes magyar felsőoktatási, kutatói és közgyűjteményszférát egy közös előfizetés keretében szolgáljuk ki.
– Milyen szolgáltatások érhetőek el most?
– Van az ADT, vagyis a lapok és folyóiratok adattára, van a Hungaricana, vagyis festmények, oklevelek, folklórgyűjtemény (több mint húszezer óra hanganyag), ez utóbbi a Nemzeti Kulturális Alap és az állam finanszírozásában készült, van a térkép datbázisunk, a MAPIRE, vagyis az a lehetőség, hogy mondjuk egy város térképét online különböző korokban meg lehessen nézni, egymásra tenni, és elindult a Szaktárs szolgáltatásunk, ahol 15 kiadó összes könyvét szolgáltatjuk, egyelőre csak intézmények részére. Maga a keresési szolgáltatások rendszere, nyugodtan mondhatom, világszínvonalú, gyors, kényelmes és látványos, a szolgáltatás egy pillanatra sem állhat le, még akkor sem, ha napi százezer látogatónk van. Egyébként a világ legnagyobb felhőszolgáltatójával, az Amazonnal van szerződésünk, hiszen mi vagyunk itt, Kelet-Európában az egyik legnagyobb felhasználójuk. Ebben a munkában nagy szerepe van Előd fiamnak, aki matematikusként az egész informatikai rendszert, illetve fejlesztéseket átfogja. Egyébként mind az öt gyermekem ideig-óráig itt dolgozott vagy dolgozik, a céget is közösen birtokoljuk.
A jövő már itt van
– Milyen tervek, jövőbeni megoldások körvonalazódnak?
– Most teszteljük például az arcfelismerő rendszert, ami már a mesterséges intelligencia felhasználása felé vezető út. Ez praktikusan azt jelenti, hogy beadod a nagypapa fényképét, és a rendszer megtalálja azokat a fotókat, illusztrációkat, amelyeken ő képi formában megjelent valamikor. Aztán magyar nyelvmodelleket készítünk, ami egy emeltebb szintű szövegjavítást és -felismerést tesz lehetővé. A cél, hogy a keresés intelligenciáját fokozzuk, például a képkeresésnél már most működik az, hogy egy állatfaj képével a rendszer megkeresi azokat a fotókat, amelyeken mondjuk elefánt található. Alapelv, hogy a szolgáltatásaink felhasználóközpontúak és minél változatosabbak legyenek. Azt is mondhatom, hogy egyre növekszünk, de ez egy szerves, több mint három évtizedet felölelő fejlődés eredménye. Na meg a hosszú távú együttműködés a szakmai partnereinkkel. S ami a legfontosabb: az üzletfeleink a barátaink, ugyanolyan elkötelezettséggel teszik a dolgukat, mint mi. És továbbra is keressük a partnereket, az intézményeken kívül egyre több magánszemély is felajánl nekünk dokumentációt, forrásokat, gyűjteményeket, újságokat, hiszen rájöttek, hogy akkor hasznosulnak a legjobban, ha digitálisan is elérhetőek.