Rokonok a gráfon

A Móricz-család

 

Nekem kell felfedezni a rokonságot?...” 

Móricz Rokonok című regényében Kardics bácsi, a helyi takarékpénztár igazgatója  szólítja meg így a helyi főügyészt, sógorát. Az író regényhez készített feljegyzései között fenn maradt egy kézirat, amelyen, még a regény megírása előtt, gonddal tervezte meg főhősének Kopjáss Istvánnak családfáját. Móricz Zsigmond leveleinek publikálása során  a Móricz-kutatócsoport számára is szükségessé vált a rokoni kapcsolatok tisztázása, így indult el side-projektként a családfakutatás.


A kiindulópont: “Kedves ángyomkisasszony!”

Móricz Zsigmond leveleinek publikálása mellett side-projektként indult el a családfakutatás. A tapasztalat azt mutatja, hogy a genealógiai kutatás elkerülhetetlen egy teljességre törekvő levelezéskiadás készítésekor, hiszen az itt említett családtagok (ángyomkisasszonyok, sírig szerető öccsök, nénék, sógorok és sógorasszonyok) azonosítása, ezáltal a családi kapcsolatrendszer kibogozása a mindennapi tevékenységünk részévé vált. A levélváltásokból feltáruló hétköznapi és magánéleti vonatkozások magától értetődő módon mutatják meg, Móricz milyen módon és milyen gyakorisággal tartott kapcsolatot családjával, valamint a tágabb rokonsággal. A sok Móricz- és Pallagi-rokon (például a Zsindely-, Vályi-, Kiséry-, Szilágyi-családok), majd az író házasságkötése után feleségének családi kapcsolatai, a Holics- és Szklenár-generációk további családokat (a Hrencsik-, Szerényi-, Galló-, Tomasovszky-, Matthaeidesz-, Pucsek-, Petrenka-, Gáll-vonalat)  kapcsoltak be a levelezésébe. A személyes kapcsolattartás szervezésére, illetve a család, majd a rokonok ügyes-bajos dolgainak intézésére irányuló levelezés résztvevői között egyező nevű családtagok is szerepeltek, például szükséges volt különbséget tennünk ifj. és legifj. Pallagi József között. Bár sokszor a levél kontextusa is segít abban, hogy felismerjük, kiről is van szó, de az ellenőrzött, strukturált adatbázis, melyben gyorsan megtalálhatjuk a szükséges információkat, nélkülözhetetlen lett.

Éppen ezért fogalmazódott meg az igény arra, hogy legyenek átlátható, követhető családfáink, melyeket bármikor előkaphatunk, ha éppen bizonytalanok vagyunk abban, hogy ki és hogyan kapcsolódik Móricz Zsigmond és Holics Janka szűk családjához. Ebből a szándékból hoztunk létre először négy önálló Word dokumentumot, amely a négy érintett ághoz tartozó családtagok személyneveit – jóesetben alapadatait is – tartalmazta. Ebben, a levelezés mellett, Móricz Miklós: Móricz Zsigmond indulása; Móricz Virág: Apám regénye, Anyám regénye; Móricz Zsigmond: Életem regénye és az eddig megjelent írói Naplók voltak segítségünkre.

A Móricz Zsigmond apai ágának tagjait megjelenítő dokumentum első körben 35 névből állt,  az anyai ági felmenőket sorjázó Pallagi családról készített dokumentum 25 nevet tartalmazott. Természetes módon, a levelezés gyakori szereplői Móricz Zsigmond feleségének, Holics Jankának a családtagjai is. Ezért szükségszerű volt Holics Janka apai valamint anyai ágának, a Szklenároknak a számbavétele. A Holics családfa kiindulópontjául szolgált egy 45 rekordból álló, szinte kizárólag keresztneveket tartalmazó dokumentum, melyet Holics László bocsátott korábban a kutatócsoport rendelkezésére; a Szklenárok első családfáját (55 név) pedig Varga Katalin, a PIM Móricz-hagyatékának revíziója során készítette.

 

Túl sok vagy túl kevés? Adatgyűjtés és forráskritika

Az eredményeinket egy közösen szerkeszthető Excel-táblázatban gyűjtöttük, melyen feltüntettük az egyes személyek azonosításához szükséges legfontosabb adatokat (név és névvariánsok, születési hely és idő, halálozási hely és idő, foglalkozás), az adatok forrását, Móricz-vonatkozásait és mindehhez kapcsolódó egyéb megjegyzéseinket. Az adatok strukturálása esetében fontosnak tartottuk figyelembe venni, milyen szoftverrel töltjük át a rekordokat a vizualizáció során, hiszen az szabja meg a szegmentálás mikéntjét. Középtávú célkitűzéseink közé tartozott, hogy az adatvizualizáció mögött közgyűjteményi névtér álljon, ezért arra törekedtünk, hogy az alapkutatás során folyamatosan gazdagított Excel-táblázatból könnyen importálhatók legyenek az adatok a PIM személynévterébe. Az információk validálása tekintetében forráskritikával éltünk, a bizonytalan vagy ellentmondásos adatok esetében a hitelesített forrásokat vettük alapul.

Gyakran használtunk külső tudástárakat, mint az OSZK digitális archívumában elérhető gyászjelentések gyűjteményét, illetve a Hungaricana platformján található digitalizált dokumentumokat, leginkább szintén gyászjelentéseket, valamint az Arcanum Digitális Tudománytárat. Nagymértékben elősegítette a családfák bővítését a FamilySearch oldalon elérhető digitalizált anyakönyvek gyűjteménye (ahol többek között Móricz Zsigmond keresztelési anyakönyvi kivonatát is megtaláltuk). Kutatásunk természetesen a PIM kézirattárában található hagyatékra, illetve a  múzeum névterére épült: a Móricz Zsigmond-hagyatékban lévő hivatalos és személyi dokumentumok, biográfiák, az író által készített családfák és nem utolsó sorban maga a levelezés fontos információkkal járultak hozzá a családok történetének tanulmányozásához, valamint az említett külső tudástárakból származó anyagok forráskritikai szempontú értékeléséhez.

Tanulságos látni, hogy Móricz számára is kiemelt fontossággal bírt saját családtörténetének felgöngyölítése. A 20. század elején jellemzően meghatározó családi származás kérdése Móricz számára írói identitása építését és ars poeticájának alakítását is megalapozta. Erről tanúskodik többek között Schöpflin Aladárnak írt 1911-es levele, valamint Életem regénye című munkája. Utóbbiban olvashatunk az ún. “két pólus” elméletről, amely a különböző hagyományokkal rendelkező Móricz- és Pallagi-ág együttes hatását jelöli: “Az egyik az apám, a Móricz Bálint öröksége volt, a másik az édesanyámé, a Pallaghy Erzsébeté. Két pólus, mondtam már nagyon régen s ebből a poláris helyzetből következtettem ki az egész házasságot szüleim között. A két pólus között szikra pattant s lettem én.” (5) Nem véletlen, hogy több alkalommal is belekezdett az eredeti anyakönyvek másolatainak beszerzésébe. A ‘20-as évektől kapcsolatban állt Prügy református lelkipásztorával, aki több, mint tíz éves kutatómunka után levélben küldte el eredményeit, aprólékos ágrajzait Móricz Zsigmond felmenőiről. 

Minden egyes családfa más és más módon érte el jelenlegi, bővített formáját. Számos hiányzó vagy pontatlan születési és halálozási hely- illetve idő-megjelölés esetében a szelektálás és a forráskritika volt a legfontosabb feladat. Móricz Zsigmond írói hagyatékában természetszerűleg a Móricz- és Pallagi-ág dokumentációja volt a legrészletesebb. Mégis előfordult, hogy a dokumentumok sokszor eltérő adatokat tartalmaztak. Pallagi Józsefnek, Móricz nagyapjának halálozási dátuma például több helyen is eltér egymástól: találkozunk 1868, 1869 és 1870-es datálásokkal is. Erre vonatkozó forrásaink nagyrészt családi feljegyzésekből, családfákból, vagyis retrospektív elbeszélésekből, valamint a Protestáns Egyházi és Iskolai Lapokban megjelent nekrológból állnak, melyeknek összevetése után nem volt kérdéses, hogy az 1869. novemberében megjelent nyomtatott forrás tartalmazza a hiteles adatot.

A Holics-családfában is több megválaszolatlan kérdés merült fel. Szerencsénkre Móricz Miklós egyik, a PIM kézirattárában őrzött jegyzetében megemlíti, hogy Holics Janka unokatestvére, Porcsalmy Zoltán, elkészítette a Holics-család genealógiáját az 1700-as évekig visszavezetve. Miután viszonylag pontosan, mégis számos kérdéses adattal sikerült kirakni a Holics-puzzle-t, úgy döntöttünk, felkutatjuk Porcsalmy Zoltán leszármazottját, aki a Holics családfa-rajz tulajdonosa. Ő bocsátotta rendelkezésünkre azt az igen részletes, lepedőnyi nagyságú rajzot, amit nagyapja még az 1940-es években készített. Így alakult ki az eddigi tudásunk szerinti legteljesebb Holics-családfa, melynek nagyobb része az adatvizualizáción is szerepel.

 

Porcsalmy Zoltán által készített Holics-családfa

 

Hasonló problémák adódtak Holics Janka anyai ági felmenőinek azonosításakor is. Móricz Virág Anyám regénye c. munkájában (1988) ugyan elvégezte ezt a feladatot, azonban adatai szignifikáns eltéréseket mutattak a hitelesnek tekinthető forrásokhoz képest. A Szklenár-családfa letisztázása során Móricz Virág Gömöri kövek c. munkájára és kisebb kapcsolódó jegyzeteire is támaszkodhattunk, melyek 2020-ban kerültek a PIM gyűjteményébe. Ez a kézirat az Anyám regénye előzményének tekinthető, azonban a publikát szöveggel szemben a Szklenár-család fennmaradt leveleinek teljes közlését adja. A fentebb már említett források mellett – paradox módon – ez az anyag is igazolta, hogy az Anyám regénye helyenként ellentmondásos adatokat, hibás névazonosításokat, esetenként egyes személyek rokonsági fokának téves meghatározását adja. Az új források feldolgozásával mindemellett újabb, a kéziratos anyag rendezésekor még ismeretlen, de feltételezhetően a családhoz tartozó személyeket is sikerült azonosítanunk, illetve – ahogy az a hasonló kutatások természetéből következik – újabb ellentmondásokba ütköztünk, melyek feloldása a kutatás további feladata lesz.

 

Mi legyen Ernével?

Kutatási tapasztalatként fontos megjegyeznünk, hogy egy-egy tulajdonnév többféle variánsát is érdemes számon tartani, hiszen eltérőek a betű szerinti, kiejtés szerinti és a hagyományőrző írásmód alakváltozatai. A rendelkezésre álló adatbázisokból előkerülhetnek olyan meglepő névváltozatokat tartalmazó dokumentumok is, mint Sigismundus Michael Holits alias Holics Zsigmond, Janka édesapjának keresztelési anyakönyvi bejegyzésében, vagy Pallagi Susánna, vagyis Zsuzsánna, Móricz nagynénjének a keresztelési anyakönyvi bejegyzésében. Névvariánsok például a Holics – Holich, Pallagi – Pallaghy, vagy a Gáll család esetében a Gál és a Gaál névformák. Néhány keresztnévre latin vagy lengyel alakjukban találtunk rá, például Holics Elekre Alexiusként, vagy Petrenka Pálra Pawelként.  

Pallagi József, Móricz nagybátyja például Erzsébet néven utal lányára, az anyakönyvi bejegyzés szerint viszont Ernének keresztelték. Mivel rokon nevekről van szó, a család körében használt Erzsébet csak névvariáns lehet és nem másik családtagról van szó. Ugyanígy Pallagi László felesége és lánya is különböző neveken szerepelnek a családi feljegyzésekben. Mindkét esetben Emma vagy Emília névvariánssal találkozunk, és mivel csak családi feljegyzésekre hagyatkozhatunk, saját megítélésünk szerint a relevánsabb forrást fogadtuk el.

Számos útvesztő, magukra maradt keresztnevek vagy tulajdonnevek, névegyezések, különböző házasságokból származó gyerekek nehezen nyomon követhető családi kapcsolatai után beszéljenek a számok arról, hová jutottunk. Móricz Zsigmond apai ágán a Móricz-család ismert tagjainak száma 35-ről 62 főre, az anyai, a Pallagi-ág 25-ről 90-re gyarapodott. Holics Janka apai felmenői közül a kiindulópontul szolgáló 45-höz képest 142 személyt sikerült beazonosítani, a Szklenár-rokonság ismert tagjainak a száma pedig 55 főről 101-re nőtt. 

Határt kellett szabnunk a kutatásnak, mivel míg bizonyos esetben már-már nehezen kezelhető adatmennyiséget sikerült feltárnunk. Máskor a rendelkezésre álló források korlátoztak bennünket abban, hány nemzedéket tudunk számontartani. Ezért úgy döntöttünk, hogy az egyesített családfa összesen öt generációt fog prezentálni, melyből Móricz Zsigmond és Holics Janka dédszülei határolják a legtávolabbit, gyermekeik pedig az utolsó generációt, melyet ábrázolunk. Minden esetben feltüntettük az oldalági rokoni kapcsolatokat is, mivel a családtörténetekben betöltött szerepük, illetve a levelezés kapcsolathálózatának feltérképezése szempontjából is indokoltnak tűnt. 
 

Személyek, számok, szoftverek

A családi hálózat elkészítéséhez olyan adatvizualizációs eszközt kerestünk, amelybe a nagy méretű adatkészletet hatékonyan integrálhatjuk, valamint egyszerű, átlátható, és esztétikailag igényes vizualizációt készíthetünk. 

Elsőként kimondottan családfakészítő programokat teszteltünk. A MyHeritage és a Gramps szoftverek genealógiai kutatásokhoz készültek, felületükön a felvitt személyekhez fűződő adatok szegmentáltan, jegyzetekkel és képekkel kiegészítve jeleníthetők meg. Adatbázisunk nem volt automatikusan importálható ezekbe a programokba, 409 személy adatainak kézi felvitele viszont túl időigényes és nem is ésszerű feladat lett volna, ha figyelembe vesszük a hibázási lehetőségeket. A Gramps-be és MyHeritage-be felvitt adatok és automatikusan generált családfarajzok csak a genealógiai szoftver segítségével olvasható szövegfájlokba (gedcom-ba, illetve pdf, jpg, png formátumba) exportálhatók. Ezek a kimenetek leszűkítik a publikálási lehetőségeket és csak címkés vizuális megjelenítést tesznek lehetővé, ami Móricz kiterjedt családi hálózatának esetében korlátozza az átláthatóságot, az eligazodást, és a felhasználói aktivitást.

 

Családfa a My Heritage oldalon

Pallagi-családfa a MyHeritage szoftverrel

 

Családfa a Gramps szoftverben

Szklenár-családfa a Gramps szoftverrel

 

A felsorolt hiányosságok miatt felmerült az ismertebb Thinglink és a Prezi programok kínálta lehetőségek felhasználása is. A Thinglink alkalmasságát két adatvizualizáció is alátámasztja a Móricz-műhely honlapján és a dHUpla felületén: virtuális kalendárium és séta. Az alkalmazás, hasonlóan az említettekhez, előzetesen feltöltött háttérképén mutatja meg a családi hálózatot, ami az erre helyezett ikonok mögé beágyazott szövegek, hangok, videók, fotók segítségével tehető interaktívvá. A hálózat teljes átláthatósága azonban itt sem valósulna meg, mert a családi ágakat csak külön részletekben lehetne megjeleníteni. Kisebb családfa esetén azonban a Thinglink is kreatív megoldás volna, az elkészült anyag pedig online könnyen közzétehető, vagy beágyazható egy honlapra. A másik lehetőségként felmerült Prezi előnye az interaktivitás és az esztétikus megjelenítés mellett, hogy a zoomolás által jobban lehet strukturálni az adatokat, de hátránya, hogy a sok személynév és adat miatt végtelen számú diára lenne szükség, ami nehezíti az eligazodást.

 

Családfa a Preziben

 

Ezután elkezdtünk felderíteni a gráf-típusú adatvizualizációs szoftverek lehetőségeit. Két programot teszteltünk, a Tableau-t  és a Gephit. Mindkét szoftver asztali alkalmazáson szerkeszthető, jelentős előnyük, hogy txt- vagy excel-formátumú adatbázisokat is tudnak importálni. Nemcsak az adatok integrálását, hanem a teljes családi hálózat megjelenítését és átláthatóságát is biztosítják, mivel ezek a szoftverek esztétikailag igényes, látványos gráfokon jelenítenek meg kiterjedt, komplex adathálózatokat. A Tableau szoftver használatát végül elvetettük, mivel a Gephi hasonló eszköztárral rendelkezik, és nincs korlátozva az elkészült gráf közzététele sem.

 

Családfa a Tableau szoftverben

 

Családfa a Gephi szoftverben

 

Családfa a négyzeten

Egyesített családfánk képi megjelenítéséhez végül olyan szoftvert találtunk, ami alapvetően nem családfa-vizualizációra készült, ezért rögtön olyan megoldandó problémákkal találtuk szembe magunkat, mint a személyes adatok megjelenítése, a családi kapcsolatok és generációk megkülönböztetése. Ballabás Dániel programozótörténész.hu blogbejegyzése a Gephibe importált adatbázis kialakításáról segített az adatkészletünk formázásában. Ennek alapján két táblázatot készítettünk a csomópontokról és a kapcsolatokról.

 

Nodes-táblázat

 

A csomópontok adatait (nodes) tartalmazó táblán minden személynévnek (Label) egyéni azonosítót (ID) adtunk. A megjelenített komplex családfán látható gráfcsomópontokon személynevek vannak feltüntetve, ahová az ellenőrzött születési és halálozási évszámokat is beírtuk, így azonosítva a tulajdonneveket, illetve megkülönböztetve az azonos nevű családtagokat. Ez a tábla további adatokkal bővíthető, így a kutatócsoport úgy döntött, hogy a hónapra, napra pontos születési, halálozási dátumot és helymegjelölést, illetve a családi hovatartozást tünteti fel. A másik tábla a csomópontok közötti kapcsolat adatait tartalmazza.

 

Edges-táblázat

 

Minden kapcsolat két csomópont között jön létre, melyből az első személynév ID kerül a forrás (Source), a második pedig a cél (Target) mezőbe. A hálózat irányított (directed) vagyis a két ID-sorrendjét a kapcsolat típusa szerint vettük fel: szülő → gyerek, házastárs1 → házastárs2, házastárs2 → házastárs1. A Label mezőben a rokonsági relációt tüntettük fel,  amit a Weight mezőben súlyoztunk, vagyis a két csomópontot összekötő él vastagságát állítottuk be. A testvéri, unokatestvéri és egyéb relációkat azért nem jelenítettük meg, mert a túl sűrű kapcsolatrendszer megnehezítette volna az eligazodást a hálózatban. Ugyanígy jártunk el a négy családi ág esetében, melyeket különböző színekkel jelöltünk, azonban lemondtunk a generációk vizuális elkülönítésétől. A színeket a legegyszerűbben úgy tudtuk kiosztani, hogy minden egyes családtagnál a Nodes tábla egy külön oszlopában meghatároztuk, hogy melyik ághoz tartozik: Móricz, Holics, Pallagi, Szklenár, illetve Móricz Zsigmond családja. 

Ezután meg kellett találnunk azt az elrendezési formát (Layout), amely egyszerre esztétikus és informatív is. Több kísérlet után végül a Fruchterman Reingold elnevezésű programra  esett a választásunk. Ez az algoritmus úgy állítja be az adott gráfot, hogy abban a csúcsok ne fedjék egymást, az élek pedig nagyjából azonos hosszúságúak legyenek (ez nem mindig adott a program szerint), ezáltal pedig “harmonikus egyensúlyi” állapotba hozza az egész gráfot. A mi esetünkben ez kör alakú elrendezésben mutatkozik meg. Így készült el a teljes családfa modellje. Most már csak arra kellett rájönnünk, hogyan tudunk mindebből interaktív, online megjeleníthető vizualizációt létrehozni.

 

A gráf életre keltése 

Mivel a családfa 409 nevet tartalmaz, egyértelmű volt számunkra, hogy egy zoomolható, tehát egészében és részleteiben egyaránt vizsgálható és bejárható megjelenítést kellett választanunk. Ez a terület, vagyis az adatvizualizáció dinamikussá tétele szintén ismeretlen volt számunkra, ezért megint megoldást kerestünk az interneten.

A Gephihez szabadon letölthető egy plugin, amelyet az Oxford Internet Institute munkatársai fejlesztettek 2012-ben: a sigma.js. Használatához egy data science-szel foglalkozó blogon találtunk útmutatót. A bővítmény arra szolgál, hogy a Gephiben megrajzolt gráfot minden paraméterével és az általa tartalmazott adathalmazzal együtt egy különböző fájlokat (pl. json, html, css, Java Script) és almappákat tartalmazó “network” nevű mappába exportáljuk a saját gépünkre. Ezzel lehetővé válik a böngészős megjelenítés akár egy GitHub oldalon keresztül, akár egy html oldalra beágyazva.  

Először az exportált mappát változtatások nélkül betöltöttük egy GitHub repozitóriumba, majd ebből létrehoztunk egy oldalt, ahol a teljes hálózat megjelenik.

 

 

Láthatjuk az összes node-ot és a közöttük húzódó kapcsolati szálakat a Gephiben beállított színekkel együtt. Ezen kívül a bal oldalon található egy információs panel, amelyen belül a kereső is elhelyezkedik. A nevek akkor jelennek csak meg a családfán, ha ráközelítünk, illetve ha az egyes csomópontokra visszük az egeret.

 

 

Egy névre kattintva pedig a gráf leszűkül az adott személy közvetlen kapcsolataira, a családtagokra. A jobb oldalon a névhez tartozó adatlap is felugrik, ahol megjelennek a releváns születési és halálozási információk, amelyeket korábban a Gephibe feltöltött Node táblázat, az export után pedig a data.json nevű fájl tartalmaz. Az adatlap Connections része listaszerűen felsorolja az összes hozzá kapcsolódó családtagot.

A vizuális és tartalmi elemek mind módosíthatóak is az egyes fájlokban. Ezért elkezdtük felfedezni a külböző funkciókat és lehetőségeket. A dizájn változtatásán kívül (pl. háttérszín cseréje, élek ívének és vastagságának módosítása), minden feliratot lefordítottunk magyarra. Majd a személyi adatlapokon a családi kapcsolatokat tovább strukturáltuk, így már nem csak egy ömlesztett listát látunk, hanem az oldal a kapcsolat iránya szerint (incoming, outgoing, mutual) elkülönítve listázza ki az adott személy szüleit, gyermekeit, illetve házastársait. Ezeken kívül még egy új funkciót is hozzáadtunk az oldalhoz: az egyes családok külön-külön is megjeleníthetőek lettek a bal oldali panel legördülő menüjén keresztül. 

 

 

Az adatvizualizáció első publikálásakor még nem egy lezárult projekt eredményeit tesszük közzé,  hanem a továbbfejlesztés szándékával, azzal az elhatározással, hogy a  levelezéskiadás műhelymunkálatai során  szerzett újabb kutatási eredményekkel és esettanulmányokkal tesszük teljesebbé.

Az interaktív családfa megtekinthető a Digitális Bölcsészeti Platformon.

Az adatvizualizációt készítették: Makkai T. Csilla, Török Sándor Mátyás, Varga Emese, Vétek Bence.

 

 
Cséva Anna, Makkai T. Csilla, Török Sándor Mátyás, Varga Emese, Vétek Bence