Kiss József levelezésének digitalizálása – Munkaterv

Munkaterv

 1. Távlati tervek

  1. 1.0 Betűhív átirat

  2. 2.0 Forráskiadás

  3. 3.0  Tudományos kiadás

 2. Kiss József-levelezés 1.0

 3. Kiss József-levelezés 2.0

 4. Kiss József-levelezés 3.0

 5. Egyéb tervek

Távlati tervek

 

Kiss József teljes levelezését több intézmény őrzi. Első lépésként csak a PIM-ben található anyagot digitalizáljuk, ezután érdemes kooperálni a többi intézményel.

A PIM-ben őrzött levelezést lépcsőzetesen fogjuk feldolgozni, hogy a nagyközönség számára minél előbb elérhetővé váljon, s minden lépcsőfok más-más szinten nyújt hozzáférést, segítséget a levelek olvasásához, kutatásához.

1.0 Betűhív átirat

A beszkennelt leveleket kétrétegű PDF formátumban közöljük, azaz látható lesz a digitalizált kézirat (facsimile), és mögötte áll a kereshető szövegréteg.

A metaadatok rögzítése a Huntékában történik.

2.0 Forráskiadás

A leveleket TEI-formátumban kódoljuk, böngészőben megjelenítjük.

Külön olvasható lesz az átírt szöveg is, jelölésekkel, textológiai jegyzetekkel ellátva. A cél forráskiadás szintű feldolgozás.

Ezen a szinten lehetővé válnak nem csak a szabadszavas, hanem egyéb keresési lehetőségek.

A metaadatok a TEIHeader-ben lesznek tárolva.

3.0 Tudományos kiadás

A levelek szövegében jelöljük a személyneveket, földrajzi neveket és egyéb a feldolgozás során fontosnak ítélt kategóriákat (pl. műcím), amelyeket egyéni azonosítókkal, hivatkozásokkal látunk el, hogy az olvasó közvetlen információkat szerezhessen róluk.

A szükséges helyeken tárgyi magyarázatokat, az értelmezéshez szükséges jegyzeteket adunk.

Kiss József-levelezés 1.0

A levelezést két részletben dolgozzuk fel:

 1. Kiss József által írt levelek időrendben

 2. Kiss Józsefnek írt levelek időrendben

Munkafolyamat:

 1. Verziókövető rendszer felállítása: A teljes anyagot a szkenneléstől a publikálásig egy helyen kell tartani, hogy mindig egyben hozzáférhető és kinyerhető legyen. A verziókövetéssel követni tudjuk az egyes munkafolyamatok és szintek során bekövetkezett változásokat, a hibák könnyebben javíthatóak lesznek.

 2. Adminisztrációs felület kialakítása: A munkafolyamat egyes lépéseit, az ezzel kapcsolatos kérdéseket, feladatokat stb. a Trello ezen projektre létrehozott felületén dokumentáljuk.

 3. Szkennelés: A szkennelés-mentések helyét, módját, mappastruktúrát, fájlelnevezési konvenciót lásd a csatolmányok alatt.

 4. Metaadatok felvitele: Huntékába a megszokott módon.

 5. Átírási szabályok lefektetése: A cél betűhív átirat létrehozása. Ennek megfelelően, az anyag speciális jellemzőit figyelembe véve meghatározzuk az átírási szabályokat (pl. törlések jelölése, emendálás stb.) - lásd a csatolmányok alatt.

 6. Szöveg szegmentálása, átírása: A levelek átírását vagy gépeléssel, vagy szövegfelismertetéssel lehet megoldani. A kézírás felismertetése nem evidens feladat, mindig az adott anyagtól függ, hogy érdemes-e szoftvert használni, vagy gyorsabb megoldás a gépelés. (Jelenleg folyik a nyelvi modell építése, amellyel a tervek szerint automatikusan felismertethető lesz a kézírások nagy része.)

  1. A beszkennelt képeket feltöltjük a Transkribus-ra, a projektnek létrehozott gyűjteménybe.

  2. Ezután kezdődhet a szegmentálás és az átírás. Transkribus-ban folyó munka leírását lásd  a csatolmányok alatt.

 7. Korrektúra: A szöveg átírása után korrektúrázni kell, hogy az adott elütéseket, félreolvasásokat javíthassuk. Ez a munka szintén a Transkribus-ban történik.

 8. Ellenőrzés (filológiai+technikai): Szintén a Transkribus-ban történik.

 9. Exportálás: A Transkribus lehetővé teszi a létrehozott szöveg kétrétegű PDF-ben, illetve TEI XML-ben való exportálását is, ami megoldja az 1.0 és a 2.0 közötti átjárhatóságot. A létrehozott PDF és TEI fájl elnevezése azonos lesz a szkennelt kép(ek) mappájának nevével. A betűhív átirat elkészültével létrejön egyrészt egy kétrétegű kereshető PDF, másrészt egy nyers TEI fájl, ami a 2.0-s munka kiindulópontja lesz.

 10. Publikálás: Kétrétegű PDF-formátumban publikálhatóvá válik a levél. A közzététel az Opac-on fog történni.

Kiss József-levelezés 2.0

A levelezést két részletben dolgozzuk fel:

 1. Kiss József által írt levelek időrendben

 2. Kiss Józsefnek írt levelek időrendben

Munkafolyamat:

 1. Szabályok lefektetése: Meghatározzuk a kódoláshoz szükséges TEI-elemkészletet, a textológiai, filológiai  jegyzetek mélységét és mikéntjét. Ezeket lásd lásd a Kiss József-levelezés átírási szabályok c. mellékletben a csatolmányok alatt.

 2. Az átírt levelek kódolása TEI XML-ben: A levelek kódolása Oxygen-ben történik (a megfelelő Oxygen-framework használatával).

 3. Metaadatok, header kialakítása TEI XML-ben

 4. Ellenőrzés: A kódolt szöveg ellenőrzése Oxygen-ben, a projektre kialakított framework-ben történik. Validálunk egy megegyezés szerinti általános TEI-sémával (dtd, rng stb.), illetve  Schematron-szabályokkal, ami nagyban felgyorsítja a javítást.

 5. Szakértői munka: A kiadás lektorálása külső szakértő bevonásával történik.

 6. Megjelenítés, publikálás: A dHUpla felületén.

 7. Keresési lehetőségek kialakítása: Facettált keresés.

Kiss József-levelezés 3.0

Ezen a szinten nem érdemes levélíró szerint két csoportba osztani az anyagot, mivel a személynevek, utalások felderítéséhez inkább az időrendben való haladás nyújt segítséget.

Munkafolyamat:

 1. Személynevek, földrajzi nevek, intézménynevek felderítése szoftveres segítséggel (ezek ellátása egyedi azonosítókkal, normalizált nevekkel, megfelelő hivatkozásokkal)

 1. Egyéb kategóriák jelölése (pl. műcím, dátum)

 1. Tárgyi jegyzetek készítése

1–3.: A munka külső szakértők bevonásával történik, hogy háttértudásukkal segítsék a minőségi szöveg létrejöttét.

 1. Megjelenítés

Egyéb tervek

Csatlakozás a CorrespSearch-projekthez

Olvasóbarát változat

Idegennyelvű leveleknél fordítás készítése