Forráskiadás

A dHupla felületén közzétett digitális forráskiadások a magyar kulturális örökség különböző intézményekben őrzött, eddig ismeretlen vagy méltatlanul elfeledett szöveges tartalmú forrásait tárja a a kutatók, olvasók elé egy központi helyről.
Mindezt filológiai, módszertani igényességgel teszi, amelynek biztosításához szakmai ajánlásokat, útmutatókat, szabványokat, oktatási anyagokat tesz közzé a különböző műhelyek számára. Folyamatos szakmai támogatás és szerkesztőségi keretrendszert is kínál a tartalmak digitalizálásához, a források egységes és színvonalas feldolgozásáért.
 
A dHupla publikációs felületen egyszerre  vizsgálható az átírt szöveg és az eredeti facsimile. A kéziratok nagy felbontású digitális másolatai oly mértékben nagyíthatók, hogy a kutatók, filológusok számos esetben választ kapnak amúgy megoldhatatlan problémákra. A szöveg és kép összhangban működik: a felhasználó a szövegeket olvasva, azokban keresve egyszerre láthatja a szövegen belüli pozícióját mind az átírásban, mind a facsimilén.
 
A kéziratok átírása során olyan kézírásfelismerő-modell épül, amely folyamatosan bővülve alkalmassá válik a magyar nyelvű kézírások automatikus felismertetésére, azaz mesterséges intelligencián alapuló gépi feldolgozására (Handwritten Text Recognition).
 
Az átírt szövegek a nemzetközileg támogatott TEI (Text Encoding Initiative) szabvány szerint annotált XML formátumban készülnek, amely a nemzetközi integráció mellett lehetővé teszi többek között a dokumentumok gépi feldolgozását és értelmezését (Linked Open Data),  szemantikus hálók kiépítését (Semantic Web), adatgazdagítást (Data Enrichment), illetve a távoli olvasás (Distant Reading) különböző aspektusait. A szolgáltatás kapcsolatot létesít a PIM Névtérrel, a Nemzeti Névtérrel, illetve a Nyelvtudományi Intézet nyelvi elemző szoftvereivel. Mindezek segítségével a legkülönbözőbb korpuszlekérdezések, adatvizualizációk válnak megvalósíthatóvá.