Szöveglabor

A Szöveglaborban történik egyrészt a dHUpla többi alterületéről (forráskiadás, kritikai kiadás, born digital) érkező szövegek, másrészt a kívülről feltöltött szövegek nyelvi, stilometriai és szövegbányászati elemzése. A Szöveglabor funkcióit két nagy részre oszthatjuk.

Az elsőbe tartoznak a stilometriai és szövegbányászati funkciók, amelyek bemenete sima szöveg, kimenete pedig szövegen kívüli információk halmaza (számok, listák, elemzések, vizualizációk). A számítógépes stilometria alapját az képezi, hogy a szövegek különféle változókkal rendelkeznek, amelyek közül néhány mérhető. A Szöveglaborban a mérhető változókat megmérjük minden egyes szövegre nézve, majd az eredményeket összehasonlítjuk. Ebből az összehasonlításból kaphatunk képet az egyes szövegek stílusáról. A funkciók a felhasználó által hozott és feltöltött anyagokon, valamint a dHUplán belüli tartalmakon is használhatók, s emellett az alapvető keresési funkciók is elérhetőek.

A második rész egy korpuszlekérdező, aminek a bemenetét a dHUpla többi alterületéről érkező elemzett szövegek alkotják, a kimenete pedig egy nyelvi annotációval ellátott, de az eredeti annotációt is megőrző TEI XML, amin klasszikus korpuszlekérdezési kéréseket futtathatunk.

A felsorolt elemzési és keresési funkciók mellett a felhasználóbarát felület lehetőséget ad a különféle kutatási igényeket kielégítő paraméter-beállításokra, valamint az eredmények megjelenítésére és letöltésére is.

A Szöveglabor úttörő jelentőségű, hiszen jelenleg nem létezik ehhez hasonló funkcionalitást megvalósító, szabadon felhasználható, magyar nyelvre adaptált eszközkészlet.