OCR Output

III. SZÓELEMZÉS

szóval kapcsolatban a jogszabälyok kezelik az „alkotmänyellenesseg”
kérdését, a roma szóval kapcsolatban azonban látszólag már kevésbé.
Közvetlen következtetésként ebből — az egyházak jogállásának szaba¬
lyozására vonatkozó normák ismert sorsát is figyelembe véve — min¬
denesetre levonható, hogy a cigány népesség a jogi szövegekben nem
az Alaptörvény / alkotmányosság kontextusa felől tematizálódik, ami
összhangban áll annak megfigyelésével, hogy a , hátrányos", , megkü¬
lönböztetes” kifejezesek is csak fokozatosan kerülnek be és erősödnek

a hálóban.

Az Országgyűlés jegyzőkönyveinek idősoros elemzése

A harmadik típusú elemzés kifejezetten egyes szavak időbeli megjelenésé¬
re koncentrált. Az elemzés során a 2014. év parlamenti jegyzőkönyveit
vizsgáltuk, időbeli bontásban. A jegyzőkönyvek szövegében előforduló
szavak gyakoriságáról lista készült ülésenként és összesítve is. Az így kapott,
megközelítőleg 150 000 szót tartalmazó, a szavak előfordulási gyakoriságát
ülésenkénti bontásban tartalmazó adattábla volt a forrása a későbbi elem¬
zéseknek. Az elemzendő szavak halmazának szótövezése során 50 000
szótövet és előfordulási gyakoriságot tartalmazó adattábla keletkezett.
A gyakorisági eredmények elemzésével jóval gyorsabban alkotható kép
a jegyzőkönyvek tartalmáról, mint empirikus úton való vizsgálattal.

Az elemzéshez az Állami Számvevőszék munkájával kapcsolatos kulcs¬
szavakat, valamint e kulcsszavaknak a Számvevőszék törvényben előírt
feladatok alapján kijelölt társkifejezéseit határoztuk meg. A szövegelem¬
zéssel választ kaptunk arra, hogy mennyi volt a Számvevőszékre való uta¬
lások tényleges száma, valamint arra, hogy az egyes ellenőrzési területek
meghatározásához szükséges fogalmak a parlamenti diskurzus során milyen
gyakorisággal fordultak elő, és ez a gyakoriság miként változott. Az Állami
Számvevőszék fogalmához közvetlenül tartozó szavak elemzése kvalitatív
módon, szövegkörnyezetében is megtörtént

A szavak kapcsolatrendszerét egy olyan térképen ábrázoljuk, melyen
a szavak távolsága fordítottan arányos a hasonlóságukhoz. Az elemzés
a MATLAB programmal készült.

Az elemzés alapja, hogy az országgyűlési jegyzőkönyveket úgynevezett
vektortérmodell segítségével reprezentáljuk. A modellben az x szó¬
dokumentum mátrix x4; eleme a k-adik szó relevanciáját reprezentálja az
i-edik dokumentumban, x;-ben. A X mátrixban tehát a sorok száma azonos

+ 144 +