OCR Output

III. SZÓELEMZÉS

központi témáinak. A szótövek sorrendje és egyes szótövek egymáshoz
való közelsége alapján gyakran további következtetéseket is levonnak
a dokumentum jelentésével kapcsolatban.

- Az ontológiai megközelítés az elemzendő strukturálatlan szöveget vala¬
milyen jól strukturált, lehetőleg , szakmailag elismert" szakontológiával
(pl. üzleti ontológia) veti össze. A szakontológia fogalmai , szűrőként" vi¬
selkednek, az ezen fennakadt tartalomra és jelentésre vonatkozóan."

Munkánkban egyszerre alkalmaztuk a tematikus megközelítést és a szak¬
ontológia kialakításának módszerét. Első lépésben az etika területén mérv¬
adó irodalom segítségével összeállítottunk egy „etika-ontolögiät”, majd az
ide tartozó szavaknak az előfordulását vizsgáltuk a szövegekben. Munkánk
során nem egyszerűen csak a szógyakoriságot, hanem a szavak együttes
előfordulását, illetve a szöveg kulcsszavait is figyelembe vettük.

A SZÓELEMZÉS ELŐZMÉNYEINEK MÓDSZERTANI LEÍRÁSA

A kutatást megelőzte több, a szövegelemzés módszerét felhasználó vizs¬
gálat. Mivel ezek módszertana a jelen kutatásban is felhasználásra került,
felvázoljuk a módszereket és az eredményeket.

Szövegek központi tartalmának elemzése (kerügma)

Feltételeztük, hogy minden szövegnek van olyan egyszerű, központi tar¬
talma, amelyet a későbbiekben a szöveget olvasók tartalomként megérte¬
nek és továbbadnak. Tipikusan ilyen, , továbbadott" szöveg az Evangéli¬
umok szövege. Kísérletképp Márk evangéliumának angol fordítását
elemeztük. (Az elemzés alapja, az angol fordítás, szándékoltan olyan hét¬
köznapi szöveg volt, amely sok emberhez eljuthat.)

A Snowball algoritmust alkalmazó szótövező programmal megkerestük
a leggyakrabban előforduló szavakat, illetve az egy mondatban leggyakrab¬
ban előforduló szópárokat. A leggyakoribb szópárok táblázatát korrigáltuk
a szövegben leggyakrabban előforduló szavak táblájával, majd az Ucinet elne¬
vezésű kapcsolati hálót rajzoló programmal vizualizáltuk az eredményt.
A kutatók számára is meglepő módon az eredményt mutató ábra nagyon jól

28 Számítógépes szövegelemzés: Krauth Péter.

+ 140 +