OCR
2. A LEXIKOLÓGIA ALAPFOGALMAI fajfogalmakat, mégis, a különböző megnevezésekhez tartozó értelmezések lényegében azonosak. Félkövérrel emelem ki a legáltalánosabban elterjedt megnevezést. (1) A szövegszó (Papp 2006/1974), szóelőfordulás (Zsemlyei 2002), a számíitógépes nyelvészetben token (Antal 1959): ,egy szövegben akár többször is előforduló bármely szó; vö. szövegszó" (,példány") (Szirmai 2005: 172). (2) A szóalak , a szótári szók valamennyi lehetséges szóelőfordulásának, vagyis minden toldalékos (jeles, ragos) és toldalék nélküli formájának egyike" (Zsemlyei 2002: 5, Papp 2006/1974), a számítógépes nyelvészetben type: , a szövegben előforduló különböző írásképű szó (pl. bot, botot, botja)" (Szirmai 2005: 173). (3) A szótári szó (Zsemlyei 2002), lexéma (Papp 2006/1974), a mai számítógépes nyelvészetben és a lexikográfiában lemma vagy címszó pedig a különböző szóalakok egy együvé tartozó csoportjának képviselője, ,az azonos szótőből származó összes (általában azonos szófajú) szóalakot átfogó kategória" (Szirmai 2005: 170), pl. bot. Nézzünk egy egyszerű példát a szó fajfogalmainak megkülönböztetésére: A katonák a tábornokot várják, hogy megtámadják végre a várat. 1. Ez a mondat 10 szövegszóból áll: a, katonák, a, tábornokot, várják, hogy, megtámadják, végre, a, várat. 2. 8 szóalakot tudunk elkülöníteni: a, katonák, tábornokot, várják, hogy, megtámadják, végre, várat. 3. 8 szótári szóból áll a mondat (a vár két alakja homonima): a, katona, tábornok, vár", hogy, megtámad, végre, vár? 4. Ezeket betűrendbe rendezve a következő listát kapjuk: a, hogy, katona, megtámad, tábornok, vár", vár", végre. A szóalakok szótári szóvá alakításának folyamatát hívják a nyelvészeti szakirodalomban lemmatizálásnak. + 24e