Magyar szókincs
A Wikipédiából, a szabad lexikonból.
[szerkesztés] A magyar szókincs eredete
A legelfogadottabb elmélet szerint szókincsünk jó része finnugor (azaz ősi magyar) eredetű, ezt a legjobban a magyar szóbokrokat bemutató Czuczor-Fogarasi féle szótár igazolja. A mai magyar szövegekben előforduló szavaknak a tudomány mai állása szerint 80-90%-a finnugor szavakra vezethető vissza. (Ennek kritikáiról az Alternatív elméletek a magyar nyelv rokonságáról cikkben olvashatóak további részletek.) A magyar nyelv emellett már az ősmagyarban korban magába olvasztott iráni (alán, perzsa stb.) és török szavakat. (Ez utóbbiakról egyesek úgy tartják, hogy nem egyszerűen nyelvi kölcsönzés eredményei, a türk-magyar nyelvrokonság elmélete szerint ugyanis a magyar a török nyelvekkel áll közelebbi rokonságban.).Ebből a korból viszont nem mutatható ki szláv[1] hatás. Az ómagyar korban(896-1526) a magyar nyelv elsősorban latin és új-latin elemekkel bővült,és - különösen Mátyás idején - a francia és olasz szavak is megjelentek, ekkor a déli- és északi-szláv nyelvekben eltérő szavak a magyar közvetítésével jutottak el egymáshoz[1]. Majd a középmagyar nyelv(1526-1772) korszakában a német behatás nyomait lehet felfedezni. A török hódoltság alatt jelentős volt az oszmán-török hatás, ez azonban a hódoltsági területek fokozatos elnéptelenedése miatt kevésbé érvényesült(pl.:Bács 1522-1550 között a magyarok teljesen eltűntek, a lakosságot kicserélték más nyelvűekre[1]). A 18. századtól kezdve megerősödött a német nyelv hatása, a 20. században pedig számos nemzetközi vándorszó került a magyar nyelvbe, főleg az angolból, illetve kisebb részben a franciából, olaszból és más nyelvekből.
A szókincs bővülésének forrásai: 1. Jövevényszavak - példák:
Honfoglalás előtti jövevényszavak:
- iráni eredetű szavak: ezer, kard, nemez, tej, tíz, perzsa: vám, vásár, vár (főnév), alán: asszony, híd stb.
- ótörök (bolgár-török és köztörök) eredetű szavak (kb. 300): kicsi, alma, sárga, iker, betű, bika, borjó, disznó, búza , árpa stb.
Honfoglalás utáni jövevényszavak:
- török eredetű szavak: kun-besenyő: balta, csősz, kalauz, komondor; oszmán-török: zseb, papucs, bogrács, kávé, pite stb.
- szláv eredetű szavak: kapál, kaszál, munka, barát, király, megye, paraszt, ebéd, asztal, vacsora stb.
- német eredetű szavak: herceg, mozsár, páncél, zsinór, kastély, sógor, bejgli, cél stb.
- latin eredetű szavak: angyal, kápolna, ceruza, iskola, kréta, kollégium, porta, tégla, augusztus, rózsa stb.
- francia eredetű szavak: címer, furmint, kilincs, mécs, paraj, butik, garzon stb.
- olasz eredetű szavak: lándzsa, pajzs, pálya, piac, egres, füge, mazsola, narancs, remete, banda, szalámi stb.
- román eredetű szavak: áfonya, ficsúr, mokány, tokány stb.
- angol eredetű szavak: futball, taccs, dzsip, busz, dzsentri, menedzser, klub, hobbi, keksz, notesz, Wikipédia stb.
- cigány eredetű szavak: ácsi, csaj, csávó, csór, csóró, dilinós, duma, gádzsó, góré ’főnök’, hóhányó, kajál, lóvé, manusz, séró stb.
- jiddis eredetű szavak: handlé, jampec, jatt, kóser, sóher, stika, balhé, haver, srác, szajré stb.
- nemzetközi műveltségszavak:
- vándorszavak: kömény, majom, maszlag, papagáj, tárkony, selyem, szablya, alabárd, borbély stb.
- nemzetközi szavak: agronómus, akrobata, akusztika, automata, garázs, csekk, tröszt, algebra, szamovár, dzsungel stb.
[1] Bárczi Géza: A magyar nyelv életrajza /1962.március/(Custos kiadó 1996)
[szerkesztés] A magyar szókincs nagysága
A magyar nyelv szavainak száma kb. 1 millióra tehető, s így az egyik legnagyobb szókinccsel rendelkező nyelv. E becslés magyarázata: az egymillió úgy jön ki, hogy a helyesírás szabályai szerint a magyar nyelv alapvetően támogatja az összetett szavakat (szemben az angol vagy francia nyelvekkel. A magyar nyelvben bármely tetszőlegesen kiválasztott két főnévből kialakítható egy összetett szó. Pl. ajtó + fű = ajtófű, melyeknek természetesen csak nagyon kis százaléka ténylegesen része a magyar nyelvnek. Ha az ajtófű szónak nincs is értelme első pillantásra, egy kis kutatással még találhatunk neki: pl. a Küküllő mentén így nevezik azt a növényt, ami a küszöb alól sarjad. Számbeli viszonyok: ha 60 000 főnévből indulunk ki, ezek tetszőleges kombinációja kb. 3,6 millárd szót eredményezne. Ennek elenyésző töredéke a valójában a nyelvhez tartozó 1 millió szó.
Az angolban pl. nem szokás egybeírni az ilyen szerkezeteket, így az írott angol nyelv elemzése során kevesebb szót találhatunk, azonban még így is kb 400-600 ezer közötti számú szót; másfelől a német, holland, japán, észt vagy finn nyelvben hasonló szintű az egybeírás, és ezekben szinte korlátlan szókígyók jöhetnek létre (Donaudampfschifffahrtsgesellschaftskapitänsmütze), lásd [1], így ezek hasonló képet mutatnak, mint a magyar nyelv. A szókincset az írott nyelv alapján számbavevő módszer azonban vitatható, ugyanis az egybeírás és a különírás sok esetben csak formai, és nem tartalmi különbséget jelent, azaz új jelentés, új szótári egység úgy is létrejön, ha a két alkotóelemet külön írjuk. Például a szövegszerkesztő angol megfelelője, a word processor külön írandó, s így az íráskép alapján két szó, de a nyelvhasználó számára egy új fogalmi egységet jelent, nem pedig két, a mondatban egymás után következő elemet. (Érdekességképpen megjegyzendő, hogy ilyen alapon például a cseh és a szlovák nyelv igekészletét is duplán kellene számolnunk, mivel egybeírják a tagadószót az igével. Nevím, neviem: nem tudom - a „ne” a tagadószó.) Annak ellenére, hogy valójában a szóösszetétel sokkal bonyolultabb jelenség annál, hogy csak formai, pusztán az írásrendszerre vonatkozó és nem a nyelv mélyszerkezetéből adódó szabályrendszernek minősítsük (például a szilárd test és a szilárdtest, a mesterséges intelligenciateszt és a mesterségesintelligencia-teszt egészen mást jelentenek, a törökbúza nem török búza stb.), mint a példák is mutatják, az egybeírt összetett szavak egy szóvá, a különírt összetett szavak két szóvá minősítése csak kritikával és a jelentésre való tekintettel fogadható el, és a becslésnél óvatosnak kell lenni. Ez egyben indokolja a szógyűjtés nehézségét is.
Általában is igaz, hogy egy nyelv szókincse igen nehezen definiálható, miután nem egyértelmű meghatározni, mit nevezünk szónak, illetve mit nevezünk származtatott (képzett) szónak. Emellett a magyarban nehéz eldönteni, mi legyen a ragozott és képzett szóalakokkal, ráadásul arról sem teljes a közmegegyezés, hogy egyes szuffixumok ragok-e vagy képzők, és a velük alkotott szóalakok önálló szótári tételek-e vagy nem. Más szavakkal, a képző és rag fogalmának használata nyelvészeti művekben sem teljesen egységes. Ezen kívül a magyar nyelvet beszélik a moldvai csángók is, csak éppen nagyszámú román jövevényszót használnak. Ebben az esetben ezek a román jövevények éppúgy a magyar nyelv szókincsének részét képezik, mint az amerikai magyarok angol nyelvi átvételei, hiszen a magyar nyelv egyik változatát beszélők használják őket. Ezek alapján sokak számára úgy tűnik, értelmetlen és haszontalan próbálkozás megállapítani, hány szóból áll a magyar nyelv szókincse. Mások valamilyen alapművet, pl. az MTA által gondozott és meghatározott ún. irodalmi nyelvet veszik alapul. Megjegyzendő, hogy a teljes szókészletet magában foglaló szótár e pillanatban nincs, az Akadémia által kiadott magyar helyesírás szótárának szószáma 300 000 szó alatt van, tehát a magyar szavak lehetőleg teljes összegyűjtése még várat magára. Megemlítendő, hogy a világ egyetlen nyelvén sem létezik teljes szótár, az angolt beleértve. Ennek egyik oka a szakszavak sokasága, (pl. bányászat, orvostudomány, számítástechnika), melyeket egyetlen szótárszerkesztő sem képes érdemben olyan szinten megismerni, hogy annak alapján felvehesse őket a szótárba. Érdekes kezdeményezés a Debreceni Egyetemen Papp Ferenc által szerkesztett szóvégmutató (atergó) szótár (ISBN 963 05 6732 6), mely fordított betűrendben (a szóvégek felől) csoportosítja „A magyar nyelv értelmező szótárá”-ban megtalálható címszavakat.
Ezzel együtt ha elkötelezzük magunkat bármelyik felfogás mellett is arról, hogy mit nevezünk egy nyelvhez tartozónak és mit nevezünk szónak, és ezt az elvet alkalmazzuk a magyarra ugyanúgy, mint más nyelvekre, könnyen összevethetjük a szókincsét más nyelvekével ebből vagy abból a szempontból.
Amennyiben csak a jel és rag nélküli szavakat vesszük figyelembe, amelyek egy művelt anyanyelvi beszélő passzív szókincsében jelen vannak, a képzett szavak közül pedig csak azokat, amelyek önálló jelentésre is szert tettek, körülbelül 120 000–240 000 szó közti értéket kapunk.[forrás?] Általában a legnagyobb írók, költők aktív szókincse sem haladja meg a 20-25 000 szót.