Szerző: Rátonyi Gábor Tamás

2004. október 28. 11:14

Magyar helyesírás-ellenőrzés a Google-lal

Érdekes kezdeményezésként, az egyes szóalakok előfordulásának arányait a Google alapján megmutató weboldal működik a hejes.szerver.org címen. Az oldal egyfajta ellenőrzési lehetőséget nyújt, hogy az általunk keresett és az ahhoz hasonló szóalakok milyen gyakorisággal fordulnak elő a neten.

[HWSW] Érdekes kezdeményezésként, az egyes szóalakok előfordulásának arányait a Google alapján megmutató weboldal működik a hejes.szerver.org címen. Az oldal egyfajta ellenőrzési lehetőséget nyújt, hogy az általunk keresett és az ahhoz hasonló szóalakok milyen gyakorisággal fordulnak elő a neten.

Helyesírás-ellenőrzés a Google-lal

Sokan használják a Google-t arra, hogy ellenőrizzék: helyes-e az a kifejezés, amit írni szeretnének. Például a Google-ba beírva a muszály szót (amit helyesen muszájnak kell írni), megkapjuk, hogy 10600, míg a pontos muszáj változat közel 70000 oldalon fordul elő. A (nevében szintén egy helyesírási hibát vétő) Hejes weboldal megkíméli a két, vagy több kereséstől a helyesírásában bizonytalan szókeresőt, mivel automatikusan kiegészíti a kifejezést, illetve megmutatja, hogy az ly-j, x-ksz, hosszú-rövid magánhangzók, hasonulások, egybe-különírások milyen arányban fordulnak elő az interneten. Ezzel a módszerrel sokan ellenőrzik egy-egy szó helyesírását, ha nincs kéznél a szabályzat, a Hejes weboldalán azonban nem kell többször keresni az egyes szóalakokra, az oldal megmutatja a lehetséges variációk mindegyikét.

Németh András, a weboldal fejlesztője maga is elismeri, hogy a Google nem felel meg a kanonizált helyesírás ellenőrzésére, például az olyan klasszikus hibát, mint az egyelőre-egyenlőre összekeverése, nem lehet kiszűrni sem a Hejes oldallal, sem a Google-lal. Arra azonban kétségtelenül alkalmas, hogy megmutassa: egy szóalak hányféle formában és mennyire gyakran fordul elő a neten. A muszáj szó beírására például kiderül, hogy a muszály csak a weblapok 16 százalékán szerepel, míg a muszáj aránya 84 százalékos, de például a szintén a klasszikus helyesírási hibaként számontartott bocsát (elbocsát, megbocsát) és a tévesen bocsájtnak írt szavakat már nem vizsgálja együtt a Hejes oldala, ezeket külön-külön kell beírni. Hogy a Google mennyire nem száz százalékos módszer a helyesírás ellenőrzésére, azt a krikszkraksz szóra való keresés támasztja alá: a helyesen ksz-szel írandó szót az internetre került oldalak többségében (78 százalékában) x-szel, krixkraxként írják, ami pontatlan.

Kontroll a weben

Noha a magyar neten nincs kifejezetten helyesírás ellenőrző -- a helyesírási szabályzatot és szótárt kiadó Akadémiai Kiadónak minden bizonnyal nagyobb bevétele származik a könyvek újranyomásából, mint a netes verzió elkészítéséből -- azért a Hejes oldalán kívül is van néhány lehetőség a helyesírás ellenőrzésére. Az Google mintájára használható -- és talán pontosabb is -- bármelyik olyan weboldal, ahol a szövegek internetre kerülését megelőzi a korrektúrázás. A sajtó és a helyesírás viszonyát ugyan érheti kritika, mégis kisebb az esélye annak, hogy durva helyesírási hibát fedezünk fel például az országos napilapok weboldalának valamelyikén, mint az internet egészén. A négy országos napilap weboldalán (Népszabadság, Magyar Nemzet, Magyar Hírlap, Népszava) például a hibás muszály szóra nincs találat, de például a csevely (a helyesírási szótár szerint: csevej) és a bocsájt (helyesen: bocsát) kifejezésekre már nem ilyen egyértelmű a helyzet: mindegyik hibát elkövették néhányszor a kollégák.

Jóval pontosabbnak tekinthető -- noha nem helyesírási szótárról van szó -- a magyar szoftverfejlesztő cég, Morphologic weboldalán elérhető szinonimaszótár. Itt csak annyi a dolgunk, hogy a miről, mire legördülő menük közül mindkettőt a magyarra görgetjük, s máris kereshetünk a hasonló jelentésű szavak közt. A szótár jellegéből adódóan persze számos kifejezésre egyáltalán nem kapunk találatot, amire viszont igen, azt helyes írásmóddal láthatjuk viszont. A helytelenül beírt szóalakokról ugyanakkor nem tudjuk meg, hogy a helytelensége miatt nincs találat, vagy azért, mert maga a szó nem szerepel a szótárban.

Persze, a bizonytalankodóknak -- sőt, gyakran a magukban biztosaknak is -- a legegyszerűbb megoldás, ha egy magyar helyesírás-ellenőrzővel kiegészített nyelvű szövegszerkesztőt használnak (például az OpenOffice.org-ot. Ez ugyan kényelmes, bár az egybe-különírás ellenőrzésére kevéssé használható. A szabályokból kiindulóknak pedig marad a magyar helyesírás szabályai, mely Windows súgó és szöveges formátumban egyaránt tartalmazza a teljes szabálygyűjteményt -- igaz, a szótár nélkül.

Nagyon széles az a skála, amin az állásinterjú visszajelzések tartalmi minősége mozog: túl rövid, túl hosszú, semmitmondó, értelmetlen vagy semmi. A friss heti kraftie hírlevélben ezt jártuk körül. Ha tetszett a cikk, iratkozz fel, és minden héten elküldjük emailben a legfrissebbet!

a címlapról