Mi a közös a beszédfelismerő programokban, az interneten elérhető szótárakban, a szövegszerkesztő helyesírás-ellenőrzőjében, a Google Translate-ben és a sebességmérő radarokban? A válasz viszonylag egyszerűnek tűnik: mindegyik a nyelvtechnológia alkalmazási területének egy-egy példája.
Kornai András előadásában azt mutatta be, ahhoz, hogy ezek az alkalmazások mindenki számára elérhetőek legyenek, milyen területeken volt szükség fejlődésre. Elsőként jobb számítógépek kellettek. Az első, 1974-ben működésbe lépő, szinte szobányi területet elfoglaló monstrum helyett ma már nevetve vesszük elő zsebünkből 10–15 centiméteres mobiltelefonjainkat, amelyek működése nemcsak jóval gyorsabb korai elődeikénél, de információtárolási kapacitásukban sem mérhetőek össze. Természetesen ez az előállítási költségben is megmutatkozik, a legkorábbi modell 300 dolláros fejlesztési ára eltörpül a tegra 2 nyolcmillió dolláros költsége mellett.
Másodsorban szükséges volt a hozzáállás megváltozása. A professzor bemutatta a „nyelvtechnológia forradalmának közkatonáit”, akik munkásságukkal hozzájárultak ahhoz, hogy manapság beszédfelismerő szerkezetek dolgozhassanak. Végül az elméleteknek kellett fejlődniük, számos elvet, modellt és logaritmust dolgoztak ki, melyek révén internetes keresők, számítógép által végzett nyelvi feladatok és rendszerelméletek működnek. Így valósulhat meg, hogy a Google 1 exabyte (1018) adatot tárol, míg a világ teljes könyvállománya csupán 5 terabyte-nyi (5 × 1012) adatnak felel meg, a János vitéz pedig 60 kilobyte-nak (6 × 103). Az emberi memória nagyjából a megabyte-os (106) nagyságrendnél reked meg, így a Koránt (750 kilobyte) még sokan meg tudják tanulni, de a Biblia (4,5 megabyte) szó szerinti ismerete már csak kevesek kiváltsága.
Kornai véleménye szerint a legnagyobb fejlődési potenciálja az elméleteknek lehet, hiszen a hozzáállás változása megvalósult, a számítógépek előtt pedig már nem áll akkora fejlődés.
Annak ellenére, hogy a különböző programok számos feladatot megkönnyítenek az ember számára, sok esetben nem tudnak minket pótolni, többnyire tartalmi vonatkozások és alakfelismerési képesség vonatkozásában (sakkozó számítógép már létezik, de a gó játékban még mindig verhetetlen az ember). Így egyelőre az ismeretlen jelrendszerek megfejtésében is mi vagyunk sikeresek.
Kornai András (1957) 1983-ban doktorált matematikából az ELTE-n (Ajtai Miklós témavezetésével); 1988-ban kandidátusi címet szerzett az MTA Nyelvtudományi Intézetében (Kiefer Ferenc vezetésével), majd Standfordban doktorált nyelvészetből (1991, Paul Kiparsky vezetésével); 2001-ben a nagydoktori címet is megszerezte, 2007-ben habilitált.
A matematikus-nyelvész a Műegyetem címzetes egyetemi tanára, a bostoni egyetem számítógép-tudományi tanszékének és a Harvard Kvantitatív Társadalomtudományi Intézetének kutató munkatársa, a YourAmigo PLC és az MTA SZTAKI tudományos tanácsadója, valamint a Formal Grammars egyik szerkesztője. Fontos érdeme a mondatok közvetlen összetevős szerkezetének matematikai vizsgálata, a beszédfelismerés modelljeinek kiterjesztése az írásfelismerésre, valamint több technika bevezetése az információkinyerésben és -visszakeresésben. Számos hazai és külföldi számítógépes, nyelvészeti és matematikai társaság tagja. Három monográfiát írt, négy kötetet szerkesztett és közel hatvan cikket publikált.
A SZTAKI-ban jelenleg olyan rendszer kiépítésén dolgozik, amelynek segítségével a számítógépek egyszerű szövegekkel kapcsolatban megfogalmazott egyszerű kérdésekre választ tudnak adni.
Szekeres Nikoletta