2024. március 28., csütörtök English version
Archívum  --  2011  --  2. szám - 2011. február 14.  --  Szabadegyetem
A nyelv­tech­no­ló­gia fej­lő­dé­se
A Min­den­tu­dás Egye­te­me 2.0 leg­utób­bi prog­ram­já­ra Sze­ge­den ke­rült sor feb­ru­ár 8-án, mely­nek ke­re­té­ben Kor­nai And­rás ma­te­ma­ti­kus-nyel­vész Em­ber, gép, nyelv­tech­no­ló­gia cí­mű elő­adá­sát hall­hat­tuk.
Címkék: Szabadegyetem

Mi a kö­zös a be­széd­fel­is­me­rő prog­ra­mok­ban, az inter­neten el­ér­he­tő szó­tá­rak­ban, a szö­veg­szer­kesz­tő he­lyes­írás-el­len­őr­ző­jé­ben, a Google Trans­late-ben és a se­bes­ség­mé­rő ra­da­rok­ban? A vá­lasz vi­szony­lag egy­sze­rű­nek tű­nik: mind­egyik a nyelv­tech­no­ló­gia al­kal­ma­zá­si te­rü­le­té­nek egy-­e­gy pél­dá­ja.
Kor­nai And­rás elő­adá­sá­ban azt mu­tat­ta be, ah­hoz, hogy ezek az al­kal­ma­zá­sok min­den­ki szá­má­ra el­ér­he­tő­ek le­gye­nek, mi­lyen te­rü­le­te­ken volt szük­ség fej­lő­dés­re. El­ső­ként jobb szá­mí­tó­gé­pek kel­let­tek. Az el­ső, 1974-ben mű­kö­dés­be lé­pő, szin­te szo­bá­nyi te­rü­le­tet el­fog­la­ló monst­rum he­lyett ma már ne­vet­ve vesszük elő zse­bünk­ből 10–15 cen­ti­mé­te­res mo­bil­te­le­fon­ja­in­kat, ame­lyek mű­kö­dé­se nem­csak jó­val gyor­sabb ko­rai elődeiké­nél, de in­for­má­ció­tá­ro­lá­si ka­pa­ci­tá­sukban sem mérhetőek össze. Ter­mé­sze­te­sen ez az elő­ál­lí­tá­si költ­ség­ben is meg­mu­tat­ko­zik, a leg­ko­ráb­bi mo­dell 300 dol­lá­ros fej­lesz­té­si ára el­tör­pül a tegra 2 nyolc­mil­lió dol­lá­ros költ­sé­ge mel­lett.
Má­sod­sor­ban szük­sé­ges volt a hoz­zá­ál­lás meg­vál­to­zá­sa. A pro­fes­­szor be­mu­tat­ta a „nyelv­tech­no­ló­gia for­ra­dal­má­nak köz­ka­to­ná­it”, akik mun­kás­sá­guk­kal hoz­zá­já­rul­tak ah­hoz, hogy ma­nap­ság be­széd­fel­is­me­rő szer­ke­ze­tek dol­goz­has­sa­nak. Vé­gül az el­mé­le­tek­nek kel­lett fej­lőd­ni­ük, szá­mos el­vet, mo­dellt és lo­ga­rit­must dol­goz­tak ki, me­lyek ré­vén inter­netes ke­re­sők, szá­mí­tó­gép ál­tal vég­zett nyel­vi fel­ada­tok és rend­szer­el­mé­le­tek mű­köd­nek. Így va­ló­sul­hat meg, hogy a Google 1 exabyte (1018) ada­tot tá­rol, míg a vi­lág tel­jes könyv­ál­lo­má­nya csu­pán 5 ter­abyte-nyi (5 × 1012) adat­nak fe­lel meg, a Já­nos vi­téz pe­dig 60 ki­lo­byte­-nak (6 × 103). Az em­be­ri me­mó­ria nagy­já­ból a megabyte-os (106) nagy­ság­rend­nél re­ked meg, így a Ko­ránt (750 ki­lo­byte) még so­kan meg tud­ják ta­nul­ni, de a Bib­lia (4,5 me­ga­byte) szó sze­rin­ti is­me­re­te már csak ke­ve­sek ki­vált­sá­ga.
Kor­nai vé­le­mé­nye sze­rint a leg­na­gyobb fej­lő­dé­si po­ten­ci­ál­ja az el­mé­le­tek­nek le­het, hi­szen a hoz­zá­ál­lás vál­to­zá­sa meg­va­ló­sult, a szá­mí­tó­gé­pek előtt pe­dig már nem áll ak­ko­ra fej­lő­dés.
An­nak el­le­né­re, hogy a kü­lön­bö­ző prog­ra­mok szá­mos fel­ada­tot megkön­nyítenek az em­ber szá­má­ra, sok eset­ben nem tud­nak min­ket pó­tol­ni, több­nyi­re tar­tal­mi vo­nat­ko­zá­sok és alak­fe­lis­merési ké­pes­ség vo­nat­ko­zá­sá­ban (sak­ko­zó szá­mí­tó­gép már lé­te­zik, de a gó já­ték­ban még min­dig ver­he­tet­len az em­ber). Így egy­elő­re az is­me­ret­len jel­rend­sze­rek meg­fej­té­sé­ben is mi va­gyunk si­ke­re­sek.
Kor­nai And­rás (1957) 1983-ban dok­to­rált ma­te­ma­ti­ká­ból az EL­TE-n (Aj­tai Mik­lós té­ma­ve­ze­té­sé­vel); 1988-ban kan­di­dá­tu­si cí­met szer­zett az MTA Nyelv­tu­do­má­nyi In­té­ze­té­ben (Kiefer Fe­renc ve­ze­té­sé­vel), majd Stand­ford­ban dok­to­rált nyel­vé­szet­ből (1991, Paul Kiparsky ve­ze­té­sé­vel); 2001-ben a nagy­dok­to­ri cí­met is meg­sze­rez­te, 2007-ben ha­bi­li­tált.
A ma­te­ma­ti­kus-nyel­vész a Mű­egye­tem cím­ze­tes egye­te­mi ta­ná­ra, a bos­to­ni egye­tem szá­mí­tó­gép-tu­do­má­nyi tan­szék­ének és a Har­vard Kvan­ti­ta­tív Tár­sa­da­lom­tu­do­má­nyi In­té­ze­té­nek ku­ta­tó mun­ka­tár­sa, a YourAmigo PLC és az MTA SZTAKI tu­do­má­nyos ta­nács­adó­ja, va­la­mint a For­mal Gram­mars egyik szer­kesz­tő­je. Fon­tos ér­de­me a mon­da­tok köz­vet­len ös­­sze­te­vős szer­ke­ze­té­nek ma­te­ma­ti­kai vizs­gá­la­ta, a be­széd­fel­is­me­rés mo­dell­je­i­nek ki­ter­jesz­té­se az írás­fel­is­me­rés­re, va­la­mint több tech­ni­ka be­ve­ze­té­se az in­for­má­ció­ki­nye­rés­ben és -vis­sza­k­eresés­ben. Szá­mos ha­zai és kül­föl­di szá­mí­tó­gé­pes, nyel­vé­sze­ti és ma­te­ma­ti­kai tár­sa­ság tag­ja. Há­rom mo­nog­rá­fi­át írt, négy kö­te­tet szer­kesz­tett és kö­zel hat­van cik­ket pub­li­kált.
A SZTAKI-ban je­len­leg olyan rend­szer ki­épí­té­sén dol­go­zik, amely­nek se­gít­sé­gé­vel a szá­mí­tó­gé­pek egy­sze­rű szö­ve­gek­kel kap­cso­lat­ban meg­fo­gal­ma­zott egy­sze­rű kér­dé­sek­re vá­laszt tud­nak ad­ni.

Sze­ke­res Ni­ko­let­ta

DSC_136841_230x154.png

Címkék

Szabadegyetem 

Hírek, aktualitások *

Rendezvénynaptár *

  • Szorgalmi időszak 2023/2024/2
    február 12. - május 18.
  • Education period 2023/2024/2
    február 12. - május 18.
  • Szorgalmi időszak
    február 12. - május 18.
  • Szorgalmi időszak a 2023-2024/2. félévben
    február 12. - május 18.
  • 2023/2024-II. félév Szorgalmi időszak
    február 12. - május 18.

Gyorslinkek

Bezár