Google chce pri prekladačoch používať vektory namiesto slovníkov

Informatici z Google chcú presadiť nový koncept prekladania textov, ktorý sľubuje lepšie výsledky bez pomoci zo strany expertov. 

Doteraz tento program vždy vychádzal z klasického slovníka. Vďaka rozšíreniu pravidiel gramatiky a rôznych výnimiek príslušného jazyka boli výsledky síce  lepšie a lepšie, no zároveň stále ďaleko od skutočne dobrého prekladu. Predovšetkým niektoré citlivé rozdiely vo význame slov neustále spôsobovali problémy.

V Google sa práve pracuje na spôsobe, pri ktorom by sa dokonca aj slovníky  vedeli kompletne automatizovať. No a k tomu je potrebné analyzovať štruktúru reči a vytvoriť vzájomné spojitosti. Základná myšlienka spočíva v tom, že v rôznych jazykoch sú v podstate zobrazené rovnaké veci. Čiže existujú slová, ktoré označujú konkrétne veci ako napríklad zvieratá – mačka, pes. V ďalšom kroku sú tieto vzájomne pospájané v podobných väzbách, ako napríklad vo vete: „ Mačka je zviera, ktoré je menšie ako pes.“

Takéto spojenia sa môžu objaviť aj pri mnohých iných výrazoch. Jazykovedci urobili v uplynulých rokoch výrazné pokroky. Snažili sa  prepracovať podobnosť  takýchto vzťahov do rôznych jazykov prostredníctvom vektorov.

Ukázalo sa, že sa vzájomne dáva do súvislosti  množstvo rozdielnych nárečových slov s podobnými vektormi. Tak sa z jazykovedného problému pri prekladaní môže ľahko stať matematický problém, čo by bolo jednoznačne lepšie riešiť pomocou počítača.

Vývojári z Google už teraz zaznamenávajú veľmi dobré výsledky tejto metódy. Vďaka nej sa napríklad podarilo vyhľadať množstvo chýb v súčasnom algoritme prekladu medzi angličtinou a češtinou. Tiež je možné dosiahnuť lepšie výsledky v konfrontácii jazykov, ktoré nemajú relatívne podobné historické a kultúrne pozadie. 

Zdroj: winfuture

Pridať nový komentár
TOPlist