Matic Tomšič

Četrtek,
19. 1. 2017,
3.21

Osveženo pred

1 mesec, 2 tedna

Termometer prikazuje, kako vroč je članek.

Termometer prikaže, kako vroč je članek.

Thermometer Blue 1,73

Natisni članek

Natisni članek

Google prevajanje digizgodbe umetna inteligenca umetna inteligenca

Četrtek, 19. 1. 2017, 3.21

1 mesec, 2 tedna

Se bodo morali prevajalci bati za svoje službe?

Matic Tomšič

Termometer prikazuje, kako vroč je članek.

Termometer prikaže, kako vroč je članek.

Thermometer Blue 1,73
Prevod | Foto Thinkstock

Foto: Thinkstock

Google Translate je najbolj uporabljani prevajalnik na spletu. Vsak dan prevede 140 milijonov besed, pozna pa 103 jezike. Google Translate je bil dolgo pomočnik pri razumevanju tujega jezika in ne polnopravni prevajalnik celotnih besedil, v zadnjem času pa se to spreminja, prevodi so natančnejši. Google je prevajanje prepustil umetni inteligenci, ki je začela početi nekaj neverjetnega.

Google je svoj prevajalnik Google Translate vklopil 28. aprila 2006. Je daleč najbolj priljubljen in uporabljan spletni prevajalnik - na voljo je za osebne računalnike in mobilne naprave, prevajati zna besedilo, vsebino slik in fotografij, govor.

Googlovemu prevajalniku je dolgo nekaj manjkalo. Posamezne besede in besedne zveze je prevajal dobro, pravzaprav odlično, ko pa je uporabnik potreboval prevod celotne povedi, je koherenca pogosto zletela skozi okno.

Tole ne bo prav. | Foto: Matic Tomšič Tole ne bo prav. Foto: Matic Tomšič

Google Translate je prvih deset let delovanja namreč temeljil na tradicionalni strojni metodi prevajanja - to je najlažje razložiti kot neposredno zamenjevanje besed prvega jezika z besedami iz drugega jezika.

Tovrstno prevajanje je Google izpopolnil do skrajnosti, a prevodi obsežnejših in bolj zapletenih besedil pogosto niso imeli smisla. Prevodi posameznih besed in besednih zvez v povedih so bili pravilni, a ne uporabljeni v pravem kontekstu.

Prevajalnik je čez noč postal pametnejši

Nato pa se je jeseni 2016 začelo dogajati nekaj nenavadnega. Precej uporabnikov Google Translate je opazilo, da so prevodi precej izboljšani. V prevajalnik si lahko prilepil nemški esej in dobil njegovo angleško različico. Ne sicer popolno, a dovolj dobro, da se sporočilo eseja ni izgubilo.

Kakovostnejše prevajanje ni bilo naključje. Google ga je namreč prepustil svoji nevronski mreži GNMT (Google Neural Machine Translation). Nevronska mreža je obsežen računalniški sistem, ki deluje po podobnem principu kot človeški možgani.

Takšen računalniški sistem je ena od oblik umetne inteligence - sproti se uči iz že opravljenih prevodov in se na ta način sam izboljšuje. | Foto: Thinkstock Takšen računalniški sistem je ena od oblik umetne inteligence - sproti se uči iz že opravljenih prevodov in se na ta način sam izboljšuje. Foto: Thinkstock

Googlova nevronska mreža lahko prevaja celotne stavke in povedi, ne le posameznih besed in besednih zvez. Ker analizira celotno poved ali tudi večji odsek besedila, lahko izlušči kontekst in izbere besede, s katerimi se sporočilo povedi v prevodu ne bo spremenilo.

Natančnejše prevajanje z GNMT Google trenutno omogoča za devet jezikov - angleščino, nemščino, španščino, francoščino, portugalščino, kitajščino, korejščino, japonščino in turščino. | Foto: Reuters Natančnejše prevajanje z GNMT Google trenutno omogoča za devet jezikov - angleščino, nemščino, španščino, francoščino, portugalščino, kitajščino, korejščino, japonščino in turščino. Foto: Reuters

Model prevajanja z nevronsko mrežo oziroma GNMT je Google v fazi preizkušanja najprej uporabil za jezikovni par angleščina-kitajščina, s katerim je računalniško podprto prevajanje pogosto imelo ogromno težav, predvsem zaradi ohranjanja koherence.

GNMT želi Google sčasoma razširiti na vse podprte jezike (103), ker pa bi za to potreboval preveč modelov (10.609), so se odločili za eksperiment.

Umetni inteligenci so dali proste roke in zgodilo se je ...

Poskusni zajček je bila nevronska mreža, ki ji je Google dovolil prevajanje med več pari jezikov. Naučil jo je prevajanja angleščine v korejščino ter angleščine v japonščino (ter obratno), ne pa tudi prevajanja iz korejščine v japonščino.

Nevronska mreža je nato storila nekaj, česar Googlovi znanstveniki niso pričakovali - sama je poiskala povezave med neznanima jezikoma in ustvarila svoj jezik, s katerim si je pomagala pri prevajanju korejščine v japonščino.

Google temu načinu prevajanja pravi zero-shot:

View post on imgur.com

"Sploh prvič se je zgodilo, da je računalnik uspešno prevajal povedi z uporabo znanja, ki ga je pridobil s prevajanjem enega jezika v tretje jezike," so v objavi na uradnem blogu zapisali pri Googlu.

Jezik, s katerim si je umetna inteligenca pomagala pri prevodih, bi bil človeku sicer nerazumljiv in neberljiv, poudarjajo pri Googlu. Rečejo mu interlingua, tako imenovani vmesni jezik.

Bodo prevajalci kmalu ostali brez dela?

"To se bo morda zgodilo, ko bodo računalniki bolje razumeli, kako deluje svet, kakšni so odnosi med ljudmi in kako to znanje uporabiti pri prevajanju," je za znanstveno publikacijo New Scientist povedal Andrejs Vasiljevs, ki razvija nevronske modele za prevajanje med latvijskim, estonskim in angleškim jezikom.

"Umetna inteligenca zna zelo dobro prevajati golo besedilo, še vedno pa ji težave delajo širši kontekst in stilsko zaznamovane besede, na primer. Dober človeški prevajalec pa te lastnosti besedila prepozna in naredi boljši prevod," pravi Vasiljevs. | Foto: Thinkstock "Umetna inteligenca zna zelo dobro prevajati golo besedilo, še vedno pa ji težave delajo širši kontekst in stilsko zaznamovane besede, na primer. Dober človeški prevajalec pa te lastnosti besedila prepozna in naredi boljši prevod," pravi Vasiljevs. Foto: Thinkstock