Skip to content

Machine Translation Mystery Cache

This cache has been archived.

Voyager Reviewer: Archivace listingu keše

Protože výzvy k údržbě nebyly naplněny, byla keš v souladu s pravidly archivována. Upozorňuji, že keš, která byla archivována pro zanedbávanou údržbu, již nelze odarchivovat.

Voyager Reviewer - reviewer pro ČR, (především kraje Jihomoravský, Zlínský)

More
Hidden : 6/24/2009
Difficulty:
3 out of 5
Terrain:
1.5 out of 5

Size: Size:   micro (micro)

Join now to view geocache location details. It's free!

Watch

How Geocaching Works

Please note Use of geocaching.com services is subject to the terms and conditions in our disclaimer.

Geocache Description:


DISABLED kvůli stavebním úpravám na cílové schovce!



Machine Translation
Strojovy preklad

 
aneb kolik jazyku znas, tolikrat jsi clovekem
 
Verim ze mnoho z nas geocacheru uz ovlada vice jazyku nez nas rodny, cesky. Pokud ale jazyk neznate nebo potrebujete prelozit kus textu kteremu nerozumite mate tri moznosti: nechat si text prelozit prekladatelskou agenturou, zkusit prelozit text slovo od slova pomoci slovniku nebo vyuzit nektere z on-line sluzeb poskytujicich strojovy preklad - machine translation.

Machine translation (MT) je proces automatickeho prekladu z jednoho prirozeneho jazyka do jineho pomoci pocitace. Strojovy preklad pronasleduje informatiku a je stale nepolapitelnym cilem. Dnes jsou dostupne mnohe systemy, jejichz vystup neni dokonaly, ale je dostatecne kvalitni pro pouziti v mnoha oblastech, kde pomaha lidskym prekladatelum.

Pokusy o strojovy preklad cizojazycnych textu zacaly kratce po 2. svetove valce. Ocekavalo se, ze pro pocitace, jejichz prvni prototypy byly v te dobe uvedeny do provozu, nebude tento ukol nijak slozity. Brzy se vsak ukazalo, ze tento predpoklad byl zcela mylny.

Prvni MT system byl verejnosti predstaven 7. ledna 1954 v ustredi firmy IBM. Udalost pritahla znacnou pozornost medii i siroke verejnosti. System samotny byl ale z dnesniho pohledu velmi jednoduchy, jeho slovnik obsahoval pouze 250 slov a pri predvadeni prekladal pouze 49 zvlast vybranych vet z rustiny do anglictiny. I pres tuto jednoduchost ale system vzbudil dojem, ze prakticke nasazeni strojoveho prekladu uz neni daleko, coz pomohlo ziskat dostatecne financni prostredky na dalsi vyzkum v tomto oboru.

Hlavni motivaci pro vyvoj dalsich podobnych systemu byla eskalujici studena valka. USA se zacaly obavat naskoku tehdejsiho Sovetskeho svazu ve vyvoji raketove i jine vojenske techniky a snazily se peclive monitorovat pokrok sovetske vedy. V oblasti spionaze a valecneho usili pokracuje vyzkum dodnes. V dobe valky proti terorismu je machine translation hojne vyuzivan k prekladum z jazyku dalneho vychodu. Proc by nebylo mozne mit kazde rano v kancelari americkeho prezidenta sjetinu toho co bylo uvedeno o USA predchozi den ve vsech mediich (vcetne novin, radii a TV stanic) zemi osy zla... a rovnou prelozene v anglictine? Samozrejme ze to mozne je a v realu to tak i funguje. Vzdyt soucasne stroje dokazi prelozit tisice slov za minutu :-)

Preklady generovane soucasnymi systemy jsou uz na takove urovni, ze prelozenemu textu je mozne rozumet a strojove preklady lze pouzit v lokalizacnim prumyslu jako zaklad pro preklad clovekem - prekladatel ("post-editor") pro kazdou takto prelozenou vetu rozhodne zda pouze zkoriguje strojovy preklad nebo ji prelozi od zacatku (bez pouziti MT). Je overeno ze efektivita post-editora vychazejiciho ze strojove "pred-prelozenych" segmentu textu/vet je vyssi nez efektivita prekladatele pouzivajiciho klasicky proces prekladu.

Systemy pro strojove preklady delime podle principu jejich funkcnosti na dve zakladni skupiny:

Rule-Based MT (RBMT)
System se sklada z mnoziny gramatickych pravidel (zdrojoveho a ciloveho jazyka) a slovniku. Tyto systemy byly pouzivany on samotneho pocatku vyvoje MT a pracuji na principu hledani vhodne sablony odpovidajici gramatice zdrojoveho jazyka, aplikovani ekvivalentu gramatiky pro cilovy jazyk do ktere jsou dosazeny prelozene terminy ze slovniku.
 
+ aplikovatelne okamzite pro jakykoliv text (domenu)
-  horsi srozumitelnost prelozeneho textu pri pouziti spatne gramatiky
-  velmi nakladne a pracne sestaveni gramatickych pravidel

Statistical MT (SMT)
S pouzitim statistickych metod pocitajicich pravdepodobnostni tabulky vyskytu prekladu daneho textu je mozne s pomoci obrovskych, jiz drive prelozenych textu sestavit MT system ktery vraci slusne vysledky bez nutnosti definovani jakychkoliv gramatickych pravidel, dokonce i bez nutnosti znalosti jakehokoliv z jazyku. System se z drive (prekladatelem) prelozeneho textu "nauci" co ma jak prelozit.
 
+ neni potreba definovat slozita gramaticka pravidla
-  pro slusne "nauceni" systemu je nutne systemu dodat patricne krmivo.
    Vetsinou by to melo byt vic jak 3 miliony prelozenych slov v domene ve ktere
    budeme aplikovat MT


Zde uvadim nekolik prikladu vyuziti Machine translation v komercni praxi (v drtive vetsine SMT):

               



Dost bolo teorie, ted ke kesi samotne. Tyka se jak jinak znalosti jazyku a machine translation, kterou budete asi s nejvetsi pravdepodobnosti pouzivat k overeni dilcich vysledku. V nasledujici tabulce je nekolik prekladu stejne vety do ruznych jazyku. Kazdy jazyk ma pridelene unikatni cislo (klic) ktere dosazujeme do vzorce pod tabulkou. Ve vzorci jsou pouzity standardizovane zkratky nazvu jazyku - zkratka bude nahrazena klicem ktery patri danemu jazyku.

Klic  
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15

Krabicku najdete na souradnicich:
 
N 49° X
E 16° Y

 
kde
 
X = ((KO*SV*ZHTW*ZHCN) + FR) / ((ES*FR*IT*DA) + (KO*ES) - DA)
Y = ((IT*BG*EL*AR) + (ES*HI) - BG) / ((BG*EL*ZHTW) - (NL*KO*HE) - (JA*DA) + EL)

Nekolik upozorneni a rad:

  • Vypocet zaokrouhlujte standardnim zpusobem na 3 desetinna mista
  • Na miste je slaby signal proto doporucuji podivat se nejdriv na mapy.cz nebo googlemaps.com kam vlastne jdete
  • V zadnem pripade NEVSTUPUJTE DO PROSTOR SOUKROMYCH SUBJEKTU (i kdyz vas tam povede sipka v dusledku spatneho signalu)! Krabicka je schovana na VEREJNEM MISTE, pristupna POUZE z chodniku
  • Kes prosim vracejte opatrne zpet tak, aby ji kolegove kteri prijdou po vas mohli pohodlne odlovit! Kes nezastrkujte uplne "dovnitr", muze byt nenavratne ztracena!
  • V kesi neni tuzka

Dobrovolny ukol: Pokud pri lusteni nebo jinem pouzivani MT na nekterych z verejnych serveru narazite na nejaky vtipny preklad, muzete se o nej v logu podelit s ostatnimi.

Preji hodne trpelivosti a stastny lov!

Jste visitor stats navstevnik na teto strance.

Additional Hints (Decrypt)

Cbq "ebyrgbh"

Decryption Key

A|B|C|D|E|F|G|H|I|J|K|L|M
-------------------------
N|O|P|Q|R|S|T|U|V|W|X|Y|Z

(letter above equals below, and vice versa)