6 min read

Google tłumaczyć na polski

Serwis Translate Google wprowadzono w końcu język polski. Jak mozna się było tego spodziewać jakość tłumaczenia na razie jest taka „se”. Poza tym na razie nie ma jeszcze naszego języka w kilku usługach Googla opartych na Translate.

FireShot capture #8 - 'Przetłumaczona wersja strony http___news_google_com_' - translate_google_com_translate_u=news_google_com&hl=pl&ie=UTF8&sl=en&tl=pl

Na razie z usługi mozna korzystać na dwa sposoby: wprowadzając sentencje która zostanie przetłumaczona na jeden z ponad 20 języków w tym m.in. chiński i arabski lub odwrotnie oraz na automatycznym tłumaczeniu na polski (znowu lub odwrotnie na jeden z ponad 20 języków) strony WWW.

Niestety jak to bywa z automatycznymi tłumaczeniami ich jakośc jest na razie kiepska. Google dodkonale zdaje sobie z tego sprawę i dlatego wprowadził mechanizm dzięki któremu sami internauci mogą poprawiać jakość tłumaczenia. Co na ten temat pisze Google w swoim FAQ? Możemy to oczywiście poczytać już w wersji tłumaczonej 🙂

Co to jest „automatyczne tłumaczenie”?

To tłumaczenie produkowane przez państwa-najnowszych technologii, bez interwencji człowieka tłumaczy. Automatyczne tłumaczenie jest często określany jako tłumaczenia maszynowego.

_ Czy Google stworzył własny tłumaczenia oprogramowania?_

Tak. Google badania grupa opracowała swój własny system statystyczny tłumaczenie na język parach teraz dostępne w Google Translate.

Jaki jest statystyczny tłumaczenia maszynowego?

Większość state-of-the-art, komercyjne systemy tłumaczenia maszynowego w użyciu dzisiaj zostały opracowane z zastosowaniem podejścia opartego na zasadach, i wymaga dużo pracy, aby zdefiniować słowniki i gramatyki.

Nasz system przyjmuje inne podejście: We feed the komputera miliardy słów tekstu, zarówno mono tekst w języku docelowym, i wyrównany tekst składający się z przykładami ludzkiego tłumaczenia między językami. Następnie stosuje statystycznych technik nauczania do zbudowania modelu tłumaczenia. Mamy bardzo dobre wyniki osiągnięte w badaniach oceny.

Niestety na razie (przynajmniej gdy pisze te słowa) polski język nie jest obsługiwany przez boty w Gtalku i próżno go szukać w Google Toolbar.

Tak na marginesie przypomniało mi się, że kiedyś pisałem dość komiczny tekst w Gazecie Wyborczej na temat automatycznego tłumaczenia. Usługę taka miał kiedyś Yahoo! Poniżej dość pokaźny fragment oddający naturę tekstu 🙂

Ten ekspert być zły

Tyle teoria, a praktyka? Kilka miesięcy temu Google uruchomił testową wersję serwisu tłumaczącego strony WWW z niemieckiego, francuskiego i hiszpańskiego na angielski. Wystarczy wejść na stronę Google, wprowadzić adres strony i po chwili pojawi się ona kompletnie przetłumaczona. Często korzystam z tej możliwości, zaglądając na strony „Le Monde” czy niemieckich gazet, które w oryginale wyświetlane są w językach, których znajomości w stopniu odpowiednim nie posiadłem.

Serwis tłumaczący Google spotkał się z olbrzymim zainteresowaniem, choć trzeba przyznać, że nie był pierwszy. Wcześniej podobny oferowała AltaVista oraz kilka firm zajmujących się technologiami maszynowego tłumaczenia.

_Jedną z nich jest firma Translation Experts (http://www.transexp.com) oferująca kilka programów tłumaczących pomiędzy kilkunastoma językami. Większość serwisów ogranicza się do pięciu-sześciu popularnych języków zachodnioeuropejskich oraz rosyjskiego i chińskiego. Translation Experts jest wyjątkiem – potrafi zamienić również z języka polskiego i na niego. _

Postanawiam przyjrzeć się kilku stronom. Pierwszą jest mój ulubiony portal Yahoo!

Zawsze myślałem, że nazwa portalu pochodzi od okrzyku radości, który tak właśnie brzmi w języku angielskim. System tłumaczący twierdzi jednak, że Yahoo! to po polsku Człowiek! Niech im tak będzie. Patrzę dalej na strony Człowiek! i widzę dużo różnych ciekawych rzeczy.

Człowiek! w wielu przypadkach był dla mnie inspiracją. Nie podejrzewałem, że w tak prosty sposób można nazwać rzeczy po imieniu. Na przykład nigdy nie by mi do głowy, aby nazwać komputer „rachmistrzem” – a tak właśnie brzmi w wersji tłumaczonej. Trudno jednak od programu tłumaczącego wymagać, aby na podstawie jednego słowa potrafił dobrać odpowiadający mu z kontekstu właściwy wyraz w naszym języku. Niezrażony tym postanowiłem dalej eksplorować polskie Yahoo! – przepraszam – Człowiek! Już na początku strony zaproszony zostałem, aby „zrobić pewien Połączenie z Człowiek! Osobisty”. Chodzi oczywiście o popularny serwis dla samotnych Yahoo!

Powiem szczerze, że trochę zniechęcony, ale pełen nadziei postanowiłem zobaczyć, co też Człowiek! ma do powiedzenia „w temacie” „Poland”. Wpisałem hasło w wyszukiwarce. Oj… nie był to dobry pomysł. Człowiek! przedstawił mi stronę z podziałem na kilka części. Pierwsza to: „Wnętrze Człowiek! Zapałki”. Nie, nie chodzi o strony produkujące zapałki, tylko tzw. Yahoo! Matches – czyli kategorie związane z tematem, które proponuje mi portal.

Kolejna część jest dla mnie do dziś zagadką. No bo niby co to ma być: „Ojciec Zapałki”? Analizowałem oryginał i nie wiem. Człowiek! jakby rozumiał moje zakłopotanie i po prawej stronie zdał pytanie: „Co (jesteście Ojciec Zapałki?)”. Nie i nie chcę być.

_W końcu pojawia się coś, co jestem w stanie pojąć, czyli grupa: „Tkanina Umiejscowienie Zapałki” – chodzi o Web Site Matches. Są tu różne adresy, niektóre mało ciekawe, inne wręcz przeciwnie. Każdy adres ma krótki opis – jak to w katalogu portalowym. Główna polska strona (http://www.polska.pl) ma opis następujący: „rząd piasta umiejscowienie ów ma ogniwa wobec tereny pod kątem urzędnicy, biura i ministerstwa”. Rozumiem, że tereny pod kątem rządu, ale „piasta” to u nas już długo nie ma. Nie wiedziałem, że w Krakowie jest „Wszczynać od Fizyka jądrowa”, czyli Instytut Fizyki Jądrowej. W Warszawie za to znajduje się „Najwyższy Court od ten Republika od Polska Zasmucony Najwyższy Rzeczpospolitej Polskiej” – co oczywiście oznacza strony Sądu Najwyższego, który jak każdy sąd jest chyba poważny, a nie zasmucony. _

Jest jednak strona, która mnie zaciekawia. Według opisu „zawiera pewien profil od ten prezydent i ten gabinet, i pewien tło od prezydencki pałac”, czyli link do strony prezydenckiej. Po chwili już tam jestem. Wiele elementów jest tak nowatorskich, że nie mogę ich nie przytoczyć. Okazuje się, że Aleksander Kwaśniewski urodził się w Białogardzie, „dawniej Koszalin Województwo, wkrótce Zachód – Pomorski Prowincja”. W latach 1973-77 „przeczytać pod kątem transportować ekonomika (handel zagraniczny)” – czyli studiował ekonomikę transportu. W 1985 roku „PEWIEN co – założyciel od ten pierwszy rachmistrz – nauka periodyczny w Polska „Bajtek” w 1985″ – był po prostu inicjatorem powstania pierwszego popularnego czasopisma komputerowego „Bajtek”.

W 1985 roku, jak niektórzy pamiętają, Aleksander Kwaśniewski został ministrem „pod kątem Młodość Sprawy” w „Zbigniew Nieład rząd” – czyli rządzie Zbigniewa Messnera. Rzeczywiście był to rząd nieładu – sam pamiętam. Wiemy też, że obecny prezydent był „PEWIEN członek od ten Polski Zjednoczony Pracownicy Stron”. Później zacząłem się nieco gubić w partiach, w jakich prezydent był. Bo okazuje się, że miał coś wspólnego z „Towarzyski Demokratyczny Strona”, by później (w 1991 roku) być jednym z inicjatorów powstania „Demokratyczny Zostawiać Sojusz”.

Bardzo ciekawe są odznaczenia, jakie nasz prezydent otrzymał. Na przykład Wielka Brytania uhonorowała go „Rycerz Duży od ten Najliczniejszy Honorowy Klasa od ten Kąpiel”. W Portugalii za to uhonorowano prezydenta odznaczeniem „Klasa od Niemowlę Henry z Duży Wstążka”, a w Estonii – „z ten Wstążka od Ziemia Kobyły”.

Po tych lekturach wróciłem do Człowieka!, gdzie na końcu strony proponuje: „dostać Człowiek! Towarzysz wobec zrewidować ten tkanina z gdziekolwiek”. Ja już „zrewidować ten tkanina” nie mam sił.

Stanisław M. Stanuch – KOMPUTER nr 8 dodatek do Gazety Wyborczej nr 42, wydanie waw z dnia 19/02/2002 , str. 3