Wysłany: 2008-05-16, 09:54 NLP - natural language processing
Pozwoliłem sobie założyć oddzielny wątek na temat analizy języka naturalnego ponieważ jest to dość obszerna dziedzina i chyba nie poruszana na forum w jednym miejscu.
Tematy jakie ja chciałbym poruszać:
- automatyczne translatory języków naturalnych
- rozumienie maszynowe
- syntezatory mowy (a nawet śpiewu)
Zacznę od doniesienia o nowym pomyśle (coraz dynamiczniej rozwijających się google).
Firma stworzyła translator wielojęzyczny (w tym polski). Nowością wśród translatorów jest funkcja "Zaproponuj lepsze tłumaczenie". Ciekawe jak to się przełoży na jakość tłumaczenia.
Porównałem tłumaczenia małego tekstu w kilku translatorach.
Okazało się, że przy niektórych tekstach google wypadły dość ładnie w porównaniu z innymi.
Obszerniejszy tekst skopiowałem z www.sciencemag.org, tu przytaczam jedno zdanie.
Np.
Cytat:
Various brain imaging techniques have become available in the past decade
Pozwoliłem sobie założyć oddzielny wątek na temat analizy języka naturalnego ponieważ jest to dość obszerna dziedzina i chyba nie poruszana na forum w jednym miejscu.
na "nowym forum" jest taki oto wątek, a wydaje mi się, że i na "starym" też coś było.
Ponieważ sporo czasu upłynęło od ostatnich aktywności w tym obszarze traktujmy Twój wpis, Jarku, jako nowe otwarcie :-)
Rzeczywiście o wpisie Bartosza zapomniałem, a "szukaj" użyłem tylko raz.
Ale stało się. Ponieważ ta tematyka mnie bardzo interesuje, być może będę pisał (jak Janusz w temacie świadomości [pisz Januszu ja to też czytam]) sam do siebie.
Postaram się też pokazać własne osiągnięcia.
Pośród wielu prowadzonych równolegle projektów pracuję nad syntezatorem mowy polskiej.
Na razie generuję słowa w prosty sposób łącząc fonemy, ale efekt jest dość brzydki.
Inspirując się na japońskiej kanie (pismo sylabiczne) pomyślałem, że wyraźniejsze brzmienie (przy jednocześnie ograniczonej ilości próbek) można uzyskać sklejając sylaby.
Nie mam zamiaru ścigać się z IVONĄ jeśli chodzi o jakość ale można powalczyć na polu miniaturyzacji lub generowania naprawdę syntetycznego głosu, a nie bazowaniu na megabajtach nagranych próbek.
Inny ciekawy efekt do uzyskania (ale już na PC) to generowanie wypowiedzi głosami znanych ludzi. Niestety wydaje mi się, że automatyczna akwizycja fonemów czy sylab z dłuższych wypowiedzi nie wchodzi w grę. Trzeba to zrobić dla każdego głosu (osoby) samemu.
Do zabaw z dźwiękiem używam darmowego ale dość dobrego programu audacity. Może ktoś zna lepsze oprogramowanie, szczególnie wspierające operacje na mowie ?
Na koniec link do loquendo - ładnie brzmiącego , wielojęzycznego syntezatora online (max 500 znaków).
Cytat:
Proces syntezy mowy dzielimy na dwa etapy. W pierwszym z nich program wydobywa z wprowadzonej frazy jak najwieksza ilosc informacji lingwistycznych - stara sie zrozumiec tekst.
_________________ "...jeśli tylko potrafimy sobie coś wyobrazić, to prędzej czy później ktoś to zrobi..."
Ostatnio zmieniony przez Jarek Mazurek. 2008-05-17, 23:51, w całości zmieniany 4 razy
Natrafiłem ostatnio na wyrażenie które nazywa i opisuje coś co było od kilku lat moją obsesją, a nie potrafiłem jej zwerbalizować, a mianowicie sieć semantyczna.
Moja sugestia aby np. Wikipedia była czytelna również dla programów komputerowych może się dość szybko zmaterializować.
_________________ "...jeśli tylko potrafimy sobie coś wyobrazić, to prędzej czy później ktoś to zrobi..."
Ostatnio zmieniony przez Jarek Mazurek. 2009-02-22, 14:09, w całości zmieniany 3 razy
Universal Translator to następny pomysł Google.
Za kilka lat będzie tłumaczył prawie na żywo rozmowę telefoniczną.
Firma ma:
- duże doświadczenie w tłumaczeniu stron internetowych
- ogromną bazę tekstów
- radzi sobie z nieprecyzyjnymi zapytaniami
- zna oczekiwania użytkowników
- potrafi syntezować mowę
- stworzyła system operacyjny (Android)
- zajmuje się telefonami komórkowymi .
Myślę, że coś z tego będzie, choć na dzień dzisiejszy część tłumaczeń jest kompletnie niezrozumiała.
Art. w Timesonline.
_________________ "...jeśli tylko potrafimy sobie coś wyobrazić, to prędzej czy później ktoś to zrobi..."
Czy przypadkiem Jarku, twoje marzenie nie zostało już zrealizowane? Akurat zapomniałem nazwę (na pewno nie android ), a latem ubiegłego roku zaczęła działać wyszukiwarka (nie korzystałem), która kontekstowo odpowiada na pytania. Podobno konkretnie, a nie jak gugle odsyłając dalej.
Czy nazwa to nie przypadkiem Wolfram?
ps. z androida korzystam w htc. Nie mogę się nachwalić.
_________________ "Gdy zastanawiam się nad sobą i swoimi sposobami myślenia, jestem bliski wniosku, że dar fantazjowania znaczył dla mnie więcej niż mój talent przyswajania wiedzy."
ALBERT EINSTEIN
Ostatnio zmieniony przez janusz kamiński 2010-02-13, 11:14, w całości zmieniany 1 raz
Tak, Wolfram miał potrafić odpowiadać na pytania zadawane językiem naturalnym.
Nawet pisałem o nim na tym forum. .
Niestety nie potrafię tego ocenić.
Jednak Google chce pójść o kilka kroków dalej:
1. rejestrować głos w telefonie komórkowym jakimiś porcjami
2. wysłać do swoich serwerów (albo sam dźwięk, albo już zamieniony na tekst)
3. zamienić mowę na tekst z podziałem na zdania / zwroty, uwzględniając akcent, seplenienie itp.
4. zrozumieć sens wypowiedzi
5. przetłumaczyć sens na drugi język
6. wygenerować poprawne zdanie tekstowe
7. wygenerować (już chyba w telefonie) mowę na podstawie tekstu
Punkty 1,2,6,7 już teraz są dość dobrze realizowane
Punkty 3,5 sprawiają problemy (nie wiem jak sobie poradzą z językami tonalnymi )
Punkt 4 jest realizowany poprzez mechaniczne zastępowanie jednych zwrotów innymi z ogromnej bazy, bez zastanawiania się co jest tematem rozmowy, jakie intencje ma rozmówca itp.
Główną nowością dla użytkownika końcowego jest złudzenie, że to wszystko siedzi w małym telefonie komórkowym.
Androida zainstalowałem sobie w moim linuksowym NEO (400MHz), ale responsywność była tak straszna, że szybko się go pozbyłem.
Ciekawe jakie opóźnienia będą w tłumaczeniu ?.
_________________ "...jeśli tylko potrafimy sobie coś wyobrazić, to prędzej czy później ktoś to zrobi..."
Nie możesz pisać nowych tematów Nie możesz odpowiadać w tematach Nie możesz zmieniać swoich postów Nie możesz usuwać swoich postów Nie możesz głosować w ankietach Nie możesz załączać plików na tym forum Możesz ściągać załączniki na tym forum