OD 11.02.2011 FORUM PEŁNI WYŁĄCZNIE ROLĘ ARCHIWALNĄ. NIE JEST MOŻLIWA REJESTRACJA ANI DODAWANIE WYPOWIEDZI.
kognitywistyka.net: forum Strona Główna
 FAQ   Szukaj   Użytkownicy   Grupy   Rejestracja   Profil   Zaloguj się, by sprawdzić wiadomości   Zaloguj 

 Ogłoszenie 
OD 11.02.2011 FORUM PEŁNI WYŁĄCZNIE ROLĘ ARCHIWALNĄ. NIE JEST MOŻLIWA REJESTRACJA ANI DODAWANIE WYPOWIEDZI.

Poprzedni temat «» Następny temat
NLP - natural language processing
Autor Wiadomość
Jarek Mazurek.


Posty: 700
Skąd: Szczecin
Wysłany: 2008-05-16, 10:54   NLP - natural language processing

Pozwoliłem sobie założyć oddzielny wątek na temat analizy języka naturalnego ponieważ jest to dość obszerna dziedzina i chyba nie poruszana na forum w jednym miejscu.

Tematy jakie ja chciałbym poruszać:
- automatyczne translatory języków naturalnych
- rozumienie maszynowe
- syntezatory mowy (a nawet śpiewu)

Zacznę od doniesienia o nowym pomyśle (coraz dynamiczniej rozwijających się google).
Firma stworzyła translator wielojęzyczny (w tym polski). Nowością wśród translatorów jest funkcja "Zaproponuj lepsze tłumaczenie". Ciekawe jak to się przełoży na jakość tłumaczenia.

Porównałem tłumaczenia małego tekstu w kilku translatorach.
Okazało się, że przy niektórych tekstach google wypadły dość ładnie w porównaniu z innymi.

Obszerniejszy tekst skopiowałem z www.sciencemag.org, tu przytaczam jedno zdanie.
Np.
Cytat:
Various brain imaging techniques have become available in the past decade

http://www.translatica.pl:
Cytat:
Rozmaite metody obrazowania mózgowe stały się dostępne w ubiegłym dziesięcioleciu.

English Translator 3.21:
Cytat:
Różny mózg obrazujący techniki stali się uchwytni w przeszłej dekadzie

http://translate.google.pl:
Cytat:
Różne techniki obrazowania mózgu, które stały się dostępne w ciągu ostatnich dziesięciu lat.

Przy innych tekstach bywa, że zupełnie nie wiadomo o co chodzi, ale to dopiero początki.
_________________
"...jeśli tylko potrafimy sobie coś wyobrazić, to prędzej czy później ktoś to zrobi..."
Ostatnio zmieniony przez Jarek Mazurek. 2008-05-16, 11:57, w całości zmieniany 3 razy  
 
 
Leszek Nowaczyk
Administrator


Posty: 765
Skąd: Poznań
Wysłany: 2008-05-16, 19:21   

Witam,

Jarek Mazurek napisał/a:
Pozwoliłem sobie założyć oddzielny wątek na temat analizy języka naturalnego ponieważ jest to dość obszerna dziedzina i chyba nie poruszana na forum w jednym miejscu.


na "nowym forum" jest taki oto wątek, a wydaje mi się, że i na "starym" też coś było.

Ponieważ sporo czasu upłynęło od ostatnich aktywności w tym obszarze traktujmy Twój wpis, Jarku, jako nowe otwarcie :-)

Pozdrawiam
 
 
Jarek Mazurek.


Posty: 700
Skąd: Szczecin
Wysłany: 2008-05-17, 12:26   

Rzeczywiście o wpisie Bartosza zapomniałem, a "szukaj" użyłem tylko raz.
Ale stało się. Ponieważ ta tematyka mnie bardzo interesuje, być może będę pisał (jak Janusz w temacie świadomości [pisz Januszu ja to też czytam]) sam do siebie.
Postaram się też pokazać własne osiągnięcia.
Pośród wielu prowadzonych równolegle projektów pracuję nad syntezatorem mowy polskiej.
Na razie generuję słowa w prosty sposób łącząc fonemy, ale efekt jest dość brzydki.
Inspirując się na japońskiej kanie (pismo sylabiczne) pomyślałem, że wyraźniejsze brzmienie (przy jednocześnie ograniczonej ilości próbek) można uzyskać sklejając sylaby.
Nie mam zamiaru ścigać się z IVONĄ jeśli chodzi o jakość ale można powalczyć na polu miniaturyzacji lub generowania naprawdę syntetycznego głosu, a nie bazowaniu na megabajtach nagranych próbek.
Inny ciekawy efekt do uzyskania (ale już na PC) to generowanie wypowiedzi głosami znanych ludzi. Niestety wydaje mi się, że automatyczna akwizycja fonemów czy sylab z dłuższych wypowiedzi nie wchodzi w grę. Trzeba to zrobić dla każdego głosu (osoby) samemu.
Do zabaw z dźwiękiem używam darmowego ale dość dobrego programu audacity. Może ktoś zna lepsze oprogramowanie, szczególnie wspierające operacje na mowie ?

Na koniec link do loquendo - ładnie brzmiącego , wielojęzycznego syntezatora online (max 500 znaków).
Cytat:
Proces syntezy mowy dzielimy na dwa etapy. W pierwszym z nich program wydobywa z wprowadzonej frazy jak najwieksza ilosc informacji lingwistycznych - stara sie zrozumiec tekst.
_________________
"...jeśli tylko potrafimy sobie coś wyobrazić, to prędzej czy później ktoś to zrobi..."
Ostatnio zmieniony przez Jarek Mazurek. 2008-05-18, 00:51, w całości zmieniany 4 razy  
 
 
Slawomir Wacewicz
Administrator


Posty: 1117
Skąd: Toruń
Wysłany: 2008-05-17, 16:07   

Dziękujemy Zosi za pozdrowienia!
_________________
http://www.home.umk.pl/~wacewicz/
 
 
Jarek Mazurek.


Posty: 700
Skąd: Szczecin
Wysłany: 2008-05-26, 08:52   

Natrafiłem ostatnio na wyrażenie które nazywa i opisuje coś co było od kilku lat moją obsesją, a nie potrafiłem jej zwerbalizować, a mianowicie sieć semantyczna.
Moja sugestia aby np. Wikipedia była czytelna również dla programów komputerowych może się dość szybko zmaterializować.
_________________
"...jeśli tylko potrafimy sobie coś wyobrazić, to prędzej czy później ktoś to zrobi..."
Ostatnio zmieniony przez Jarek Mazurek. 2009-02-22, 14:09, w całości zmieniany 3 razy  
 
 
Jarek Mazurek.


Posty: 700
Skąd: Szczecin
Wysłany: 2010-02-13, 09:53   

Universal Translator to następny pomysł Google.
Za kilka lat będzie tłumaczył prawie na żywo rozmowę telefoniczną.
Firma ma:
- duże doświadczenie w tłumaczeniu stron internetowych
- ogromną bazę tekstów
- radzi sobie z nieprecyzyjnymi zapytaniami
- zna oczekiwania użytkowników
- potrafi syntezować mowę
- stworzyła system operacyjny (Android)
- zajmuje się telefonami komórkowymi .
Myślę, że coś z tego będzie, choć na dzień dzisiejszy część tłumaczeń jest kompletnie niezrozumiała.
Art. w Timesonline.
_________________
"...jeśli tylko potrafimy sobie coś wyobrazić, to prędzej czy później ktoś to zrobi..."
 
 
janusz kamiński

Posty: 635
Skąd: Gdynia
Wysłany: 2010-02-13, 11:13   

Czy przypadkiem Jarku, twoje marzenie nie zostało już zrealizowane? Akurat zapomniałem nazwę (na pewno nie android :) ), a latem ubiegłego roku zaczęła działać wyszukiwarka (nie korzystałem), która kontekstowo odpowiada na pytania. Podobno konkretnie, a nie jak gugle odsyłając dalej.
Czy nazwa to nie przypadkiem Wolfram?

ps. z androida korzystam w htc. Nie mogę się nachwalić.
_________________
"Gdy zastanawiam się nad sobą i swoimi sposobami myślenia, jestem bliski wniosku, że dar fantazjowania znaczył dla mnie więcej niż mój talent przyswajania wiedzy."
ALBERT EINSTEIN
Ostatnio zmieniony przez janusz kamiński 2010-02-13, 11:14, w całości zmieniany 1 raz  
 
 
Jarek Mazurek.


Posty: 700
Skąd: Szczecin
Wysłany: 2010-02-13, 12:57   

Tak, Wolfram miał potrafić odpowiadać na pytania zadawane językiem naturalnym.
Nawet pisałem o nim na tym forum. .
Niestety nie potrafię tego ocenić.

Jednak Google chce pójść o kilka kroków dalej:

1. rejestrować głos w telefonie komórkowym jakimiś porcjami
2. wysłać do swoich serwerów (albo sam dźwięk, albo już zamieniony na tekst)
3. zamienić mowę na tekst z podziałem na zdania / zwroty, uwzględniając akcent, seplenienie itp.
4. zrozumieć sens wypowiedzi
5. przetłumaczyć sens na drugi język
6. wygenerować poprawne zdanie tekstowe
7. wygenerować (już chyba w telefonie) mowę na podstawie tekstu

Punkty 1,2,6,7 już teraz są dość dobrze realizowane
Punkty 3,5 sprawiają problemy (nie wiem jak sobie poradzą z językami tonalnymi )
Punkt 4 jest realizowany poprzez mechaniczne zastępowanie jednych zwrotów innymi z ogromnej bazy, bez zastanawiania się co jest tematem rozmowy, jakie intencje ma rozmówca itp.

Główną nowością dla użytkownika końcowego jest złudzenie, że to wszystko siedzi w małym telefonie komórkowym.

Androida zainstalowałem sobie w moim linuksowym NEO (400MHz), ale responsywność była tak straszna, że szybko się go pozbyłem.
Ciekawe jakie opóźnienia będą w tłumaczeniu ?.
_________________
"...jeśli tylko potrafimy sobie coś wyobrazić, to prędzej czy później ktoś to zrobi..."
 
 
Wyświetl posty z ostatnich:   
Odpowiedz do tematu
Nie możesz pisać nowych tematów
Nie możesz odpowiadać w tematach
Nie możesz zmieniać swoich postów
Nie możesz usuwać swoich postów
Nie możesz głosować w ankietach
Nie możesz załączać plików na tym forum
Możesz ściągać załączniki na tym forum
Dodaj temat do Ulubionych
Wersja do druku

Skocz do:  

Support forum phpbb by phpBB Assistant
Powered by phpBB modified by Przemo © 2003 phpBB Group
Theme xandgreen created by spleen modified v0.3 by warna

CogNews.net




Patronat Medialny kognitywistyka.net

patronat medialny

patronat medialny


Dni Mózgu 4

patronat medialny


Ways to protolanguage