OD 11.02.2011 FORUM PEŁNI WYŁĄCZNIE ROLĘ ARCHIWALNĄ. NIE JEST MOŻLIWA REJESTRACJA ANI DODAWANIE WYPOWIEDZI.
kognitywistyka.net: forum Strona Główna
 FAQ   Szukaj   Użytkownicy   Grupy   Rejestracja   Profil   Zaloguj się, by sprawdzić wiadomości   Zaloguj 

 Ogłoszenie 
OD 11.02.2011 FORUM PEŁNI WYŁĄCZNIE ROLĘ ARCHIWALNĄ. NIE JEST MOŻLIWA REJESTRACJA ANI DODAWANIE WYPOWIEDZI.

Poprzedni temat «» Następny temat
MDS (Multidimensional Scaling) w semantyce
Autor Wiadomość
Maciej Pastuszka


Posty: 2
Skąd: Wrocław
Wysłany: 2006-12-08, 20:51   MDS (Multidimensional Scaling) w semantyce

Przede wszystkim gorąco witam wszystkich uczestników forum. :)

Mam pytanie:

Od pewnego czasu prowadzę badania nad przetwarzaniem danych semantycznych za pomocą komputerów.

Miałem okazję czytać materiały Pana prof. Ducha w tym temacie (przykład z porównaniem cech różnych gatunków zwierząt następnie przedstawiony w dwóch wymiarach). Niestety zrozumienie wzorów związanych z MDS jest na razie poza moim zasięgiem (jako anglisty, a nie matematyka).

Czy ktoś może orientuje się, gdzie można znaleźć "łopatologiczne" materiały nt. MDS, ewentualnie gotowe biblioteki / komponenty napisane w C++, Delphi lub Javie?

Może po prostu powinienem obrać inną formę prezentacji danych? Obliczanie dystansu znaczeniowego między pojęciami w więcej niż 3 wymiarach nie będzie raczej dobrym wyjściem - przydałoby się coś "mniejwymiarowego",bardziej Euklidesowego ;)

Z góry dziękuję za odzew,

Maciek.

P.S. Dzisiaj trafiłem w sieci na program PERMAP (Perceptual Mapping Software). Nie wiem jeszcze wiele na jego temat, ale wygląda obiecująco. :) No i jest bezpłatny! :D

Link dla zainteresowanych:
http://www.ucs.louisiana.edu/~rbh8900/permap.html :D
Ostatnio zmieniony przez Maciej Pastuszka 2006-12-08, 21:19, w całości zmieniany 2 razy  
 
 
Marcin Ciesielski

Posty: 29
Skąd: Kutno, Warszawa
Wysłany: 2006-12-09, 23:55   Re: MDS (Multidimensional Scaling) w semantyce

Maciej Pastuszka napisał/a:
Może po prostu powinienem obrać inną formę prezentacji danych? Obliczanie dystansu znaczeniowego między pojęciami w więcej niż 3 wymiarach nie będzie raczej dobrym wyjściem - przydałoby się coś "mniejwymiarowego",bardziej Euklidesowego ;)

Być może analiza skupień byłaby dobrą metodą obliczania dystansu - wykresy prezentowane w formie dendrogramów są dość czytelne. Zarówno MDS, jak i analiza skupień są dostępne i dość łatwe do przeprowadzenia w programie Statistica. Tu można znaleźć podręcznik, który dość prosto opisuje różne metody statystyczne użyte w tym programie: http://www.statsoft.pl/textbook/stathome.html. Notabene, obliczanie metryki euklidesowej jest tak samo łatwe dla dowolnej liczby wymiarów - wystarczy wyciągnąć pierwiastek kwadratowy z sumy kwadratów różnic poszczególnych składowych, określających położenie punktów w przestrzeni, niezależnie od tego, ile ich jest.

Chciałbym jeszcze zapytać, za pomocą jakich parametrów liczbowych opisuje się znaczenie wyrazów, tak żeby można było określać ich położenie w przestrzeni?
Ostatnio zmieniony przez Marcin Ciesielski 2006-12-09, 23:58, w całości zmieniany 2 razy  
 
 
Maciej Pastuszka


Posty: 2
Skąd: Wrocław
Wysłany: 2006-12-10, 22:18   

Dzięki za odpowiedź.

Hmmm... Czyli od matematycznej strony po prostu mogę sobie zostać przy wyliczaniu pierwiastka z sumy kwadratów wartości pochodzących ze wszystkich wymiarów... taka wielowymiarowa wersja pierwiastka z twierdzenia Pitagorasa :-).

W kwestii "odległości" między słowami, to widzę, że jest kilka teorii w tym temacie. Najłatwiej jest oczywiście wybrać sobie ograniczoną grupę obiektów (np. zwierzęta) i kolejne wymiary oprzeć na cechach, które mogą posiadać - czasem wystarczy reprezentacja binarna (np. 1 - ma ogon, 0 - nie ma ogona).

Więcej informacji od str. 18 w prezentacji prof. Ducha
http://www.fizyka.umk.pl/.../CIS/CIS-11.ppt

W taki sposób można sobie stworzyć proste mapy semantyczne, ale binarne wartości znacznie ograniczają możliwości porównania różnych słów pod kątem semantycznym - w końcu mało co jest tylko czarne lub białe.

Stąd pojawiły się różne pomysły, np. bazujący na UMLu, SOM (Semantic Object Modeling). Niestety nie wyznacza on uniwersalnego modelu porównawczego dla wszystkich słów ani nawet dla jednej większej grupy, np. rzeczowników.

Jest też drugi "SOM" (Self-Organizing Maps) - wg mojej subiektywnej oceny bardzo ciekawe podejście, w którym badania nad semantyką oparto na sieciach neuronowych. Można o nim poczytać m.in. w książce M.J. Kasperskiego "Sztuczna Inteligencja", str.160.

Aktualnie sam "bawię się" bardzo prostym kilkuwymiarowym modelem semantycznym opartym na bardzo ograniczonym leksykonie (poniżej 100 słów), mam kilka pomysłów. ale nie jestem niestety ekspertem w tej dziedzinie. :D

Mogę jeszcze polecić wcześniejsze, klasyczne pomysły "klasyfikacji" słów (i nie tylko), np. pracę Marvina Minsky'ego:
http://web.media.mit.edu/...mes/frames.html

Jeśli dobrze pamiętam, to uczeń N. Chomsky'ego, Ray Jackendoff, poświęcił wiele uwagi tworzeniu interfejsu pomiędzy składnią a semantyką.

W sumie w erze data-mining, temat jest dosyć ciekawy. Może uda się rozwinąć tą dyskusję :?
Ostatnio zmieniony przez Maciej Pastuszka 2006-12-10, 22:22, w całości zmieniany 2 razy  
 
 
Wyświetl posty z ostatnich:   
Odpowiedz do tematu
Nie możesz pisać nowych tematów
Nie możesz odpowiadać w tematach
Nie możesz zmieniać swoich postów
Nie możesz usuwać swoich postów
Nie możesz głosować w ankietach
Nie możesz załączać plików na tym forum
Możesz ściągać załączniki na tym forum
Dodaj temat do Ulubionych
Wersja do druku

Skocz do:  

Support forum phpbb by phpBB Assistant
Powered by phpBB modified by Przemo © 2003 phpBB Group
Theme xandgreen created by spleen modified v0.3 by warna

CogNews.net




Patronat Medialny kognitywistyka.net

patronat medialny

patronat medialny


Dni Mózgu 4

patronat medialny


Ways to protolanguage