kognitywistyka.net: forum
Umysł - Mózg - Sztuczna Inteligencja

Neuronauki - MDS (Multidimensional Scaling) w semantyce

Maciej Pastuszka - 2006-12-08, 20:51
Temat postu: MDS (Multidimensional Scaling) w semantyce
Przede wszystkim gorąco witam wszystkich uczestników forum. :)

Mam pytanie:

Od pewnego czasu prowadzę badania nad przetwarzaniem danych semantycznych za pomocą komputerów.

Miałem okazję czytać materiały Pana prof. Ducha w tym temacie (przykład z porównaniem cech różnych gatunków zwierząt następnie przedstawiony w dwóch wymiarach). Niestety zrozumienie wzorów związanych z MDS jest na razie poza moim zasięgiem (jako anglisty, a nie matematyka).

Czy ktoś może orientuje się, gdzie można znaleźć "łopatologiczne" materiały nt. MDS, ewentualnie gotowe biblioteki / komponenty napisane w C++, Delphi lub Javie?

Może po prostu powinienem obrać inną formę prezentacji danych? Obliczanie dystansu znaczeniowego między pojęciami w więcej niż 3 wymiarach nie będzie raczej dobrym wyjściem - przydałoby się coś "mniejwymiarowego",bardziej Euklidesowego ;)

Z góry dziękuję za odzew,

Maciek.

P.S. Dzisiaj trafiłem w sieci na program PERMAP (Perceptual Mapping Software). Nie wiem jeszcze wiele na jego temat, ale wygląda obiecująco. :) No i jest bezpłatny! :D

Link dla zainteresowanych:
http://www.ucs.louisiana.edu/~rbh8900/permap.html :D

Marcin Ciesielski - 2006-12-09, 23:55
Temat postu: Re: MDS (Multidimensional Scaling) w semantyce
Maciej Pastuszka napisał/a:
Może po prostu powinienem obrać inną formę prezentacji danych? Obliczanie dystansu znaczeniowego między pojęciami w więcej niż 3 wymiarach nie będzie raczej dobrym wyjściem - przydałoby się coś "mniejwymiarowego",bardziej Euklidesowego ;)

Być może analiza skupień byłaby dobrą metodą obliczania dystansu - wykresy prezentowane w formie dendrogramów są dość czytelne. Zarówno MDS, jak i analiza skupień są dostępne i dość łatwe do przeprowadzenia w programie Statistica. Tu można znaleźć podręcznik, który dość prosto opisuje różne metody statystyczne użyte w tym programie: http://www.statsoft.pl/textbook/stathome.html. Notabene, obliczanie metryki euklidesowej jest tak samo łatwe dla dowolnej liczby wymiarów - wystarczy wyciągnąć pierwiastek kwadratowy z sumy kwadratów różnic poszczególnych składowych, określających położenie punktów w przestrzeni, niezależnie od tego, ile ich jest.

Chciałbym jeszcze zapytać, za pomocą jakich parametrów liczbowych opisuje się znaczenie wyrazów, tak żeby można było określać ich położenie w przestrzeni?

Maciej Pastuszka - 2006-12-10, 22:18

Dzięki za odpowiedź.

Hmmm... Czyli od matematycznej strony po prostu mogę sobie zostać przy wyliczaniu pierwiastka z sumy kwadratów wartości pochodzących ze wszystkich wymiarów... taka wielowymiarowa wersja pierwiastka z twierdzenia Pitagorasa :-).

W kwestii "odległości" między słowami, to widzę, że jest kilka teorii w tym temacie. Najłatwiej jest oczywiście wybrać sobie ograniczoną grupę obiektów (np. zwierzęta) i kolejne wymiary oprzeć na cechach, które mogą posiadać - czasem wystarczy reprezentacja binarna (np. 1 - ma ogon, 0 - nie ma ogona).

Więcej informacji od str. 18 w prezentacji prof. Ducha
http://www.fizyka.umk.pl/.../CIS/CIS-11.ppt

W taki sposób można sobie stworzyć proste mapy semantyczne, ale binarne wartości znacznie ograniczają możliwości porównania różnych słów pod kątem semantycznym - w końcu mało co jest tylko czarne lub białe.

Stąd pojawiły się różne pomysły, np. bazujący na UMLu, SOM (Semantic Object Modeling). Niestety nie wyznacza on uniwersalnego modelu porównawczego dla wszystkich słów ani nawet dla jednej większej grupy, np. rzeczowników.

Jest też drugi "SOM" (Self-Organizing Maps) - wg mojej subiektywnej oceny bardzo ciekawe podejście, w którym badania nad semantyką oparto na sieciach neuronowych. Można o nim poczytać m.in. w książce M.J. Kasperskiego "Sztuczna Inteligencja", str.160.

Aktualnie sam "bawię się" bardzo prostym kilkuwymiarowym modelem semantycznym opartym na bardzo ograniczonym leksykonie (poniżej 100 słów), mam kilka pomysłów. ale nie jestem niestety ekspertem w tej dziedzinie. :D

Mogę jeszcze polecić wcześniejsze, klasyczne pomysły "klasyfikacji" słów (i nie tylko), np. pracę Marvina Minsky'ego:
http://web.media.mit.edu/...mes/frames.html

Jeśli dobrze pamiętam, to uczeń N. Chomsky'ego, Ray Jackendoff, poświęcił wiele uwagi tworzeniu interfejsu pomiędzy składnią a semantyką.

W sumie w erze data-mining, temat jest dosyć ciekawy. Może uda się rozwinąć tą dyskusję :?


Powered by phpBB modified by Przemo © 2003 phpBB Group