Metrics and similarities in modeling dependencies between continuous and nominal data
Journal Title: Zeszyty Naukowe Warszawskiej Wyższej Szkoły Informatyki - Year 2013, Vol 7, Issue 10
Abstract
Classification theory analytical paradigm investigates continuous data only. When we deal with a mix of continuous and nominal attributes in data records, difficulties emerge. Usually, the analytical paradigm treats nominal attributes as continuous ones via numerical coding of nominal values (often a bit ad hoc). We propose a way of keeping nominal values within analytical paradigm with no pretending that nominal values are continuous. The core idea is that the information hidden in nominal values influences on metric (or on similarity function) between records of continuous and nominal data. Adaptation finds relevant parameters which influence metric between data records. Our approach works well for classifier induction algorithms where metric or similarity is generic, for instance k nearest neighbor algorithm or proposed here support of decision tree induction by similarity function between data. The k-nn algorithm working with continuous and nominal data behaves considerably better, when nominal values are processed by our approach. Algorithms of analytical paradigm using linear and probability machinery, like discriminant adaptive nearest-neighbor or Fisher’s linear discriminant analysis, cause some difficulties. We propose some possible ways to overcome these obstacles for adaptive nearest neighbor algorithm.
Authors and Affiliations
Michał Grabowski
Przygotowanie i technika prowadzenia kursu on-line w modelu hybrydowym
W artykule opisano udaną próbę wykorzystania Internetu do przygotowania i poprowadzenia kursu w modelu hybrydowym. Przygotowane materiały dydaktyczne wraz z układem testów samosprawdzających pozwalają studentom na samodz...
Model motywacji nauczyciela i studentów podczas nabywania kompetencji
Artykuł prezentuje pomysł na opracowanie modelu motywacji, mający na celu wspieranie aktywności zarówno studentów, jak i nauczycieli przy wdrażaniu i wykorzystaniu systemu otwartego nauczania na odległość. Opisano strukt...
Raport końcowy z badań prowadzonych w ramach projektu „EFEKTYWNI 50+”
Praca jest raportem końcowym z badań prowadzonych w ramach projektu „EFEKTYWNI 50+”
Cloud computing jako środowisko integracji usług informatycznych
W niniejszym artykule dokonano analizy możliwości integracji usług wspomagania działań biznesowych w środowisku chmury obliczeniowej (ang. cloud computing). Środowisko chmury obliczeniowej jest traktowane jako platforma...
Ontologia cyberprzestrzeni
W artykule przedstawiono podstawy ontologii cyberprzestrzeni oraz propozycje ujęcia jej istoty jako megasieci i systemu złożonego oraz koncepcję ewolucji cyberprzestrzeni.