Full-text resources of CEJSH and other databases are now available in the new Library of Science.
Visit https://bibliotekanauki.pl

Results found: 7

first rewind previous Page / 1 next fast forward last

Search results

Search:
in the keywords:  symbolic data
help Sort By:

help Limit search:
first rewind previous Page / 1 next fast forward last
EN
Ensemble approaches based on aggregated models have been applied with success to discrimination and regression tasks. Nevertheless this approach can be applied to cluster analysis tasks. Many articles have proved that, by combining different clusterings, an improved solution can be obtained. The article presents the possibility of applying ensemble approach based on aggregated models to cluster symbolic data. The paper presents also presents results of clustering obtained by applying ensemble approach.
PL
Podejście wielomodelowe oparte na agregacji modeli jest z powodzeniem wykorzystywane w zagadnieniach dyskryminacyjnych i regresyjnych. Niemniej jednak podejście to może zostać także zastosowane w zagadnieniu klasyfikacji. W wielu artykułach wskazuje się, że połączenie wielu różnych klasyfikacji pozwala otrzymać lepsze wyniki. Artykuł przedstawia możliwość zastosowania podejścia wielomodelowego w klasyfikacji danych symbolicznych. W artykule przedstawiono także wyniki klasyfikacji z wykorzystaniem podejścia wielomodelowego.
2
100%
EN
The aim of this work is to present fuzzy clustering algorithm for objects, which can be described by mixed feature-type symbolic data and fuzzy data. The main idea is the transformation of mixed feature-type symbolic data and fuzzy data into histogram-valued symbolic data. Fuzzy classification is very useful in case, when classes are difficult separated, mixed objects can be classified into class with the fixed degree of membership.
PL
Podstawowym celem skalowania wielowymiarowego jest przedstawienie relacji między obiektami w przestrzeni wielowymiarowej jako odległości w przestrzeni 2- lub 3- wymiarowej. Dane wejściowe do procedur skalowania wielowymiarowego to zazwyczaj symetryczna macierz kwadratowa wskazująca na relacje (podobieństwa lub niepodobieństwa) pomiędzy obiektami pewnego zbioru. Istnieje wiele technik klasycznego skalowania wielowymiarowego, jednak wszystkie z nich wymagają aby w poszczególnych komórkach tej macierzy znajdowały się pojedyncze wartości liczbowe. Denoeux and Masson (2002) zaproponowali rozszerzenie klasycznego skalowania wielowymiarowego na dane symboliczne w postaci przedziałów liczbowych. Danymi wejściowymi do opracowanego przez nich algorytmu 1NTERSCAL jest tabela zawierająca minimalne i maksymalne odległości pomiędzy hiperprostopadłościanami reprezentującymi obiekty. Takie same podejście występuje w algorytmach SYMSCAL i I-SCAL zaproponowanych przez Groenena i in. (2005). W artykule przedstawiony zostały najważniejsze algorytmy skalowania wielowymiarowego dla danych symbolicznych w postaci przedziałów liczbowych oraz przykłady ich zastosowania dla danych symbolicznych pochodzących z repozytorium http://www.ceremade.dauphine.fr/~touati/sodas-pagegarde.htm.
EN
The aim of multidimensional scaling is to represent dissimilarities among objects in high dimensional space as distances in low (usually 2- or 3-) dimensional space. Usually the input to multidimensional scaling procedure is a square, symmetric matrix indicating relationships (similarities or dissimilarities) among a set of items. There are many techniques of classical multidimensional scaling but all under assumption that each entry in relationship matrix is single numeric value. Denoeux and Masson (2002) have proposed to extend multidimensional scaling onto symbolic interval data. The input to theirs INTERSCAL algorithm is interval dissimilarity table containing minimum and maximum distance between hyper-rectangles representing objects. The same approach is used in SYMSCAL and I-SCAL algorithms proposed by Groenen et al. (2005). Article presents main algorithms of multi-dimensional scaling for symbolic data in form of intervals along with some examples on datasets taken from symbolic data repository (http://www.ceremade.dauphine.fr/~touati/sodas-pagegarde.htm).
PL
W rzeczywistych problemach badawczych często oprócz zmiennych istotnych mamy do czynienia ze zmiennymi zakłócającymi (nieistotnymi). Nie zawsze można dokonać wyboru zmiennych istotnych, np. za pomocą metody HINoV, lub zmodyfikowanej metody HINoV. W artykule porównano efektywność wykrywania znanej struktury klas za pomocą drzew klasyfikacyjnych dla obiektów symbolicznych oraz jądrowej analizy dyskryminacyjnej obiektów symbolicznych w sytuacji, gdy mamy do czynienia ze zmiennymi zakłócającymi. Badanie efektywności przeprowadzono na symulowanych danych symbolicznych w różnych modelach. Każdy z modeli zawierał znaną liczbę klas. Dodatkowo do każdego modelu dodano różną liczbę zmiennych zakłócających.
EN
In real research problems we usually deal with relevant variables and irrelevant (noisy) variables. Relevant variables sometimes can not be identified, by for example HINoV method or modified HINoV method. This paper compares effectiveness detection o f known class structure with application o f symbolic decision trees and symbolic kernel discriminant analysis in situation where we deal with noisy variables. This research was conducted on artificial symbolic data from a variety o f models. The models contained known structure o f clusters. In addition, the models contained different number o f noisy variables added to obscure the underlying structure.
EN
This paper describes main classification methods used for symbolic data (e.g. data in form of: single quantitative value, categorical value, interval, multivalued variable, multivaliued variable with weights) presents difficulties of measuring clustering quality for symbolic data (such as lack of "traditional" data matrix), presents which of known indexes like Silhouette index, Ball index, Hartingan index, Baker and Hubert index, Huberta and Levine index, Ratkovski index, Ball index, Hartigan index, Krzanowski and Lai index, Scott index, Marriot index, Rubin index, Friedman index may be used for validation of such type of data and what indexes are specific only for symbolic data. Simulation results arc used to propose most adequate indexes for each classification algorithm.
PL
Artykuł opisuje procedury klasyfikacyjne, które mogą być używane dla danych symbolicznych (tj. dla danych mogących być reprezentowanych w postaci: liczb, danych jakościowych, przedziałów liczbowych, zbioru wartości, zbioru wartości z wagami), przedstawia problemy związane z mierzeniem jakości klasyfikacji dla tych procedur (takie jak brak „klasycznej" macierzy danych) oraz przedstawia, które ze znanych indeksów, takich jak: Silhouette, indeks Calińskiego-Harabasza, indeks Bakera-Huberta, indeks Huberta-Levine, indeks Ratkowskiego, indeks Balia, indeks Hartigana, indeks Krzanowskiego-Lai, indeks Scotta, indeks Marriota, indeks Rubina i indeks Friedmana, mogą być wykorzystane dla tego typu danych oraz jakie są miary jakości podziału specyficzne dla danych symbolicznych. Na podstawie przeprowadzonych symulacji zaproponowane zostały indeksy faktycznie odzwierciedlające strukturę klas dla poszczególnych algorytmów klasyfikacyjnych.
EN
The economic distance defines a dissimilarity level between objects functioning in the economic space. It is one of the most important issues of spatial econometrics. However its measurement is difficult due to the definition, description and estimation problems. The objective of the paper is to indicate the role of symbolic data in describing the economic distance and also the way of its measurement using symbolic data analysis methods. A significance of the economic distance, measurement problems, symbolic data concept and dissimilarity measures, and also an empirical example were presented in the paper.
EN
Visualizing data in the form of illustrative diagrams and searching, in these diagrams, for structures, clusters, trends, dependencies etc. is one of the main aims of multivariate statistical analysis. In the case of symbolic data (e.g. data in form of: single quantitative value, categorical values, intervals, multi-valued variables, multi-valued variables with weights), some well-known methods are provided by suitable 'symbolic' adaptations of classical methods such as principal component analysis or factor analysis. An alternative visualization of symbolic data is obtained by constructing a Kohonen map. Instead of displaying the individual items k = 1,..., n by n points or rectangles in a two dimensional space, the n items are first clustered into a number m of mini-clusters and then these mini-clusters are assigned to the vertices of a rectangular lattice of points in the plane such that 'similar' clusters are represented by neighbouring vertices in the lattice.
first rewind previous Page / 1 next fast forward last
JavaScript is turned off in your web browser. Turn it on to take full advantage of this site, then refresh the page.