Full-text resources of CEJSH and other databases are now available in the new Library of Science.
Visit https://bibliotekanauki.pl

Results found: 4

first rewind previous Page / 1 next fast forward last

Search results

help Sort By:

help Limit search:
first rewind previous Page / 1 next fast forward last
EN
High accuracy of the results is very important task in any grouping problem (clustering). It determines effectiveness of the decisions based on them. Therefore in the literature there are proposed methods and solutions that main aim is to give more accurate results than traditional clustering algorithms (e.g. k-means or hierarchical methods). Examples of such solutions can be cluster ensembles or spectral clustering algorithms. Here, we carry out an experimental study to compare accuracy of spectral clustering and cluster ensembles.
PL
Stosując metody taksonomiczne w jakimkolwiek zagadnieniu klasyfikacji ważną kwestią jest zapewnienie wysokiej poprawności wyników grupowania. Od niej bowiem zależeć będzie skuteczność wszelkich decyzji podjętych na tej podstawie. Stąd też w literaturze wciąż proponowane są nowe rozwiązania, które mają przynieść poprawę dokładności grupowania w stosunku do tradycyjnych metod. Przykładem mogą tu być metody polegające na zastosowaniu podejścia zagregowanego oraz algorytmy spektralne. Głównym celem tego artykułu jest porównanie dokładności zagregowanych i spektralnych algorytmów taksonomicznych. W badaniach pod uwagę wzięta zostanie tylko specyficzna klasa metod agregacji, która oparta jest na macierzy współwystąpień (Fred, Jain 2002). Natomiast jako algorytm spektralny zastosowana będzie metoda zaproponowana przez Ng i in. (2001).
EN
Testing differences between multivariate populations is one of a crucial problems in statistical investigations. The most known – MANOVA tests being parametric ones need to fulfill the assumptions about the conformity with multivariate normal distribution. Very often these assumptions are practically unrealistic or the verification, especially for small number of observations is hard. This paper presents an approach, based on permutation tests (no needs of verification mentioned assumptions), where proposed test statistics base on the properties of eigenvectors. The investigations were carried out for simulated and real multivariate datasets, where the permutation tests were compared with variable-based and MANOVA test statistics.
PL
Testowanie różnic pomiędzy populacjami wielowymiarowymi jest jednym z kluczowych problemów w badaniach statystycznych. Najbardziej znane – testy MANOVA, jako parametryczne wymagają spełnienia założenia o zgodności z rozkładem normalnym wielowymiarowym. Bardzo często założenia te są praktycznie nierealne lub ich weryfikacja, szczególnie dla małej ilości obserwacji jest trudna. Artykuł ten przedstawia podejście, oparte o testy permutacyjne (co zwalnia z weryfikacji powyższych założeń), gdzie proponowane statystyki testowe oparte są o własności wektorów własnych. Badania zostały przeprowadzone dla symulowanych i rzeczywistych zestawów danych, gdzie testy permutacyjne zostały porównane z testami opartymi na analizie zmiennych i statystykach testowych w MANOVA.
EN
The problem of modeling longitudinal profiles is considered assuming that the population and elements’ affiliation to subpopulations may change in time. Some longitudinal model which is a special case of the general linear model (GLM) and the general linear mixed model (GLMM) is studied. In the model two random components are included under assumptions of simultaneous spatial autoregressive process (SAR) and temporal first-order autoregressive process (AR(1)) respectively. The accuracy of model parameters’ restricted maximum likelihood estimators is considered in the simulation.
PL
Rozważany jest problem modelowania profili wielookresowych zakładając, że populacja i przynależność elementów domen mogą zmieniać się w czasie. Proponowany model jest przypadkiem szczególnym ogólnego modelu liniowego i ogólnego mieszanego modelu liniowego. W modelu tym uwzględniono dwa wektory składników losowych spełniające odpowiednio założenia przestrzennego modelu autoregresyjnego i modelu autoregresyjnego rzędu pierwszego w czasie. W symulacji rozważano dokładność estymatorów parametrów modelu uzyskanych metodą największej wiarygodności z ograniczeniami.
EN
One of the crucial problems in multiple-model approach of the regression is estimation of optimal number of base models. If the quantity is too low – it increases the prediction error whereas too high number of models increases time and complication of calculations. Unfortunately, the estimation of the quantity of base models based on the analysis of prediction error can lead to its overestimation. This paper proposes a formal approach where the predictions obtained with the models aggregated from different number of base models are compared. In this approach both: parametric and permutation tests were applied with the empirical data from petroleum industry.
PL
Jednym z kluczowych problemów w wielomodelowym podejściu do zagadnienia regresji jest estymacja optymalnej ilości modeli bazowych. Jeśli ich ilość jest zbyt mała – rośnie błąd predykcji, zbyt duża ilość powiększa czas i komplikację obliczeń. Niestety estymacja tej ilości na podstawie analizy błędu predykcji może prowadzić do jej przeszacowania. W artykule proponuje się formalne podejście, w którym porównywane są wyniki prognoz otrzymanych z modeli zagregowanych z różnej liczby modeli bazowych. W tym przypadku wykorzystane zostały zarówno testy parametryczne jak i testy permutacyjne, a jako dane testowe: dane empiryczne wykorzystywane w przemyśle rafineryjnym.
first rewind previous Page / 1 next fast forward last
JavaScript is turned off in your web browser. Turn it on to take full advantage of this site, then refresh the page.