PL EN


2013 | 3 | 2 | 179-194
Article title

Analiza porównawcza wybranych metod analizy skupień w grupowaniu jednostek o złożonej strukturze grupowej

Content
Title variants
EN
A comparative analysis of selected methods of cluster analysis in the grouping units with a complex group structure
Languages of publication
PL
Abstracts
PL
Celem prezentowanych badań jest analiza porównawcza wybranych klasycznych metod grupowania danych z autorskimi, hybrydowymi metodami opartymi na samouczących się sieciach neuronowych typu Self Organizing Map (SOM) i Growing Neural Gas (GNG). Wykazano eksperymentalnie, że w wyróżnianiu złożonych struktur przestrzennych badanych jednostek najczęściej stosowane metody klasyczne mogą być nieskuteczne. Znacząco lepsze wyniki spośród uwzględnionych metod uzyskano dla hybrydowej sieci neuronowej typu SOM+GNG. Wykazano także, że w testowanych przypadkach samodzielnie stosowana sieć GNG charakteryzuje się najlepszymi własnościami wyróżniania skupień spośród wszystkich badanych metod.
Year
Volume
3
Issue
2
Pages
179-194
Physical description
Contributors
  • r, Katedra Statystyki, Wydział Zarządzania, Uniwersytet Gdański, kmn@wzr.ug.edu.pl
References
  • 1. Anderberg M.R. (1973), Cluster analysis for applications, Academic Press, New York, San Francisco, London.
  • 2. Ball G.H., Hall D.J. (1965), ISODATA, a novel method of data analysis and pattern classification, Technical report NTIS AD 699616, Stanford Research Institute, Stanford, Menlo Park CA.
  • 3. Benzécri J.P. (1992), Correspondence Analysis Handbook, New York: Marcel Dekker.
  • 4. Bergan T., (1971), Survey of numerical techniques for grouping, „Bacteriological Reviews”, Vol. 35, No. 2
  • 5. Davies D.L., Bouldin D.W. (1979), A cluster separation measure, „IEEE Transactions on Pattern Analysis and Machine Intelligence”, PAMI-1, No. 2.
  • 6. Deboeck G., Kohonen T. (1998), Visual explorations in finance with Self-Organizing Maps, Springer-Verlag, London.
  • 7. Everitt B.S., Landau S., Leese M., Stahl D. (2011), Cluster analysis, 5th edition, John Wiley & Sons, Ltd., Chichester.
  • 8. Forgy E.W. (1965), Cluster analysis of multivariate data: efficiency vs. interpretability of classifications, Streszczenia referatów wygłoszonych na Spring Meeting of ENAR, na Florida State University at Tallahassee, Floryda, 29.04-1.05, „Biometrics”, Vol. 21, No. 3.
  • 9. Fritzke B. (1994), Growing cell structures – a self-organizing network for unsupervised and supervised learning, „Neural Networks”, Vol. 7, No. 9.
  • 10. Gatnar E., Walesiak M. (red.) (2004), Metody statystycznej analizy wielowymiarowej w badaniach marketingowych, Wydawnictwo Akademii Ekonomicznej im. Oskara Langego we Wrocławiu, Wrocław.
  • 11. Gordon A.D. (1987), A review of hierarchical classification, „Journal of the Royal Statistical Society”, Series A (General), Vol. 150, No. 2.
  • 12. Greenacre M.J. (1984), Theory and Applications of Correspondence Analysis, Academic Press, London.
  • 13. Hardy A. (1996), On the number of clusters, „Computational Statistics & Data Analysis”, Vol. 23, No. 1.
  • 14. Hartigan J. (1975), Clustering algorithms, John Wiley & Sons, New York.
  • 15. Hartigan J., Wong M. (1979), Algorithm AS136: a k-means clustering algorithm, „Applied Statistics”, Vol. 28, No. 1.
  • 16. Jajuga K. (1990), Statystyczna teoria rozpoznawania obrazów, PWN, Warszawa.
  • 17. Jajuga K. (1993), Statystyczna analiza wielowymiarowa, PWN, Warszawa.
  • 18. Jardine N., Sibson R. (1968), The construction of hierarchic and non-hierarchic classifications, „The Computer Journal”, Vol. 11, No. 2.
  • 19. Johnson S.C. (1967), Hierarchical clustering schemes, „Psychometrika”, Vol. 32, No. 3.
  • 20. Kohonen T. (1995, 1997, 2001), Self-Organizing Maps, Springer-Verlag, Heidelberg, Berlin.
  • 21. Lance G.N., Williams W.T. (1966 a), Computer programs for hierarchical polythetic classification („Similarity analysis”), „The Computer Journal”, Vol. 9, No. 1.
  • 22. Lance G.N., Williams W.T. (1966 b), A generalized sorting strategy for computer classifications, „Nature”, Vol. 212.
  • 23. Lance G.N., Williams W.T. (1967 a), A general theory of classificatory sorting strategies, I. Hierarchical systems, „The Computer Journal”, Vol. 9, No. 4.
  • 24. Lance G.N., Williams W.T. (1967 b), A general theory of classificatory sorting strategies: II. Clustering systems, „The Computer Journal”, Vol. 10, No. 3.
  • 25. Lamirel J., Mall R., Cuxac P., Safi G. (2011), Variations to incremental growing neural gas algorithm based on label maximization, „Neural Networks, The 2011 International Joint Conference on”.
  • 26. MacQueen J.B. (1967), Some methods for classification and analysis of multivariate observations, Proceedings of 5th Berkeley Symposium on Mathematical Statistics and Probability, Berkeley, University of California Press, 1.
  • 27. Marek T., Noworol C. (1987), w: Brzeziński J. (red.), Wielozmiennowe modele statystyczne w badaniach psychologicznych, PWN, Warszawa-Poznań.
  • 28. Migdał Najman K., (2007), Propozycja hybrydowej metody grupowania dużych zbiorów danych wykorzystującej sieć Kohonena i taksonomiczne metody grupowania, Taksonomia 14, Prace Naukowe AE we Wrocławiu, nr 1169.
  • 29. Migdał Najman K. (2008), Analiza porównawcza struktur hierarchicznych skupień uzyskanych z wykorzystaniem hybrydowych metod grupowania, Taksonomia 15, Prace Naukowe Uniwersytety Ekonomicznego we Wrocławiu, nr 7.
  • 30. Migdał Najman K. (2009), Analiza porównawcza własności nienadzorowanych sieci neuronowych typu self organizing map i growing neural gas w analizie skupień, Taksonomia 16, Prace Naukowe Uniwersytetu Ekonomicznego we Wrocławiu, nr 47.
  • 31. Migdał Najman K. (2012), Propozycja hybrydowej metody grupowania opartej na sieciach samouczących, Taksonomia 19, Prace Naukowe Uniwersytetu Ekonomicznego we Wrocławiu, nr 242.
  • 32. Migdał Najman K., Najman K. (2005), Analityczne metody ustalania liczby skupień, Taksonomia 12, Prace Naukowe AE we Wrocławiu, nr 1076.
  • 33. Migdał Najman K., Najman K. (2006 a), Analityczne metody ustalania liczby skupień w rozmytych zbiorach danych, Taksonomia 13, Prace Naukowe AE we Wrocławiu, nr 1126.
  • 34. Migdał Najman K., Najman K. (2006 b), Wykorzystanie indeksu silhouette do ustalania optymalnej liczby skupień, „Wiadomości Statystyczne”, nr 6.
  • 35. Migdał Najman K., Najman K. (2008), Wykorzystanie wskaźnika Dunna do ustalania optymalnej liczby skupień, „Wiadomości Statystyczne”, nr 11.
  • 36. Milligan G.W. (1980), An examination of the effect of six types of error perturbation on fifteen clustering algorithms, „Psychometrika”, Vol. 45, No. 3.
  • 37. Milligan G.W., Cooper M.C. (1985), An examination of procedures for determining the number of clusters in a data set, „Psychometrika”, Vol. 50, No. 2.
  • 38. Milligan G.W., Cooper M.C. (1987), Methodology review: clustering methods, „Applied psychological measurement”, Vol. 11, No. 4.
  • 39. Mirkin B.G. (1996), Mathematical classification and clustering, Kluwer Academic Publishers, Dordrecht, The Netherlands.
  • 40. Najman K. (2008), Symulacyjna analiza wpływu wyboru kryterium optymalności podziału obiektów na jakość uzyskanej klasyfikacji a algorytmach k-średnich, Taksonomia 15, Prace Naukowe Uniwersytety Ekonomicznego we Wrocławiu, nr 7.
  • 41. Najman K. (2009), Zastosowanie nienadzorowanych sieci neuronowych typu Growing Neural Gas w analizie skupień, Taksonomia 16, Prace Naukowe Uniwersytetu Ekonomicznego we Wrocławiu, nr 47.
  • 42. Najman K. (2010), Ocena wpływu parametrów sterujących procesem samouczenia się sieci GNG na ich zdolność do separowania skupień, Taksonomia 17, Prace Naukowe Uniwersytetu Ekonomicznego we Wrocławiu nr 17.
  • 43. Najman K. (2011), Propozycja algorytmu samouczenia się sieci neuronowych typu GNG ze zmiennym krokiem uczenia, Taksonomia 18, Prace Naukowe Uniwersytetu Ekonomicznego we Wrocławiu, nr 176.
  • 44. Pociecha J., Podolec B., Sokołowski A., Zając K. (1988), Metody taksonomiczne w badaniach społeczno-ekonomicznych, PWN, Warszawa.
  • 45. Rand W.M. (1971), Objective criteria for the evaluation of clustering methods, „Journal of the American Statistical Association”, Vol. 66, No. 336.
  • 46. Rousseeuw P.J. (1987), Silhouettes: a graphical aid to the interpretation and validation of cluster analysis, „Journal of Computational and Applied Mathematics”, Vol. 20, No. 1.
  • 47. Sneath P.H.A., Sokal R.R. (1973), Numerical taxonomy, the principles and practice of numerical classification, W.H. Freeman and Company, San Francisco.
  • 48. Stąpor K. (2005), Automatyczna klasyfikacja obiektów, Akademicka Oficyna Wydawnicza EXIT, Warszawa.
  • 49. Tryon R.C. (1939), Cluster analysis, New York: McGraw-Hill.
  • 50. Vesanto J., Himberg J., Alhoniemi E., Parhankangas J. (2002), SOM Toolbox for Matlab 5, SOM Toolbox Team, Helsinki University of Technology, ESPOO, Finland.
  • 51. Walesiak M. (1996), Metody analizy danych marketingowych, PWN, Warszawa.
  • 52. Ward J.H. (1963), Hierarchical grouping to optimize an objective function, „Journal of the American Statistical Association”, Vol. 58, No. 301.
Document Type
Publication order reference
Identifiers
YADDA identifier
bwmeta1.element.desklight-21a69ea1-8540-42c2-ab4d-aee83f37933a
JavaScript is turned off in your web browser. Turn it on to take full advantage of this site, then refresh the page.