Full-text resources of CEJSH and other databases are now available in the new Library of Science.
Visit https://bibliotekanauki.pl

PL EN


2018 | 19 | 3 | 263-273

Article title

ZASTOSOWANIE ANALIZY SKUPIEŃ I LASÓW LOSOWYCH W KLASYFIKACJI GMIN W POLSCE NA SKALI POZIOMU ROZWOJU SPOŁECZNO-GOSPODARCZEGO

Authors

Content

Title variants

EN
USING CLUSTER ANALYSIS AND TECHNIQUE OF RANDOM FORESTS IN THE CLASSIFICATION OF COMMUNES IN POLAND ON THE SCALE OF SOCIO-ECONOMIC DEVELOPMENT

Languages of publication

PL EN

Abstracts

PL
W artykule przedstawiono algorytm klasyfikacji gmin na skali poziomu rozwoju społeczno-gospodarczego. Algorytm ten obejmuje cztery etapy: (1) dobór i redukcja zmiennych, (2) konstrukcja miernika syntetycznego i uszeregowanie liniowe gmin na skali poziomu rozwoju społeczno-gospodarczego, (3) grupowanie gmin metodą analizy skupień wg algorytmu k-średnich na podstawie wartości miernika syntetycznego, (4) weryfikacja klasyfikacji metodą lasów losowych. W wyniku procedury klasyfikacyjnej zidentyfikowano dywergencję rozwoju społeczno-gospodar¬czego w Polsce.
EN
"The article presents the algorithm of classification of communes on the scale of socio-economic development level. The algorithm includes four steps: (1) selection and reduction of variables, (2) construction of a synthetic measure and linear ordering of communes on the scale of socio-economic development level, (3) grouping of communes by cluster analysis (k-means algorithm) based on the synthetic measure, (4) verification of classification using the random forests method. As a result of the classification procedure was identified the progressive divergence of socio-economic development in Poland."

Contributors

  • "Wydział Nauk Geograficznych i Geologicznych, Uniwersytet im. Adama Mickiewicza w Poznaniu "

References

  • Bray J. R., Curtis J. T. (1957) An Ordination of the Upland Forest Communities of Southern Wisconsin. Ecological Monographs, 27(4), 325-349.
  • Breiman L. (2001) Random Forests. Machine Learning, 45, 5-32.
  • Breiman L., Friedman J. H., Olshen R. A., Stone C. J. (1998) Classification and Regression Trees (CART). Chapman and Hall, CRC Press reprint.
  • Burton I. (1963) The Quantitative Revolution and Theoretical Geography. Canadian Geographer, 7(4), 151-162.
  • Chen C., Liaw A., Breiman L. (2004) Using Random Forest to Learn Imbalanced Data. Technical Report 666, Statistics Department, University of California at Berkeley.
  • Chojnicki Z. (1985) Orientacje filozoficzno-metodologiczne geografii – ich koncepcje i modele. Przegląd Geograficzny, 57(3), 255-281.
  • Chojnicki Z., Czyż T. (1973) Metody taksonomii numerycznej w regionalizacji geograficznej. PWN, Warszawa.
  • Duranton G., Henderson J. V., Strange W. C. (Eds.) (2015) Handbook of Regional and Urban Economics. 5A/5B, North-Holland.
  • Hastie T., Tibshirani R., Friedman J. (2013) The Elements of Statistical Learning Data Mining, Inference and Prediction. Second Edition. Springer.
  • Hartigan J. (1975) Clustering Algorithms. John Wiley & Sons.
  • Jańczak J. (2015) Phantom Borders and Electoral Behaviour in Poland. Historical Legacies, Political Culture and Their Influence on Contemporary Politics. Erdkunde, 69(2), 125-137.
  • Kaufman L., Rousseeuw P. J. (1990) Finding Groups in Data. An Introduction to Cluster Analysis. Wiley-Interscience.
  • Mój region, moja Europa, nasza przyszłość: siódme sprawozdanie w sprawie spójności gospodarczej, społecznej i terytorialnej (2017) Bruksela, 9.10.2017, COM(2017) 583.
  • Nijkamp P. (Ed.) (1986) Handbook of Regional and Urban Economics. Volume I. Regional Economics. North-Holland.
  • Powers D. M. W. (2011) Evaluation: from Precision, Recall and F-Measure to ROC, Informedness, Markedness & Correlation. Journal of Machine Learning Technologies, 2(1), 37-63.
  • Sobczyński M. (2008) Polskie doświadczenia w zakresie badania granic reliktowych i krajobrazu pogranicza. [w:] Kulesza M. (red.) Czas i przestrzeń w naukach geograficznych: wybrane problemy geografii historycznej. Wyd. UŁ, Łódź, 66-78.
  • Walesiak M. (2016) Wybór grup metod normalizacji wartości zmiennych w skalowaniu wielowymiarowym. Przegląd Statystyczny, 63(1), 7-18.
  • Zeliaś A. (2002) Uwagi na temat wyboru metody normowania zmiennych diagnostycznych. [w:] Kufel T., Piłatowska M. (red.) Analiza szeregów czasowych na początku XXI wieku. Wyd. UMK, Toruń.

Document Type

Publication order reference

Identifiers

YADDA identifier

bwmeta1.element.desklight-bd2c2a06-2aba-4211-825f-429bc86b8e21
JavaScript is turned off in your web browser. Turn it on to take full advantage of this site, then refresh the page.