Full-text resources of CEJSH and other databases are now available in the new Library of Science.
Visit https://bibliotekanauki.pl

Results found: 8

first rewind previous Page / 1 next fast forward last

Search results

Search:
in the keywords:  classification methods
help Sort By:

help Limit search:
first rewind previous Page / 1 next fast forward last
EN
Categorical data analysis is a statistical method that can be successfully applied in different scientific areas, such as: social, medical, psychological and political sciences. Classification and segmentation are statistical methods that usually have been used for large quantitative datasets to identify segments in the data, however if applied for categorical data for contingency tables, one may arrive at impressive results as well. This paper presents the use of classification and segmentation methods for categorical data in a contingency table based on real data from Central Statistics on the number of university positions in Polish voivodeships. The authors compare the results of different approaches and provide graphical results using advanced visualization tools, perceptual map (biplot) and dendrogram. Comparative analysis provides information on corresponding categories of academic positions in different voivodeships. All calculations are conducted in R.
PL
Analiza danych jakościowych należy do grupy metod statystycznych, która może być z powodzeniem wykorzystywana w wielu obszarach naukowych, takich jak: nauki społeczne, medyczne, psychologiczne oraz polityczne. Metody klasyfikacji i segmentacji są technikami statystycznymi, które wykorzystuje się zazwyczaj do analizy dużych zbiorów danych o charakterze ilościowym w celu identyfikacji segmentów w danych. Zastosowanie tych metod w analizie danych jakościowych może także przynieść zaskakujące wyniki. W niniejszym artykule zaprezentowano metody klasyfikacji i segmentacji do analizy danych jakościowych w analizie tablic kontyngencji. Porównano wyniki i rezultaty różnych podejść, a także zaprezentowano graficznie wyniki analizy. Wszystkie obliczenia przeprowadzono w programie R na danych rzeczywistych pochodzących z Głównego Urzędu Statystycznego.
PL
Problem zbyt małej liczby obserwacji w próbie, reprezentującej określoną domenę populacji, może być rozwiązany między innymi poprzez zastosowanie takich estymatorów, które do szacowania parametrów w określonej supopulacji (małym obszarze, domenie) mogłyby wykorzystać informacje o innych jednostkach w próbie, które pochodzą spoza określonej części populacji. Jedna z metod estymacji dla małych domen zwana estymacją syntetyczną zakłada, że rozkład w badanej małej domenie jest identyczny z rozkładem całej populacji. Założenie to pozostaje zazwyczaj niespełnione, zwłaszcza w przypadku specyficznych domen, co skutkuje dużymi błędami estymacji. Autorzy przedstawiają propozycję dwuetapowego procesu estymacji. W pierwszym etapie za pomocą sieci neuronowych typu SOM oraz za pomocą metody klasyfikacji k-średnich określa się podobieństwa jednostek należących do małej domeny do jednostek z pozostałej części próby. Drugim krokiem jest wykorzystanie w estymacji, za pomocą odpowiednio skonstruowanych wag, informacji tylko z tych domen, które są podobne do badanej małej domeny. Autorzy przedstawiają rezultaty zastosowania podanej procedury w analizie branży budowlanej na podstawie wyników reprezentacyjnego badania małych i średnich przedsiębiorstw. Podjęli także próbę oszacowania błędów tak zmodyfikowanej metody estymacji syntetycznej.
EN
The problem of a too small number of observations of a sample, representing a defined domain of a population may be solved inter alia thanks to the application of estimators which would use information about other components of the sample (derived from outside the defined part of the population) to estimate parameters in a given subpopulation (small area, domain). One of estimation methods for small domains - the synthetic estimation - assumes, that the distribution of the studied small domain is identical with the distribution of the whole population. This assumption remains usually unfulfilled, in particular in case of specific domains, what results in large estimation errors. The authors present a proposition of two-stage estimation process. In the first stage, using the SOM-type neural networks and using the k-means classification method the similarity of components belonging to the small domain with the components belonging to the remaining part of the sample is determined. The second step consists in using the information only from those domains, which are similar to the studied small domain with the help of appropriately construed weights. Authors present the results of the above procedure in the analysis of the building industry on the basis of a representative study of small and medium-sized enterprises. They have also undertaken an attempt to estimate the errors of the synthetic estimation method modified in such a way.
EN
The aim of this paper is to present the impact on the European Union’s trade structure arising from the Eastern enlargements. The effects of economic integration resulting from the participation of a certain country in the EU’s internal market were reviewed at the beginning. Afterward, the intra- and extra-EU trade structure by member state and product group with the CEE countries’ share in it in years 2004–2012 was analyzed. The group-average clustering was the method used to show the similarities in their share in the EU trade structure. Ten years after the Eastern enlargements the share of the CEE countries in the EU trade, both geographic and sectoral orientation of their trade flows, is rising, but still is rather low comparing to the EU-15. The main reason for this situation is their very large economic distance from the EU-15
EN
In this paper the author presents an analysis of the development of the water and sewerage infrastructure and environmental protection in the counties of the Silesian voivodship on the basis of designated synthetic variables in the dynamic approach. Selected years before and after joining the European Union are considered and some interpretative hypotheses are verified by empirical research. To achieve this purpose, the problem of the selection of diagnostic variables and the descriptive characteristics to be used, as well as the determination of the of the synthetic variables values based on selected aggregation formulas, also in dynamic terms, are discussed and suitable solutions are proposed.
5
Content available remote

Uniwersalna Klasyfikacja Dziesiętna w projekcie PASSIM

63%
PL
W 2010 r. Biblioteka Narodowa przystąpiła do projektu SYNAT. W ramach tego projektu zajmowała się częścią zadania badawczego o nazwie PASSIM. Celem działań licznego konsorcjum było stworzenie oraz wdrożenie uniwersalnej, otwartej, repozytoryjnej platformy hostingowej i komunikacyjnej dla sieciowych zasobów wiedzy wykorzystywanych przede wszystkim przez badaczy, pracowników nauki, studentów oraz wszystkich tych, którzy dążą do poszerzania wiedzy. Zakład Informacji Naukowej Biblioteki Narodowej odpowiadał za identyfikację, systematyzację i ewidencję cyfrowych zasobów informacyjnych zarówno polskich, jak i zagranicznych w zakresie nauk humanistycznych, ekonomicznych i społecznych. W artykule poddano analizie zasady praktycznego użycia w PASSIM Uniwersalnej Klasyfikacji Dziesiętnej (UKD). Zanalizowano jego cechy charakterystyczne, wskazujące na możliwość wykorzystania UKD do opisania treściowego źródeł danych. Omówiono metodę klasyfikowania dokumentów w projekcie PASSIM. Przedstawiono wybrane opcje wyszukiwawcze, tj. wyszukiwanie przez symbol UKD i odpowiedniki słowne do symbolu.
EN
In 2010 Polish National Library embarked on the SYNAT project (Science and Technology System). Within this project, the National Library performs a research task called PASSIM. The activities carried out by consortium members aim at creating and implementing a universal, open hosting and communication repository platform of web-based knowledge resources for researchers, students and others wanting to expand their knowledge. The National Library’s Information and Reference Department is involved in the task of identifying, systematizing and listing web-based information resources, both Polish and foreign, in the field of humanities, economics and social sciences. The article describes the Universal Decimal Classification (UDC), a system of broad application and long tradition. The authors analyzed its characteristics and pointed out its potential to present data sources. The article discusses classification methods in the PASSIM project. Selected search options were presented with the use of UDC numbers and their word equivalents.
PL
Celem opracowania była analiza odrębności kultury energetycznej krajów UE oraz czynników, które decydują o ukształtowaniu się różnic. W tym celu dokonano identyfikacji kultury energetycznej krajów UE na podstawie zastosowanych metod analizy statystycznej. Analizę tę oparto na 17 cechach diagnostycznych opisujących kulturę energetyczną poszczególnych krajów unijnych. W opracowaniu do wyznaczenia grup krajów o zbliżonej kulturze energetycznej użyto: wskaźnika energochłonności gospodarki wyrażonego w jednostkach energii na jednostkę PKB, wskaźnika intensywności emisji gazów cieplarnianych wyrażonego ilością emisji CO2 przypadającą na jednego mieszkańca, struktury zużycia źródeł energii pierwotnej (6 zmiennych), struktury zużycia źródeł energii finalnej (7 zmiennych), wskaźnika sprawności przetwarzania energii pierwotnej w energię finalną oraz wskaźnika przetwarzania energii finalnej w usługi. Grupowania krajów o zbliżonej kulturze energetycznej dokonano opierając się na dwóch wy-branych metodach analizy skupień: hierarchicznej metodzie aglomeracji Warda oraz grupowaniu metodą k-średnich. Podstawą grupowania były szczegółowe dane statystyczne charakteryzujące odrębność polityki energetycznej poszczególnych krajów unijnych. W wyniku przeprowadzonej analizy wyodrębniono dziewięć grup (skupień) krajów UE o zbliżonej kulturze energetycznej. Analiza odrębności kultury energetycznej krajów UE-28 umożliwiła ich pogrupowanie. Dla przeprowadzenia analizy odrębności poszczególnych kultur energetycznych wskazano na zasadnicze cechy polityki energetycznej prowadzonej w poszczególnych grupach krajów unijnych oraz na wybrane czynniki decydujące o ukształtowaniu się tam określonej kultury energetycznej. W opracowaniu wskazano także na znaczne różnice bilansów energetycznych poszczególnych krajów unijnych.
EN
The aim of the paper was to analyze the distinctiveness of energy culture of the EU countries and the factors that shape these differences. For this purpose an identification of energy culture of EU countries was made based upon the methods of statistical analysis. This analysis was based on 17 diagnostic features that describe the culture of energy in particular EU countries. In order to determine the groups of countries with similar culture of energy the following indices were applied: energy intensity index expressed in energy units per GDP unit, the rate of greenhouse gas emissions intensity expressed by the amount of CO2 emissions per one inhabitant, the structure of consumption of primary energy sources (6 variables), the consumption structure of final energy resources (7 variables), the efficiency ratio of primary energy conversion into the final energy and the ratio of final energy conversion into services. Grouping of countries with similar culture of energy was based on two selected methods of cluster analysis: the Ward’s hierarchical agglomeration method and clustering by k-means. The basis for grouping were detailed statistical data characterizing distinct national energy policy of the EU countries. The analysis distinguished nine groups (clusters) of EU countries with similar culture of energy. The analysis of the cultural energy distinctiveness of EU-28 countries allowed to group them. For the analysis of the energy distinctiveness of the different energy cultures there were indicated the essential characteristics of energy policy implemented in the individual EU countries and groups on some factors for shaping the energy of a particular culture there. The study also identified significant differences of energy balances of individual EU countries.
PL
Celem artykułu jest próba identyfikacji czynników, które wpływają na wyniki egzaminu pisanego na koniec gimnazjum. Praca prezentuje porównanie umiejętności uczniów dolnośląskich gimnazjów, piszących egzamin końcowy w 2010 r., ze względu na płeć oraz uwzględniając czynniki indywidualne, szkolne, środowiskowe i regionalne. Zastosowane metody klasyfikacji i korelacji umożliwiły częściowe rozpoznanie zróżnicowania w osiąganych wynikach z egzaminu gimnazjalnego w pięciu wydzielonych klasach powiatów, o względnie jednolitych warunkach nauki. Niezależnie od klasy powiatów zaobserwowano podobne prawidłowości w zakresie umiejętności uczniów gimnazjów. Przeprowadzona analiza nie pozwoliła jednak jednoznacznie wskazać na istotne czynniki środowiskowe różnicujące wyniki osiągane przez uczniów gimnazjów.
EN
The objective of this article is to identify the factors which influence the results of the written final examination in junior high schools. This paper presents a comparison of pupils’ skills in Lower Silesia junior high schools, students who wrote final exams in 2010, regarding sex, and referring to individual features and schools, environmental and regional factors. The applied methods of classification and correlation make it possible to recognize the differences in the results of junior high school exams in five classes of the given poviats with relatively homogeneous conditions of learning. Regardless of poviat class, similar regularities in terms of skills of junior high school students can be observed. The analysis did not allow, however, to indicate clearly the significant environmental factors which differentiate the results achieved by the students in junior high schools.
PL
W pracy zaprezentowano wyniki statystycznej analizy kształtowania się wydatków gospodarstw domowych w latach 2000–2014. Okres badania obejmuje lata trwającej transformacji gospodarczej i społecznej, charakteryzuje się zmianami szeroko pojętych warunków życia. Zmieniają się wzorce konsumpcji, powstają nowe potrzeby, kształtują się zachowania konsumpcyjne, których odzwierciedleniem są wydatki gospodarstw domowych. W niniejszej pracy uwagę skoncentrowano na strukturze wydatków ponoszonych na zakup podstawowych agregatów dóbr i usług konsumpcyjnych. Analizę przeprowadzono w ujęciu czasowym i przestrzennym. Poruszane problemy dotyczą: zróżnicowania terytorialnego poziomu i struktury wydatków; określenia społeczno-ekonomicznych determinant kształtowania się wydatków; zmian zachodzących w poziomie i strukturze wydatków w latach 2000–2014; oceny poziomu nasycenia dla podstawowych agregatów dóbr i usług. W analizie wykorzystano zagregowane dane liczbowe pochodzące z badań budżetów gospodarstw domowych przeprowadzanych przez GUS w latach 2000–2014. Punkt odniesienia w ocenie dynamiki badanych cech stanowi rok 2000, w którego cenach wyrażono realne dochody i wydatki gospodarstw domowych. Narzędzia badawcze wykorzystane w prowadzonych analizach można podzielić na dwie grupy: metody klasyfikacji (cech, obiektów i okresów) oraz modele ekonometryczne. Pierwsza grupa metod pozwoliła m.in. na wyodrębnienie faz rozwojowych (podokresów), charakteryzujących się wewnętrznym podobieństwem struktury wydatków. Próba zastosowania wielu postaci modeli regresyjnych umożliwiła przeprowadzenie analizy porównawczej kształtowania się poziomu i struktury wydatków w podzbiorach gospodarstw domowych, wskazania na podobieństwa oraz różnice w rozdysponowaniu ich dochodu, określenia istotnych zmian w strukturze wydatków w badanym okresie.
EN
The paper presents the results of the statistical analysis of the evolution of household expenditures in years 2000–2014. This time span covers the ongoing economic and social transformation, characterised by evolving living conditions, i.e. consumption patterns, needs, and behaviours which are reflected in household expenditures. In this paper, the attention is focused on the structure of expenditures on basic consumer goods and services. It examines the following problems: the territorial differentiation of the levels and structures of household expenditures; the socio-economic determinants of the expenditures; the changes in the level and structure of the expenditures in years 2000–2014; household needs regarding the considered goods and services. The analysis uses the aggregated data from household budget surveys carried out by Central Statistical Office of Poland between 2000 and 2014. The benchmark for the dynamics of the studied features is the year 2000. Thus, its prices are used to estimate real incomes and expenditures of households in the analysed period. The research tools used in the analysis consist of the methods of classification of features, objects, and periods, as well as econometric models. The methods of classification allow identifying the sub-periods characterised by an internal similarity of expenditure structure. The attempts to apply the multiple regression models enable to compare the level of and structure of the expenses in household subsets, the similarities and disparities in income distribution, and significant changes in the structure of the expenditures over the period considered.
first rewind previous Page / 1 next fast forward last
JavaScript is turned off in your web browser. Turn it on to take full advantage of this site, then refresh the page.