Potrzeby firm w zakresie stosowania zaawansowanych metod przetwarzania danych są różne w zależności od branży funkcjonowania, możliwości finansowania, zachowań konkurencji, rozmiaru i zmienności gromadzonych informacji. W pewnych przypadkach technologie business intelligence, wizualizacja lub metody statystyczne stają się niezbędne do funkcjonowania firmy, w innych są sposobem zwiększenia wydajności oraz uzyskania przewagi konkurencyjnej. Celem publikacji jest analiza różnic w podejściu przedsiębiorstw do stosowania tych technologii. Sprawdzono, czy istnieją cechy powodujące, że dana grupa jest podatna na ofertę związaną z big data i data science. Realizacji tego celu służy analiza skupień, pozwalająca na wyznaczenie grup klientów o podobnej charakterystyce. Wyniki badania wskazują, że źródłem różnic są cechy demograficzne, odmienne oczekiwania oraz dotychczasowe doświadczenia.
EN
Enterpreneurs’ needs in terms of advanced data analysis methods vary depending on the business sector, funding flexibility, competitors’ behavior, volume and volatility of stored information. Business intelligence, visualisation or statistical methods become essential for performing daily operations in some cases, while in the others they develop into a mean of increasing efficiency or gaining competitive advantage. This publication analyses the differences in enterprises' attitude towards application of hot technologies. An attempt is made to distinguish certain features that potentially make a particular group prone to use offered solutions. This objective is accomplished with a cluster analysis carried out to determine client segments sharing similar characteristics. The results indicate that main differences arise from demographic features, varied expectations and past experiences.
W pracy przedstawiono wielowymiarowe metody analizy porównawczej, które mogą być pomocne w doborze spółek do portfela inwestycyjnego. W tym celu wykorzystano porządkowanie liniowe metodą sum, tworząc ranking spółek atrakcyjnych inwestycyjnie. Wykorzystano również liniową funkcję dyskryminacyjną (klasyfikacja na podstawie stopy zwrotu wyższej od mediany dla analizowanych spółek), w której zmienne niezależne zostały dobrane na postawie selekcji parametrycznej. W celu zidentyfikowania wskaźników finansowych wpływających w znacznym stopniu na podział spółek na grupy walorów podobnych do siebie wykorzystano metodę głównych składowych. Grupy podobnych do siebie spółek zobrazowano również za pomocą hierarchicznego dendrogramu uzyskanego metodą Warda.
Analiza zanieczyszczenia powietrza obejmuje rejestr zanieczyszczeń gazowych i pyłowych z materiałów gospodarki narodowej do atmosfery. Po wejściu do atmosfery emitowane substancje znajdują się poza wszelką kontrolą człowieka i stają się częścią naturalnego obiegu materii; mogą wywoływać kilka rodzajów oddziaływań na środowisko. Celem artykułu jest ocena jakości czystości powietrza ze szczególnym uwzględnieniem zanieczyszczeń w krajach Unii Europejskiej na podstawie danych udostępnianych przez Eurostat. W artykule wykorzystane zostaną metody wielowymiarowej analizy statystycznej (skalowanie wielowymiarowe oraz porządkowanie liniowe) w celu identyfikacji krajów o znacznym wkładzie w walkę z zanieczyszczeniami, jak i krajów które tych zanieczyszczeń generują najwięcej. Otrzymane wyniki wskazują na poprawę jakości powietrza, mimo że nie wszystkie kraje UE osiągnęły zbliżony poziom zmian. Wszystkie obliczenia przeprowadzono w programie R.
Zabieg ablacji stosuje się do leczenia zaburzeń rytmu serca. Określono parametry gwarantujące jego skuteczność i bezpieczeństwo. Zastosowano trzy metody klasyfikacyjne: regresję logistyczną, analizę skupień i analizę korespondencji, aby wyznaczyć wartości graniczne analizowanych cech (czasu trwania zabiegu, wielkości końcówki elektrody uziemiającej, obciążenia końcówki elektrody) lub cech anatomicznych blizny (średnicy wyjścia, średnicy wejścia, głębokości wejścia, całkowitej głębokości blizny, zmiany impedancji) o kluczowym znaczeniu w tworzeniu blizny transmuralnej w ablacji bipolarnej, kiedy to przepuszcza się prąd między elektrodami położonymi blisko siebie. Badanie przeprowadzono na 72 sercach świńskich. Dowiedziono, że największe prawdopodobieństwo transmuralności powstaje podczas zabiegu trwającego 90 s z użyciem 8 mm elektrody o nacisku 20 g. Analizy skupień pokazują, że transmuralność można z podobną skutecznością przewidzieć na podstawie parametrów anatomicznych blizny
W roku 2001 Desai zaproponował ciekawą miarę podobieństwa dwóch różnych wartości/wariantów tej samej cechy. Miarę tę można w dość prosty sposób wykorzystać do wyznaczenia siły dyskryminacyjnej cechy binarnej lub nominalnej wielostanowej w problemie analizy skupień. Idea oparta jest na tym, że im mniejsze podobieństwo, na przykład 1 do 0 (jako wartości zmiennej binarnej), tym większa zdolność dyskryminacyjna cechy. Ten pomysł zastosowano do skonstruowania nowej metody selekcji zmiennych binarnych w zagadnieniu analizy skupień i w zastosowaniu do dość obszernej klasy zbiorów danych binarnych, jaką są dane marketingowe. Podstawową zaletą nowej metody jest jej niezależność od konieczności grupowania danych, co wiąże się zawsze z przyjęciem jakiejś konkretnej metody grupowania oraz konkretnej wartości liczby skupień. Eksperyment przeprowadzony na 162 zbiorach danych pokazuje wysoką efektywność metody
W opracowaniu dokonano identyfikacji najbardziej zbliżonych okresów interglacjalnych w okresie ostatnich 600 000 lat na podstawie analizy krzywej izotopowej tlenu (LR04 δ18O) z użyciem pseudoodległości DTW (dynamic time warping). Analizowane okresy (MIS: 1, 5e, 7e, 9e, 11c, 13a, 15a) wykazują podobieństwa, a równocześnie zaznacza się ich zróżnicowanie na dwa typy. Pierwszy o mniejszych wartościach krzywej δ18O i wyraźnym pojedynczym wierzchołku, a drugi o większych wartościach krzywej δ18O oraz współwystępujących, niekiedy równorzędnych wierzchołkach. Stwierdzone podobieństwo tych okresów może potwierdzać, że w każdym z nich mogły w pełni istnieć warunki interglacjalne, a więc mogło też dochodzić do rozwoju charakterystycznych dla danej strefy klimatycznej formacji roślinnych. Dodatkowo przedstawiono próbę modelowania przebiegu krzywej δ18O z uwzględnieniem wybranych parametrów orbitalnych Ziemi, które są zasadniczymi czynnikami zewnętrznymi cykli glacjalno-interglacjalnych.
W polskim szkolnictwie wyższym następuje wiele zmian, głównie wynikających z przemian demograficznych oraz wprowadzania do życia akademickiego nowoczesnych technologii. Szybki wzrost liczby uczelni i spadek liczby studentów powoduje konkurencyjność na polskich uczelniach wyższych. Celem pracy jest prezentacja wyników wielowymiarowej analizy porównawczej stanu polskiego szkolnictwa wyższego w 2014 roku w podziale na województwa na podstawie danych Głównego Urzędu Statystycznego i Banku Danych Lokalnych. Ocena obejmuje zarówno uczelnie publiczne, jak i niepubliczne oraz studia stacjonarne i niestacjonarne. Za pomocą analizy skupień pogrupowano województwa, uwzględniając podobieństwo stanu szkolnictwa wyższego, oraz zastosowano porządkowanie liniowe pozwalające ustalić klasyfikację województw. Do obliczeń wykorzystano pakiet Statistica.
Celem artykułu jest wielowymiarowa ocena konkurencyjności eksportowej krajów UE. Jej podstawą będzie dekompozycja zmian w eksporcie krajów UE dokonana metodą stałego udziału w rynku opracowaną przez Leamera, Sterna (1970). Obliczone efekty: popytowy, struktury przestrzennej, struktury towarowej i konkurencji pozwolą na szczegółową analizę źródeł zmian zachodzących w eksporcie porównywanych krajów, a w szczególności pozwolą odpowiedzieć na pytanie w jakim stopniu zmiany w eksporcie można wytłumaczyć koniunkturą w światowym handlu, a w jakim wynikają one z właściwych proporcji udziału w rynkach, odpowiedniego dopasowania asortymentowego towarów czy ekspansywnej polityki eksporterów? W analizie porównawczej wykorzystano m.in. metodę Warda, co pozwoliło wskazać kraje o najbardziej podobnej pozycji konkurencyjnej w układzie przestrzenno-towarowym w zakresie towarów o różnym stopniu nasycenia czynnikami produkcji. Przedstawione wyniki badań pozwolą na wielokierunkowe porównanie konkurencyjności handlowej krajów UE, jak również mogą stanowić źródło ważnych informacji dotyczących kształtowania właściwych proporcji udziału i ekspansji firm na rynkach zagranicznych.
In the article are presented the synthetic review of the literature from P. Jaccard in 1908 to B. Mirkin, 2011. In this paper, the concept and classification of cluster validity indices are proposed. There are presented classification of validity indices to find the optimal number of clusters. The results of this study should be useful for all concerned with the problems of classification.
PL
W artykule dokonano syntetycznego przeglądu literatury tematu począwszy od prac P. Jaccarda z roku 1908 a skończywszy na pracach B. Mirkina z 2011 roku. Dokonano próby klasyfikacji znanych wskaźników jakości grupowania, uwzględniając kryteria pochodzące z różnych dyscyplin naukowych. W szczególności dokonano klasyfikacji wskaźników optymalnej liczby skupień jako podklasy wskaźników jakości grupowania. Wyniki prezentowanych badań powinny być użyteczne dla wszystkich zajmujących się problemami grupowania i klasyfikacji.
Information about the whole population or its part are used in the regression estimation of small area parameters. In the paper the possibilities of application of cluster analysis methods are considered in case of determining the group of similar small areas. The studies of a similarity of subpopulations are conducted on the basis of studies of similarity of regression function and similarity of ranks for small areas. The results of simulation analysis of precision of regression estimators are presented in case of using two auxiliary variables.
The paper present results of cluster analysis based on some financial risk and efficiency pa- rameters with respect to 14 open pension funds in Poland. The segmentation procedure is based on the properties of association and incidence matrices. Some theoretical aspects of the cluster proce- dure are presented.
Celem artykułu jest zbadanie podobieństwa krajów Unii Europejskiej pod kątem realizacji celów strategii Europa 2020. Z uwagi na dostępność danych, analizę oparto na realizacji wskaźników za 2014 r. W badaniu posłużono się metodami grupowania obiektów, w tym metodą k‑średnich. Uzyskane wyniki wskazują na podział krajów z wyraźną dominacją podziału na kraje starej i nowej Unii Europejskiej. Jak pokazuje analiza część założonych celów już została osiągnięta, część zbliża się do wartości ustalonych celów, podczas gdy np. realizacja celu dla wskaźnika wydatków na badania i rozwój wyrażonych jako ich udział w PKB jest niepewna. Średnie wykonanie w zakresie głównych wskaźników dla krajów UE–15 i UE–13 wydaje się być zbliżone i o podobnym trendzie.
EN
The aim of this article is to investigate the similarities between the EU countries in terms of achieving the Europe 2020 Strategy goals. Due to the latest data availability, the analysis is based on the year 2014. The study uses grouping methods, including the k-means algorithm. The results indicate the existence of a division between the “old” and “new” European Union Member States. However, as is shown, some of the Strategy’s targets have already been achieved and some indicators have been nearly achieved, whereas among others, such as implementation of the headline indicator for investment in the R&D sector as a % of GDP is uncertain. The average performance of headline indicators for the EU–15 and EU–13 countries seems to be similar and exhibits the same trend of changes.
Ważną decyzją w analizie zróżnicowania jednostek w przestrzeni wielowymiarowej jest wybór odpowiedniej dla danego problemu miary odległości. W badaniach empirycznych najczęściej stosuje się miary odległości oparte na metryce potęgowej. W metryce tej, gdy jednostki opisane są bardzo dużą liczbą cech, istotny staje się wybór odpowiedniego poziomu stałej Minkowskiego. Wybór ten jest bardzo ważny, ponieważ istotnie wpływa na własności metryki we właściwym różnicowaniu jednostek. Własności te zmieniają wraz ze wzrostem wymiaru przestrzeni. W artykule poddano analizie wpływ wartości stałej Minkowskiego na poprawność identyfikacji skupień dla danych o wysokim wymiarze, przy występowaniu jednostek nietypowych.
Celem prezentowanych badań jest analiza porównawcza wybranych klasycznych metod grupowania danych z autorskimi, hybrydowymi metodami opartymi na samouczących się sieciach neuronowych typu Self Organizing Map (SOM) i Growing Neural Gas (GNG). Wykazano eksperymentalnie, że w wyróżnianiu złożonych struktur przestrzennych badanych jednostek najczęściej stosowane metody klasyczne mogą być nieskuteczne. Znacząco lepsze wyniki spośród uwzględnionych metod uzyskano dla hybrydowej sieci neuronowej typu SOM+GNG. Wykazano także, że w testowanych przypadkach samodzielnie stosowana sieć GNG charakteryzuje się najlepszymi własnościami wyróżniania skupień spośród wszystkich badanych metod.
Celem artykułu było wyznaczenie grup krajów Unii Europejskiej podobnych pod względem struktury statusu mieszkaniowego gospodarstw domowych oraz ich scharakteryzowanie pod względem PKB per capita kraju. Analiza została przeprowadzona dla roku 2016 na podstawie wyników badań EU-SILC prowadzonych przez Eurostat. Badanymi obiektami było 28 krajów UE. Dokonano wyboru wskaźników ilościowych, a następnie poddano je analizie skupień z wykorzystaniem metody Warda w celu określenia grup krajów podobnych pod względem struktury statusu mieszkaniowego gospodarstw domowych. Następnie wyodrębnione grupy państw scharakteryzowano pod względem poziomu PKB per capita według parytetu siły nabywczej. Badanie wykazało, że w UE można wyróżnić cztery grupy krajów podobnych pod względem struktury statusu mieszkaniowego gospodarstw domowych, przy czym kraje tworzące poszczególne skupienia posiadają PKB per capita na zbliżonym poziomie.
Głównym celem artykułu jest analiza i ocena zmian dobrobytu w krajach UE w kontekście sytuacji pokryzysowej. Dla osiągnięcia celu zastosowano następujące metody badawcze: studia literaturowe, porządkowanie statystyczne i analizę skupień. Zasadniczym źródłem danych wykorzystanych w badaniu jest baza EUROSTAT oraz raporty i strony internetowe związane z wykorzystanymi w artykule miernikami dobrobytu, takimi jak: PKB per capita, Human Development Index i Happy Planet Index. Podmiotem badań w artykule są kraje UE, a przedmiotem badań ich dobrobyt społeczno-ekonomiczny. Na podstawie przeprowadzonej analizy wyciągnąć można wniosek, że w warunkach pokryzysowych w dobrobycie krajów UE niewątpliwie nastąpiły zmiany, które w poszczególnych krajach miały zróżnicowany kierunek i siłę. Nieznacznie, ale zwiększył się dystans w poziomie dobrobytu pomiędzy skrajnymi państwami UE oraz nastąpił ogólny wzrost zróżnicowania dobrobytu pomiędzy krajami UE. Ponadto w dobrobycie w ujęciu ilościowym nastąpiły mniej zauważalne zmiany aniżeli w dobrobycie w ujęciu jakościowym.
Celem artykułu jest zaprezentowanie zastosowania analizy skupień w segmentacji użytkowników bankowości elektronicznej oraz opis uzyskanych tą metodą segmentów rynku. Do przeprowadzenia segmentacji wykorzystano jedną z hierarchicznych metod analizy skupień – metodę aglomeracyjną Warda. W wyniku zastosowania metody uzyskano dendrogram oddający hierarchiczną strukturę zbioru obiektów ze względu na zmniejszające się podobieństwo między nimi. Uzyskana hierarchia pozwoliła na określenie wzajemnego położenia skupień i obiektów w nich zawartych. Natomiast przyjęty punkt odcięcia pozwolił na wyodrębnienie trzech relatywnie jednorodnych grup – segmentów użytkowników bankowości elektronicznej: młodych entuzjastów (46,7%), ostrożnych pragmatyków (39,3%) i nieufnych nieświadomych (14%). Rozważania poprowadzono z wykorzystaniem metod wnioskowania logicznego, na podstawie krytycznej analizy dostępnych źródeł wtórnych oraz wniosków z badań ilościowych przeprowadzonych w 2017 roku na próbie 1075 osób.
Sektor bankowo-kredytowy w sytuacji pojawiających się zawirowań i kryzysów finansowych jest szczególnie wrażliwy na ryzyko występowania licznych niekorzystnych zjawisk. Celem artykułu jest uzyskanie odpowiedzi na pytania dotyczące stopnia podobieństwa rozwoju sektora bankowo-kredytowego w Polsce w porównaniu z innymi krajami UE oraz zbadanie, które kraje charakteryzują się najlepszym poziomem jego rozwoju. Z wykorzystaniem metod taksonomicznych wyodrębniono skupienia krajów podobnych pod względem poziomu rozwoju sektora bankowo-kredytowego i przeanalizowano zmiany w strukturze skupień krajów podobnych, które nastąpiły w dobie kryzysu finansowego (rok 2014) w stosunku do okresu przed kryzysem (rok 2008). Wyznaczono ranking krajów UE ze względu na poziom rozwoju sektora bankowo-kredytowego w obu porównywanych okresach. Zbadano, które kraje są najlepsze w rankingu rozwoju, a także porównano pozycję Polski w stosunku do krajów najlepszych oraz pozostałych krajów Europy Środkowo-Wschodniej.
W artykule przedstawiono wielowymiarową analizę statystyczną polskich firm ze względu na motywy podejmowania bezpośrednich inwestycji zagranicznych (BIZ). Uwzględniono czynniki o charakterze kosztowym, rynkowym, efektywnościowym, prawnym, społecznym i politycznym, którymi firmy kierują się, rozważając możliwość eksportu BIZ. Celem artykułu jest wyodrębnienie obszarów działalności firm, w których polityka inwestycyjna w zakresie priorytetów przy podejmowaniu decyzji o uruchomieniu BIZ wykazuje największe podobieństwo. Podstawowym narzędziem badawczym wykorzystanym w opracowaniu jest analiza korespondencji uzupełniona o metody analizy skupień. Wyniki takiego badania mogą stanowić wsparcie w procesie segmentacji polskich przedsiębiorstw podejmujących BIZ. Analizę wykonano przy wykorzystaniu danych pochodzących z badania ankietowego przeprowadzonego wśród polskich przedsiębiorstw podejmujących BIZ lub planujących tę formę inwestowania.
Porównywanie empirycznych rozkładów pierwszej cyfry znaczącej, ustalonychna bazie badanych zbiorów danych, z rozkładem Benforda często sprowadza się dokonstruowania rankingów tych zbiorów. W tym celu korzysta się z różnych mierników podobieństwarozkładów, które umożliwiają ocenę stopnia podobieństwa empirycznego rozkładupierwszej niezerowej cyfry ze wspomnianym rozkładem teoretycznym. W artykulezaprezentowano wyniki analizy wskazań trzynastu mierników podobieństwa rozkładów,opierając się na danych generowanych symulacyjnie. W przeprowadzonym badaniu posłużonosię analizą korelacji. Podjęto też próbę klasyfikacji mierników podobieństwa rozkładówza pomocą metody 𝑘-średnich. Rezultaty grupowania doprowadziły do wniosku, że wbadaniach empirycznych, gdy dysponujemy zbiorami danych o różnej wielkości, a celembadań jest stworzenie rankingów analizowanych zbiorów ze względu na stopień ich podobieństwaz rozkładem Benforda, wystarczy ograniczyć się do czterech tego typu mierników
JavaScript is turned off in your web browser. Turn it on to take full advantage of this site, then refresh the page.