Search results

1

Boosting Regression Models

100%

Rozmus D., Department of Statistics T. K. A. U. o. E.

Acta Universitatis Lodziensis. Folia Oeconomica

|

2009

|

vol. 228

PL

Boosting jest jedną z najlepszych metod agregacji modeli dyskryminacyjnych (Bauer, Kohavi, 1999). Liczne badania empiryczne potwierdzają możliwość znacznej poprawy jakości modeli klasyfikacyjnych, niewiele jednakże wiadomo na temat efektywności tej metody w przypadku modeli regresyjnych. Freund i Schapire (1995), stosując swój algorytm AdaBoost.R, podjęli próbę wykorzystania metody boosting do tego typu zagadnień. Głównym celem artykułu jest prezentacja nowej implementacji metody boosting w regresji, która opracowana została przez Ridgeway’a (2005). W przeprowadzonych eksperymentach zbadany został wpływ wartości podstawowych parametrów tego algorytmu, takich jak np. współczynnik uczenia, czy też liczba iteracji, na jakość modelu zagregowanego.

EN

In a wide variety of classification problems, boosting technique have proven to be very effective method for improving prediction accuracy (Bauer, Kohavi, 1999). While more evidence compiles about the utility of these technique in classification problems, little is known about their effectiveness in regression. Freund and Schapire (1995) gave a suggestion as to how boosting might improve regression models using their algorithm AdaBoost.R. The main aim of this article is to present an application of the new boosting method for regression problems which was introduced by Ridgeway (2005). We will discuss the influence of the main parameters of this algorithm, such as eg. learning rate or number of iterations on the model performance.

2

Graphical Presentation of a Multi - Way Contingency Table in the R Software

100%

Kasprzyk I., Department of Statistics T. K. A. U. o. E.

Acta Universitatis Lodziensis. Folia Oeconomica

|

2009

|

vol. 228

PL

Tablica kontyngencji jest częstym sposobem przedstawiania danych mierzonych zarówno na skali nominalnej jak i porządkowej. W referacie zostaną przedstawione różne typy modeli log-liniowych, które pozwalają na badanie zależności między zmiennymi zawartymi w tablicy kontyngencji. Za pomocą pakietu vcd oraz graphics w programie R zostanie dokonana wizualizacja danych zawartych w wielowymiarowej tablicy kontyngencji Zostaną przedstawione przede wszystkim wykresy mozaikowe, które to są najczęstszym sposobem wizualizacji modeli log-liniowych. Tego typu wykresy mozaikowe zostały zaproponowane przez Hartigan i Kleiner [1981]. Referat jest kontynuacją referatu „Wizualizacja dwuwymiarowych tablic kontyngencji w pakiecie statystycznym R” wygłoszonego na XXV Konferencji MSA 2006.

EN

The contingency table is a popular way of presenting categorical data. This paper presents the various types of the log-linear models, which describe the relationship between variables in the contingency table. We can make a visualisation of data contained in the multi-way contingency table using the vcd and graphics packages in the R software. The main aim of this paper is to show the mosaic plots, which are the most popular ways of visualization of this kind of models. The mosaic display was proposed by Hartigan and Kleiner (1981). This paper is a continuation of the paper titled “Visualizing of a two-way contingency table in the R software” delivered at the conference on Multivariate Statistical Analysis in 2006.

3

Unbiased Recursive Partitioning Algorithm in Regression Trees

100%

Rozmus D., Department of Statistics T. K. A. U. o. E.

Acta Universitatis Lodziensis. Folia Oeconomica

|

2009

|

vol. 228

PL

Drzewa klasyfikacyjne i regresyjne są bardzo popularnym narzędziem predykcji. Budowa takiego modelu polega na stopniowym podziale wielowymiarowej przestrzeni cech na rozłączne obszary aż do uzyskania maksymalnej ich homogeniczności ze względu na wartość zmiennej objaśnianej y. Podział ten kontynuowany jest w kolejnych krokach, w oparciu o wartości wybranych zmiennych objaśniających. Istnieje wiele możliwych sposobów wyboru tych zmiennych, a jednym z najpopularniejszych jest algorytm wyczerpującego przeszukiwania (ang. exhaustive search) opracowany przez Breimana (Breimana et al., 1984). Zaproponowany przez Hothoma, Hornika i Zeileisa, (2006) sposób doboru zmiennych znany pod nazwą nieobciążonej metody rekurencyjnego podziału (ang. unbiased recurcive partitioning) opierający się na zastosowaniu testów permutacyjnych miał na celu ominięcie podstawowej wady tradycyjnego podejścia, jakim jest tendencja do wyboru zmiennych dających wiele potencjalnych możliwości podziału. Okazuje się, że w przypadku dyskryminacji to nowatorskie podejście prowadzi do uzyskania modeli zapewniających bardzo zbliżone wyniki klasyfikacji jak podejście tradycyjne, a w podejściu wielomodelowym może doprowadzić do pogorszenia poprawności klasyfikacji. Zasadniczym celem referatu jest przedstawienie wyników badań, które mają na celu porównanie dokładności predykcji na podstawie drzew regresyjnych, które doboru zmiennych objaśniających dokonują za pomocą algorytmu wyczerpującego przeszukiwania oraz za pomocą podejścia bazującego na testach permutacyjnych. Ponadto porównane zostaną wyniki predykcji modeli zagregowanych, w których modelami składowymi będą te dwa rodzaje drzew regresyjnych.

EN

Classification and regression trees are very popular tool for prediction. The construction of these models is based on recursive partitioning of multidimensional attribute space into disjoint homogenous regions till gaining the maximum homogeneity from the point of view of the dependent variable value. The main aim of this research is to apply in regression trees unbiased recursive partitioning algorithm proposed by Hothom, Homik and Zeileis (2006), which is based on permutation tests. The research takes into consideration both single and aggregated approach and compare the results with classical method of tree model construction based on exhaustive search algorithm proposed by Breiman et al. (1984).

4

VaR in risk analysis on DAM and models of volatility of variance

100%

Ganczarek A., Department of Statistics T. K. A. U. o. E.

Acta Universitatis Lodziensis. Folia Oeconomica

|

2008

|

vol. 216

EN

The aim of this paper is to describe and measure risk on the Day Ahead Marked (DAM) of the Polish Power Exchange. In this paper downside risk measures such as Vcilue-at-Risk (VaR) and Conditional Value-at-Risk (CVaR) are presented. These measures were estimated on the basis of the Generalized Autoregressive Conditional Heteroscedasticity (GARCH). They are applied to time series of the logarithmic rate of return of prices from the DAM from March to October 2003. The Kupiec test was used to choose an appropriate heteroscedasticity model to compute VaR and CVaR and to describe and measure risk on the DAM.

PL

W pracy przeprowadzono analizę ryzyka na Rynku Dnia Następnego (RDN) Towarowej Giełdy Energii. Do pomiaru ryzyka zmiany ceny na RDN wykorzystano wartości zagrożone: Value-at-Risk (VaR) oraz Conditional Value-at-Risk (CVaR), oszacowane na podstawie modeli z warunkową wariancją: Generalized Autoregressive Conditional Heteroscedasticity (GARCH). Do oceny efektywności oszacowanych wartości VaR oraz CVaR wykorzystano test przekroczeń Kupca. Analizę ryzyka przeprowadzono na szeregach czasowych dziennych logarytmicznych stóp zwrotu cen energii elektrycznej notowanej na RDN w okresie od marca do października 2003.

5

Visualisation of a two - way contingency table in R

100%

Kasprzyk I., Department of Statistics T. K. A. U. o. E.

Acta Universitatis Lodziensis. Folia Oeconomica

|

2008

|

vol. 216

EN

The contingency table is one of the most popular ways of presenting categorical data. We can make a visualisation of data contained in the two - way contingency table using the vcd and graphics packages in the R sofware. The main aim of this Paper is to show the use of various types of plots: the fourfold display, the mosaic display, the sieve diagram and the association plot. In addition to that, we can describe the relations among different categories of variables by applying the correspondence analysis.

PL

Tablica kontyngencji jest częstym sposobem przedstawiania danych mierzonych zarówno na skali nominalnej jak i porządkowej. W artykule zostanie przeprowadzona analiza bezrobocia na terenie Śląska, ze szczególnym uwzględnieniem obszaru Bytomia tj. miasta szczególnie dotkniętego tą problematyką. Za pomocą pakietu ved i graphics w programie R zostanie dokonana wizualizacja danych zawartych w dwuwymiarowej tablicy kontyngencji przy pomocy kilku sposobów graficznej prezentacji, w tym za pomocą wykresu mozaikowego, wykresu siatkowego oraz wykresu zależności. W celu dokładniejszej analizy danych, wyniki zostaną przedstawione również za pomocą analizy korespondencji, która pozwala na opisanie zależności pomiędzy kategoriami zmiennych.

Refine search results

5 Acta Universitatis Lodziensis. Folia Oeconomica

5 Department of Statistics T. K. A. U. o. E.

2 Kasprzyk I.

2 Rozmus D.

1 Ganczarek A.

3 2009

2 2008

Boosting Regression Models

Graphical Presentation of a Multi - Way Contingency Table in the R Software

Unbiased Recursive Partitioning Algorithm in Regression Trees

VaR in risk analysis on DAM and models of volatility of variance

Visualisation of a two - way contingency table in R