Full-text resources of CEJSH and other databases are now available in the new Library of Science.
Visit https://bibliotekanauki.pl

PL EN


2015 | 227 | 75-84

Article title

O odporności na obserwacje odstające wybranych nieparametrycznych modeli regresji

Content

Title variants

EN
Robustness for outliers of selected nonparametric regression models

Languages of publication

PL

Abstracts

PL
Artykuł jest poświęcony zagadnieniu odporności metod regresji na obserwacje odstające występujące w zbiorze danych. W pierwszej części przedstawiono wybrane metody identyfikacji obserwacji nietypowych. Następnie badano odporność trzech nieparametrycznych metod regresji: PPR, POLYMARS i RANDOM FORESTS. Analiz dokonano za pomocą procedur symulacyjnych na rzeczywistym zbiorze danych Mieszkania, w którym wykryto obserwacje odstające. Pomimo dosyć powszechnych przekonań o odporności regresji nieparametrycznej, okazało się, że modele zbudowane na całym zbiorze danych mają istotnie mniejsze zdolności predykcyjne niż modele uzyskane na zbiorze, z którego usunięto obserwacje nietypowe.
EN
The paper presents an important problem of robustness for outliers in regression. In the first part selected outliers detection techniques are described. Moreover, we empirically examine the robustness of the following methods: PPR, POLYMARS and RANDOM FORESTS on real world dataset. We show, that after removing outliers the prediction abilities of the models increase.

Year

Volume

227

Pages

75-84

Physical description

Contributors

References

  • Breiman L. (2001), Random Forests, „Machine Learning”, No. 45, s. 5-32.
  • Cook R.D. (1977), Detection of Influential Observations in Linear Regression, „Technometrics”, No. 19 (1), s. 15-18.
  • Filzmoser P., Maronna R.A., Werner M. (2008), Outlier Identification in High Dimensions, „Computational Statistics & Data Analysis”, no. 52, s. 1694-1711.
  • Friedman J., Stuetzle W. (1981), Projection Pursuit Regression, „Journal of the American Statistical Association”, No. 76, s. 817-823.
  • Healy M. J. R. (1968), Multivariate Normal Plotting, „Applied Statistics”, No. 17, s. 157-161.
  • Jajuga K. (1993), Statystyczna analiza wielowymiarowa, Wydawnictwo Naukowe PWN, Warszawa.
  • Kooperberg C., Bose S., Stone C. (1997), Polychotomous Regression, „Journal of the American Statistical Association”, No. 92, s. 117-127.
  • Meyer D., Leisch F., Hornik K. (2003), The Support Vector Machine under Test, „Neurocomputing”, Vol. 1-2, No. 55, s. 169-186.
  • Trzęsiok J. (2011), Przegląd metod regularyzacji w zagadnieniach regresji nieparametrycznej [w:] Jajuga K., Walesiak M., red., Taksonomia 18. Klasyfikacja i analiza danych, Wydawnictwo UE, Wrocław, s. 330-339.
  • Trzęsiok J. (2013), Wybrane symulacyjne techniki porównywania nieparametrycznych metod regresji [w:] Jajuga K., Walesiak M., red. Taksonomia 20. Klasyfikacja i analiza danych – teoria i zastosowania, Wydawnictwo UE, Wrocław, s. 197-205.
  • Trzpiot G. , red. (2013), Wybrane elementy statystyki odpornej, Wydawnictwo UE, Katowice.
  • Tukey J.W. (1977), Exploratory Data Analysis, Addison-Wesley.

Document Type

Publication order reference

Identifiers

ISSN
2083-8611

YADDA identifier

bwmeta1.element.desklight-1103875f-0b72-4024-abbf-bcd8653faab5
JavaScript is turned off in your web browser. Turn it on to take full advantage of this site, then refresh the page.