Full-text resources of CEJSH and other databases are now available in the new Library of Science.
Visit https://bibliotekanauki.pl

PL EN


2020 | 395 | 66-79

Article title

Wykrywanie zagrożenia upadłością jako problem klasyfikacji danych niezbalansowanych

Content

Title variants

EN
Bankruptcy prediction as imbalanced classification problem

Languages of publication

PL

Abstracts

PL
W artykule wykorzystano wybrane algorytmy uczenia maszynowego oraz techniki przygotowania danych (preprocessing) stosowane w klasyfikacji na zbiorach niezbalansowanych w celu oceny ich skuteczności w prognozowaniu upadłości z użyciem danych zawierających wskaźniki finansowe podmiotów gospodarczych. Trafność prognoz upadłości na pierwotnym niezbalansowanym zbiorze danych o przeważającym udziale podmiotów prowadzących działalności nad upadłymi była bliska zero. Trafność prognozowania upadłości klasyfikatorów utworzonych na zbiorach zbalansowanych była odwrotnie proporcjonalna do całkowitej trafności klasyfikacji i wahała się od 10% – dla całkowitej trafności klasyfikacji wynoszącej 93%, do 77% – dla całkowitej trafności klasyfikacji równej 49%. Lepsze wyniki klasyfikacji osiągały algorytmy gradient boosting i drzewo klasyfikacyjne w stosunku do sztucznej sieci neuronowej. W problemie klasyfikacji na zbiorach niezbalansowanych wystąpił efekt wymiany – albo możliwe jest zwiększenie trafności klasyfikacji upadłości kosztem nadmiarowości obiektów kla-syfikowanych jako upadłe, albo – zwiększenie trafności klasyfikacji całkowitej algorytmu kosztem zmniejszenia trafności klasyfikacji samej upadłości.
EN
Selected machine learning algorithms and data preprocessing techniques were used in the article to predict bankruptcy on an unbalanced data set containing financial ratios. The accuracy of bankruptcy forecasts on the original unbalanced data set of the prevailing share of entities still operating over the bankrupt ones was close to zero. The accuracy of bankruptcy forecasting classifiers created on balanced sets ranged from 10% to 77%, but was inversely proportional to the total accuracy of the classification, which ranged from 93% to 49%. Better classification results were achieved by the classification trees algorithms in relation to the artificial neural network. In the problem of classification in unbalanced data sets the effect of substitution occurred – or it is possible to increase the accuracy of classification of bankruptcy at the expense of redundancy of objects classified as bankrupt, or – to increase the accuracy of the overall classification of the algorithm at the expense of decreasing the classification of the bankruptcy itself.

Year

Volume

395

Pages

66-79

Physical description

Contributors

  • AGH w Krakowie. Wydział Zarządzania. Katedra Informatyki Stosowanej

References

  • Altman E.I. (1968), Financial Ratios, Discriminant Analysis and the Prediction of Cor-porate Bankruptcy, “The Journal of Finance”, Vol. 23, No. 4, s. 589-609.
  • Beaver W.H. (1966), Financial Ratios as Predictors of Failure, “Journal of Accounting Research”, Vol. 4, s. 71-111.
  • Friedman J.H. (2001), Greedy Function Approximation: A Gradient Boosting Machine, “The Annals of Statistics”, Vol. 29, No. 5, s. 1189-1232.
  • Galar M., Fernández A., Barrenechea E., Bustince H., Herrera F. (2012), A Review on Ensembles for the Class Imbalance Problem: Bagging-, Boosting-, and Hybrid-Based Approaches, “IEEE Systems, Man, and Cybernetics Society”, Vol. 42(4), s. 3358-3378.
  • Geng R., Bose I., Chen X. (2015), Prediction of Financial Distress: An Empirical Study of Listed Chinese Companies Using Data Mining, „European Journal of Operational Research”, Vol. 241, Iss. 1, s. 236-247.
  • Gissel J., Giacomino D., Akers M. (2007), A Review of Bankruptcy Prediction Studies: 1930-Present, “Journal of Financial Education”, Vol. 33, s. 1-42.
  • He H., Garcia E.A. (2009), Learning from Imbalanced Data, “IEEE Transactions on Knowledge and Data Engineering”, Vol. 21(9), s. 1263-1284.
  • Laitinen E.K. (1991), Financial Ratios and Different Failure Processes, “Journal of Business Finance & Accounting”, Vol. 18, s. 649-673.
  • Lantz B. (2015), Machine Learning with R – Second Edition, Packt Publishing, Birmingham.
  • Li M.Y.L., Miu P. (2010), A Hybrid Bankruptcy Prediction Model with Dynamic Loadings on Accounting-ratio-based and Market-based Information: A Binary Quantile Regression Approach, “Journal of Empirical Finance”, Vol. 17, s. 818-833.
  • Longford N.T. (2005), Missing Data and Small-Area Estimation, Springer, New York.
  • Maalouf M., Trafalis T. (2011), Rare Events and Imbalanced Datasets: An Overview, “International Journal of Data Mining, Modelling and Management”, Vol. 3(4), s. 375-388.
  • Mahani A., Ali A. (2020), Classification Problem in Imbalanced Datasets [w:] A. Sadol-lah (ed.), Recent Trends in Computational Intelligence, IntechOpen, London.
  • Mączyńska E. (1994), Ocena kondycji przedsiębiorstwa (Uproszczona metoda), „Życie Gospodarcze”, nr 38, s. 42-45.
  • Paliński A. (1999), Ocena procesu restrukturyzacji trudnych kredytów bankowych w latach 1992-1998 dla wybranych największych polskich banków, „Banki i Kredyt”, nr 12, s. 51-69.
  • Pociecha J., red. (2014), Statystyczne metody prognozowania bankructwa w zmieniającej się koniunkturze gospodarczej, Fundacja Uniwersytetu Ekonomicznego, Kraków.
  • Serrano-Cinca S. (1996), Self Organizing Neural Networks for Financial Diagnosis, “Decision Support Systems”, Vol. 17, Iss. 3, s. 227-238.
  • Wędzki D. (2005), A Bankruptcy Logit Model for the Polish Economy, “Argumenta Oeconomica Cracoviensia”, No. 3, s. 49-70.
  • Wilcox J.W. (1973), A Prediction of Business Failure Using Accounting Data, “Journal of Accounting Research”, Vol. 11, s. 163-179.
  • Zięba M. (2013), Zespoły klasyfikatorów SVM dla danych niezbalansowanych, Rozprawa doktorska zrealizowana pod kierunkiem naukowym J. Świątka na Politechnice Wrocławskiej (niepublikowana).
  • Zięba M., Tomczak S., Tomczak J. (2016), Ensemble Boosted Trees with Synthetic Features Generation in Application to Bankruptcy Prediction, “Expert Systems with Applications”, Vol. 58, s. 93-101.
  • Zmijewski M.E. (1984), Methodological Issues Related to the Estimation of Financial Distress Prediction Models, “Journal of Accounting Research”, Vol. 22, s. 59-82.
  • [www 1] http://archive.ics.uci.edu/ml/datasets/Polish+companies+bankruptcy+data (dostęp: 10.04.2018).
  • [www 2] https://cran.r-project.org/package=caret (dostęp: 10.02.2019).
  • [www 3] https://cran.r-project.org/package=DMwR (dostęp: 10.02.2019).
  • [www 4] https://cran.r-project.org/package=mice (dostęp: 10.02.2019).
  • [www 5] https://docs.microsoft.com/en-us/sql/ssdt/download-sql-server-data-tools-ssdt?view=sql-server-2017 (dostęp: 10.02.2019).

Document Type

Publication order reference

Identifiers

ISSN
2083-8611

YADDA identifier

bwmeta1.element.cejsh-756ba170-7183-4dc9-92c1-044dd6126831
JavaScript is turned off in your web browser. Turn it on to take full advantage of this site, then refresh the page.