2016 | 288 | 59-70
Article title

A critical comparison of discriminant analysis and svm-based approaches to credit scoring

Title variants
Porównanie analizy dyskryminacyjnej i maszyn wektorów podpierających w analizie ryzyka kredytowego
Languages of publication
Credit scoring models are the basis for financial institutions like retail and consumer credit banks. The purpose of these models is to evaluate the likelihood of credit applicants defaulting in order to decide whether to grant them credit. The paper compares two methodologies for building credit scoring models: heteroscedastic discriminant analysis-based with the support vector machines. The real-world credit dataset is used for comparison.
Modele oceny ryzyka kredytowego stanowią podstawę działalności większości instytucji finansowych, zajmujących się udzielaniem kredytów. Celem takich modeli jest ewaluacja prawdopodobieństwa zaprzestania przez kredytobiorcę spłaty udzielonego mu kredytu. W artykule dokonano porównania dwóch modeli oceny ryzyka kredytowego, które wykorzystują nowe metody statystyczne, a także metody uczenia maszynowego do ich konstrukcji: heteroscedastyczną analizę dyskryminacyjną oraz maszyny wektorów podpierających. Dla dokonania porównania tych metod wykorzystany został ogólnie dostępny, niemiecki zbiór kredytowy.
Physical description
  • Silesian University of Technology. Institute of Computer Science Institute of Computer Science. Faculty of Automatic Control, Electronics and Computer Science
  • Chen F., Li F. (2010), Combination of Feature Selection Approaches with SVM in Credit Scoring, "Expert Systems with Applications", Vol. 37, s. 4902-4909.
  • Crook J.N., Edelman D.B., Thomas L.C. (2007), Recent Developments in Consumer Credit Risk Assessment, "European Journal of Operational Research", Vol. 183(3), s. 1447-1465.
  • Duda R., Hart P., Stork D. (2001), Pattern Classification, 2 ed., John Wiley & Sons, New York.
  • Fisher R. (1936), The Use of Multiple Measurements in Taxonomic Problems, "Annals of Eugenics", No. 7, s. 179-188.
  • Gayler R. (2006), Comment: Classifier Technology and the Illusion of Progress - Credit Soring, "Statistical Science", Vol. 21(1), s. 19-23.
  • Krzyśko M. (1990), Discriminant Analysis, WNT, Warszawa.
  • Krzyśko M., Wołyński W. (1996), Discriminant Rules Based on Distances, "Tatra Mountains Math. Publ.", No. 7, s. 289-196.
  • Loog M., Duin R. (2002), Non-iterative Heteroscedastic Linear Dimension Reduction for Two-class Data: From Fisher to Chernoff, Proc. 4th Int. Workshop S+SSPR, s. 508-517.
  • Matuszczyk A. (2012), Credit Scoring,, Warszawa.
  • Murphy P.M., Aha D.W. (1994), UCI Repository of Machine Learning, Department of Information and Computer Science, University of California, -~mlearn/MLRepository.html.
  • Stąpor K. (2011), Classification Methods in Computer Vision, Wydawnictwo Naukowe PWN, Warszawa.
  • Stąpor K., Smolarczyk T., Fabian P. (2016), Heteroscedastic Discriminant Analysis Combined with Feature Selection for Credit Scoring, "Statistics in Transition new series", June.
  • Thomas L.C. (2000), A Survey of Credit and Behavioural Scoring: Forecasting Financial Risk of Lending to Consumers, "International Journal of Forecasting", Vol. 16(2), s. 149-172.
  • Vapnik V. (1995), The Nature of Statistical Learning Theory, Springer Verlag, New York.
  • Walesiak M. (2003), Strategies in Statistical Methods in the Case of Variables Measured on Different Scales, "Operational Research and Decisions", No. 1, s. 71-77.
  • Zhu L., Ng K., Jing P. (2002), Resampling Methods for Homogeneity Tests of Covariance Matrices, "Statistica Sinica", No. 12, s. 769-783.
Document Type
Publication order reference
YADDA identifier
JavaScript is turned off in your web browser. Turn it on to take full advantage of this site, then refresh the page.