Full-text resources of CEJSH and other databases are now available in the new Library of Science.
Visit https://bibliotekanauki.pl

Results found: 2

first rewind previous Page / 1 next fast forward last

Search results

help Sort By:

help Limit search:
first rewind previous Page / 1 next fast forward last
PL
Jednym z podstawowych zadań banków jest udzielanie kredytów i pożyczek pieniężnych. Z punktu widzenia kredytodawcy w procesie kredytowaniem niezwykle istotna jest ocena ryzyka zaniechania płatności zobowiązań potencjalnego kredytobiorcy. W celu selekcji klientów, obok oceny ich zdolności kredytowej, coraz częściej wykorzystuje się modele scoringowe wchodzące w skład metodologii tzw. scoringu kredytowego (creditscoring). W podejściu tym z punktu widzenia kredytodawcy kluczowa jest jakość doboru jednostek, którym kredyt zostanie przyznany. To, czy klasyfikacja dokonywana na podstawie modelu scoringowego jest dobra, może być opisane za pomocą statystycznych miar oceny jakości. Mimo coraz większej popularności metod scoringowych w praktyce gospodarczej literatura dotycząca statystycznych metod oceny ich jakości jest w dalszym ciągu stosunkowo uboga. Ponadto w publikacjach na ten temat często występują rozbieżności w zakresie nazewnictwa oraz konstrukcji poszczególnych miar. W artykule przedstawiono charakterystykę najczęściej stosowanych statystycznych miar oceny jakości modelu scoringowego (m.in. indeksu pseudo Giniego, statystyki Kolmogorova‑Smirnova, krzywej koncentracji), a także podjęto próbę standaryzacji nazewnictwa oraz postaci samych miar jakości modelu scoringowego. Ponadto przedstawione zostało studium przypadku, w którym dokonano analizy porównawczej trzech modeli scoringowych w kontekście ich jakości klasyfikacyjnej.
EN
Granting a credit product has always been at the heart of banking. Simultaneously, banks are obligated to assess the borrower’s credit risk. Apart from creditworthiness, to grant a credit product, banks are using credit scoring more and more often. Scoring models, which are an essential part of credit scoring, are being developed in order to select those clients who will repay their debt. For lenders, high effectiveness of selection based on the scoring model is the primary attribute, so it is crucial to gauge its statistical quality. Several textbooks regarding assessing statistical quality of scoring models are available, there is however no full consistency between names and definitions of particular measures. In this article, the most common statistical measures for assessing quality of scoring models, such as the pseudo Gini index, Kolmogorov‑Smirnov statistic, and concentration curve are reviewed and their statistical characteristics are discussed. Furthermore, the author proposes the application of the well‑known distribution similarity index as a measure of discriminatory power of scoring models. The author also attempts to standardise names and formulas for particular measures in order to finally contrast them in a comparative analysis of credit scoring models.
PL
Szacuje się, że około 80% wszystkich danych gromadzonych i przechowywanych w systemach informacyjnych przedsiębiorstw ma postać dokumentów tekstowych. Artykuł jest poświęcony jednemu z podstawowych problemów textminingu, tj. klasyfikacji tekstów w analizie sentymentu, która rozumiana jest jako badanie wydźwięku tekstu. Brak określonej struktury dokumentów tekstowych jest przeszkodą w realizacji tego zadania. Taki stan rzeczy wymusił rozwój wielu różnorodnych technik ustalania sentymentu dokumentów. W artykule przeprowadzono analizę porównawczą dwóch metod badania sentymentu: naiwnego klasyfikatora Bayesa oraz regresji logistycznej. Badane teksty są napisane w języku polskim, pochodzą z banków i mają charakter marketingowy. Klasyfikację przeprowadzono, stosując podejście bag‑of‑n‑grams. W ramach tego podejścia dokument tekstowy wyrażony jest za pomocą podciągów składających się z określonej liczby n wyrazów. Uzyskane wyniki pokazały, że lepiej spisała się regresja logistyczna.
EN
It is estimated that approximately 80% of all data gathered by companies are text documents. This article is devoted to one of the most common problems in text mining, i.e. text classification in sentiment analysis, which focuses on determining the sentiment of a document. A lack of defined structure of the text makes this problem more challenging. This has led to the development of various techniques used in determining the sentiment of a document. In this paper, a comparative analysis of two methods in sentiment classification, a naive Bayes classifier and logistic regression, was conducted. Analysed texts are written in the Polish language and come from banks. The classification was conducted by means of a bag‑of‑n‑grams approach, where a text document is presented as a set of terms and each term consists of n words. The results show that logistic regression performed better.
first rewind previous Page / 1 next fast forward last
JavaScript is turned off in your web browser. Turn it on to take full advantage of this site, then refresh the page.