In this paper the application of parametric count data models in claim counts modeling is investigated. Insurance portfolios have a very specific characteristic, i.e. for many policies there are no claims observed in the insurance history for a given period of time. As the zero-inflation and over-dispersion effects are a common situation in insurance portfolios, three models: zero-inflated Poisson (ZIP), zero-inflated negative binomial (ZINB) and zeroinflated generalized Poisson regression (ZIGP) are tested against the classic Poisson model. The 4-step procedure for modeling zero-inflation effect is proposed. This procedure is applied in the case study. For all calculations the R CRAN software was used.
W masowych portfelach ryzyk zakłady ubezpieczeń przeprowadzają tzw. taryfikację, której celem jest wyznaczenie składki czystej dla pojedynczego ryzyka. Modele statystyczne stosowane obecnie w praktyce należą najczęściej do klasy uogólnionych modeli liniowych (GLM), w których szacuje się w osobnych modelach wartości oczekiwane dwóch zmiennych losowych: średniej wartości szkody oraz liczby szkód dla ryzyka. Składka czysta definiowana jest wtedy jako iloczyn uzyskanych wartości. Takie podejście wymaga założenia niezależności pomiędzy rozpatrywanymi dwoma zmiennymi losowymi. Jednak w literaturze to założenie jest podważane. Celem tego artykułu jest zaproponowanie modelu z kopulą uwzględniającego nieobserwowalny czynnik ryzyka w modelowaniu liczby szkód. Model ten służy do oszacować oczekiwanej wartości iloczynu dwóch zmiennych losowych: średniej wartości szkody oraz liczby szkód dla pojedynczego ryzyka przy założeniu zależności oraz występowaniu czynnika nieobserwowalnego. W pracy szczegółowo opisano aspekty teoretyczne związane z budową modelu oraz szacowaniem wartości oczekiwanej. Ponadto w licznych przykładach przedstawiono numeryczne rozwiązania obliczeniowe w programie R. Dodatkowo udostępniono kody programu R na stronie internetowej http://web.ue.katowice.pl/woali/.
EN
Nowadays a common practice of any insurance company is ratemaking, which is defined as the process of classification of the mass risk portfolio into risk groups where the same premium corresponds to each risk. As generalised linear models are usually applied, the process requires the independence between the average value of claims and the number of claims. However, in literature this assumption is called into question. The interest of this paper is to propose the copula-based total claim amount model taking into account an unobservable risk factor in the claim frequency model. This factor, called also as unobserved heterogeneity, is treated as a random variable influencing the number of claims. The goal is to estimate the expected value of the product of two random variables: the average value of claims and the number of claims for a single risk assuming the dependence between the average value of claims and the number of claims for a single risk and the dependence between the number of claims for a single risk and the unobservable risk factor. We give details of the theoretical aspects of the model as well as the empirical example. To acquaint the reader with the model operation, every step of the process of the expected value estimation in described and the R code is available for download, see http://web.ue.katowice.pl/woali/.
The problem in the analysis of insurance data is modeling the number of claims occurring in a given portfolio policy using regression assuming a Poisson distribution which is not always justified, since sometimes the data contains a large number of zeros. This paper presents a generalized Poisson regression for the counter variable and a modified version of Poisson regression taking into account the situation of the presence of a large number of zeros in the data (called zero-inflated Poisson regression). Various types were analyzed in order to determine which variables influence the occurrence tarification zeros in the portfolio policy using the procedure 10 times the patch validation. The result is ranking for classification policies because of the number of generated damage.
Celem niniejszej pracy jest zaproponowanie pewnego złożonego mieszanego rozkładu Poissona, korzystając z tego, że złożony rozkład Poisson–gamma jest szczególnym przypadkiem rozkładu Tweedie. Wykorzystujemy fakt, iż z kolei rozkład Tweedie należy do dyspersyjnej rodziny rozkładów wykładniczych. W tym celu w pierwszej części pracy rozważamy mieszany rozkład Poissona, w którym uwzględniamy zmienną nieobserwowalną. Następnie charakteryzujemy złożony mieszany rozkład Poissona. W drugiej części przedstawiamy możliwość wykorzystania tego rozkładu w szacowaniu oczekiwanej łącznej wartości szkód dla pojedynczego ryzyka w masowym portfelu ryzyk.
EN
The paper presents compound mixed Poisson distributions in the context of Tweedie distribution, since e.g. the compound Poisson-gamma distribution is its special case. We use the fact, that Tweedie distribution belongs to overdispersed exponential family of distributions. In the first part of the paper the problem of overdispersion is addressed by considering mixed Poisson distribution, where the unobserved variable is introduced. Then we specify compound mixed Poisson distribution. In the second part we present the possibilities of making use of this distribution in estimating the total claim costs for the individual risk in the automobile insurance portfolio.
Celem pracy jest zaproponowanie rozkładu prawdopodobieństwa, w którym dowolny rozkład dyspersyjnej rodziny rozkładów wykładniczych zostaje rozszerzony o wartości zerowe (ozn. ZA-rozkład). Rozkład ten wykorzystywany jest dalej do konstrukcji modelu regresyjnego mającego zastosowanie w prognozowaniu wartości pojedynczej szkody w masowym portfelu polis ubezpieczeniowych (np. komunikacyjne czy nieruchomości).
EN
In the paper, we introduce probability distribution which augments any distribution from the exponential family with zero value (ZA-distribution). The new distribution is then employed in a regression model applied for forecasting value of a single claim in a large insurance portfolio (motor or property).
JavaScript is turned off in your web browser. Turn it on to take full advantage of this site, then refresh the page.