Full-text resources of CEJSH and other databases are now available in the new Library of Science.
Visit https://bibliotekanauki.pl

PL EN


2020 | vol. 24, nr 2 | 1-16

Article title

On the method of identification of atypical observations in time series

Content

Title variants

PL
O metodzie identyfikacji obserwacji nietypowych w szeregach czasowych

Languages of publication

EN

Abstracts

EN
The paper presents a method of detecting atypical observations in time series with or without seasonal fluctuations. Unlike classical methods of identifying outliers and influential observations, its essence consists in examining the impact of individual observations both on the fitted values of the model and the forecasts. The exemplification of theoretical considerations is the empirical example of modelling and forecasting daily sales of liquid fuels at X gas station in the period 2012-2014. As a predictor, a classic time series model was used, in which 7-day and 12-month cycle seasonality was described using dummy variables. The data for the period from 01.01.2012 to 30.06.2014 were for the estimation period and the second half of 2014 which was the period of empirical verification of forecasts. The obtained results were compared with other classical methods used to identify influential observations and outliers, i.e. standardized residuals, Cook distances and DFFIT. The calculations were carried out in the R environment and the Statistica package.
PL
W pracy zaproponowano metodę wykrywania obserwacji nietypowych w szeregach czasowych z wahaniami sezonowymi oraz bez tych wahań. Jej istota jej polega na badaniu wpływu poszczególnych obserwacji szeregu na wartości teoretyczne modelu oraz wielkości prognoz zbudowanych na jego podstawie. Egzemplifikacją rozważań o charakterze teoretycznym jest przykład empiryczny dotyczący modelowania i prognozowania dziennej sprzedaży paliw płynnych na stacji paliw X w latach 2012-2014. Dane za okres od 1.01.2012 do 30.06.2014 stanowią okres estymacyjny, a za II półrocze 2014 r. okres empirycznej weryfikacji prognoz. Wyniki otrzymane za jej pomocą zostały porównane z wynikami uzyskanymi innymi metodami służącymi do identyfikacji obserwacji wpływowych oraz odstających, w tym m.in.: reszt standaryzowanych, odległości Cooka oraz DFFIT. Obliczenia przeprowadzono w środowisku R oraz pakiecie Statistica.

References

  • Algur, S. P., and Biradar, J. G. (2017). Cooks distance and mahanabolis distance outlier detection methods to identify review spam. International Journal of Engineering and Computer Science, 6(6), 21638-21649. doi:10.18535/ijecs/v6i6.16
  • Anderson, D. R., Sweeney, D. J., and Williams, T. A. (2011). Statistics for business and economics 11e. Mason: South-Western Cengage Learning.
  • Atkinson, A. C., Koopman, S. J., and Shephard, N. (1997). Detecting shocks: Outliers and breaks in time series. Journal of Econometrics, (80), 387-422. Retrieved from https://www.sciencedirect.com/science/article/pii/S030440769700050X
  • Belsely, D. A., Huh, E., and Welsch, R. E. (2004). Regression diagnostics. Identifying influential data and sources of collinearity. Hoboken: John Wiley & Sons.
  • Bonham, C. D. (1971). Testing for outlying observations in a sample group. Journal of Range Management, 24(4), 310-312. doi:10.2307/3896952
  • Chatterjee, S., and Hadi, A. S. (1986). Influential observations, high leverage points, and outliers in linear regression. Statistical Science, 1(3), 379-393. Retrieved from http://www.mathstat.ualberta.ca/~wiens/stat578/papers/Chatterjee%20&%20Hadi.pdf
  • Cook, D. R. (1977). Detection of influential observation in linear regression. Technometrics, 19(1), 15-18. doi:10.2307/1268249
  • Cook, D. R. (1980). Identification of outliers. Chapman & Hall. doi:10.1007/978-94-015-3994-4
  • Cousineau D., and Chartier, S. (2010). Outliers detection and treatment: a review. International Journal of Psychological Research, 3(1), 58-67.
  • Dittmann, P., Dittman, I., Szabela-Pasierbińska, E., and Szpulak, A. (2009). Prognozowaniu w zarządzaniu przedsiębiorstwem. Kraków: Wolters Kluwer Polska Sp. z o.o.
  • Hoaglin, D. C., and Welsch, R. E. (1978). The Hat Matrix in Regression and ANOVA. The American Statistician, 32(1), 17-22. Retrieved from http://www.stat.ucla.edu/~cocteau/stat201b/handout/hat.pdf
  • Kannan Senthamarai, K., and Manoj, K., (2015). Outlier detection in multivariate data. Applied Mathematical Sciences, 47(9), 2317-2324
  • Oesterreich, M. (2017). Symulacyjne badanie wpływu liczby i rozmieszczenia luk na dokładność prognoz w szeregu czasowym dla danych dziennych. Ekonometria, 1(55), 57-68. doi:10.15611/ekt.2017.1.05
  • Osborne, J. W., Overbay, A. (2004). The power of outliers (and why researchers should ALWAYS check for them). Practical Assessment, Research & Evaluation, 9(6). Retrieved from https://pareonline.net/getvn.asp?v=9%26n=6
  • Paul, R. K. (2018). Some methods of detection of outliers in linear models. Retrieved from IASRI: http://iasri.res.in/seminar/AS-299/ebooks/2005-2006/Msc/trim1/4.%20Some%20Methods%20of%20Detection%20of%20Outliers%20in%20Linear%20Regression%20Model-Ranjit.pdf
  • Tsay, R. S. (1988). Outliers, level shifts and variance changes in time series. Journal of Forecasting, (7), 1-20. doi:10.1002/for.3980070102
  • Watson, S. M., Clark, S., Tight, M., and Redfern, E. (1992). An influence method for outliers detection applied to time series traffic data. ITS Working Paper, (365). Retrieved from http://eprints.whiterose.ac.uk/2206/1/ITS365_WP365_uploadable.pdf
  • Watson, S. M., Tight, M., Clark, S., and Redfern, E. (1991). Detection of outliers in time series. ITS
  • Working Paper (362). Retrieved from http://eprints.whiterose.ac.uk/2209/1/ITS261_WP362_ uploadable.pdf
  • Zahari, S. M., Zainol, M. S., Sopian, K. B., Zaharim, A., and Ibrahim, K. (2010). Additive outliers (AO) and innovative outliers (IO) in GARCH (1, 1) processes. AMERICAN-MATH’10 Proceedings of the 2010 American conference on Applied mathematics, 471-479. Retrieved from https://www.researchgate.net/publication/228664831_Additive_outliers_AO_and_innovative_outliers_IO_in_GARCH_1_1_processes
  • Zawadzki, J. (1999). Ekonometryczne metody predykcji dla danych sezonowych w warunkach braku pełnej informacji. Szczecin: Wydawnictwo Naukowe Uniwersytetu Szczecińskiego.
  • Zawadzki, J. (2003). Zastosowanie hierarchicznych modeli szeregów czasowych w prognozowaniu zmiennych ekonomicznych z wahanimi sezonowymi. Szczecin: Wydawnictwo Akademii Rolniczej w Szczecinie.

Document Type

Publication order reference

Identifiers

YADDA identifier

bwmeta1.element.desklight-3d8306b7-3776-49ae-9b29-099984e0fb8c
JavaScript is turned off in your web browser. Turn it on to take full advantage of this site, then refresh the page.