PL EN


2017 | 55 | 2(110) | 106-125
Article title

Zastosowanie statystycznej analizy szeregów czasowych do krótkoterminowego prognozowania rozwoju dyscyplin naukowych

Title variants
EN
Application of Statistical Time Series Analysis in Short-Term Forecasting of the Development of Scientific Disciplines
Languages of publication
PL EN
Abstracts
PL
CEL/TEZA: Celem pracy jest opis podstaw statystycznej metody analizy szeregów czasowych, zbadanie możliwości jej zastosowania do krótkoterminowego prognozowania rozwoju dyscyplin naukowych w oparciu o dane na temat cytowalności publikacji dyscyplinarnych, wykorzystanie zapewnianej przez metodę możliwości oceny niepewności prognozy, a także interpretacja uzyskanych wyników w kategoriach naukoznawczych. KONCEPCJA/METODY BADAŃ: W ramach niniejszego opracowania zastosowano metodę analitycznej dekompozycji szeregu czasowego jako metodę wyodrębniania trendu rozwojowego w oparciu o dane na temat dynamiki zjawisk masowych. Zjawiskiem masowym było w tym przypadku cytowanie literatury naukowej w polskojęzycznej sferze nauk o Ziemi. Metoda polega w głównej mierze na sformułowaniu równania opisującego ilościowo przebieg zjawiska z rozróżnieniem trendu głównego oraz składowej odpowiadającej wahaniom przypadkowym. Równanie stanowi podstawę przewidywania przyszłych wartości szeregu czasowego. WYNIKI I WNIOSKI: Uzyskane wyniki przemawiają za możliwością efektywnego zastosowania statystycznej analizy szeregów czasowych do krótkoterminowego prognozowania tempa rozwoju dyscyplin naukowych. W przypadku zrealizowanego badania prognozy okazały się akceptowalne dla dwuletniego horyzontu prognozy, chociaż istnieją podstawy, aby przypuszczać, że skonstruowanie prognoz w postaci przedziałów ufności lub nieznaczne zmodyfikowanie metody mogłoby wydłużyć ten okres. Wyniki zinterpretowano w kategoriach naukoznawczych jako uproszczony indeks natychmiastowości dyscyplin, który jest szczególnie predysponowany do praktycznych zastosowań komparatywnych. ORYGINALNOŚĆ/WARTOŚĆ POZNAWCZA: W ramach analizy literatury przedmiotu nie natrafiono na przykłady badań, które byłyby prowadzone w sposób zaproponowany w ramach niniejszej publikacji. Analiza szeregów czasowych była wcześniej stosowana jedynie do wyników podziału zbioru publikacji dyscyplinarnych na, nazywane „klastrami”, podzbiory prac w założeniu reprezentatywnych dla określonych subdyscyplin. Operacja podziału jest zawsze dokonywana w oparciu o jedno z wielu dostępnych kryteriów podobieństwa publikacji, a w szczególności kryterium oparte na współwystępowaniu słów i terminów kluczowych oraz w oparciu o bardzo liczne i dające różne efekty algorytmy grupujące. Wydaje się w związku z tym, że podejście oparte na bezpośredniej cytowalności publikacji pozwala wyeliminować ze zbioru wyników element pewnej niejednoznaczności (względności) uwarunkowany znaczącym zróżnicowaniem i brakiem uniwersalności w zakresie sposobu działania algorytmów grupujących oraz kryteriów kognitywnego podobieństwa publikacji naukowych.
EN
PURPOSE/THESIS: The aim of this paper is to: describe the basics of statistical time series analysis, investigate the possibility of using this approach in short-term forecasting of the development of scientific disciplines based on data showing the citedness of research papers, assess the uncertainty of the forecasts (feature available with this method) and read the results of the research in terms of science studies. APPROACH/METHODS: The analytical method of time series decomposition was used to isolate so-called development trends based on the observations of the dynamics of mass phenomena. In this case, the mass phenomenon was the citedness of scientific literature in the field of Polish earth science.The method consists of the formulation of an equation which quantitatively describes the course of the phenomenon and distinguishes the main trend from the accidental variability (fluctuations). The equation serves as a keystone in the process of predicting future values of the time series. RESULTS AND CONCLUSIONS: The results confirm the possibility of an effective application of the approach in short-term forecasting of the scientific discipline development rate. In the case of the research in question, the forecasts proved acceptable as regards two-year horizon of the forecast. However, it is assumed that building the forecast in the form of confidence intervals or slightly modifying the approach could contribute to the lengthening of the horizon. The results were read as a simplified immediacy index, available in particular for comparative applications. ORIGINALITY/VALUE: The authors were unable to find any examples of research which was conducted in a manner presented in this paper. Time series analysis was earlier applied to so-called clusters only, which are a result of dividing disciplinary publications into narrow groups. The groups are usually considered to be representative for certain scientific subdisciplines. Clustering is always done on the basis of one out of many available similarity criteria, in particular the one called a co-word similarity. Furthermore, there is a wide variety of clustering algorithms, which typically yield considerably differing results. As a result, it seems that the approach based on direct citedness of scientific publications helps to eliminate the redundant vagueness and the inevitable lack of universality which appear when one analyzes the results of an algorithmic clustering.
Year
Volume
55
Issue
Pages
106-125
Physical description
Dates
received
2017-03-01
revised
2017-07-19
accepted
2017-12-22
Contributors
  • Oddział Informacji Naukowej Biblioteki Politechniki Rzeszowskiej, al. Powstańców Warszawy 12, 35–959 Rzeszów, lopa@prz.edu.pl
  • Wydział Chemiczny Politechniki Rzeszowskiej, al. Powstańców Warszawy 6, budynek H, pokój H-242, 35–959 Rzeszów, mjaromin@prz.edu.pl
References
  • Aczel, A.D. (2007). Statystyka w zarządzaniu. Warszawa: PWN.
  • Bornmann, L., Daniel, H-D. (2008). What Do Citation Counts Measure? A Review of Studies on Citing Behavior. Journal of Documentation, 64(1), 45–80.
  • Boyack, K.W., Klavans, R. (2014). Creation of Highly Detailed, Dynamic, Global Model and Map of Science. Journal of the Association for Information Science and Technology, 65(4), 670–685.
  • Braun, T., Schubert, A., Kostoff, R. (2000). Growth and Trends of Fullerene Reserch as Reflected in Its Journal Literature. Chemical Reviews, 100(1), 23–37.
  • Burrell, Q. (2001). Stochastic Modelling of the First-Citation Distribution. Scientometrics, 52(1), 3–12.
  • Burton, R.E., Kebler, R.W. (1960). The ‘Half-Life’ of Some Scientific and Technical Literatures. American Documentation, 11(1), 18–22.
  • Chen, Ch. (2006). CiteSpace II: Detecting and Visualizing Emerging Trends and Transient Patterns in Scientific Literature. Journal of the American Society for Information Science and Technology, 57(3), 359–377.
  • Costas, R., van Leeuwen, T.N., van Raan, A.F.J. (2010). Is Scientific Literature Subject to a ‘Sell-By-Date’? A General Methodology to Analyze the ‘Durability’ of Scientific Documents. Journal of the American Society for Information Science and Technology, 61(2), 329–339.
  • De Gooijer, J.G., Hyndman, R.J. (2006). 25 Years of Time Series Forecasting. International Journal of Forecasting, 22(3), 443–473.
  • Diodato, V. (1994). Dictionary of Bibliometrics. New York: London: Norwood: The Haworth Press.
  • Diodato, V., Smith, F. (1993). Obsolescence of Music Literature. Journal of the American Society for Information Science, 44(2), 101–112.
  • Ena, O., Mikova, N., Saritas, O., Sokolova, A. (2016). A Methodology for Technology Trend Monitoring: The Case of Semantic Technologies. Scientometrics, 108(3), 1013–1041.
  • Garfield, E. (1985). The Articles Most Cited in the SCI from 1961 to 1982. Another 100 Citation Classics: The Watson-Crick Double Helix Has Its Turn [online]. Essays of an Information Scientist, 8, 187–196, [21.12.2017], http://garfield.library.upenn.edu/essays/v8p187y1985.pdf
  • Garfield, E. (2004). Historiographic Mapping of Knowledge Domains Literature. Journal of Information Science, 30(2), 119–145.
  • Gelper, S., Fried, R., Croux, Ch. (2007). Robust Forecasting with Exponential and Holt–Winters Smoothing. Journal of Forecasting, 29(3), 285–300.
  • Glänzel, W. (2004). Towards a Model for Diachronous and Synchronous Citation Analyses. Scientometrics, 60(3), 511–522.
  • Guo, H., Weingart, S., Börner, K. (2011). Mixed-Indicators Model for Identifying Emerging Research Areas. Scientometrics, 89(1), 421–435.
  • Hirshey, M. (2009). Fundamentals of Managerial Economics. Mason, OH: South-Western Cengage Learning.
  • Huang, M-H., Chang, C-P. (2015). A Comparative Study on Detecting Research Fronts in the Organic Light-Emitting Diode (OLED) Field Using Bibliographic Coupling and Co-Citation. Scientometrics, 102(3), 2041–2057.
  • Kildiszew, G., Frenkel, A. (1976). Analiza szeregów czasowych i prognozowanie. Warszawa: PWE.
  • Krawiec, S. (2014). Adaptacyjne modele wygładzania wykładniczego jako instrumenty prognozowania krótkoterminowego zjawisk ilościowych. Gliwice: Wydaw. Politechniki Śląskiej.
  • Krzysztofiak, M., Luszniewicz, A. (1976). Statystyka. Warszawa: PWE.
  • Kuhn, T.S. (2001). Struktura rewolucji naukowych. Warszawa: Fundacja Aletheia.
  • Levitt, J.M., Thelwall, M. (2008). Patterns of Annual Citation of Highly Cited Articles and the Prediction of Their Citation Ranking: A Comparison Across Subjects. Scientometrics, 77(1), 41–60.
  • Łapkowska-Baster, B. (2009). Miary współzależności i dynamiki zjawisk w statystyce opisowej. Przykłady i zadania. Kraków: Wydaw. Uniwersytetu Jagiellońskiego.
  • Opaliński, Ł. (2017a). Bibliometryczna metodologia prognozowania i oceny rozwoju dyscyplin naukowych. Analiza piśmiennictwa. Część 1: Publikacje pionierskie, metoda powiązań bibliograficznych, metoda współcytowań i metoda współwystępowania specjalistycznej terminologii naukowej. Zagadnienia Informacji Naukowej. Studia Informacyjne, 109(1), 34–65.
  • Opaliński, Ł. (2017b). Bibliometryczna metodologia prognozowania i oceny rozwoju dyscyplin naukowych. Analiza piśmiennictwa. Część 2: badania porównawcze, hybrydowe, statystyczne, analizy dokumentów patentowych, ścieżek rozwoju dyscyplin oraz pozostałe oryginalne podejścia metodologiczne. Zagadnienia Informacji Naukowej. Studia Informacyjne, 110(2), 74–106.
  • Price, D. de Solla (1967). Mała Nauka – Wielka Nauka. Warszawa: PWN.
  • Pritchard, A. (1969). Statistical Bibliography or Bibliometrics? Journal of Documentation, 25(4), 348–349.
  • Purczyński, J. (2010). Wybrane problemy stosowania trendu wielomianowego w prognozowaniu gospodarczym. Zeszyty Naukowe Uniwersytetu Szczecińskiego. Ekonomiczne Problemy Usług, 60, 324–339.
  • Purczyński, J. (2014). Wybrane aspekty prognozowania z wykorzystaniem klasycznych modeli trendu. Zeszyty Naukowe Uniwersytetu Szczecińskiego. Studia i Prace Wydziału Nauk Ekonomicznych i Zarządzania, 36(2), 119–130.
  • Redner, S. (1998). How Popular is Your Paper? An Empirical Study of the Citation Distribution. The European Physical Journal B-Condensed Matter and Complex Systems, 4(2), 131–134.
  • Seglen, P.O. (1992). The Skewness of Science. Journal of the American Society for Information Science, 43(9), 628–638.
  • Shibata, N., Kajikawa, Y., Takeda, Y., Matsushima, K. (2008). Detecting Emerging Research Fronts Based on Topological Measures in Citation Networks of Scientific Publications. Technovation, 28(11), 758–775.
  • Skalska-Zlat, M. (1993). Bibliometryczne badania rozwoju dyscypliny naukowej. Seria: Bibliotekoznawstwo XVII. Wrocław: Wydaw. UWr.
  • Skalska-Zlat, M. (1999). Bibliografia jako odbicie rozwoju nauki. Zagadnienia Naukoznawstwa, 1(139), 57–63.
  • Small, H., Boyack, K.W., Klavans, R. (2014). Identifying Emerging Topics in Science and Technology. Research Policy, 43(8), 1450–1467.
  • Snarska, A. (2011). Statystyka. Ekonometria. Prognozowanie. Ćwiczenia z Excelem 2007. Warszawa: Placet.
  • Sobczyk, M. (2008). Prognozowanie. Teoria, przykłady, zadania. Warszawa: Placet.
  • Sobczyk, M. (2015). Statystyka. Warszawa: PWN.
  • Stinson, E.R., Lancaster, F.W. (1987). Synchronous Versus Diachronous Methods in the Measurement of Obsolescence by Citation Studies. Journal of Information Science, 13(2), 65–74.
  • Szkutnik, W., Przybylska-Mazur, A. (2008). Algebra liniowa dla studiów ekonomicznych: metody i zadania, algebra macierzy. Katowice: Wydaw. Uczelniane Akademii Ekonomicznej im. Karola Adamieckiego.
  • Takeda, Y., Kajikawa, Y. (2009). Optics: A Bibliometric Approach to Detect Emerging Research Domains and Intellectual Bases. Scientometrics, 78(3), 543–558.
  • Trajdos, T. (2013). Matematyka. Cz. 3, Liczby zespolone, wektory, macierze, wyznaczniki, geometria analityczna i różniczkowa. Warszawa: WNT.
  • Tu, Y-N., Hsu, S-L. (2016). Constructing Conceptual Trajectory Maps to Trace the Development of Research Fields. Journal of the Association for Information Science and Technology, 67(8), 2016–2031.
  • Van Dalen, H.P., Henkens, K. (2005). Signals in Science – On the Importance of Signaling in Gaining Attention in Science. Scientometrics, 64(2), 209–233.
  • Wang, Ch-Ch., Ho, Y-S. (2016). Research Trend of Metal-Organic Frameworks: A Bibliometric Analysis. Scientometrics, 109(1), 481–513.
  • Yaffee, R.A., McGee, M. (2000). Introduction to Time Series Analysis and Forecasting: With Applications of SAS and SPSS. San Diego: Academic Press.
  • Zeliaś, A. (1997). Teoria prognozy. Warszawa: PWE.
  • Zeliaś, A., Pawełek, B., Wanat, S. (2013). Prognozowanie ekonomiczne. Teoria, przykłady, zadania. Warszawa: PWN.
  • Żurowska, J. (2005). Zastosowanie modelu trendu wielomianowego do opisu kształtowania się wskaźnika motoryzacji w Polsce w latach 1980–2004. Transport Miejski i Regionalny, 12, 15–21.
Document Type
Publication order reference
Identifiers
ISSN
0324-8194
e-ISSN
2392-2648
YADDA identifier
bwmeta1.element.desklight-7ff57a48-4a25-40fc-ada1-f0b19bc1fd27
JavaScript is turned off in your web browser. Turn it on to take full advantage of this site, then refresh the page.