Full-text resources of CEJSH and other databases are now available in the new Library of Science.
Visit https://bibliotekanauki.pl

PL EN


2018 | 56 | 1(111) | 96-113

Article title

ScientoMiner ICR – moduł importu danych bibliograficznych z zasobów Crossref dla platformy Gephi

Title variants

EN
ScientoMiner ICR – The Plug-in for Importing Bibliographic Data from Crossref Resources to the Gephi Platform

Languages of publication

PL EN

Abstracts

PL
CEL/TEZA: Autorka stawia tezę, że coraz bardziej powszechne wykorzystywanie systemu identyfikacji DOI oraz postępujące zjawisko upubliczniania przez poszczególnych wydawców informacji o cytowaniach artykułów otwierają nowe możliwości prowadzenia analiz sieci cytowań bibliograficznych i zapewnić mogą wyższą niż dotąd wiarygodność uzyskiwanych wyników. Na szczególną uwagę zasługują tutaj katalogujące usługi Crossref, umożliwiające pozyskanie ustrukturalizowanych informacji bibliograficznych (w tym informacji o cytowaniach) wszystkim zainteresowanym stronom. Celem artykułu jest przedstawienie opracowanego przez autorkę rozszerzenia platformy analitycznej Gephi o moduł importu danych opisujących cytowania z zasobów Crossref. Rozwiązanie to ułatwia prowadzenie analiz cytowań pobieranych z tego źródła danych. KONCEPCJA/METODY BADAŃ: Implementacja zaproponowanego rozszerzenia wymagała analizy architektury informacyjnej zasobów gromadzonych i indeksowanych w bazie danych Crossref oraz sposobu ich udostępniania poprzez usługi sieciowe dostawcy. Opracowany został również grafowy model danych umożliwiający jednoznaczną identyfikację artykułów cytujących i cytowanych oraz relacji je łączących, tak aby rozbudowa tego modelu w przyszłości (np. o relacje autorstwa) nie uniemożliwiała korzystania z opracowanego modułu. WYNIKI I WNIOSKI: Udostępniona funkcjonalność umożliwia importowanie skierowanego grafu cytowań z zasobów Crossref do platformy Gephi, dla wybranych przez użytkownika czasopism opisywanych identyfikatorem ISSN, z możliwością ograniczenia do zadanych przedziałów czasowych. Dla mniej wprawnych użytkowników oferuje ona również wstępne pokolorowanie wierzchołków grafu według ich typu. Posługiwanie się identyfikatorami DOI uwiarygodnia wyniki prowadzonych analiz. ORYGINALNOŚĆ/WARTOŚĆ POZNAWCZA: Platforma obliczeniowa Gephi, stanowiąc ciekawe narzędzie do analizowania struktur sieciowych, bywa również wykorzystywana, głównie przez badaczy zagranicznych, do realizacji badań bibliometrycznych i wizualizacji ich wyników. Od niedawna obserwować można rosnący wzrost zainteresowania tym narzędziem również badaczy krajowych, jednak wydaje się, że ciągle przegrywa ono konkurencję z prostszą w obsłudze aplikacją Pajek oraz ściśle przeznaczonymi do analiz bibliometrycznych środowiskami VOSviewer oraz CiteSpace. Choć te ostatnie narzędzia mają zdecydowanie mniejsze możliwości analityczne, to za ich wyborem przemawiają techniczne bariery zasilania platformy Gephi danymi bibliograficznymi. Autorka, korzystając z modularnej budowy tej platformy, opracowała rozszerzenie umożliwiające automatyczny import danych wprost z zasobów Crossref w sposób bardziej przyjazny w porównaniu ze środowiskiem VOSviewer. Według jej najlepszej wiedzy jest to również pierwsze rozszerzenie tej platformy przeznaczone do badań stricte bibliometrycznych.
EN
PURPOSE/THESIS: Presenting what causes problems in reliable bibliometric research using citation network analysis, the author indicates that the growing use of the DOI identification system and the growing phenomenon of publishing information on article citations by individual publishers result in new possibilities for such research. Particularly noteworthy here are Crossref services that enable downloading structured bibliographic information (including citations) for all interested parties. The author proposes the extension of the Gephi analytical platform with a data import plug-in that imports data describing citations from Crossref services, thus facilitating citation analysis by all interested parties in this source of data. APPROACH/METHODS: The implementation of the proposed plug-in required the analysis of the information architecture of resources collected and indexed in the Crossref database and the way they are shared as web services. One of the important parts of the research was also the development of a graph data model that allows unambiguous identification of citing and cited papers and the relations between them, so that the evolution of this model in the future (e.g. adding co-authorship relations) would not prevent the usage of the developed plug-in. RESULTS AND CONCLUSIONS: The developed functionality allows to import a directed citation graph from Crossref resources to the Gephi platform, for user-defined journals identified by the ISSN, with the possibility of limiting the data set to given time intervals. For less experienced users, it also offers preliminary coloring of the graph’s vertices by their type. The use of DOI identifiers makes the results of the analyzes more reliable than in the case of analyses where matching of titles and authors of bibliographic units with records of references section is performed. ORIGINALITY/VALUE: The Gephi computing platform, being an interesting tool for analyzing network structures, is also used, mainly by foreign researchers, to implement bibliometric research and visualize their results. Recently, there has been a growing interest in this tool among local researchers, but it seems that it is still losing competition with the easier to use Pajek application and strictly dedicated to the bibliometric analysis VOSviewer platform. Although the latter tools have less analytical capabilities, the technical barriers in loading the Gephi platform with bibliographic data limits its usage. The author, using the modular construction of this platform, has developed a plug-in enabling automatic data import directly from the Crossref resources in a more friendly way compared to the VOSviewer environment. To the best of her knowledge, it is also the first extension of this platform dedicated to the support of strictly bibliometric research.

Year

Volume

56

Issue

Pages

96-113

Physical description

Dates

received
2018-02-05
revised
2018-04-14
accepted
2018-05-22

Contributors

  • Instytut Bibliotekoznawstwa i Informacji Naukowej, Uniwersytet Śląski w Katowicach, pl. Sejmu Śląskiego 1, 40-032 Katowice

References

  • Bastian, M., Heymann, S., Jacomy, M. (2009). Gephi: An Open Source Software for Exploring and Manipulating Networks. International AAAI Conference on Weblogs and Social Media, 8, 361–362.
  • Gläser, J., Glänzel, W., Scharnhorst, A. (2017). Same Data-Different Results? Towards a Comparative Approach to the Identification of Thematic Structures in Science. Scientometrics, 111(2), 981–998.
  • IDF (2017a). DOI Handbook [online]. International DOI Foundation [28.01.2018], https://www.doi.org/doi_handbook/7_IDF.html
  • IDF (2017b). Registration Agencies – Areas of Coverage [online]. International DOI Foundation [28.01.2018], https://www.doi.org/RA_Coverage.html
  • ISSI (2017). Open Citations: A Letter from the Scientometric Community to Scholarly Publishers [online]. ISSI – International Society for Informetrics and Scientometrics [28.01.2018], http://issi-society.org/open-citations-letter
  • Kamińska, A. M. (2017a). Dobre praktyki publikowania danych badawczych [online]. Biuletyn EBIB, 7(177), [28.01.2018], http://open.ebib.pl/ojs/index.php/ebib/article/view/569/752
  • Kamińska, A. M. (2017b). Miary podobieństw łańcuchów znakowych a deduplikacja rekordów w bibliograficznych bazach danych. Przegląd Biblioteczny, 4, 477–495.
  • Kamińska, A. M. (2017c). ProBIT – prospektywna metoda tworzenia trawersowalnych indeksów cytowań a współczesne problemy organizacji przestrzeni informacji w tradycyjnych bibliograficznych bazach danych. Zagadnienia Informacji Naukowej, 55(1), 66–82.
  • Kamińska, A. M. (2017d). Wizualizacje wybranych wskaźników bibliometrycznych na przykładzie bibliograficznej bazy danych CYTBIN. Toruńskie Studia Bibliologiczne, 2 (19), 163–187. DOI: 10.12775/TSB.2017.022
  • Kamińska, A. M. (2018a). Visualizations of the GRUBA Bibliographic Database: From Printed Sources to the Maps of Science. In: V. Osinska & G. Osinski (eds.). Information Visualization Techniques in the Social Sciences and Humanities (151–174). Hershey, PA: IGI Global, 151–174. DOI: 10.4018/978–1-5225–4990-1.ch009
  • Kamińska, A. M. (2018b). Zastosowanie struktur grafowych do analiz bibliometrycznych i webometrycznych. Modele i metody. Nowa Biblioteka. Usługi, Technologie Informacyjne i Media [w druku].
  • Van Eck, N.J.; Waltman, L. (2014) Visualizing Bibliometric Networks. In: Y.; R. Rousseau & D. Wolfram (eds.). Measuring Scholarly Impact (285–320). Springer, Cham. DOI: 10.1007/978–3-319–10377-8_13

Document Type

Publication order reference

Identifiers

ISSN
0324-8194
EISSN
2392-2648

YADDA identifier

bwmeta1.element.desklight-ef2fe2bf-8f7b-4704-b2c8-35c476daf583
JavaScript is turned off in your web browser. Turn it on to take full advantage of this site, then refresh the page.