Full-text resources of CEJSH and other databases are now available in the new Library of Science.
Visit https://bibliotekanauki.pl

PL EN


2016 | 84 | 1 | 65-79

Article title

Wyszukiwanie powielonych opisów bibliograficznych w bazie danych: przykład repozytorium Uniwersytetu Jagiellońskiego

Authors

Selected contents from this journal

Title variants

EN
Searching for duplicate bibliographic records in a database: the case of the Jagiellonian University Repository

Languages of publication

PL

Abstracts

PL
Teza/cel artykułu – Celem artykułu było opisanie działania i zastosowania algorytmu do wyszukiwania podobnych opisów bibliograficznych w różnych rekordach w bibliograficznej bazie danych. Algorytm stworzono z zamiarem zautomatyzowania kwerendy mającej na celu wskazanie potencjalnie powielonych opisów bibliograficznych w Repozytorium Uniwersytetu Jagiellońskiego. Metody badawcze – Tworząc stosowne narzędzie przeanalizowano istniejące algorytmy do porównań danych tekstowych. Przy tworzeniu nowego algorytmu wykorzystano obliczenia wektorowe w wielowymiarowych hiperprzestrzeniach i geometrię analityczną na płaszczyźnie kartezjańskiej. Wyniki i wnioski – W trakcie testów wykazano, że przetworzenie dużej liczby rekordów jest możliwe i skuteczniejsze po uprzedniej zamianie wartości danych tekstowych na liczby.
EN
Thesis/Objective – The article is to describe the algorithm applied to search for duplicate bibliographic records in a bibliographic database. The algorithm in question was built to automate the query used to retrieve duplicate bibliographic records in the Jagiellonian University Repository. Research methods – In order to build the algorithm the author analyzed already existing algorithms used to compare text data. The construction of the new algorithm was done with vector calculations in multidimensional hiperspaces and analytic geometry in Cartesian plane. Results and conclusions – Tests have shown that processing of large number of records is possible and more effective if text data are replaced with numbers.

Year

Volume

84

Issue

1

Pages

65-79

Physical description

Contributors

author
  • The Jagiellonian University Repository

References

  • Chang, Chengguo; Wang, Hui (2012). Comparison of Two-Dimensional String Matching Algorithms, In: IET International Conference on Computer Science and Electronics Engineering 2012. Piscataway: Institution of Engineering and Technology, pp. 608-611.
  • Charras, Christian (2004). Handbook of Exact String Matching Algorithms. London: King’s College.
  • Drabik, Adrian; Sanetra, Krystyna; Szafrański, Leszek (2014). Instrukcja katalogowania dokumentów w Bibliografii Publikacji Pracowników Uniwersytetu Jagiellońskiego: opis bibliograficzny i schemat metadanych. Kraków: Biblioteka Jagiellońska.
  • Krusche, Peter; Tiskin, Alexander (2010). New Algorithms for Efficient Parallel String Comparison. In: Proceedings of the 22nd ACM symposium on Parallelism in algorithms and architectures – SPAA ’10. New York: ACM Press, p. 209.
  • Levenshtein, Vladimir Iosifovich (1966). Binary Codes Capable of Correcting Deletions, Insertions and Reversals. Soviet Physics = Doklady, vol. 10, no. 8, pp. 707-710.
  • Ritt, Marcus et al. (2009). An integer linear programming approach for approximate string comparison. "European Journal of Operational Research", vol. 198, no. 3, pp. 706-714.
  • SaiKrishna, Vidya; Rasool, Akhtar; Khare, Nilay (2012). String Matching and its Applications in Diversified Fields. "International Journal of Computer Science Issues", vol. 9, no. 1, pp. 219-226.
  • Tiskin, Alexander (2008). Semi-local String Comparison: Algorithmic Techniques and Applications. "Mathematics in Computer Science", vol. 1, no. 4, pp. 571-603.
  • Zhenhong, Lv et al. (2012). Fast Single Pattern String Matching Algorithms Based on Multi-Windows and Integer Comparison. In: IET International Conference on Information Science and Control Engineering 2012. Piscataway: Institution of Engineering and Technology, pp. 1-5.

Document Type

Publication order reference

Identifiers

YADDA identifier

bwmeta1.element.desklight-094c8952-8bac-4154-a463-ec4c75109083
JavaScript is turned off in your web browser. Turn it on to take full advantage of this site, then refresh the page.