Full-text resources of CEJSH and other databases are now available in the new Library of Science.
Visit https://bibliotekanauki.pl

PL EN


Journal

2019 | 13 | 215-225

Article title

Narzędzia do analizy mowy – przegląd dostępnych programów i bibliotek

Content

Title variants

EN
Speech analysis tools - overview of available programs and libraries

Languages of publication

Abstracts

EN
This article presents a list of popular speech analysis tools in the form of programs available online to download and in the form of libraries in various programming languages. The first part presents programs used to visualise, to edit, to analyse the speech signal (for example, measurements of the fundamental frequency, intensity or formants) and annotation (segmentation, transcription and labelling of recordings). The second part presents selected libraries available on the GitHub website, which are used for acoustic, phonetic-phonological and prosodic analysis of speech. All tools are described taking into account their functions and capabilities, sources, authors, licenses on which they are made available. The final part of the article presents an evaluation of the described programs taking into account the number and usability of their functions.
PL
Artykuł przedstawia zestawienie popularnych narzędzi do analizy mowy w formie programów dostępnych do pobrania i w formie bibliotek w różnych językach programowania. W pierwszej części zestawione zostały programy służące do wizualizacji sygnału mowy, edytowania, analizy (na przykład pomiarów częstotliwości podstawowej, intensywności czy formantów) oraz anotacji (segmentacji, transkrypcji i etykietowania nagrań). W drugiej części przedstawiono wybrane biblioteki dostępne na stronie GitHub, które służą do akustycznej, fonetyczno-fonologicznej oraz prozodycznej analizy nagrań. Wszystkie narzędzia zostały opisane z uwzględnieniem ich funkcji i możliwości, źródeł, autorów, licencji, na jakich są udostępniane. W ostatnim rozdziale artykułu podjęto próbę ewaluacji opisanych programów, biorąc pod uwagę liczbę i użyteczność ich funkcjonalności.

Journal

Year

Volume

13

Pages

215-225

Physical description

Dates

published
2019

Contributors

  • Uniwersytet Adama Mickiewicza w Poznaniu, Wydział Neofilologii, Zakład Fonetyki

References

  • Bachan J., Wagner A., Klessa K., Demenko G. (2015), Consistency of Prosodic Annotation of Spontaneous Speech for Technology Needs, Proceedings of the 7th Language & Technology Conference.
  • Giannakopoulos T. (2015), pyAudioAnalysis: An Open-Source PythonLibrary for Audio Signal Analysis, https://journals.plos.org/plosone/article/file?id=10.1371/journal.pone.0144610&-type=printable [dostęp: 6.12.2019].
  • Leech G. (2005), Adding Lingusitic Annotation, [in:] M. Wynne, Developing Linguistic Corpora: a Guide to Good Practice, Oxford.
  • Łukasik M. (2009), Anotacja korpusów tekstów specjalistycznych, „Języki Specjalistyczne 9. Wyraz – tekst – interpretacja”.
  • Orozco-Arroyave J.R., Vásquez-Correa J.C., Vargas-Bonilla J.F., Arora R., Dehak N., Nidadavolu P., Nöth E. (2018), NeuroSpeech: An open-source software for Parkinson’s speech analysis, “Digital Signal Processing”, July.
  • Rykowski J. (2014), Metody i narzędzia rozpoznawania mowy w zastosowaniach niekomercyjnych, „Napędy i Sterowanie”, R. 16, nr 6.
  • Wagner A., Bachan J., Klessa K., Demenko G. (2015), Przegląd wybranych aspektów analizy prozodii mowy spontanicznej na potrzeby technologii mowy, „Prace Filologiczne”, t. LXVI.

Document Type

Publication order reference

Identifiers

Biblioteka Nauki
2197222

YADDA identifier

bwmeta1.element.ojs-doi-10_25312_2391-5137_13_2019_14kp
JavaScript is turned off in your web browser. Turn it on to take full advantage of this site, then refresh the page.