W artykule prezentujemy historię danych, główną ideę naszego międzynarodowego, semestralnego kursu analizy danych dla studentów nauk społecznych i humanistycznych. Posługując się wielojęzycznym zbiorem korespondencji francuskiego slawisty André Mazona, przybliżamy w szczególności cztery fazy cyklu życia danych – gromadzenie, analizę, anotację, licencjonowanie i udostępnianie. Wykorzystujemy przy tym narzędzia do wizualizacji danych (Tableau Public), transkrypcji tekstu (Transkribus, Pero), tworzenia i przeszukiwania korpusów tekstowych (TEITOK, Corpus Query Language) oraz przetwarzania języka naturalnego (UDPipe).
EN
We present a data story, the central concept of our international onesemester data analytics course for students of social sciences and humanities. Namely, we demonstrate the four stages of the data lifecycle – gathering, analyzing, annotating, licensing & sharing – using the multilingual correspondence collection of French Slavist André Mazon and tools for data visualization (Tableau Public), text transcription (Transkribus, Pero), building and searching text corpora (TEITOK, Corpus Query Language) and natural language processing (UDPipe).
JavaScript is turned off in your web browser. Turn it on to take full advantage of this site, then refresh the page.