Full-text resources of CEJSH and other databases are now available in the new Library of Science.
Visit https://bibliotekanauki.pl

Results found: 7

first rewind previous Page / 1 next fast forward last

Search results

Search:
in the keywords:  corpus studies
help Sort By:

help Limit search:
first rewind previous Page / 1 next fast forward last
EN
Bulgarian sense-annotated corpus – between the tradition and noveltyThe Bulgarian Sense-annotated Corpus (BulSemCor) is compiled according to the general methodology established by the SemCor project. It is a subset of the Brown Corpus of Bulgarian semantically annotated with a corresponding synonym set (synset) in the Bulgarian wordnet. Unlike the bulk of sense-annotated corpora where only (sets of) content words are annotated, in BulSemCor each lexical unit has been assigned a sense. The main contributions achieved in the work on BulSemCor are briefly decides in the presented paper: definition of an annotation schema, compilation of an input corpus, development of a sense-annotated corpus, Bulgarian wordnet enlargement.
EN
The paper briefly looks at two nonstandard conditional constructions, if [Su] had have [pp] and if [Su] would have [pp], which present anomalous components. Various works mentioning them have been analysed, leading to the conclusion that the forms have not been treated seriously or exhaustively. Following a small study which tries to establish their spread in the language, the paper concludes that some questions remain unanswered, such as whether the constructions can be characterised according to their geographical spread, their exact vernacular status, and to what extent they may coexist alongside the standard form in a person’s idiolect.
EN
Nowadays more and more people are using computers and the Internet; consequently, they are continually in touch with computing terminology. The study and analysis of such terminology thus seems very important not only from the point of view of a linguist, but from one of an average computer user as well. Polish language for computers and the Internet is in a state of constant change today: new terms, mostly borrowed from English, enter the language all the time. The aim of the present paper is to analyze the origin of the newest lexical borrowings of English, many of which have not been noted in the dictionaries and/or discussed in the literature on the subject, used in Polish language for computers and the Internet. Special attention will be devoted to the morphology of such loans; among other things, special morphological processes will be discussed, such as the formation of diminutives of computer terms. The research is based on a corpus, collected and analyzed by the author of the study. The corpus comprises of texts taken from various Internet message boards devoted to computers and the Internet.
EN
The purpose of the article is to show the evolution of the concepts of “figure”, “image” and “reputation” in the Russian language in the last fifty years, to analyze their use in modern political discourse. The corpus study on the material of modern political journalism, showed that “image”, the emotionally affecting perception of a person, does not always coincide with the “figure” as the type or character associated with the speaker. Content-analysis of the use of lexemes imidzh, obraz, reputatsiya showed that in the semantic plan they influenced each other, becoming synonyms in various meanings. The semantic evolution of the word imidzh went from an impression of appearance to stereotypical ideas that can be appreciated by society. The “figure”, judging by the Russian National Corpus data, today looks more like a “role” in a film or a play, responding to the theatricalization of the political process. An analysis of the speeches of the president, the prime minister of the country, regional rulers, deputies, and opposition leaders reveals the “masks” of the Grate-Powerman and Patriot, People’s Chosen, Ordinary Man, Strong Man (Powerful Hand), Debater, Distressor, and some others, used as an element of a discursive strategy.
EN
This article shows how Polish chronicler Jan Długosz used the works of Petrarch. The examination is based on computer-assisted comparative analysis as well as on philological methods. The article describes the manuscripts containing Petrarch’s works which Długosz had at his disposal, and tries to respond a question when the chronicler (in what periods of his life) got with them in touch. It also analyses Długosz’ methods of drawing textual excerpts he inserted into his chronicle. Besides, the arguments supporting hypothesis about the existence of chronicler’s special catalogue, in which he might have collected the extracts from various sources, are considered. Finally, his method of the use of sources is characterised in more detail.
PL
Artykuł przedstawia kwestię lektury i wykorzystania dzieł Francesca Petrarki w Rocznikach Jana Długosza. Badanie zostało oparte na komputerowej analizie porównawczej i metodach filologicznych. Omówione zostały rękopisy czytane przez Długosza oraz sposób pozyskiwania przez niego przejątków tekstowych i wplatania ich do kroniki. Przedstawiono również argumenty na poparcie hipotezy o istnieniu kartoteki kronikarza i wyjaśniające metodę jego pracy ze źródłami.
EN
Celem przeprowadzonych badań było porównanie kontekstów występowania angielskich słów ridiculous i funny oraz polskich absurdalny, niedorzeczny i śmieszny. Wyboru leksemów dokonano na podstawie wyników wyszukiwania ekwiwalentów słowa ridiculous w pięciu różnych słownikach angielsko-polskich (trzech tradycyjnych i dwóch internetowych). Dodatkowo w badaniach postanowiono uwzględnić wyraz funny, który jest synonimem słowa źródłowego ridiculous, i jednocześnie najczęściej pojawiającym się angielskim odpowiednikiem polskiego słowa śmieszny. W celu przeprowadzenia analizy semantycznej tych pięciu leksemów zastosowano kognitywno-korpusową metodę Multicorrespondence Analysis (MCA). Zgodnie z jej założeniami z korpusów pobrano próbki użycia wybranych jednostek językowych, które następnie zostały poddane kategoryzacji i analizie statystycznej. Dzięki przeprowadzonemu testowi chi-kwadrat i ustaleniu wartości p, możliwe było określenie wiarygodności otrzymanych wyników. Utworzona mapa korespondencyjna umożliwiła dokonanie analizy korelacji zachodzących pomiędzy czynnikami. Podjęto również próbę interpretacji zaobserwowanych powiązań semantycznych
7
45%
PL
Celem artykułu jest prezentacja procesu badawczego wykorzystującego lingwistyczne metody korpusowe do wzbogacania fi lozofi cznych teorii logosu (tj. struktur inferencyjnych) i etosu (tj. struktur komunikacyjnych powiązanych z charakterem czy wiarygodnością mówcy). Te dwa typy zjawisk komunikacyjnych przyciągały uwagę fi lozofów od czasów starożytnych, kiedy to Arystoteles, jako jeden z pierwszych, zaproponował sposób rozumienia tych pojęć w swojej Retoryce. Współcześnie problem eksplozji danych, związany z rozwojem nowoczesnych technologii i Internetu, postawił przed fi lozofi ą nowe wyzwanie: możliwość zautomatyzowania procesu przetwarzania dużych zasobów danych i wydobywania informacji dotyczących tego, jakie opinie i argumenty ludzie formułują, oraz tego, kto jest uznawany za wiarygodnego mówcę, wymaga dobrego zrozumienia tego, w jaki sposób ludzie faktycznie konstruują struktury logosu i etosu – nawet jeżeli są to niepoprawne konstrukcje. Stąd też w naszych badaniach stosujemy następującą metodologię: (1) wychodzimy od teorii fi lozofi cznych, (2) następnie wybieramy dziedzinę dyskursu, dla której chcemy zidentyfi kować typowe językowe zachowania związane z logosem i etosem, (3) dane te analizujemy przy użyciu wybranych teorii, (4) na podstawie statystyk i wglądu w naturę danego dyskursu formułujemy nowe twierdzenia dotyczące interesujących nas zjawisk, (5) aby w końcu móc zastosować wyniki tych badań do wspierania automatycznego wydobywania struktur logosu i etosu z dużych zasobów danych języka naturalnego.
EN
The aim of this paper is to discuss research process which employs linguistic methods of corpus analysis in order to better understand dialogue strategies people use. Theories developed in such a way are then suitable to be used for argument mining, i.e. for automated identifi cation and extraction of these strategies from large resources of texts in natural language. The paper considers two types of communication phenomena related to Aristotelian notions of logos (i.e. inferential premise-conclusion structures) and ethos (i.e.communication structures related to the character of the speaker). The goal of the paper is accomplished in four steps. The task of identifying the main problem (Sect. 1) allows us to give an outline of the corpus study method for automated argument mining (Sect. 2). Next, the explication of this method paves the way for discussing two examples of applying the corpus method to analyse logos and ethos, namely controversy and consensus (Sect. 3) and ethotic structures in a dialogue (Sect. 4).
first rewind previous Page / 1 next fast forward last
JavaScript is turned off in your web browser. Turn it on to take full advantage of this site, then refresh the page.