Search results

1

O roli samodzielnie przygotowanych korpusów w badaniach językoznawczych

100%

Zabawa M.

Półrocznik Językoznawczy Tertium

|

2019

|

vol. 4

|

issue 1

PL

Celem niniejszego artykułu, o charakterze teoretyczno-przeglądowym, jest omówienie problematyki związanej z budową własnego korpusu językowego. Badacz, chcący skupić się np. na analizie neologizmów, musi oprzeć swoje badania na określonych źródłach: o ile dawniej często wykorzystywano do tego celu prasę, o tyle obecnie znacznie częściej są to korpusy językowe (np. NKJP) oraz Internet. Autor artykułu stawia tezę, że zarówno NKJP, jak i Internet jako całość, nie są jednak najlepszym wyborem w wypadku chęci badania np. najnowszego słownictwa polszczyzny, a już na pewno nie są wystarczające. Jeszcze więcej problemów stwarza wybór języka mówionego jako podstawy analiz. Najlepszym wyjściem, choć jednocześnie najtrudniejszym i najbardziej czasochłonnym, jest budowa własnego korpusu językowego. W artykule wykazano, dlaczego użycie prasy czy Internetu jako całości niekoniecznie jest najlepszym rozwiązaniem, a także omówiono różnego rodzaju aspekty teoretyczne związane z budową własnego korpusu (np. wybór rodzaju tekstów, wielkość korpusu, wykorzystanie narzędzi informatycznych ułatwiających tworzenie korpusu).

2

NARODOWY KORPUS JĘZYKA POLSKIEGO – TEORIA I PRAKTYKA. FAKTY, MITY, POTRZEBY

71%

ANDRZEJCZUK A.

Comparative Legilinguistics

|

2010

|

vol. 3

133-142

EN

It may seem that all corpora creators aim at establishing representative and balanced corpora. But some think that those two concepts are not precise. The author analyses whether those two concepts are important for corpora creators and whether there is any alternative. One alternative is the creation of a corpus which would represent only itself – texts would be selectednot on the basis of their 'representative character‘ but their 'aim‘. In order to determine the aim of the text, it is necessary to investigate the needs of text users. It should be also born in mind thatcorpora users are usually not computer scientists and therefore they need a user friendly interface. The installation mode of Windows may be a good example here. The installing software usually offers two installation modes: (i) a standard one for users who are not aware of their needs and (ii) an advanced one for users who know exactly what they need.

PL

Wydaje się, że wszyscy twórcy korpusów przywiązują wagę do tego, żeby były one reprezentatywne i zrównoważone. Zaczynają się jednak pojawiać głosy, iż pojęcia te są mało precyzyjne. W niniejszym referacie autorka zamierza wyjść od przemyśleń na temat tych dwóch pojęć, zastanowić się, czy powinny być one ważne dla twórców korpusu i czy mamy jakąkolwiek alternatywę. Alternatywą może być stworzenie korpusu, którego dobór tekstów nie będzie niczego reprezentował poza samym sobą, a mianowicie teksty powinno się dobrać nie na zasadzie „reprezentatywności‖, ale na podstawie ich „celowości. Żeby określić celowość, należy się przyjrzeć potrzebom osób z nich korzystających. Należy też pamiętać, że z korpusów korzystają przede wszystkim nieinformatycy, zatem warto by było utworzyć narzędzie, które będzie miało łatwy, przyjazny dla użytkownika interfejs. Dobrym wzorem będą tryby instalacji programów windowsowych. Instalatory często oferują co najmniej dwie możliwości wyboru: wersję standardową, dla mniej zorientowanego w opcjach i poniekąd we własnych potrzebach użytkownika, jak i wersję niestandardową dla użytkowników o wysokim stopniu świadomości własnych potrzeb, umożliwiającą zainstalowanie tylko tych składników, które są rzeczywiście potrzebne.

3

WE ARE ALL TRANSLATORS NOW: CONSTITUTIONAL ANALYSIS AS TRANSLATION

71%

SOLAN L. M.

Comparative Legilinguistics

|

2016

|

vol. 28

7-24

PL

Inaczej niż europejskie, większość amerykańskich regulacji prawnych została stworzona na tyle niedawno, że terminologia użyta w tekstach prawodawczych nie zdążyła jeszcze zmienić swojego znaczenia. Ta reguła nie tyczy się jednak konstytucji Stanów Zjednoczonych, która została sformułowana w końcu XVIII w. W Stanach Zjednoczonych trwają obecnie dyskusje nad tym, czy właściwie interpretuje się konstytucję oraz jak jej współczesne rozumienie ma się do jej pierwotnego znaczenia. Czy powinniśmy skupiać się na pierwotnym znaczeniu terminów użytych przez autorów konstytucji czy na tym jak te terminy są rozumiane przez ogół współczesnego społeczeństwa, który głosował za przyjęciem konstytucji? Obecnie, w czasach popularności językoznawstwa korpusowego i po stworzeniu rozległego korpusu XVII wiecznej angielszczyzny znalezienie odpowiedzi na to pytanie może być możliwe.

EN

European courts and legal scholars are accustomed to construing codes that have been in place for long periods of time. In the U.S., most laws are recent enough that the meanings of their words have not changed very much over time. This, however, is not true of the Constitution, which was adopted in the late 18th century. There are debates in the U.S. about how faithful current interpreters of the Constitution should be to the original meaning of the Constitution’s language, and over what it means to be faithful to the original meaning of the Constitution’s language. Should we care about what the original drafters had in mind, or about how the public that voted on the Constitution understood the language? Scholars and judges have turned to old dictionaries for help. Now, however, corpus linguistics has entered the scene, including a new corpus of general 18th century English. In this paper, I will suggest that scholars and judges interested in the meanings of the words as then understood should put themselves in the position of lexicographers writing a bilingual dictionary that translates the terms from a foreign languageinto contemporary English. Such a stance will bring out the many difficult problems in using a corpus as a means of making legal decisions today.

4

Typologia tekstów oparta na miarach kwantytatywnych: studium korpusowe o zróżnicowaniu polszczyzny

63%

Eder M., Górski R. L.

Język Polski

|

2019

|

vol. 99

|

issue 3

5-17

PL

Artykuł stara się odpowiedzieć na pytanie, czy możliwe jest ustalenie typologii polskich tekstów wyłącznie na podstawie ich cech gramatycznych. Dodatkowym celem było ustalenie, czy typologia przyjęta w Narodowym Korpusie Języka Polskiego, oparta na kryteriach pozajęzykowych, rzeczywiście grupuje teksty, które są do siebie gramatycznie podobne. Badanie przeprowadzono na korpusie 1190 tekstów wybranych losowo z Narodowego Korpusu Polskiego. W każdym z tekstów zbadano frekwencję ok. 60 cech gramatycznych, takich jak liczba słów należących do poszczególnych części mowy bądź występujących w konkretnym przypadku, osobie lub czasie gramatycznym itp. Na podstawie tych danych przeprowadzono analizę Bootstrap Consensus Network, a także skalowanie wielowymiarowe. Rezultaty potwierdzają, że większość tekstów przynależnych w NKJP do danego typu rzeczywiście wykazuje wzajemne podobieństwo pod względem frekwencji poszczególnych kategorii gramatycznych.

EN

The article seeks to answer the question whether it is possible to establish a typology of Polish texts based exclusively on their grammatical features. An additional aim was to find whether the typology adopted in the National Corpus of Polish (NCP), based on purely extra-linguistic criteria, groups together texts that are grammatically similar. The study was conducted on a corpus of 1190 texts randomly chosen from the NCP. For each text the frequency of some 60 grammatical features was counted, such as the number words belonging to a part of speech, occurring in a particular case, person or tense etc. With these data Bootstrap Consensus Network analysis as well as multidimensional scaling was conducted. The results show that most members of a text type cluster together showing similarity one to another. Moreover, the typology of texts adopted in the NCP gains additional support.

5

Z prac nad korpusem polsko- oraz rosyjskojęzycznych wiadomości przesyłanych na kartach pocztowych w drugiej połowie XX w. Zagadnienia transkrypcji i anotowania

63%

Daniel Dzienisiewicz D., Piotr Wierzchoń P.

Napis. Pismo poświęcone literaturze okolicznościowej i użytkowej

|

2017

|

vol. 23: List jako szczególny gatunek literacki

277-301

EN

The aim of this article is to present selected issues related to the process of creating the corpus of messages both in Polish and Russian sent via postcards in the second half of the 20 th century. There will be described stages of digital processing of the postcard’s text such as transcription of the text and creation of tags assigned to the following elements of the message’s text, including the beginning phrase to the addressee, greetings, wishes, the final phrase and postscript. Particular points, which appear on the list of directives for people transcribing messages, will be put under thorough analysis. The reasons behind the choice of certain – often controversial – procedures will be discussed and illustrated with adequate examples. The considerations presented in the article constitute a part of the 100 000 minihistories project, which intends to create a full-text searchable corpus of around 10 000 of Polish and Russian post-war texts sent in postcards.

6

Świadectwa ewangelikalne i katolickie w perspektywie korpusowej analizy dyskursu

63%

Leśniak A., Pasek Z.

Socjolingwistyka

|

2020

|

issue 34

57-75

PL

Artykuł przedstawia wyniki analizy porównawczej ewangelizacyjnych świadectw rzymskokatolickich (z portalu Deon.pl) i protestanckich – zielonoświątkowych (z pisma „Chrześcijanin” i in.). Autorzy, korzystając z narzędzi językoznawstwa korpusowego, ukazują odmienności obu korpusów. Interesujące było zrekonstruowanie „obszarów grzechu” – zła, które składający świadectwa przezwyciężyli dzięki bożej pomocy. Są to odmienne sfery: w przypadku świadectw katolickich obszar ten tworzy kompleks znaczeniowy zbudowany wokół pojęć miłość – seks – asceza. Świadectwa zielonoświątkowe skupione są na kompleksie używki – uzależnienia – patologie. Składająca się z dwu etapów analiza (frekwencja i zakorzenienie w kor pusie słów kluczowych i rozpoznanie wizualne najistotniejszych kolokacji) pozwoliła sformułować wniosek o dominujących obszarach znaczeniowych, które określają mapę mentalną życia religijnego wyznawców obu nurtów chrześcijaństwa.

EN

The article presents the results of a comparative analysis of Roman Catholic (from the portal Deon.pl) and Protestant, Pentecostal (from the magazine “Chrześcijanin” et al.) Christian testimonies. Using the tools of corpus linguistics, the authors show the differences between both collections of texts. Especially interest ing was the reconstruction of the „areas of sin”, the evils the testimony authors overcame thanks to God’s help. These are different spheres for both types of texts, in the case of Catholic testimonies it is formed by a semantic complex built around the terms of “love – sex – asceticism”, and Pentecostal testimonies are focused on the “stimulants – addictions – antisocial behaviour” complex. The analysis consisting of two stages (frequency, describing the role of keywords in the corpus, and visual recognition of the most impor tant collocations) allowed us to formulate conclusions on the dominant areas of meaning which define the mental map of the religious life of the followers of both the Christian denominations.

7

Linguam novit curia? Analiza korpusowa w prawie karnym – przyczynek do dyskusji

63%

Tobor Z., Zeifert M.

Forum Polityki Kryminalnej

|

2021

|

issue 1

1-25

EN

In the interpretation of criminal law, an important role is played by the presumption of the common (general, colloquial) meaning of statutory expressions. Determining the common meaning in the process of applying the law is usually based on the linguistic intuition of the procedural authority or on dictionaries. In the article, we present an alternative sourceof knowledge about the common meaning of linguistic corpora. The use of corpora as a tool of legal interpretation has been intensively discussed in American literature for several years. The main objections are raised in the context of criminal law. The article reviews the main arguments raised in the American debate and relates them to Polish legal culture. Moreover, some exemplary corpus analyzes in criminal cases are presented, both in the context of legal interpretation and the assessment of linguistic elements of the facts of the case.

PL

W interpretacji prawa karnego dużą rolę odgrywa domniemanie znaczenia powszechnego (ogólnego, potocznego) wyrażeń ustawowych. Ustalanie znaczenia powszechnego w procesie stosowania prawa odbywa się zwykle na podstawie intuicji językowej organu procesowego lub słowników. W artykule przedstawiono konkurencyjne źródło wiedzy o znaczeniu powszechnym, jakim są korpusy językowe. Wykorzystanie korpusów jako narzędzia wykładni prawa jest od kilku lat intensywnie dyskutowane w literaturze amerykańskiej. Główne zastrzeżenia zgłaszane są w kontekście prawa karnego. Artykuł zawiera przegląd głównych argumentów podnoszonych w amerykańskiej debacie i odniesienie ich do polskiej kultury prawnej. Ponadto, przedstawione zostały przykładowe analizy korpusowe na gruncie spraw karnych, zarówno w kontekście wykładni prawa, jak i oceny językowych elementów stanu faktycznego.

8

Narodowy Korpus Diachroniczny Polszczyzny. Projekt

63%

Król M., Derwojedowa M., Górski R. L., Gruszczyński W., Opaliński K., Potoniec P., Woliński M., Kieraś W., Eder M.

Język Polski

|

2019

|

vol. 99

|

issue 1

92-101

PL

Artykuł przedstawia projekt Narodowego Korpusu Diachronicznego Polszczyzny (NKDP), który w założeniu ma być uspójnioną i rozszerzoną kolekcją mniejszych korpusów, powstających w różnych ośrodkach naukowych i obejmujących różne zakresy czasowe. W skład owego uspójnionego korpusu wejdą teksty obejmujące lata 1380–1939, co będzie stanowiło uzupełnienie Narodowego Korpusu Języka Polskiego. Celem projektu jest stworzenie zbalansowanego korpusu ukazującego historię rozwoju języka polskiego i stanowiącego bazę materiałów dla badaczy języka oraz punkt porównania dla korpusów historycznych języków europejskich i światowych. Poszczególne części składowe korpusu składają się z 24 mln słów, natomiast docelowo NKDP będzie stanowił repozytorium 40 mln słów.

EN

The paper presents the project of the Diachronic Corpus of Polish (DCP), which is intended as a cohesive collection of smaller corpora, arising in various scientific centers and covering various time ranges. This corpus will include texts covering the years 1380-1939 and will complement the National Corpus of Polish. The aim of the project is creating a balanced corpus presenting the history of the development of the Polish language and constituting a data basis for language researchers and a point of comparison for the historical corpora of European and world languages. The different parts of the corpus consist of 24 million words in total, while the target NPDC will constitute a repository of 40 million words.

9

Rodzina w dyskursie polskiego Kościoła katolickiego. Badania korpusowe z perspektywy Krytycznej Analizy Dyskursu

63%

Kamasa V.

Socjolingwistyka

|

2013

|

issue 27

139-152

EN

The paper aims at describing the discourse of the Polish Catholic Church upon family. The perspective of Critical Discourse Analysis is adapted and chosen categories suggested by van Leeuwen (2008) are used. The study is conducted on corpus (241-thousand words) of official documents published on website of Polish Bishop’s Conference. Qualitative and quantitative methods are used. The analysis reveals three discursive ways of constructing of the family: family as a part of church’s community, family as week, endangered and needing protection and strong connection between family and national identity.

10

Korpusy językowe jako narzędzie interpretacji prawa. Amerykańska teoria i praktyka

63%

Tobor Z., Zeifert M.

Archiwum Filozofii Prawa i Filozofii Społecznej

|

2020

|

vol. 4(25)

80-90

EN

In American adjudicating practice and theory of statutory interpretation, great attention is paid to the notion of ordinary meaning of legal text. In order to determine the ordinary meaning, judges usually refer to their own linguistic intuition or dictionaries – both these methods give rise to a number of reservations that have been expressed in legal literature for years. In the last few years, courts have also started using linguistic corpora for this purpose. Linguistic corpora are electronic collections of authentic texts in a given language which can be analyzed using IT tools (e.g. searches, frequency lists, concordances, collocations). Corpus research requires considerable linguistic knowledge and technical skills, and in return it offers statistical data that can reveal a lot about the semantic layer of language. The use of corpora by judges – first in state courts, later also in the federal Supreme Court – sparked lively academic discussion. In Polish literature, this issue has not been discussed so far, which is why the article is essentially of a reporting nature. First, an outline of corpus linguistics is presented. Then the history of the use of linguistic corpora by US courts is reconstructed. Finally, the legal discussion about corpora in the US is presented, with particular emphasis on voices approving their use and on critical voices.

PL

W amerykańskiej praktyce orzeczniczej i teorii interpretacji dużą wagę przywiązuje się do pojęcia zwykłego znaczenia (ordinary meaning) tekstu prawnego. W celu ustalenia zwykłego znaczenia sędziowie odwołują się najczęściej do własnej intuicji lub do słowników – obie te metody nasuwają szereg zastrzeżeń, które od lat wyrażane były w literaturze. W ostatnich kilku latach sądy zaczęły w tym celu wykorzystywać również korpusy językowe. Korpusy językowe to elektroniczne zbiory autentycznych tekstów danego języka, które można analizować za pomocą narzędzi informatycznych (m. in. wyszukiwania, list frekwencyjnych, konkordancji, kolokacji). Badania korpusowe wymagają sporej wiedzy lingwistycznej i umiejętności technicznych, w zamian zaś oferują dane statystyczne, które mogą wiele powiedzieć m. in. na temat warstwy semantycznej języka. Użycie korpusów przez sędziów – najpierw sądów stanowych, później również federalnego Sądu Najwyższego – wywołało ożywioną dyskusję akademicką. W polskiej literaturze zagadnienie to nie było dotąd podejmowane, dlatego artykuł ma zasadniczo charakter sprawozdawczy. W pierwszej kolejności przedstawiony zostaje zarys językoznawstwa korpusowego. Następnie odtworzona jest historia wykorzystania korpusów przez amerykańskie sądy. Wreszcie, zreferowana zostaje amerykańska dyskusja na temat korpusów, ze szczególnym uwzględnieniem głosów aprobujących ich wykorzystanie i głosów krytycznych.

11

Prozodia semantyczna. Pojęcie, problemy, przydatność

63%

Kamasa V.

Socjolingwistyka

|

2015

|

issue 29

105-120

PL

Rozwój technologii i związana z nim możliwość obserwacji ogromnych zbiorów tekstów skierowały uwagę badaczy języka na wzorce współwystępowania jednostek w tekście. Niniejszy tekst poświęcony jest jednemu z takich wzorców — prozodii semantycznej. W kolejnych częściach tekstu omawiamy definicję tego zjawiska, związane z nim kontrowersje, takie jak pytanie o jednostkę prozodii semantycznej czy też zasadność założenia o transferze znaczenia między kolokatami. Wskazujemy też najczęstsze sposoby pomiaru prozodii. Tekst kończymy przeglądem zastosowań opisów prozodii semantycznej ze szczególnym na ciskiem na społecznie zorientowane badania nad dyskursem.

EN

Possibility to observe large samples of texts related to advances in technology have allowed the researchers to see diverse patterns of co-occurrence. In this paper we introduce one of such patterns — semantic prosody. We start with an overview of semantic prosody definitions. Then we move to some controversial points such as the unit of the prosody or the problem of meaning transfer between collocates. We also describe how to determine semantic prosody, to finally conclude with examples of its application focusing on socially oriented discourse analyses.

12

O roli samodzielnie przygotowanych korpusów w badaniach językoznawczych

63%

Zabawa M.

Półrocznik Językoznawczy Tertium

|

2019

|

vol. 4

|

issue 1

EN

The aim of the present paper, which is of a theoretical character, is to discuss the problems related to the process of the compilation of one’s own linguistic corpus. A linguist who wants to study e.g. neologisms must base his or her analysis on a certain source. Formerly, the language of the press was frequently used as such source; now, however, linguistic corpora and the Internet are utilized more frequently. The author of the paper points out that both the National Corpus of Polish (NKJP) and the Internet as a whole are not the best choices (and are definitely not sufficient) when a linguist intends to study e.g. the newest vocabulary items in Polish. The use of the spoken language as the main source is even more problematic. The best solution, albeit the most difficult and time-consuming at the same time, is the compilation of one’s own linguistic corpus. The paper discusses the inadequacy of regarding the press or the Internet as a whole as the best sources and then proceeds to discuss various theoretical aspects connected with the compilation of one’s own corpus (such as the choice of the type of texts, corpus size, the use of computer tools intended to aid in corpus compilation, etc.).

PL

Celem niniejszego artykułu, o charakterze teoretyczno-przeglądowym, jest omówienie problematyki związanej z budową własnego korpusu językowego. Badacz, chcący skupić się np. na analizie neologizmów, musi oprzeć swoje badania na określonych źródłach: o ile dawniej często wykorzystywano do tego celu prasę, o tyle obecnie znacznie częściej są to korpusy językowe (np. NKJP) oraz Internet. Autor artykułu stawia tezę, że zarówno NKJP, jak i Internet jako całość, nie są jednak najlepszym wyborem w wypadku chęci badania np. najnowszego słownictwa polszczyzny, a już na pewno nie są wystarczające. Jeszcze więcej problemów stwarza wybór języka mówionego jako podstawy analiz. Najlepszym wyjściem, choć jednocześnie najtrudniejszym i najbardziej czasochłonnym, jest budowa własnego korpusu językowego. W artykule wykazano, dlaczego użycie prasy czy Internetu jako całości niekoniecznie jest najlepszym rozwiązaniem, a także omówiono różnego rodzaju aspekty teoretyczne związane z budową własnego korpusu (np. wybór rodzaju tekstów, wielkość korpusu, wykorzystanie narzędzi informatycznych ułatwiających tworzenie korpusu).

13

O wyrażeniu oldschool i jego derywatach w polszczyźnie

63%

Marcin Zabawa M.

Język Polski

|

2024

|

vol. 104

|

issue 1

79-92

PL

Celem artykułu jest analiza anglicyzmu leksykalnego oldschool w polszczyźnie. Pierwsza część artykułu poświęcona jest definicjom omawianego słowa w różnych źródłach leksykograficznych, a następnie przedstawione są informacje dotyczące częstości jego użycia. Zasadnicza część artykułu poświęcona jest opisowi nowych kontekstów użycia wyrażenia, które zostały zilustrowane licznymi przykładami, zaczerpniętymi z korpusów NKJP oraz MoncoPL. Artykuł wykazuje, że leksem znacząco rozszerzył swój zakres użycia i może być traktowany nie tylko jako anglicyzm właściwy, ale i zapożyczenie semantyczne, a także rodzimy neosemantyzm.

EN

The aim of the present paper is to discuss the English lexical borrowing oldschool used in Polish. The first part of the article is devoted to definitions of the word in various lexicographic sources; then, information on the frequency of its use is presented. The main part of the paper focuses on the discussion of the new contexts of the use of the lexeme in question, illustrated with numerous examples, taken from NKJP and MoncoPL corpora. The article shows that the word has significantly expanded its scope and should be perceived not only as a lexical borrowing from English, but as a semantic loan and a native semantic innovation as well.

14

К вопросу о хронологизации русских заимствований в польском языке

63%

Dzienisiewicz D., Wierzchoń P., Graliński F.

Studia Rossica Gedanensia

|

2016

|

issue 3

99-120

RU

В статье предпринимается попытка представить результаты лингвохронологизационного анализа, проведенного на группе избранных русских заимствований в польском языке. Заимствования были отобраны на основании их текстовой частотности с помощью системы Odkrywka (букв. Oбнаружка), самого большого корпуса польского языка XIX и XX вв., созданного сотрудниками Института языкознания и Лаборатории информационных систем в Университете им. Адама Мицкевича в Познани. Анализу подвергнуты лишь те единицы, средняя частотность которых свыше трех употреблений на один миллион слов. В статье описаны некоторые теоретические проблемы, связанные с лингвохронологизацией, представлены самые ранние употребления слов, а также указаны примеры передатировки некоторых, уже имеющихся метрик слов. Кроме того, некоторые вариативные формы слов в данной статье описаны с перспективы их частотности в текстах.

EN

The article discusses the results of chronological research conducted on a group of Russian loanwords in Polish. The analyzed loanwords have been selected on the basis of their frequency in texts with the use of the Odkrywka system (the largest corpus of the 19th and 20th century Polish) developed by researchers from the Institute of Linguistics and the Laboratory of Information Systems at Adam Mickiewicz University in Poznań. Only the units with the frequency of over three occurrences per one million words have been included in the analysis. In the article, fundamental theoretical issues related to linguochronologization are outlined, the earliest records of the analyzed units are presented and the examples of the antedated units are discussed. Moreover, selected variant forms are described from the perspective of their occurrence frequency.

PL

W artykule zaprezentowano rezultaty analizy lingwochronologizacyjnej przeprowadzonej na grupie wybranych rosyjskich zapożyczeń w polszczyźnie. Zapożyczenia zostały wyselekcjonowane na podstawie ich częstości w tekstach przy pomocy systemu Odkrywka, stanowiącego jednocześnie największy korpus języka polskiego XIX i XX w., stworzonego przez pracowników Instytutu Językoznawstwa i Pracowni Systemów Informacyjnych Uniwersytetu im. Adama Mickiewicza w Poznaniu. Analizie zostały poddane wyłącznie jednostki o frekwencji przekraczającej trzy wystąpienia na milion słów. W artykule opisano niektóre teoretyczne zagadnienia związane z lingwochronologizacją, przedstawiono najwcześniej odnalezione świadectwa użycia badanych rusycyzmów, jak również wskazano wyrazy, których datacje zostały przesunięte. Ponadto ustalono frekwencję niektórych form wariantywnych.

15

Językoznawstwo korpusowe w badaniach medioznawczych – ujęcie historyczne i praktyczne

63%

Hess A., Hwaszcz K.

UR Journal of Humanities and Social Sciences

|

2022

|

vol. 25

|

issue 4

118-132

EN

The aim of this paper is to present the benefits and risks of implementing corpus linguistics for discourse analysis. The authors describe the origins and development of Natural Language Processing (NLP) tools in a historical perspective and provide examples of their application in social sciences, particularly in the methodology of Social Communication and Media Sciences. Fragmentary findings of studies carried out at the Institute of Journalism, Media and Social Communication at the Jagiellonian University in collaboration with the CLARIN-PL consortium illustrate a practical approach to the topic. The article presents the application of NLP tools in the analysis of the corpus of parliamentary discourse from 1989-2019 in terms of determinants for the institutionalization of civic dialogue in Poland and also in the comparative analysis of multiculturalism in the city council discourse and media discourse in Krakow between 2014–2018 (7th term of the Krakow City Council). The authors indicate in which phase and at which stage of communication research the use of computational linguistics can support the conclusion.

PL

Celem artykułu jest przedstawienie korzyści i zagrożeń wynikających z implementacji komputerowego językoznawstwa korpusowego do analizy dyskursu. Autorzy opisują genezę i rozwój narzędzi do przetwarzaniu języka naturalnego (z ang. Natural Language Processing, NLP) w ujęciu historycznym oraz prezentują przykłady ich zastosowania w obszarze nauk społecznych, w szczególności w metodologii nauk o komunikacji społecznej i mediach. Praktyczne ujęcie tematu obrazują fragmentaryczne wyniki badań zrealizowanych w Instytucie Dziennikarstwa, Mediów i Komunikacji Społecznej Uniwersytetu Jagiellońskiego we współpracy z konsorcjum CLARIN-PL. Artykuł prezentuje zastosowanie narzędzi NLP w analizie korpusu dyskursu parlamentarnego z lat 1989– 2019 pod kątem uwarunkowań instytucjonalizacji dialogu obywatelskiego w Polsce oraz w analizie porównawczej tematu wielokulturowości w dyskursie rady miasta i dyskursie mediów w Krakowie w okresie 2014–2018 (VII kadencja Rady Miasta Krakowa). Autorzy wskazują, w której fazie i jak lingwistyka komputerowa wpisuje się w szeroki kontekst problematyki związanej z badaniami komunikologicznymi – przede wszystkim jako narzędzie, które może wspierać proces wnioskowania.

16

THE BOLC FOR LEGAL TRANSLATIONS: A TRIAL LESSON

62%

GIAMPIERI P.

Comparative Legilinguistics

|

2019

|

vol. 39

21-46

PL

W artykule dowiemy się, w jaki sposób BoLC (Bononia Legal Corpus; Rossini Favretti, Tamburini i Martelli 2007) może być pomocnym i korzystnym źródłem w tłumaczeniu prawnym i prawniczym. W tym celu zorganizowano 4-godzinną lekcję próbną z doświadczonymi tłumaczami. Przed warsztatami uczestnicy przetłumaczyli 300-wyrazowy dokument wydany w sprawie cywilnej. Ich tłumaczenia (z języka angielskiego na włoski) zostały poprawione podczas lekcji próbnej, w której uczestnicy nauczyli się konsultować swoje wyniki z BoLC. Korzystali również z dodatkowych zasobów internetowych, takich jak słowniki i/lub blogi eksperckie lub fora. Ustalenia w niniejszym artykule dowodzą, że pomimo pewnych wad, takich jak brak tagowania POS i lematyzacji oraz dość złożona składnia wyszukiwania, BoLC pomaga rozwiać wątpliwości i zapewnić zdumiewające wyniki w pracy przy tłumaczeniu. Jego główna użyteczność polega na możliwości znalezienia wyrażeń konwencjonalnych i użycia kolokacyjnego, co może być dość skomplikowane w dyskursie prawnym.

EN

This paper will explore how consulting the BoLC (Bononia Legal Corpus; Rossini Favretti, Tamburini and Martelli 2007) can be helpful and advantageous when tackling legal translations. To this aim, a 4-hour trial lesson with experienced translators was organized. Before the workshop, the participants translated a 300-word legal document issued within a civil case. Their translations (from English to Italian) were revised during the trial lesson, where the attendants learned how to consult the BoLC. They also used supplementary online resources, such as dictionaries and/or experts' blogs or fora. The paper findings will remark that despite some drawbacks, such as the absence of POS tagging and lemmatization, and a quite complex search syntax, the BoLC helps dispel doubts and deliver outstanding translation work. Its main usefulness lies in the possibility to find formulaic expressions and collocational use, which can be rather intricate in legal discourse.

17

THE WEB AS CORPUS AND ONLINE CORPORA FOR LEGAL TRANSLATIONS

54%

GIAMPIERI P.

Comparative Legilinguistics

|

2018

|

vol. 33

35-56

PL

Język prawny i prawniczy cechuje się dokładnością i żargonowością a jego struktury nie są intuicyjne. Na to nakłada się określony system prawny, który sprawia, że język prawny i prawniczy jest w każdym kraju inny. Tak osoby uczące się drugiego języka (L2) jak i naukowcy mogą uznać język prawny za trudny do zrozumienia, tymczasem tłumacze mogą uważać, że jest on skomplikowany i zawiły, jak i jego przekład. Tymczasem literatura przedmiotu wskazuje, że remedium na te problemy może być sieć użytkowana jako korpus oraz korpusy on-line. Celem niniejszego artykułu jest weryfikacja tego, czy komercyjne przeglądarki internetowe, narzędzia konkordancji, korpusy specjalistyczne on-line mogą być przydatne w rozwiazywaniu problemów wynikających z natury języka prawnego i prawniczego. W szczególności badaniu poddaje się przeszukiwanie zaawansowane w przeglądarce Google i narzędzia konkordancji sieciowej Leeds i specjalistyczne korpusy on-line: COCA. W ten sposób wskazuje się sposób wykorzystania powyższych narzędzi sieciowych oraz ich działanie w sytuacji, gdy wykorzystywane są jednocześnie jako narzędzia do analizy krzyżowej.

IT

Il linguaggio giuridico è caratterizzato da un gergo pedante ed arcaico. Gli studiosi di una lingua straniera, i traduttori ed i professionisti che si approcciano al linguaggio giuridico in lingua straniera, devono tenere presente non solo le peculiarità tecnico-linguistiche, ma anche quelle legate al sistema giuridico di riferimento. Il presente articolo si pone l'obiettivo di mostrare come il Web, considerato come un corpus, può fornire risposte in ambito linguistico e giuridico. In particolare, analizzerà la sintassi di ricerca in Google, il Leeds ed il corpus online COCA. In tal modo si evidenzierà come, usati congiuntamente, questi strumenti possono fornire risposte attendibili in ambito giuridico.

EN

Legal language is hallmarked by a pedantic and user-unfriendly jargon whose constructs are all but intuitive, not to mention the legal system specificity which makes it unique in every country. Second language (L2) learners or scholars, hence, may find it difficult to understand the language of the law; whereas translators may consider legal lexical phrases and patterns rather intricate to deal with. The literature claims that a practical way to deepen language knowledge can be found in the Web considered as corpus and in online corpora. This paper is aimed at exploring whether commercial search engines, Web concordancers and online specialised corpora can tackle the issues revolving around legal language. In particular, it will investigate whether Google advanced search and the Leeds Web concordancer can be used to meet the requirements of legal language learners, scholars and translators. Furthermore, it will address legal language queries (and results) in an online specialised corpus: the COCA. This paper will provide instances of the soundness of the above-mentioned online resources, especially when used jointly as cross-analysis tools. The shortcomings of one can, in fact, be compensated for by the other(s).

18

Konceptualizacje pojęcia „władza” w tekstach polskiego dyskursu ewangelickiego, katolickiego i prawosławnego

51%

Pawlikowska A.

Oblicza Komunikacji

|

2013

|

vol. 6

119 - 135

EN

The article is devoted to an analysis of the notion of “power” in texts of selected religious discourses. The broadly defined language of power includes a manner of conceptualising the notion that is sugested to readers as well as measures used to determine it. In religious discourses, transcendentally oriented, we can find specific meanings attributed to lexemes from the given semantic field. The author analyses synonymous nouns designating the notion of “power.” The study was quantitative and qualitative, and was conducted on a specialised body of texts of various genres and representing the Catholic, the Lutheran and the Orthodox discourse. The article presents the frequencies of each lexeme taking into account the different genres, and profiles which create discursive images of power in the various groups of texts. The analysis has demonstrated that notions appearing in the texts include “God’s power”, “the power of the Church” and “lay authorities.” The conceptualisations play similar roles in the three discourses and are used to define reality from the religious and ethical perspective.

19

Lose one's life and lose one's job with singular they: two constructions, two regional varieties, many practical aspects of working with mega-corpora

51%

Rudnicka K.

Forum Filologiczne Ateneum

|

2020

|

vol. 8

|

issue 1

149-162

PL

Artykuł porównuje użycie zaimka they w odniesieniu do podmiotów w liczbie pojedynczej z dwiema, z punktu widzenia morfologicznego podobnymi do siebie, konstrukcjami w wariancie brytyjskim i amerykańskim języka angielskiego. Badane konstrukcje to lose one’s life [stracić życie] i lose one’s job [stracić pracę]. Uzyskane wyniki sugerują, że they odnoszące się do liczby pojedynczej jest bardziej rozpowszechnione w amerykańskim wariancie języka angielskiego niż w brytyjskim. Dodatkowym celem artykułu jest zaprezentowanie i przedyskutowanie praktycznych aspektów pracy z dużymi korpusami językowymi. Praca wskazuje w których miejscach badania ilościowe muszą iść w parze z badaniami jakościowymi. Korpusy zastosowane do wykonania badania to Brytyjski Korpus Narodowy (BNC) i Amerykański Korpus Współczesnego Języka Angielskiego (COCA).

EN

The paper compares the usage of singular they with two morphologically similar constructions in British and American English. The constructions in question are lose one’s life and lose one’s job. The results obtained suggest that singular they, at least used with the two constructions in focus of this work, seems to be more widely used in the American variety of English than in the British variety. An additional aim of this work is to present and discuss some practical aspects of working with mega-corpora. The work shows how and where quantitative language studies need to be accompanied by manual and qualitative investigations. The corpora used in this work are the British National Corpus (BNC) and the Corpus of Contemporary American English (COCA).

20

Błędy programu do obróbki korpusu, podczas badań korpusowych słownictwa biznesowego i prawnego w języku wietnamskim, na przykładzie programu AntConc

51%

Królczyk J.

Investigationes Linguisticae

|

2014

|

issue 31

5-17

EN

On the one hand corpus research and corpus linguistics are relatively new fields of science but on the other hand, according to some people, there are one of fastest developing methods of linguistic research. To perform a corpus research, it is necessary to have a text corpus and a proper kind of software. The range of software kinds is wide and its easy to find free of charge on or license based software. Nevertheless, what the choice is, it is possible to encounter problems or the software will have low efficiency. Low efficiency of AntConc can be seen while researching a corpus compiled from an isolating language. After processing the corpus, consisting of 18 text items in the Vietnamese language (that is 290 pages of typescript) dedicated to the field of management and law, the software outputted incorrect results. Starting with counting the number of words in a corpus and ending with concordance plotting. There are two ways to deal with this problem. The method involves “teaching” AntConc how to read the Vietnamese language, in other words it is necessary to input a list of all words in the Vietnamese language. The second method is more time consuming because it involves replacing the spaces between syllables to a sign that will not be recognized by the software as a space. Using one of these methods could potentialy end in raising AntConc efficiency.

PL

Badania korpusowe, jak i językoznawstwo korpusowe są dość młodymi dziedzinami nauki, są też według niektórych najszybciej rozwijającymi się metodą badawczą językoznawstwa. W badaniach korpusowych wykorzystuje się korpusy tekstów i specjalne oprogramowania komputerowe. Oprogramowanie to może być darmowe albo płatne, niestety, nie ważne, na jakie oprogramowanie się zdecydujemy, mogą pojawić się błędy lub program może mieć małą skuteczność. Niska skuteczność programu AntConc jest widoczna podczas badania korpusów języków izolujących. Po wprowadzeniu do programu AntConc korpusu, składającego się z 18 pozycji w języku wietnamskim (tj. 290 stron maszynopisu), poświęconych zagadnieniom zarządzania i prawa, program przedstawiał błędne wyniki. Począwszy od policzenia ilości słów i wytypowaniu jakie pojawiają się najczęściej do tworzenia list konkordancji. Istnieje kilka sposobów na zaradzeniu takiej sytuacji, pierwszą metodą jest „nauczenie” programu AntConc czytania języka wietnamskiego innymi słowy wprowadzenie listy słów które występują w języku wietnamskim. Inną metodą, znacznie trudniejszą i wymagającą dużego nakładu pracy, jest zamiana spacji między sylabami na inny znak który nie był by czytany jako odstęp między słowami przez program AntConc. Jeżeli by zastosować jedną z wyżej wymienionych metod, program ten miał by bardzo wysoką sprawność gdyż język wietnamski nie posiada końcówek fleksyjnych i jest typowym językiem SVO.

Refine search results

O roli samodzielnie przygotowanych korpusów w badaniach językoznawczych

NARODOWY KORPUS JĘZYKA POLSKIEGO – TEORIA I PRAKTYKA. FAKTY, MITY, POTRZEBY

WE ARE ALL TRANSLATORS NOW: CONSTITUTIONAL ANALYSIS AS TRANSLATION

Typologia tekstów oparta na miarach kwantytatywnych: studium korpusowe o zróżnicowaniu polszczyzny

Z prac nad korpusem polsko- oraz rosyjskojęzycznych wiadomości przesyłanych na kartach pocztowych w drugiej połowie XX w. Zagadnienia transkrypcji i anotowania

Świadectwa ewangelikalne i katolickie w perspektywie korpusowej analizy dyskursu

Linguam novit curia? Analiza korpusowa w prawie karnym – przyczynek do dyskusji

Narodowy Korpus Diachroniczny Polszczyzny. Projekt

Rodzina w dyskursie polskiego Kościoła katolickiego. Badania korpusowe z perspektywy Krytycznej Analizy Dyskursu

Korpusy językowe jako narzędzie interpretacji prawa. Amerykańska teoria i praktyka

Prozodia semantyczna. Pojęcie, problemy, przydatność

O roli samodzielnie przygotowanych korpusów w badaniach językoznawczych

O wyrażeniu oldschool i jego derywatach w polszczyźnie

К вопросу о хронологизации русских заимствований в польском языке

Językoznawstwo korpusowe w badaniach medioznawczych – ujęcie historyczne i praktyczne

THE BOLC FOR LEGAL TRANSLATIONS: A TRIAL LESSON

THE WEB AS CORPUS AND ONLINE CORPORA FOR LEGAL TRANSLATIONS

Konceptualizacje pojęcia „władza” w tekstach polskiego dyskursu ewangelickiego, katolickiego i prawosławnego

Lose one's life and lose one's job with singular they: two constructions, two regional varieties, many practical aspects of working with mega-corpora

Błędy programu do obróbki korpusu, podczas badań korpusowych słownictwa biznesowego i prawnego w języku wietnamskim, na przykładzie programu AntConc