Full-text resources of CEJSH and other databases are now available in the new Library of Science.
Visit https://bibliotekanauki.pl

PL EN


2010 | 3 | 133-142

Article title

NARODOWY KORPUS JĘZYKA POLSKIEGO – TEORIA I PRAKTYKA. FAKTY, MITY, POTRZEBY

Content

Title variants

EN
THE NATIONAL POLISH LANGUAGE CORPUS – THEORY AND PRACTICE. FACTS, MYTHS AND NEEDS

Languages of publication

PL

Abstracts

PL
Wydaje się, że wszyscy twórcy korpusów przywiązują wagę do tego, żeby były one reprezentatywne i zrównoważone. Zaczynają się jednak pojawiać głosy, iż pojęcia te są mało precyzyjne. W niniejszym referacie autorka zamierza wyjść od przemyśleń na temat tych dwóch pojęć, zastanowić się, czy powinny być one ważne dla twórców korpusu i czy mamy jakąkolwiek alternatywę. Alternatywą może być stworzenie korpusu, którego dobór tekstów nie będzie niczego reprezentował poza samym sobą, a mianowicie teksty powinno się dobrać nie na zasadzie „reprezentatywności‖, ale na podstawie ich „celowości. Żeby określić celowość, należy się przyjrzeć potrzebom osób z nich korzystających. Należy też pamiętać, że z korpusów korzystają przede wszystkim nieinformatycy, zatem warto by było utworzyć narzędzie, które będzie miało łatwy, przyjazny dla użytkownika interfejs. Dobrym wzorem będą tryby instalacji programów windowsowych. Instalatory często oferują co najmniej dwie możliwości wyboru: wersję standardową, dla mniej zorientowanego w opcjach i poniekąd we własnych potrzebach użytkownika, jak i wersję niestandardową dla użytkowników o wysokim stopniu świadomości własnych potrzeb, umożliwiającą zainstalowanie tylko tych składników, które są rzeczywiście potrzebne.
EN
It may seem that all corpora creators aim at establishing representative and balanced corpora. But some think that those two concepts are not precise. The author analyses whether those two concepts are important for corpora creators and whether there is any alternative. One alternative is the creation of a corpus which would represent only itself – texts would be selectednot on the basis of their 'representative character‘ but their 'aim‘. In order to determine the aim of the text, it is necessary to investigate the needs of text users. It should be also born in mind thatcorpora users are usually not computer scientists and therefore they need a user friendly interface. The installation mode of Windows may be a good example here. The installing software usually offers two installation modes: (i) a standard one for users who are not aware of their needs and (ii) an advanced one for users who know exactly what they need.

Year

Volume

3

Pages

133-142

Physical description

Dates

published
2010-01-20

Contributors

  • Wydawnictwo Naukowe PWN ul. Postępu 18 02-676 Warszawa Instytut Języka Polskiego PAN

References

  • Andrzejczuk Anna, Czupryniak Maciej, 2008, O wykorzystaniu zasobów internetowych w pracy językoznawcy, [w:] „Polonica‖, t. 29, Kraków, s. 189–204.
  • Górski Rafał Ludwik, 2008, Charakterystyka chronologiczna i stylistyczna korpusu dla „Wielkiego słownika języka polskiego”, [w:] Nowe studia leksykograficzne 2, red. P. Żmigrodzki, R. Przybylska, Kraków, Wydawnictwo Lexis, s. 117–127.
  • Kilgarriff Adam, Grefenstette Gregory, 2003, Introduction to the Special Issue on the Web as Corpus, „Computational Linguistics‖,
  • http://www.mitpressjournals.org/toc/coli/29/3.
  • Pawłowski Adam, 2003, Uwagi na temat korpusu języka polskiego (reprezentatywność, aktualność, nazwa), [w:] Językoznawstwo w Polsce. Stan i perspektywy, red. S. Gajda, Opole, Polska Akademia Nauk – Komitet Językoznawstwa, Uniwersytet Opolski – Instytut Filologii Polskiej, s. 162–180.

Document Type

Publication order reference

Identifiers

YADDA identifier

bwmeta1.element.ojs-doi-10_14746_cl_2010_3_13_
JavaScript is turned off in your web browser. Turn it on to take full advantage of this site, then refresh the page.