Full-text resources of CEJSH and other databases are now available in the new Library of Science.
Visit https://bibliotekanauki.pl

Results found: 6

first rewind previous Page / 1 next fast forward last

Search results

help Sort By:

help Limit search:
first rewind previous Page / 1 next fast forward last
PL
Morfeusz jest aplikacją znaną polskim badaczom z kręgu językoznawstwa komputerowego od ponad 10 lat. W artykule przedstawiamy jego nową wersję, skupiając się na zmianach, które pojawiły się od poprzedniej wersji programu.
EN
Morfeusz is a well known application, used in Polish computational linguistics for over a decade. In the paper we present a new version of the program, focusing on new features which have been introduced since the previous version.
PL
W artykule opisujemy internetową wersję „Słownika gramatycznego języka polskiego”. Skupiamy się przede wszystkim na zmianach, które zaszły w jego nowym wydaniu w porównaniu z poprzednimi wydaniami dostępnymi w postaci aplikacji komputerowej. Wśród najciekawszych zmian należy wymienić pełny wgląd w system wzorów odmiany wraz z ich nową systematyzacją, a także znacznie rozszerzone możliwości przeszukiwania słownika według rozmaitych kryteriów. Pokazujemy kilka praktycznych przykładów wykorzystania nowych funkcji SGJP.
EN
In the paper we present a new online version of the “Grammatical Dictionary of Polish”. We focus on new features which have been introduced since the previous editions of the dictionary which were available as a desktop application. The most interesting changes include a full view of inflectional patterns together with their new systematization and significantly extended searching tools allowing to filter entries of the dictionary based on various criteria. Some practical examples of using these new features are presented.
XX
The article describes the well-known and widely used National Corpus of Polish in a new setup. The update consists of the annotation scheme modification in the morphosyntactic layer (especially in its parts related to the grammatical gender), as well as adding new layers of annotation: the syntactic layer and the named entities layer. All three layers are indexed in the MTAS corpus search engine and can be referenced in CQL corpus queries.
PL
Artykuł prezentuje nowy słownik walencyjny języka polskiego opracowany przez Zespół Inżynierii Lingwistycznej IPI PAN. Słownik ten, Walenty, jest nadal rozwijany, lecz już obecnie, pod koniec roku 2016, jest największym i najbardziej szczegółowym słownikiem walencyjnym języka polskiego, jedynym w pełni integrującym poziomy opisu: składniowy, semantyczny (nie tylko preferencje selekcyjne, lecz także role semantyczne) i frazeologiczny. Wielkość i stopień szczegółowości słownika usprawiedliwiają użycie przymiotnika „gruntowny” w tytule artykułu. Omawiany słownik jest publicznie dostępny – w postaci wygodnej zarówno do przeglądania i przeszukiwania za pomocą przeglądarki internetowej, jak i do pobrania w kilku formatach.
EN
The paper presents a new valency dictionary of Polish, developed by the Linguistic Engineering Group at the Polish Academy of Sciences. The dictionary, called Walenty, while still under development, is already (as of late 2016) the biggest and most detailed valency dictionary of Polish, the only one which fully integrates syntax, semantics (not only selectional preferences, but also semantic roles) and phraseology. The size and the degree of precision of Walenty justify the use of the adjective ‘thorough’ (Pol. ‘gruntowny’) in the title of this paper. The dictionary is freely available – searchable via any browser and downloadable in a variety of formats.
PL
Zasadniczym impulsem do stworzenia tego opracowania była trudność reprezentowania konstrukcji ale nie w tworzonym korpusie składniowym. W jednym z dwóch wariantów tej konstrukcji pojawia się nietypowa interakcja z dopełniaczem negacji. W artykule dyskutujemy proponowane reprezentacje składniowe takich konstrukcji, pokazując ich zalety i wady. Zestawiamy także cechy odróżniające warianty interpretacyjne, które mogą pomóc w pracy osobom znakującym struktury składniowe w korpusie. W końcowej części badamy względną częstość użycia obu wariantów omawianych konstrukcji.
EN
The main impulse for this study was the difficulty of representing the ale nie construction in a currently created syntactic corpus. One of the two variants of this construction involves an unusual interaction with genitive of negation. In the article, we discuss the proposed syntactic representations of such structures and notice their advantages and disadvantages. We also consider the features that distinguish the interpretation variants, which can aid manual annotation of syntactic structures in the corpus. In the final part, we examine the relative frequency of using both variants of the discussed structures.
PL
Artykuł przedstawia projekt Narodowego Korpusu Diachronicznego Polszczyzny (NKDP), który w założeniu ma być uspójnioną i rozszerzoną kolekcją mniejszych korpusów, powstających w różnych ośrodkach naukowych i obejmujących różne zakresy czasowe. W skład owego uspójnionego korpusu wejdą teksty obejmujące lata 1380–1939, co będzie stanowiło uzupełnienie Narodowego Korpusu Języka Polskiego. Celem projektu jest stworzenie zbalansowanego korpusu ukazującego historię rozwoju języka polskiego i stanowiącego bazę materiałów dla badaczy języka oraz punkt porównania dla korpusów historycznych języków europejskich i światowych. Poszczególne części składowe korpusu składają się z 24 mln słów, natomiast docelowo NKDP będzie stanowił repozytorium 40 mln słów.
EN
The paper presents the project of the Diachronic Corpus of Polish (DCP), which is intended as a cohesive collection of smaller corpora, arising in various scientific centers and covering various time ranges. This corpus will include texts covering the years 1380-1939 and will complement the National Corpus of Polish. The aim of the project is creating a balanced corpus presenting the history of the development of the Polish language and constituting a data basis for language researchers and a point of comparison for the historical corpora of European and world languages. The different parts of the corpus consist of 24 million words in total, while the target NPDC will constitute a repository of 40 million words.
first rewind previous Page / 1 next fast forward last
JavaScript is turned off in your web browser. Turn it on to take full advantage of this site, then refresh the page.