Celem artykułu jest przedstawienie opisu realizacji schematu frazeologicznego poprzez analizę utworzonych według niego związków na przykładzie polskiego modelu ANIOŁ nie NNOMPERS. Obejmuje ona trzy główne parametry: semantyczny, morfosyntaktyczny i pragmatyczny. W obrębie każdego z nich wydzielono parametry szczegółowe (semantyka: znaczenie sumaryczne (składniki leksykalne, metaforyka); znaczenia wyrażeń zbudowanych według badanego modelu; morfosyntaktyka: wariantywność, funkcje syntaktyczne, potencjał transformacyjny; pragmatyka: nacechowanie stylistyczne, typowe użycie, frekwencja, potencjał modyfikacyjny, aspekty kulturowe). Wyniki tego rodzaju analiz mogą znaleźć wykorzystanie w leksykograficznym opisie jednostek wyrazowych utworzonych według modeli frazeologicznych.
EN
The aim of the paper is to present a description of realisations of a phraseological model through the analysis of its realisations. This issue is discussed on the example of the Polish pattern ANIOŁ nie NNOMPERS [lit. (an) ANGEL not NNOMPERS] and the units coined according to this schema. The analysis comprises three main aspects: semantic, morphosyntactic and pragmatic, each of which is subdivided into categories (semantic: literal meaning (lexical constituents, imagery); meanings of the units coined according to the analysed model; morphosyntactic: variability, syntactic functions, transformation potential; pragmatic: stylistic markedness, typical use, frequency, modification potential, cultural aspects). The findings of such analyses can be implemented in the lexicographic description of multiword units coined according to phraseological patterns.
Autor niniejszego artykułu zgromadził ok. 2,7 mln rosyjskojęzycznych newsów internetowych. Zasadnicze cele tego tekstu stanowią: omówienie pojęcia web crawlingu w odniesieniu do pozyskiwania internetowych danych tekstowych, omówienie kwestii strukturyzacji takich danych w nieanotowanych korpusach tekstowych, a także przedstawienie wybranych aspektów analizy danych strukturyzowanych w ten sposób. Autor rozpatruje newsy internetowe jako połączenie tekstu zasadniczego oraz identyfikujących i charakteryzujących go metadanych (wyróżnionych podczas automatycznej ich ekscerpcji ze stron internetowych). Rozdział newsów na tekst zasadniczy i metadane stwarza możliwość przeprowadzenia ich analizy z dwóch perspektyw – tekstowej oraz metainformacyjnej (dodatkowo, np. w odniesieniu do badań chronologizacyjnych, z perspektywy uwzględniającej oba te poziomy). Zarys możliwych badań lingwistycznych zgromadzonego materiału uzupełnia autor ewaluacją wybranych wielowyrazowych całostek, wydobytych z tych tekstów z wykorzystaniem delimitacyjnej funkcji cudzysłowu.
EN
The author of the article collected nearly 2.7 million excerpts of Russian-language Internet news. The main objectives of the article include: discussing the concept of web crawling in relation to the acquisition of online text data, addressing issues related to structuring such data in unannotated text corpora, as well as presenting selected aspects of analyzing data structured this way. The author considers Internet news to be a combination of the main text and metadata that identifies and characterizes it (acquired during automatic extraction from websites). The categorization of news into the main text and metadata creates an opportunity to analyze it from two perspectives – textual and meta-information (and an additional perspective that combines these two, for example for the purpose of chronological studies). An outline of possible linguistic research into the collected material is supplemented with evaluating selected multi-word tokens extracted from these texts based on the delimitation function of quotation marks.
JavaScript is turned off in your web browser. Turn it on to take full advantage of this site, then refresh the page.