Full-text resources of CEJSH and other databases are now available in the new Library of Science.
Visit https://bibliotekanauki.pl

Results found: 2

first rewind previous Page / 1 next fast forward last

Search results

Search:
in the keywords:  phonological variability
help Sort By:

help Limit search:
first rewind previous Page / 1 next fast forward last
EN
The paper describes the principles and structure of the one-million-word DIA1900 Corpus built at the Institute of the Czech National Corpus (CNC) in Prague, focused on the language of Czech texts published in the years 1851 to 1900. The DIA1900, planned for publication by June 2020 and to be followed by the DIA1850 (a corpus built around the same principles, with the focus on the first half of the 19th century), observes both the balanced representation of the three major text types (belles lettres — journalistic texts — technical/scientific texts) and the system of morphological tagging implemented in the synchronic corpora included in the CNC project, thus facilitating the diachronic comparison of two stages in the development of Czech. A brief description is given of the structure of the morphological terminology used in the lemmatisation and tagging of the corpus, and of two tools designed to help search the 19th century texts with their fluctuating orthographic consistency combined with phonological and morphological variation characteristics of the language of the period: (1) a multiple select/suggest feature (reminding the user of the existence of non-standard orthographic and phonological variants of the lemma found in the corpus before the lemma search is started) and (2) the position attribute (informing the user of the ambiguous status of a word in the text, resulting from a misprint or misspelling, damaged page etc.).
2
100%
EN
In this article, I describe the principal features of the Database of Loanword Pronunciation Variants, realised with the aim of bridging a long gap in the empirical study of Czech loanword phonology. The database contains pronunciation forms obtained for 300 phonetically problematic loans and proper names from a balanced sample of 300 Czech speakers. After considering the principles that underlie the phonological adaptation of loanwords, I describe the design of the database and the methodology used. Although the validity of the data is undoubtedly high, I note some factors that might cause bias, such as the influence of spelling or the item selection procedure. The average number of different pronunciation variants per item is 8.02 (1.97 after variants with less than 5% frequency have been excluded). 34 different paradigms of phonological variability were identified in the database. A number of criteria can be used when analysing the data: the phonological phenomenon, word type (e.g. common vs. proper noun), source language, as well as informant features (region, sex, age, education). The database represents a large sociolinguistic survey which can be used both as an empirical platform for the study of Czech loanword phonology and as a source for lexicographic work.
FR
Nous décrivons ici les principales caractéristiques de la Base de données des emprunts dans leur prononciation usuelle (http://dvucs.ff.cuni.cz), mise au point afin de combler une longue absence d’études empiriques sur la phonologie des emprunts en tchèque. La base de données contient les formes phonétiques obtenues pour 300 emprunts et noms propres présentant des difficultés phonétiques, auprès d’un échantillon équilibré de 300 locuteurs tchèques. Après avoir exposé les principes généraux qui sous-tendent l’adaptation phonologique des emprunts, nous décrivons la structure de la base de données et la méthodologie utilisée. Bien que la validité de ces données pour l’analyse de la phonologie des emprunts soit incontestable, nous mentionnons plusieurs facteurs susceptibles de causer des interférences, comme l’influence de l’orthographe ou la démarche adoptée pour la sélection des entrées. Le nombre moyen de variantes phonétiques différentes par entrée est de 8,02 (1,97 après l’exclusion des variantes ayant un effectif inférieur à 5 %). 34 paradigmes différents de variabilité phonologique ont été identifiés dans la base de données, dont certains sont typiques de langues sources particulières. Plusieurs critères peuvent être utilisés lors de l’analyse des données : phénomène phonologique, type de mot (p. ex. nom commun vs. nom propre), langue source, ainsi que les caractéristiques du locuteur (région, sexe, âge, éducation). Des exemples d’analyses sont donnés pour chacun de ces critères. Cette base de données représente une vaste étude sociolinguistique utilisable non seulement comme une plateforme empirique pour l’étude de la phonologie des emprunts en tchèque, mais aussi comme une source valable d’informations pour la lexicographie.
first rewind previous Page / 1 next fast forward last
JavaScript is turned off in your web browser. Turn it on to take full advantage of this site, then refresh the page.