Full-text resources of CEJSH and other databases are now available in the new Library of Science.
Visit https://bibliotekanauki.pl

PL EN


2020 | 27 | 177-192

Article title

Długość przeciętnego polskiego wyrazu w tekstach pisanych w świetle analizy korpusowej

Content

Title variants

Długość przeciętnego polskiego wyrazu w tekstach pisanych w świetle analizy korpusowej

Languages of publication

PL

Abstracts

PL
W niniejszym artykule podjęto próbę znalezienia odpowiedzi na pytanie: Jak długi jest przeciętny polski wyraz? W tym celu w trakcie dwóch badań przeanalizowano 90 próbek tekstów zaczerpniętych z Narodowego Korpusu Języka Polskiego zawierających po 1000 słów W czasie badań kontrolowano średnią liczbę znaków w każdej próbce, jak również medianę liczby znaków na wyraz. Uzyskane wyniki pozwoliły na określenie długości przeciętnego polskiego wyrazu (PW), która wynosi 6 znaków. Przeliczono też liczbę znaków we wszystkich próbkach i ujęto ją za pomocą PW, porównując długość tekstu wyrażoną słowami faktycznymi i przeciętnymi. Zastosowane procedury statystyczne umożliwiły odrzucenie hipotezy zerowej o braku różnicy między użyciem wyrazów konkretnych, a PW jako miary długości tekstu. W podsumowaniu przedstawiono możliwe zastosowania tego modelu dla celów (glotto)dydaktycznych.
EN
Considering the fact that words vary in length within a language and between different languages the author has conducted the research, inspired by Carver’s model of a standard-length word, to answer the question: What is the average length of a Polish word? To achieve that goal, ninety samples, a 1000-words-long each, drawn from the National Corpora of Polish Language have been examined. The texts belonged to different genres and had different publication channel. The average length of a Polish word was established to be 6 characters. Using that value, the number of average words (AV) has been calculated for each analyzed sample. The number of actual words has been juxtaposed with the number of AV. The procedure made possible to reject the null hypothesis and validate the new unit of text measurement. In the last part of the article a number of possible uses of the new concept have been enumerated.

Year

Volume

27

Pages

177-192

Physical description

Dates

published
2020-12-23

Contributors

References

  • Alderson J., 2000, Assessing Reading, Cambridge.
  • Andersen S., 2002, Speakers´s information content: length-frequency correlation as partial correlation, “Glottometrica”, nr 3, s. 90–109.
  • Broda B., Ogrodniczuk M., Nitoń B., Gruszczyński W., 2014, Measuring Readibility of Polish Texts: Baseline Experiments, w: N. Calzolari i in. (red.), Materiały z konferencji LREC 2014 (9th International Conference on Language Resources and Evaluation, Rejkiawik, 26–31 maja 2014), Rejkiavik, s. 573–580.
  • Brysbaert M., 2019, How many words do we read per minute? A review and meta-analysis of reading rate, [online], https://psyarxiv.com/xynwg/ [29.05.2020]
  • Carver R.P., 1972, Evidence for the invalidity of the Miller-Coleman Readability Scale, „Journal of Reading Behavior”, nr 4(3), s. 42–47.
  • Carver R.P., 1976, Word Length, Prose Difficulty and Reading Rate, „Journal of Reading Behavior”, nr 8(2), s. 193–204.
  • Carver R.P., 1977–1978, Toward a Theory of Reading Comprehension and Rauding, „Reading Research Quarterly”, nr 13(1), s. 8–63.
  • Carver R.P., 1982, Optimal rate of reading prose, „Reading Research Quarterly”, nr 18(1), s. 56–88.
  • Carver R.P., 1983, Is reading rate constant or flexible?, „Reading Research Quarterly”, nr 18(2), s. 190–215.
  • Charzyńska E., Dębowski Ł., 2015, Empirical verification of the Polish formula of text difficulty, „Cognitive Studies”, nr 15, s. 125–132, https://doi.org/10.11649/cs.2015.010
  • Cooper C.R., Petrosky A.R., 1976, A Psycholinguistic View of the Fluent Reading, „Journal of Reading”, nr 20(3), s. 184–207.
  • Defrancis J., 1996, Graphemic indeterminacy in writing systems, „Word”, nr 477(3), s. 365–377, https://doi.org/10.1080/00437956.1996.11432455
  • De Saussure F., 1961, Kurs językoznawstwa ogólnego, Warszawa.
  • Dębowski Ł., Nitoń B., Broda B., Charzyńska E., 2015, Jasnopis – A Program to Compute Readibility of Texts in Polish based on Psycholinguistic Research, w: B. Sharp, W. Lubaszewski, R. Delmonte (red.), Natural Language Processing and Cognitive Science, Proceedings 2015, Kraków, s. 51–61.
  • DuBay W.H., 2004, The Principles of Readability [online], https://eric.ed.gov/?id=ED490073 [11.05.2020]
  • Ellis N.C., 2002, Frequency Effects in Language Processing: A Review with Implications for Theories of Implicit and Explicit Language Acquisition, „Studies in Second Language Acquisition”, nr 24(2), s. 143–188, https://doi.org/10.1017/S0272263102002024
  • Górski R.L., 2012, Zastosowanie korpusów w badaniu gramatyki, w: A. Przepiórkowski, M. Bańko, R.L. Górski, B. Lewandowska-Tomaszczyk (red.), Narodowy Korpus Języka Polskiego, Warszawa, s. 291–301.
  • Górski R.L., Łaziński M., 2012, Reprezentatywność i zrównoważenie korpusu, w: A. Przepiórkowski, M. Bańko, R.L. Górski, B. Lewandowska-Tomaszczyk (red.), Narodowy Korpus Języka Polskiego, Warszawa, s. 25–37.
  • Grabe W., 1991, Current Developments in Second Language Reading Research, „TESOL Quarterly”, nr 25(3), s. 357–406.
  • Grabe W., 2009, Reading in a Second Language, Cambridge.
  • Gruszczyński W. i in., 2015, Measuring Readability of Polish Texts, w: Z. Vetulani, J. Mariani (red.), Materiały Konferencji LTC 2015 (7th Language & Technology Conference: Human Language Technologies as a Challenge for Computer Science and Linguistics, Poznań, 27–29 listopada 2015), Poznań, s. 445–449.
  • Huey E.B., 1908, The Psychology and Pedagogy of Reading, New York.
  • Juel C., Minden-Cupp C., 2000, Learning to read words: Linguistic units and instructional strategies, „Reading Research Quarterly”, nr 35(4), s. 458–492.
  • Kuhn M., Schwanenflugel P., Meisinger E., 2010, Aligning Theory and Assessment of Reading Fluency: Automaticity, Prosody, and Definitions of Fluency, „Reading Research Quarterly”, nr 45(2), s. 230–251.
  • Lado, R., 1955, Patterns of Difficulty in Vocabulary, „Language Learning”, nr 6(1), s. 23–41, https://doi.org/10.1111/j.1467-1770.1955.tb00829.x
  • Laufer B., 1990, Why Some Words are More Difficult Than Others, „IRAL”, nr 28(4), s. 293–307, https://doi.org/10.1515/iral.1990.28.4.293
  • Lewandowska-Tomaszczyk B., 2011, Nowe wyzwania w jakościowej i ilościowej metodologii analizy języka, „Biuletyn Polskiego Towarzystwa Językoznawczego”, nr 67, s. 141–165.
  • Lewandowska-Tomaszczyk B. i in., 2012, Narodowy Korpus Języka Polskiego: geneza i dzień dzisiejszy, w: A. Przepiórkowski, M. Bańko, R.L. Górski, B. Lewandowska-Tomaszczyk (red.), Narodowy Korpus Języka Polskiego, Warszawa, s. 3–9.
  • Perfetti C., 2007, Reading Ability: Lexical Quality to Comprehension, „Scientific Studies of Reading”, nr 11(4), s. 357–383, https://doi.org/10.1080/10888430701530730
  • Piekot T., Zarzeczny G., Moroń E., 2019, Standard „plain language” w polskiej sferze publicznej, w: M. Zaśko-Zielińska, K. Kredens (red.), Lingwistyka kryminalistyczna. Teoria i praktyka, Wrocław, s. 197–214.
  • Ratner N.B., Berko Gleason J., Narasimhan B., 2005, Wprowadzenie do psycholingwistyki – wiedza użytkowników języka, w: J. Berko Gleason, N.B. Ratner (red.), Psycholingwistyka, Gdańsk, s. 15–60.
  • Reeves L.M., Hirsch-Pasek K., Golinkoff R., 2005, Słowa i znaczenia – od pojęć pierwotnych do złożonych struktur, w: J. Berko Gleason, N.B. Ratner (red.), Psycholingwistyka, Gdańsk, s. 173–240.
  • Rey A., Ziegler J.C., Jacobs A.M., 2000, Graphemes are perceptual reading units, „Cognition”, nr 75(1), s. 1–12, https://doi.org/10.1016/S0010-0277(99)00078-5
  • Seidenberg M., 2017, Language at the speed of sight: How we read, why so many can’t, and what can be done about it, Nowy Jork.
  • Seretny A., 2006, Wskaźnik czytelności tekstu jako pomoc w określaniu stopnia jego trudności, „Ling-Varia”, nr 2(2), s. 87–98.
  • Seretny A., 2011, Kompetencja leksykalna uczących się języka polskiego jako obcego w świetle badań ilościowych, Kraków.
  • Seretny A., 2016, Stopień trudności słowa w perspektywie glottodydaktycznej, „Języki Obce w Szkole”, nr 60(1), s. 18–25.
  • Sigurd B., Eeg-Olofsson M., van de Weijer J., 2004, Word Length, Sentence Length and Frequency – Zipf Revisited, „Studia Linguistica”, nr 58(1), s. 37–52.
  • Taylor S.E., 1965, Eye Movements in Reading: Facts and Fallacies, „American Educational Research Journal”, nr 2(4), s. 187–202.
  • Wolf M., Vellutino F., Berko Gleason J., 2005, Psycholingwistyczna analiza czynności czytania, w: J. Berko Gleason, N.B. Ratner (red.), Psycholingwistyka, Gdańsk, s. 439–477.
  • Wyllys R., 1981, Empirical and Theoretical Bases of Zipf’s Law, „Library Trends”, nr 30(1), s. 53–64.
  • Yeni-Koshian G., 2005, Percepcja mowy, w: J. Berko Gleason, N.B. Ratner (red.), Psycholingwistyka, Gdańsk, s. 121–173.
  • http://certyfikatpolski.pl/o-egzaminie/przykladowe-testy-zbiory-zadan/ [08.05.2020].
  • https://cke.gov.pl/egzamin-osmoklasisty/arkusze/2019-2 [09.05.2020].
  • http://nkjp.pl/ [07.05.2020].

Document Type

Publication order reference

Identifiers

YADDA identifier

bwmeta1.element.ojs-doi-10_18778_0860-6587_27_09
JavaScript is turned off in your web browser. Turn it on to take full advantage of this site, then refresh the page.