Celem niniejszej publikacji jest przedstawienie projektu badawczo-rozwojowego związanego z opracowaniem technologii kontekstowego rozumienia języka pisanego na potrzeby systemu automatycznej poprawy błędów dla języka polskiego. Rozważania te w oczywisty sposób wpisują się w stosunkowo często podejmowany w ostatnim czasie (głównie na gruncie językoznawstwa angielskiego) nurt badań dotyczący wykorzystywania metod przetwarzania języka naturalnego (natural language processing) oraz uczenia maszynowego (machine learning) na potrzeby zaprojektowania systemów GEC (grammatical error correction). W pierwszym punkcie zaprezentowano (w ujęciu problemowym) stan badań, tj. najważniejsze koncepcje z zakresu sposobów tworzenia systemów GEC. Następnie przedstawiono charakter i cel prowadzonych prac badawczych oraz omówiono główne założenia metodologiczne. W przedostatnim paragrafie zasygnalizowano najważniejsze problemy związane z opracowaniem korpusu badawczego.
The aim of the study is to present a research and development project focused on the development of contextual understanding of the written language for the purpose of an automatic error correction system for the Polish language. The presented ideas are clearly part of the current research (mainly in the field of English linguistics) on the use of natural language processing and machine learning for the development of GEC (grammatical error correction) systems. The first section of the article discusses the current state of research in a problem-oriented manner, i.e. the most important concepts in the field of creating GEC systems. The next paragraphs present the aim of the research and a brief methodological introduction. The penultimate paragraph points out the most important issues related to the development of the research corpus.