EN
From a theoretical point of view, the scope and quality of available information determines the market efficiency and, thus, investors’ decisions. However, an excessive amount of information leads to information overload. In the case of textual data, advanced analytical methods must be applied to identify some regularities and trends within the analysed text corpora. Text mining may be useful in supporting the decision-making process. The paper examines the interdependencies between market commentaries and stock prices. More specifically, it verifies the linguistic characteristics of opinions distributed by institutional investors (investment fund company) and their intertemporal links to the price movements on the Warsaw Stock Exchange. The results indicate that: 1) there is no significant linguistic difference between market commentaries written after weeks of relatively low and relatively high rates of returns on the Warsaw Stock Exchange; 2) the linguistic content of selected market commentaries does not have a predictive value for the Polish stock market; 3) commentaries with a one-week time difference linguistically differ less than the commentaries with two or more weeks’ time difference.
PL
Z teoretycznego punktu widzenia zakres i jakość dostępnych informacji determinuje efektywność rynku, a tym samym wpływa na decyzje inwestycyjne inwestorów. Jednakże duża ilość informacji nie przekłada się wprost na poprawę tej efektywności, wymaga natomiast odpowiedniej selekcji, segregacji oraz strukturyzacji w celu ekstrakcji potencjalnych sygnałów kupna lub sprzedaży instrumentów finansowych. W przypadku informacji tekstowych realizowanie tych działań może zostać usprawnione poprzez zastosowanie komputerowych metod eksploracji danych tekstowych (text mining). Przedmiotem analizy jest weryfikacja parametrów lingwistycznych komentarzy rynkowych oraz ocena ich powiązań z wahaniami cen akcji notowanych na Giełdzie Papierów Wartościowych w Warszawie. Badania z wykorzystaniem wybranych metod i mierników analizy danych tekstowych (m.in. znakowanie części mowy, odległość cosinusowa, Jaccarda) prowadzone są na bazie korpusów tekstowych opracowań analitycznych, sporządzanych regularnie w odstępach tygodniowych przez profesjonalny zespół analityków rynkowych jednego z towarzystw funduszy inwestycyjnych dla polskiego rynku akcji. Wyniki badań wskazują, że: 1) nie występuje statystycznie istotne zróżnicowanie językowe tekstów komentarzy sporządzanych po zakończeniu tygodni o relatywnie niskich oraz tygodni o relatywnie wysokich stopach zwrotu na Warszawskiej Giełdzie Papierów Wartościowych, 2) zawartość językowa wybranych komentarzy rynkowych nie ma wartości predykcyjnej dla polskiego rynku akcji, 3) komentarze z jednotygodniową różnicą czasową różnią się pod względem lingwistycznym mniej niż komentarze z różnicą czasu dwóch lub więcej tygodni.