Full-text resources of CEJSH and other databases are now available in the new Library of Science.
Visit https://bibliotekanauki.pl

PL EN


2016 | 4 | 1-16

Article title

Wpływ nierównomierności wypełnienia tablicy dwudzielczej na wartość krytyczną statystyki testowej

Content

Title variants

EN
The impact of uneven filling two-way contingency tables on the critical value of the test statistics
RU
Влияние неравномерностей заполнения двухразделительной таблицы на критическое значение тестовых статистик

Languages of publication

PL EN RU

Abstracts

PL
Artykuł dotyczy tablic dwudzielczych 2×2. Gdy hipoteza H0 o niezależności cech jest słuszna, bardzo często — za sprawą małych próbek — rozkład statystyki testowej odbiega od rozkładu chi-kwadrat. Kwantyl rozkładu chi-kwadrat nie jest zatem właściwą wartością krytyczną. Problemem nie jest, przy obecnej wydajności komputerów, wyznaczenie metodą modelowania statystycznego Monte Carlo właściwej wartości krytycznej, lecz modelowanie H0. Modelowanie H0 to generowanie takich tablic, w których wartości cechy przypisane wierszom są niezależne od wartości cechy przypisanej kolumnom. Odpowiednie do takiego modelowania są tablice — równomierna o jednakowym prawdopodobieństwie przynależności do komórek oraz nierównomierna mająca jednakowe prawdopodobieństwo we wszystkich wierszach danej kolumny lub we wszystkich kolumnach danego wiersza. Analiza wyników modelowania statystycznego ujawniła, że nawet gdy H0 jest słuszna, rozkład statystyki testowej w istotny sposób zależy od nierównomierności tablicy. W artykule pokazano, że chcąc maksymalizować moc testu należy wartość krytyczną ustalać z uwzględnieniem miary nierównomierności tablicy. Finalnym efektem opracowania jest zaproponowane czytelnikowi gotowe narzędzie do samodzielnej weryfikacji H0.
EN
The article concerns two-way (2×2) contingency tables. When the H0— hypothesis of independence of features is correct, very often — because of the small sample — the distribution of the test statistics differ from the chi-square. Quantile of the chi-square is therefore not a correct critical value. With the current performance of computers, designation of critical value by statistical modeling of Monte Carlo method is not a problem, but a problem is H0 modeling. The H0 modeling is generating such arrays, which feature value assigned rows are independent of the characteristics of the assigned columns. Suitable for such modeling are tables — uniform of the same probability of belonging to cells and uneven having equal probability in all rows of a given column or in all columns of a given row. Analysis of the results of statistical modeling revealed that even when H0 is right, the distribution of the test statistics significantly depends on the uneven array. The article shows that in order to maximize the power of the test should be set critical value, taking into account measures of inequality array. The final result of the study is offered the reader a ready tool for independent verification of the H0 hypothesis.
RU
Статья рассматривает двухразделительные таблицы 2×2. Если гипотеза H0 по независимости признаков является правильной, очень часто — с использованием небольших выборок – распределение тестовых статистик не подчиняется распределению хи-квадрат. Квантиль распределения хи-квадрат таким образом не является соответствующим критическим значением. Учитывая производительность сегодняшних компьютеров, проблемой не является обозначение по методу статистического моделирования Монте-Карло соответствующего критического значения, но моделирование H0. Моделирование H0 это разработка таких таблиц, в которых значения признака отнесены к строкам являются независимыми от величины признака отнесенного к столбцам. Соответствующими для такого моделирования таблицами являются — равномерная с одинаковой вероятностью принадлежности к клеткам, а также неравномерная имеющая одинаковую вероятность во всех строках данного столбца или во всех столбцах данной строки. Анализ результатов статистического моделирования показал, что даже если H0 является правильной, распределение тестовых статистик действительно зависит от неравномерности таблицы. В статье было показано, что для высокой мощности критерия следует определять критическое значение с учетом меры неравномерности таблицы. Конечным эффектом разработки является предложение читателю готового инструмента для самостоятельной проверки H0.

Year

Issue

4

Pages

1-16

Physical description

Dates

published
2016-04

Contributors

  • Akademia Pomorska w Słupsku
  • Akademia Marynarki Wojennej w Gdyni

References

  • D’Ambra A., Crisci A. (2013), Multiple TAU decomposition in mean effect and interaction term, SIS Statistical Conference, Advances in Latent Variables. Methods, Models and Applications, Brescia.
  • Goodman L., Kruskal W. (1954), Measures of Association for Cross Classifications, „Journal of the American Statistical Association”, Vol. 49.
  • Gray L. N., Williams J. S. (1975), Goodman and Kruskal’s tau b: multiple and partial analogs, [w:] Proceedings of the Social Statistics Section, American Statistical Association.
  • Pearson K. (1900), On the criterion that a given system of deviations from the probable in the case of a correlated system of variables is such that it can be reasonbly supposed to have arisen from random sampling, „Philosophy Magazine Series”, Series 5, Vol. 50.
  • Sulewski P. (2014), Statystyczne badanie współzależności cech typu dyskretne kategorie, Akademia Pomorska, Słupsk.
  • Sulewski P. (2015a), Wyznaczanie obszaru krytycznego przy testowaniu niezależności w tablicach wielodzielczych, „Wiadomości Statystyczne”, nr 3.
  • Sulewski P. (2015b), Ocena zdolności tablic dwudzielczych do wykrywania związku między uporządkowanymi cechami typu jakościowego, „Wiadomości Statystyczne”, nr 5.

Document Type

Publication order reference

Identifiers

YADDA identifier

bwmeta1.element.desklight-57a3974b-663b-491f-8653-f67d74eeaef4
JavaScript is turned off in your web browser. Turn it on to take full advantage of this site, then refresh the page.