PL EN


Journal
2012 | 3(119) | 9-30
Article title

Wyniki egzaminu gimnazjalnego 2002–2010 na wspólnej skali

Title variants
EN
Results of the 2002–2010 lower secondary school leaving exams on a common scale
Languages of publication
PL
Abstracts
PL
W artykule prezentowane są metodologia oraz rezultaty badania nad zrównaniem wyników egzaminu gimnazjalnego dla lat 2002–2010 przeprowadzonych przez Pracownię Analiz Osiągnięć Uczniów w Instytucie Badań Edukacyjnych. Do badania zrównującego wylosowano ponad 10 tys. uczniów i wykorzystano informacje o ponad 500 zadaniach. Do zrównania wyników egzaminu wykorzystano modele IRT, wyniki przedstawiono na skali zmiennej ukrytej oraz na skali wyników obserwowanych. Dzięki zastosowanej procedurze udało się wyizolować losowe wahania trudności między arkuszami egzaminacyjnymi w poszczególnych latach i przedstawić zmiany w poziomie umiejętności uczniów zdających egzamin gimnazjalny. Na podstawie rezultatów badania można stwierdzić, że poziom umiejętności humanistycznych gimnazjalistów jest stabilny, natomiast poziom umiejętności matematyczno-przyrodniczych wykazał trend spadkowy. W analizie dokonano walidacji zrównywania, porównując przedstawione wyniki z wynikami badania międzynarodowego, porównywalnego w kolejnych cyklach badania PISA. Wyniki dla części humanistycznej wykazują wysoką zbieżność z wynikami PISA dla czytania ze zrozumieniem. W przypadku części matematyczno-przyrodniczej egzaminu, która porównywana była z matematyką w badaniu PISA, zaobserwowano większe różnice pomiędzy rezultatami obydwu badań.
EN
The article presents the methodology and results of a survey on equating the lower secondary school examinations from 2002–2010. The survey was carried out by the Student Performance Analysis Unit at the Educational Research Institute. More than 10 000 students were selected for the equating study and information about more than 500 items was used. IRT models were used for equating exams, the results were presented on a latent variable scale and the observed score scale. Using this procedure, it was possible to isolate random difficulty variation between exam papers from specific years and present changes in ability level of students taking the exam. Based on the results, the level of humanities abilities of lower secondary school leavers was stable, whilst maths and science demonstrated a downward trend. Equating was validated by comparison with the results of the international PISA survey. Results for the arts and humanities were consistent with the PISA results for reading literacy. Maths and science, as compared with the PISA survey maths section demonstrated greater divergence.
Journal
Year
Issue
Pages
9-30
Physical description
Dates
issued
2012-09-30
Contributors
 • Instytut Badań Edukacyjnych
 • Instytut Badań Edukacyjnych
 • Instytut Badań Edukacyjnych
author
 • Instytut Badań Edukacyjnych
 • Instytut Badań Edukacyjnych
References
 • Glas C. A. (2010). Preliminary manual of the software program Multidimensional Item Response Theory (MIRT). Enschede: University of Twente.
 • Glas C. A. W. i Béguin A. A. (1996). Appropriateness of IRT observed-score equating. Research Report 1996–2. Enschede: University of Twente.
 • Kolen, M. J. i Brennan R. L. (2004). Test equating, scaling, and linking: Method and practice (2nd ed.). New York, New York: Springer–Verlag.
 • Patz R. J. i Junker B. W. (1999). A straightforward approach to Markov ChainMonte Carlo methods for Item Response Models. Journal of Educational and Behavioural Statistics, 24(2), 146–178.
 • OECD (2003). Program Międzynarodowej Oceny Umiejętności Uczniów OECD PISA. Wyniki badania 2003 w POLSCE [Niepublikowany maszynopis0.
 • OECD (2006). Program Międzynarodowej Oceny Umiejętności Uczniów OECD PISA. Wyniki badania 2006 w POLSCE (http://www.ifispan.waw.pl/pliki/pisa_raport_2006.pdf).
 • OECD (2009). Program Międzynarodowej Oceny Umiejętności Uczniów OECD PISA. Wyniki badania 2009 w POLSCE (http://www.ifispan.waw.pl/pliki/pisa_2009.pdf).
 • Torre, J. de la (2009). Improving the quality of ability estimates through multidimensional scoring and incorporation of ancillary variables. Applied Psychological Measurement 33(6), doi: 10.1177/0146621608329890
 • Wu. M. (2005). The role of plausible values in large-scale surveys. Elsevier: Studies in Educational Evaluation 31, 114–128.
Notes
http://www.edukacja.ibe.edu.pl/images/numery/2012/3-1-szaleniec-i-in-wyniki-egzaminu-gimnazjalnego.pdf
Document Type
Publication order reference
Identifiers
ISSN
0239-6858
YADDA identifier
bwmeta1.element.desklight-5b3e7fff-ecb1-4322-9118-1abdd859de3e
JavaScript is turned off in your web browser. Turn it on to take full advantage of this site, then refresh the page.