
Testowanie w szkole – zmora czy metoda?
Jak mierzyć „przyrost” wiedzy ucznia?
Przeciętny „zjadacz chleba” myśli o edukacji „dialektycznie”. Wyobraża sobie, że pobyt ucznia w szkole sam z siebie zaowocuje jego ciągłym rozwojem umysłowym. Każdy rok nauki poszerza – według tej wizji – horyzonty młodego człowieka: zdobyta wiedza stale się pogłębia, przybywa umiejętności, coraz łatwiej przychodzi rozwiązywanie problemów. Praktyka szkolna jednak nie zna takiej definicji edukacji. Oczywiście, rozwój leży u podstaw nie tylko popularnego myślenia o kształceniu, ale także stanowi „słowo-klucz” w podstawowych założeniach funkcjonowania systemu oświaty. Dla nauczyciela jest to cel codziennej pracy w szkole. Ale jak to w życiu – droga do celu bywa kręta i wyboista.
Zmierzając do wytyczonego celu, nauczyciel (a także szkoła i inne ogniwa systemu kształcenia) potrzebuje maksymalnie obiektywnej informacji o stanie wiedzy i umiejętności swych podopiecznych. Mało tego, oczekuje takiej informacji w regularnych, niezbyt wielkich odstępach czasu – tylko wtedy będzie mógł stwierdzić, czy ów postęp faktycznie następuje albo też zastosować program naprawczy, gdy wystąpią przeszkody w osiąganiu kolejnych szczebli wtajemniczenia.
Chłodno i z dystansu
Ocenę postępów ucznia w nauce trzeba postrzegać jako złożone działanie. Pierwszym krokiem jest ocena dokonywana przez nauczyciela w ramach tzw. wewnątrzszkolnego systemu kształcenia i oceniania, z natury rzeczy naznaczona indywidualnymi cechami samego oceniającego. Jak pozbyć się intuicyjności i subiektywizmu w ocenie? Na tym etapie – mimo najlepszych chęci – zadanie niewykonalne, bo nauczyciel musi oceniać na podstawie własnych kryteriów, doświadczeń, upodobań itp.
Kapitalne znaczenie dla efektywności pracy nauczyciela i szkoły ma więc weryfikacja własnych wyobrażeń o postępach (stanie) wiedzy z maksymalnie zobiektywizowanym wzorcem, miarą tych osiągnięć, która jest stosowana wobec całej populacji lub jej reprezentatywnej części. Nauczycielowi może się wydawać, że Jaś Malinowski zanotował postępy w nauce, ale sam nie jest w stanie określić precyzyjnie wielkości tego „przyrostu”. Co więcej, może się okazać, że z punktu widzenia ogólnie przyjętych kryteriów Jaś wcale nie poszedł do przodu.
Diagnoza wewnętrzna musi zatem być uzupełniona oglądem zewnętrznym.
Egzamin to nie wszystko
Elementem diagnozy zewnętrznej stał się od kilku lat system egzaminów w szkole podstawowej i gimnazjum. Progi egzaminacyjne oczywiście są istotnym wydarzeniem w procesie oceny postępów edukacyjnych, ale daleko niewystarczającym. Ich diagnostyczny sens – zdaniem Instytutu Badań Kompetencji – uwidoczni się dopiero wtedy, gdy będą traktowane jako zwieńczenie systematycznych i zaplanowanych „diagnoz etapowych”. Jeśli przywiążemy zbyt dużą wagę interpretacyjną do pojedynczego wyniku na egzaminie, narażamy się na niebezpieczeństwo tworzenia nie do końca prawdziwego obrazu rozwoju ucznia.
Instytut proponuje metodę „podglądu” rozwoju ucznia zanim dojdzie on do progu egzaminacyjnego. Korzyści płynące z takiej diagnozy są wszechstronne. Uczeń przystąpi do egzaminu bardziej świadomy swoich możliwości, łatwiejsze stanie się planowanie kolejnych szczebli edukacji – na decyzje o wyborze dalszej drogi kształcenia mniej wpływać będą życzenia i ambicje środowiska, a więcej racjonalne przesłanki.
Niepełna wartość diagnostyczna wyniku egzaminu w szkole podstawowej lub gimnazjum bierze się stąd, że każdy sporadycznie zastosowany test – nawet ten „zewnętrzny” i niewiadomo jak doskonale skonstruowany – nie może być źródłem na tyle ważnych informacji, aby na ich podstawie trafnie i rzetelnie opisać postępy edukacyjne ucznia.
Po pierwsze: badajmy (testujmy) systematycznie.
W przód czy w tył?
Instytut stworzył już liczącą kilkaset pozycji „bazę” szkół, które obserwuje od kilku lat. Dzięki zebranym informacjom, możliwe stało się określenie profilu rozwoju zarówno tych szkół, jak i konkretnych uczniów tam uczęszczających.


Zwróćmy uwagę na przykładowe zaświadczenie o rozwoju kompetencji ucznia (Moniki). Powstało ono na podstawie wyników badań przeprowadzanych przez 4 lata – od III klasy aż do sprawdzianu w klasie VI. Zawarte w nim informacje w skrócie opisują przebieg „kariery” szkolnej tej uczennicy.
Narzędzie pomiaru
Sama jednak powtarzalność testowania nie jest wystarczająca. Niezwykle ważnym elementem każdej skutecznej diagnozy jest narzędzie, za pomocą którego dokonujemy pomiaru. Nie może ono być „znikąd wzięte”, przypadkowo sklecone na potrzeby doraźnego celu. Instytut bezwzględnie przestrzega zasady dbałości o jakość narzędzia.
Test użyty w badaniach musi:
- spełniać podstawowe wymogi statystyczne,
- składać się z zadań poddanych standaryzacji,
- być budowany ze świadomością celu,
- zawierać dokładnie opisaną strukturę,
- „trafiać” w wybrane pola wiedzy i umiejętności ucznia.
Z takiego testu dopiero można mieć pożytek – jego wynik stanie się punktem wyjścia do wszechstronnej analizy, która z kolei będzie źródłem istotnych informacji dla ucznia, rodziców, nauczycieli, nadzoru pedagogicznego.
Monika „surowa”
Analizując zacytowane wcześniej zaświadczenie o rozwoju kompetencji Moniki, odnajdujemy skalę porównawczą: indywidualne wyniki tej uczennicy zostały naniesione na 9-stopniowe skale poziomów kompetencji populacji. Wynik wyrażony punktowo (nazywamy go wynikiem surowym) sam z siebie niczego nie powie, jeśli nie zestawimy go z wynikami większej grupy uczniów, badanych tym samym narzędziem. Mało tego – może wprowadzić fałszywe informacje do obrazu rozwoju ucznia. Zwróćmy uwagę na czarny słupek, zamieszczony na poniższych schematach, który prezentuje za każdym razem taką samą liczbę punktów - 33.
szkoła A

szkoła B

szkoła C

Monika, która uczęszcza do szkoły A, uzyskała 33 punkty. Gdyby ograniczyć się do interpretacji wyniku surowego, to można dziewczynce powiedzieć, że nie błysnęła specjalnie – jej wynik punktowy „ulokował” ją w grupie przeciętnych uczniów, bowiem bardzo wielu kolegów i koleżanek z tej szkoły uzyskało podobny rezultat, natomiast wielu okazało się lepszych (czyli zdobyło więcej punktów). Ten sam test rozwiązywali także uczniowie w innych szkołach. Okazało się, że 33 punkty w szkole B to wcale nie taki „przeciętny” wynik. Znacznie mniej uczniów osiągnęło taki rezultat, a zdecydowanie więcej było wyników słabszych. Monika w tej szkole byłaby „dobra”. W jeszcze innej szkole (C) Monika nawet miałaby szansę wystąpić na apelu jako ta uczennica, która wraz z kilkorgiem dzieci najlepiej wypadła w badaniach kompetencji – bo zdobyła aż... 33 punkty.
Taki sam wynik – trzy różne interpretacje.
Monika „znormalizowana”
Instytut Badań Kompetencji, dążąc do budowania możliwie najbardziej rzetelnego obrazu osiągnięć edukacyjnych uczniów i szkół, dokonuje normalizacji wyników surowych.
Nowoczesna technologia umożliwia zgromadzenie „bazy” wszystkich wyników surowych, a następnie poddanie ich szlachetnej „obróbce”. Ona to prowadzi do zbudowania skali porównawczej dla pojedynczych wyników. Schemat pokazuje tę skalę.


Wszystkie zebrane wyniki ulegają podziałowi na 9 grup – każdej przypisany jest umowny „poziom kompetencji” (od najniższego do najwyższego). Przykładając do tej swoistej miary pojedynczy wynik, otrzymujemy obiektywną informację, na jakim poziomie znajduje się konkretny uczeń. Dopiero teraz wynik punktowy Moniki (33 punkty) daje się tak naprawdę zinterpretować: ta liczba punktów plasuje Monikę w grupie uczniów o „bardzo wysokim” poziomie kompetencji (choć jak sobie przypomnimy, w szkole A mogłaby liczyć co najwyżej na określenie „przeciętna”).
Ma to ogromny walor motywacyjny – jakże inaczej Monika może podejść do swoich osiągnięć: wie, że sporo jej brakuje do najwyższych stopni „na drodze ku szczytom kompetencji” (bo przecież w jej szkole bardzo wielu uczniów było lepszych), ale z drugiej strony nie ma powodu do zniechęcenia i poczucia zawodu – przecież w skali wszystkich uczniów biorących udział w badaniu znalazła się w czołówce.
Podobne analizy i interpretacje wyników Instytut przeprowadza dla poszczególnych klas i szkół.
Program naprawczy
Zastosowanie metody porównywania wyników, tworzenia rozkładów znormalizowanych, pozwala na dokonywanie dalej idących analiz, które czynią z badania kompetencji zdarzenie o doniosłym znaczeniu.
W opinii Instytutu wyniki testowania powinny dać podstawę dla tworzenia programu naprawczego – pokazując jak na ekranie monitora słabe i mocne strony, dając sygnał, ile brakuje uczniowi, klasie, szkole do najlepszych. Tak naprawdę testujemy, żeby przekonać się, czego jeszcze nie umiemy, co należy poprawić, żeby osiągnąć jak najwyższy poziom opanowania konkretnej umiejętności.
Doświadczenia wyniesione z wieloletnich badań skłaniają Instytut do stwierdzenia, że tworzenie programów naprawczych, indywidualnych i grupowych, nie może być odniesione wyłącznie do analizy norm wymagań wyznaczonych programem nauczania, lecz powinno zawierać porównanie
ze wskaźnikami osiągnięć populacji. Cóż bowiem wynika z tego, że klasa X opanowała wybrane umiejętności na poziomie 50% tego, co wymaga program? Można drzeć z tego powodu szaty, ale gdy uświadomimy sobie, że zdecydowana większość badanych klas nie wypadła wcale lepiej – to magiczne „50%” nabiera już innego znaczenia dla nauczyciela czy dyrektora szkoły.
Oczywiście, rozumując w odwrotnym kierunku, nie powinna uśpić naszej nauczycielskiej (bądź rodzicielskiej) czujności informacja, że procent ów mieści się w „górnej strefie stanów wysokich”. Zestawienie z osiągnięciami populacji może ten na pozór znakomity wynik zweryfikować do stanów najwyżej „średnich”.
Empiryczne normy osiągnięć
Mając nieustannie na uwadze potrzebę porównywania wyników na różne sposoby, Instytut w kolejnych latach badań odkrywa tzw. empiryczne normy osiągnięć, czyli poziom opanowania konkretnej umiejętności na danym etapie kształcenia. (Jest on wyrażony za pomocą „uśrednionego” procentu poprawnych odpowiedzi w teście).
Można przyjąć dla każdej badanej umiejętności „próg niezadowolenia” z jej opanowania. Wystarczy zestawić ze sobą empiryczne normy osiągnięć w klasie z empiryczną normą osiągnięć w populacji. Gdy obie liczby są „bliskie” sobie, wówczas nauczyciel może z czystym sumieniem powiedzieć, że jego uczniowie są tak samo „dobrzy” jak ich rówieśnicy z innych klas i szkół. Gdy jednak liczby te różnią się znacznie (empiryczna norma w klasie osiąga niższą wartość niż norma w populacji), wtedy otrzymuje „sygnał ostrzegawczy” – jego podopieczni są słabsi od „konkurencji”. Wyróżnione kolorem pola w poniższej tabelce to właśnie „obszary niedomagań” w przykładowej szkole; „słabe punkty”, które trzeba jak najszybciej wzmocnić.
| Współczynnik zgodności (WZ) |
0,85 |
0,57 |
0,96 |
0,73 |
1,01 |
0,64 |
0,64 |
0,70 |
0,70 |
0,76 |
0,91 |
| Epmiryczna norma osiągnięć w klasie (ENK) |
67% |
48% |
87% |
64% |
77% |
41% |
45% |
47% |
54% |
50% |
65% |
| Empiryczna norma osiągnięć w populacji (ENP) |
79% |
84% |
90% |
88% |
76% |
63% |
70% |
68% |
77% |
66% |
72% |
„Współczynnik zgodności” zwłaszcza dla nauczyciela jest obiektywną, pochodzącą
z zewnątrz wskazówką, które partie programu nauczania należy przerobić jeszcze raz, aby nadrobić utracony dystans.
Oto propozycja programu naprawczego dla klasy drugiej pewnej szkoły podstawowej – jako przykład korzyści płynącej z tak przeprowadzonej analizy wyników:


Metoda – nie zmora
Rozbudowana diagnoza edukacyjna staje się niezbędnym czynnikiem wpływającym na poprawę jakości polskiej szkoły. Do niedawna była to prawda „teoretyczna”, powtarzana za tymi, którzy już się o tym przekonali na własnej skórze. Dzisiaj czerpanie z zachodnioeuropejskich wzorów dostarcza konkretnych korzyści, ale jednocześnie zmienia się z prostego naśladowania w zweryfikowaną praktycznie metodę, dostosowaną ściśle do wymagań polskiego systemu kształcenia. Powoli wszyscy przestajemy myśleć o testowaniu jak o zmorze gnębiącej niepotrzebnie ucznia i nauczyciela, zakłócającej spokojną codzienność szkoły. Zaczyna do nas docierać oczywista prawda, że rozwój (postęp) nie zna samozadowolenia. Coraz bardziej świadomie godzimy się włożyć kij w mrowisko i sprawdzić się na tle innych.
Diagnoza rozpoczęta już na początku szkoły podstawowej może zapobiec trudnościom na kolejnych etapach kształcenia – może uchronić przed rozczarowaniem...
System badań zewnętrznych, proponowany przez Instytut, pomaga szkołom znaleźć odpowiedź na zasadnicze pytania: „czy nasi uczniowie się rozwijają, czy ich umiejętności są na tyle ukształtowane,
aby sprostać rywalizacji z rówieśnikami z innych szkół, miast, środowisk”.
