Kontrolowanie i ocenianie wiedzy i umiejętności uczniów jest podstawowym ogniwem procesu edukacji szkolnej. Jest niezbywalnym etapem tego procesu i środkiem prowadzącym do samokontroli i samooceny uczniów (Denek K. 1977). Zagadnienie właściwego w sensie trafności i skuteczności kontrolowania i oceniania jest stale żywym problemem wymagającym dalszych ulepszeń powodującym wiele dyskusji i kontrowersji.

Przewidywane w reformie progi edukacyjne, na których sprawdzane będą wyniki kształcenia dla poszczególnych uczniów: kompetencji po szkole podstawowej, preorientacji po gimnazjum oraz państwowa matura po liceum (Reforma systemu oświaty, 1998) stawiają nowe wymagania dla procesu kontrolowania i oceniania. To co jest najgorsze w polskim systemie szkolnym to właśnie niedostosowany system kontrolowania i oceniania pracy ucznia, nauczyciela, szkoły, metodyka, nadzoru pedagogicznego do centralnych władz oświatowych włącznie. Reforma stwarza potrzebę i usprawiedliwia zmiany w zakresie kontrolowania i oceniania, natomiast nie gwarantuje, że zmiany, które się dokonają, spowodują bardziej efektywne i bardziej sprawiedliwe działanie systemu szkolnego. Proces kontrolowania i oceniania określony zostaje wtedy, gdy określimy:

  • Kto ma kontrolować i oceniać?
  • W jakim celu ma kontrolować i oceniać?
  • Co ma być przedmiotem kontrolowania i oceniania?
  • Kiedy ma przebiegać proces kontrolowania i oceniania?
  • W jakich warunkach ma przebiegać proces kontrolowania i oceniania?

Odpowiedzi na te pytania powinny być operacyjne, takie by można nimi się kierować w praktyce. Odpowiedzi operacyjne są określone szczegółowo na celach, wymaganiach i treściach kształcenia szkolnego oraz na oczekiwanych własnościach ucznia. Są zatem możliwe dopiero po szczegółowym określeniu programu kształcenia.

Słabość procesu kontrolowania i oceniania w systemie kształcenia przejawiająca się w niekonsekwencji i nietrafności powoduje jego nieefektywne funkcjonowanie, ponieważ daje informację ze sprzężenia zwrotnego będącą regulatorem procesu kształcenia. Jeśli regulator daje błędne informacje to proces może być korygowany na osiągnięcie nie tych celów, które zostały przyjęte do realizacji.

Przedmiotem oceniania może być spełnianie przez ucznia wymagań programowych, może też być spełnianie przez niego nowo spełnianych wymagań, co ma wpływ na motywację ucznia do uczenia się i wreszcie oceniana może być relacja spełniania wymagań w relacji do innych uczniów. Uważam, że relacja ucznia ocenianego do innych uczniów w zespole uczniowskim nie powinna być przedmiotem oceniania z uwagi na to, że ocena ucznia zależeć będzie wówczas nie tyle od tego jakie i ile wymagań uczeń spełnia, co w jakim zespole uczniowskim uczy się. Oceny tracą wówczas swą porównywalność. Zauważmy ponadto, że jeśli są uczniowie którzy nie nadążają czyli nie spełniają wymagań minimalnych, to jest to sygnał o niedostosowaniu programu do ich możliwości i wtedy należy się zastanowić nad tym jaką strategie rozwiązania tego problemu przyjąć. Jeśli tacy uczniowie stanowią istotną frakcję to wówczas można rozważać opcjonalny program kształcenia dla tych uczniów różniący się np. tempem realizacji.

Wśród nauczycieli trwają dyskusje także nad tym, co ma być przedmiotem oceniania i kontrolowania, czy spełnianie wymagań programowych, czy ustosunkowanie się ucznia do procesu uczenia się, czy wkładany przez niego wysiłek, a może wszystko razem? W kształceniu szkolnym oceny mają charakter syntetyczny i to jest nie do uniknięcia, jednak synteza powinna następować po określonej zmiennej kryterialnej ze znanych i określonych elementów szczegółowych np. oceniamy spełnianie przez ucznia kolejnych wymagań, a następnie oceniamy spełnianie przez niego wszystkich wymagań spełniających określone warunki np. będących z określonego przedmiotu kształcenia. W innym przypadku tzn., gdy synteza nie zachodzi po określonej zmiennej kryterialnej a elementy syntetyzowane nie są znane to ocena nie pełni funkcji informacyjnej lecz dezinformacyjną, a w konsekwencji traci wszystkie pozostałe funkcje.

Ze względu na cel rozróżniam ocenę prospektywną i kwalifikującą (Zimny T. 1999). Ocenianie prospektywne dotyczy diagnozowania stanu wiedzy, umiejętności, sprawności i postaw ucznia i porównywania go z oczekiwanym stanem w chwili przyszłej, który ma nastąpić za pewien okres kształcenia po to, by móc dostosować proces kształcenia do realizowanych celów i uczynić go bardziej efektywnym. Ocenianiem prospektywnym jest ocenianie diagnostyczne na początku okresu kształcenia, ale jest nim tylko wtedy, gdy ta diagnoza ma pomóc w przyswajaniu nowych wymagań, gdy diagnozuje luki w celu ich wypełnienia. Ocena prospektywną jest ocena formatywna informująca o tym w jakim stopniu uczeń opanował treści dydaktyczne lekcji, jednostki metodycznej, ale jest nią tylko wtedy, gdy służy dalszemu procesowi kształcenia, tzn. potwierdza uczniowi, że przyswoił sobie nowe treści albo wskazuje na konieczne do uzupełnienia braki. Te zastrzeżenia wydają się być niepotrzebne, ale czynię je aby podkreślić, że ocena jest instrumentem sterującym procesem kształcenia. Oceną kwalifikującą jest ocena sumatywna mająca charakter ogólnego, finalnego osądu i selekcji. Oceną kwalifikującą jest także ocena diagnostyczna jeśli jest syntetyczna i wykorzystana do kwalifikowania uczniów do dalszego etapu kształcenia.

Klasyczny już podział ocen na przed, w trakcie i po etapie kształcenia chciałbym zamienić na oceny na progu edukacyjnym oraz na oceny w trakcie procesu kształcenia

Oceny prospektywne jako oceny analityczne tak jak oceny kwalifikujące odnoszą się do tego co uczeń przyswoił w trakcie kształcenia, lecz służą do optymalizacji procesu kształcenia by uczeń w jak najwyższym stopniu opanował wymagania programowe, a w konsekwencji uzyskał w przyszłości jak najlepsze oceny kwalifikujące. Ocenianie prospektywne może i powinno być dokonywane przez nauczyciela i ucznia w sposób ciągły stale modyfikując i dookreślając dalszy proces kształcenia. Ocenianie prospektywne wymaga jak najlepszej znajomości ucznia, zatem może być dokonywane na podstawie wszystkich możliwych metod poznawczych.

Oceny kwalifikujące jako oceny syntetyczne odnoszące się do tego, co uczeń przyswoił w trakcie kształcenia, służą do jego kwalifikowania. Ocenianie kwalifikujące powinno być dokonywane przez osobę zewnętrzną względem procesu kształcenia po to, by ocena nie była zniekształcona wiedzą o uczniu, pozbawiona subiektywizmu osoby oceniającej, by zachowana została zasada sprawiedliwości zewnętrznej by wszyscy uczniowie oceniani byli według tych samych kryteriów. Wiedza nauczyciela o każdym uczniu jest inna, a zatem mogłaby dla różnych uczniów w różny sposób modyfikować ich ocenę. Ocenianie kwalifikujące dokonywane przez osobę zewnętrzną względem procesu kształcenia powoduje także zmianę relacji nauczyciel - uczeń. Nauczyciel z egzekutora staje się mistrzem pomagającym uczniowi w przyswojeniu wiedzy i umiejętności, a w konsekwencji otrzymania jak najlepszej oceny kwalifikującej. Stąd oceny kwalifikujące powinny wynikać z badania testowego i być stawiane w oderwaniu od znajomości ucznia, tylko na podstawie wyniku testowego. Ocenianie kwalifikujące dokonywane na progu edukacyjnym, powinno odbywać się tak, by oceny uzyskane przez różnych uczniów w różnych miejscach i różnym czasie były porównywalne (ale tylko w przypadku, gdy nie został zmieniony program kształcenia). Porównywalność ocen może zapewnić tylko standaryzacja warunków przeprowadzania kontrolowania i oceniania. Warunki kontrolowania i oceniania dotyczą:

  • sposobu kontrolowania,
  • warunków czasoprzestrzennych,
  • osoby kontrolującej i oceniającej,
  • zadań do rozwiązania czy wykonania,
  • sposobu rejestrowania wyników kontrolowania i ich interpretacji oraz
  • relacji uczniów do wymienionych warunków.

Z wymienionych powodów istnieje uzasadniony pogląd, że tylko kontrolowanie testowe przez osoby zewnętrzne względem kształcenia w szkole, może być trafne, rzetelne i obiektywne. Pojęcie testu jest jednak przez nauczycieli i nadzór pedagogiczny rozumiane często niewłaściwie zawężająco do testów z zadaniami zamkniętymi. Ponadto wystandaryzowanie testu kojarzy im się z tym, że wszyscy badani dostają te same zadania, pomijają natomiast kwestię interpretacji wyniku testowego.

Słowo test pochodzi od łacińskiego czasownika testor, testari czyli ja świadczę, świadczyć. Koncepcja testów jako metody zbierania informacji wprowadzona była przez francuskich psychiatrów E. Seguina 1837 roku we Francji i 1848 w USA oraz J. E. D. Esquirola 1838 roku. W Niemczech w Lipsku W. Wundt 1879 roku badał czas reakcji na bodźce. W Anglii 1882 roku F. Galton prowadził badania antropometryczne, badania widzenia, słyszenia i czasu reakcji oraz innych prostych funkcji senso-motorycznych. W 1890 roku J. Cattell opublikował artykuł pod tytułem „Mental test”. Było to pierwsze użycie terminu test w psychologii jako metody zbierania informacji (A. Anastasi 1964).

„Przedmiotem testowania są właściwości potencjalne ludzi bezpośrednio nieobserwowalne, a więc funkcje psychiczne: intelektualne (poznawcze), emocjonalne (ustosunkowawcze) i wykonawcze (motoryczno-działaniowe)” (Z.M. Zimny 1999).

Międzynarodowe Towarzystwo Psychologiczne przyjęło, że „test jest próbą, zadaniem do wykonania, identycznym dla wszystkich badanych, ze ściśle określonymi sposobami oceniania wyników i przedstawiania tych ocen za pomocą liczby.” Od testu wymaga się żeby był:

  • wystandaryzowany,
  • znormalizowany,

(R.L. Thorndike 1961; L.Wołoszynowa red. 1965; E. Hagen 1969; Z. Skorny 1974; J.Brzeziński 1980, 1996; M. Łobocki 1982; T.Pilch 1995; K. Denek 1998; Z.M. Zimny 1999).

Wystandaryzowanie testu polega na szczegółowym określeniu procedury badawczej po to by ujednolicić warunki mogące mieć wpływ na wynik badania w tym także dokładnie określić zasady oceniania i interpretacji otrzymanych wyników po to by zmniejszyć do minimum zależność wyników od osoby badającej. Test wystandaryzowany posiada instrukcję oraz klucz. Instrukcja składa się z dwóch części: z instrukcji dla prowadzącego badania oraz dla osób badanych. Instrukcja dla prowadzącego badania wyznacza sposób i przebieg badania, warunki w których ma się odbywać (lokal, rozmieszczenie badanych, termin badań, czas przeznaczony na wykonanie zadań testowych). Instrukcja dla badanych zawiera informacje dotyczące celu badań, omówienie zasad rozwiązywania zadań testowych i wpisywania odpowiedzi, charakterystykę używanych znaków umownych, określenie czasu przeznaczonego na rozwiązywanie zadań testowych, wyjaśnienie sposobu rozpoczęcia i zakończenia badań. Klucz zawiera jednoznaczny sposób kwalifikowania i oceniania rezultatów wykonywania zadań testowych. Określa on wszystkie możliwe kategorie rezultatów wykonywania zadań i przypisane im oceny i ich charakterystyki liczbowe.

Znormalizowanie testu polega na opracowaniu norm stanowiących układ odniesienia dla indywidualnych wyników testowych.

Normalizację empiryczną testu dokonuje się przez badanie danym testem reprezentacyjnej próbki danej populacji. Normy są wyrażane w jednej ze skal standardowych. (stąd często normalizacja testu jest mylona ze standaryzacją wyników testowych określającą transformację wyniku na wynik na skali standardowej).

Dla testów dydaktycznych związanych z kształceniem szkolnym owym odniesieniem czyli normą jest program kształcenia, a dokładniej określone w nim wymagania programowe. Normalizacja empiryczna natomiast informowałaby nas o wzajemnych relacjach tych norm, czy i w jakim stopniu program kształcenia jest realizowany na poziomie sprawdzanych wymagań.

Właściwościami testu jest trafność i rzetelność.

Trafność testu orzeka o tym w jakim stopniu test mierzy tę właściwość, którą ma mierzyć. Zasadniczo wyróżnia się 3 rodzaje trafności: trafność kryterialną diagnostyczną i prognostyczną, trafność treściową i trafność teoretyczną (B. Niemierko 1975; J. Brzeziński 1996; Z. M. Zimny 1999; K. Denek 1998).

Dla testów dydaktycznych największe znaczenie ma trafność treściowa określona przez porównanie operacji które trzeba wykonać aby wykonać poszczególne zadania testowe i wymagań programowych. Jeśli te wszystkie operacje są operacyjnym przedstawieniem wymagań programowych określonych na własnościach ucznia, to zadania testowe trafnie sprawdzają spełnienie wymagań programowych. Jeśli operacje te są operacyjnymi przedstawieniami wszystkich wymagań programowych to test ma własność kompletności sprawdzania wymagań programowych.

Rzetelność testu orzeka o stabilności (dokładności) uzyskanych wyników tej samej osoby (przy założeniu, że jej własność się nie zmieniła). J. Brzeziński (1996) omawia wiele możliwych sposobów określania rzetelności testu i wyliczania współczynników rzetelności, omawiając czynione przy tej okazji założenia. Dokładnie wskazuje na 6 różnych metod w ramach których dalej wyróżnia różne podejścia. Dla testów dydaktycznych trzeba zauważyć, że testy mogą dotyczyć tylko jednego wymagania i wówczas dokładność rzetelność określania spełniania przez ucznia takiego wymagania jest większa i możliwa do empirycznego wyznaczania, natomiast znakomicie częściej spotyka się testy dydaktyczne skonstruowane w ten sposób, że każde zadanie sprawdza spełnianie innego wymagania i wówczas empiryczne metody estymacji rzetelności testu nie są możliwe do stosowania. Można natomiast zadbać o rzetelność testu przez redukcję źródeł błędów, a w konsekwencji wyeliminować pewną ich zmienność spowodowaną:

  • nietrafną operacjonalizacją badanej właściwości potencjalnej i niejednorodnością operacyjną zadań testowych, a także
  • nieprecyzyjnie ustaloną procedurą prowadzenia badań testowych oraz zmiennością warunków tak zewnętrznych badania jak wewnętrznych psycho-fizycznych osoby badanej.

Rodzaje testów dydaktycznych.

Testy dydaktyczne mogą być stosowane w procesie oceniania prospektywnego. W tym przypadku mogą dotyczyć wielu bądź tylko jednego wymagania. Można je stosować także w procesie oceniania kwalifikującego i wtedy zawsze dotyczą wielu wymagań.

Jednego wymagania dotyczą testy szybkości (speed testy) oraz testy mocy. Testy szybkości składają się z wielu zadań o tej samej bądź podobnej złożoności i trudności. Mierzą sprawność wykonywania określonej operacji o określonej złożoności potrzebnej do wykonania każdego zadania testowego. Testy mocy składają się z wielu zadań o rosnącej trudności i złożoności. Mierzą one moc wykonywania operacji określonego rodzaju.

Ponadto wyróżnić należy testy wiadomości, testy rozumienia tekstu, testy rozumienia pojęć, testy umiejętności wykonywania operacji matematycznych, testy umiejętności wykonywania operacji językowych, testy umiejętności rozwiązywania problemów, testy umiejętności wykonywania operacji praktycznych, testy ustosunkowań itp.

W kształceniu szkolnym na progach edukacyjnych zastosowanie mają testy wymagań z jednego przedmiotu, kilku bądź nawet wszystkich przedmiotów.

Rodzaje zadań testowych

Testy dydaktyczne mogą zawierać bardzo różnorodne zadania, które spełniają warunki wynikające z przytoczonej definicji testu:

  • treść zadania jest jednoznacznie rozumiana przez uczniów dla których jest przeznaczona,
    • rozwiązujący zadanie nie ma wątpliwości na czym ma polegać wykonanie zadania,
    • treść zadania nie zawiera skrótów myślowych, które mogłyby być nieczytelne dla rozwiązujących,
  • treść zadania jest tak samo rozumiana przez wszystkich badanych uczniów,
  • sposób oceniania zadania jest określony jednoznacznie,
  • ocenę zadania można przedstawić liczbowo,
  • interpretacja wyniku zadania jest sensowna i znana.

Zadania dydaktyczne można podzielić na:

  • zadania zamknięte:
    • wyboru (analogia do pytań zamkniętych rozstrzygnięcia) - takie, że mają jedno poprawne rozwiązanie, które trzeba wybrać z wymienionych w zadaniu, można nimi sprawdzać wiadomości, rozumienie tekstu, rozumienie pojęć, umiejętności wykonywania operacji matematycznych i metamatematycznych czyli matematyzowania sytuacji zadaniowych (Ajdukiewicz K. 1948).
    • dopełnienia (analogia do pytań zamkniętych dopełnienia) - takie, że mają jedno poprawne rozwiązanie, które rozwiązujący ma sam znaleźć, można nimi sprawdzać wiadomości, rozumienie tekstu i pojęć, umiejętności wykonywania operacji matematycznych i metamatematycznych, czyli wszystkie te właściwości, które mogą być sprawdzane przez zadania wyboru.
  • zadania otwarte - mają wiele rozwiązań poprawnych (nazwijmy je dopuszczalnymi) spełniających warunki podane w zadaniu, można nimi sprawdzać umiejętności rozwiązywania problemów, konkretyzacji modelu matematycznego, konstruowania, komponowania, destruowania i dekomponowania.

Zadania zamknięte wyboru mogą różnić się między sobą pod względem formalnym: ilością możliwych wyborów, ilością poprawnych wyborów, charakterem jednostki wyboru i stosunkiem ilości poprawnych wyborów do możliwych wyborów. Najprostsze zadanie wyboru to zadanie o dwu możliwych wyborach wzajemnie wykluczających się w tym jednym poprawnym. Są to np. zadania „prawda - fałsz”. Nieco bardziej złożonymi są zadania o jednym prawidłowym wyborze, ale o wielu możliwych wyborach. Wadą takich zadań jest możliwość uzyskania prawidłowej odpowiedzi bez odpowiedniej wiedzy na drodze zgadywania. Prawdopodobieństwo odgadnięcia prawidłowej odpowiedzi jest odwrotnością liczby możliwych wyborów. Przykładowo jeśli test zbudowany jest z 30 zadań z dwoma możliwymi odpowiedziami to prawdopodobieństwo odgadnięcia prawidłowej odpowiedzi dla każdego zadania wynosi 0,5. Zatem osoba która nie ma wiedzy i będzie zgadywała będzie słusznie oczekiwać, że otrzyma 15 punktów tzn., że dla co drugiego zadania odgadnie prawidłowo rozwiązanie. W testach, w których wszystkie zadania są tego typu zaleca, się brać poprawkę na zgadywanie. Przyjmijmy, że test składa się z N zadań. W każdym zadaniu jest k wyborów i tylko jeden wybór prawdziwy, wówczas wynik skorygowany y uwzględniający możliwość zgadywania przez osobę rozwiązującą wyraża się wzorem:

gdzie x jest wynikiem nie skorygowanym czyli liczbą prawidłowo rozwiązanych zadań.

Uwzględnianie poprawki na zgadywanie może być jednak krzywdzące dla niektórych rozwiązujących zadania. Jest to niechybnie wada, która dyskwalifikuje takie postępowanie w kształceniu, gdzie naturalnym wydaje się przyjęcie zasady, że każdą niepewność rozstrzyga się na korzyść ucznia.

Znacznie korzystniejsze wydaje się takie konstruowanie zadań, by możliwość zgadywania była minimalna. Zadanie w którym prawidłowe rozwiązanie polega na wskazaniu nie jednego lecz kilku wyborów nazywamy zadaniem wyboru wielokrotnego. Jeśli w zadaniu liczba wyborów prawidłowych będzie dla rozwiązującego nieznana, a sposób oceniania zadania będzie taki, że za prawidłowe rozwiązanie tzn. za wskazanie tylko wszystkich prawidłowych wyborów tyle punktów, ile było prawidłowych wyborów za każdy 1 pkt, i jednocześnie wskazanie nieprawidłowego wyboru powoduje ocenę zadania równą zero. Natomiast wskazanie nie wszystkich wyborów prawidłowych przy jednoczesnym nie wskazaniu wyboru nieprawidłowego spowoduje ocenę zadania na tyle punktów ile prawidłowych wyborów wskazał rozwiązujący np. jeżeli w zadaniu są 4 prawidłowe wybory a rozwiązujący wskazał na 3 to otrzymuje 3 punkty, jeżeli wskazał na 2 to 2 punkty. Takie ocenianie nie wymusza od rozwiązującego zaznaczania odpowiedzi bez wiedzy o tym, że są one prawdziwe, a ponadto powstrzymuje rozwiązującego przed zaznaczeniem niepewnej odpowiedzi, gdy już są w zadaniu zaznaczone inne wybory uznane przez niego za prawidłowe. Tak więc ewentualne możliwe zgadywanie jest tu marginalne.

W tej klasie zadań znajdują się zadania przyporządkowania. Należy wtedy wybrać określoną relację (jedną bądź wiele) między dwoma elementami dwóch zbiorów.

Zadania wyboru są trudne w konstrukcji, ponieważ ważne jest jak dobierze się owe nieprawidłowe wybory. W swojej naturze mają być podchwytliwe, a niekiedy mogą spowodować, że uczeń utrwali sobie złą lub niepełną odpowiedź. Dlatego w testach dydaktycznych powinniśmy ograniczyć się do zadań wielokrotnego wyboru w tym zadań przyporządkowania z zastrzeżeniem, że analiza i poprawa testu powinna odbywać się w niedługim czasie po samym teście, najlepiej bezpośrednio po rozwiązaniu testu.

Zadania zamknięte dopełnienia są łatwiejsze do skonstruowania od zadań wyboru. Najbardziej popularnym, bo i najprostszym rodzajem zadań dopełnienia są zadania z luką. Zadania te mogą być kłopotliwe ze względu na to, że łatwo w nich o narzucenie rozwiązującemu swojego specyficznego języka czy sposobu myślenia.

Przy badaniu testowym bierze się pod uwagę sam wytwór osoby badanej i z jego własności wnioskuje się o własnościach jego twórcy. Stąd jeśli chcemy w zadaniach dopełnienia oczekiwać od ucznia nie tylko podania rozwiązania, ale także drogi dojścia do niego, trzeba to jednoznacznie określić w treści zadania. W konsekwencji zadania dopełnienia można podzielić na proste i złożone. Zadania proste to takie, w których mamy tylko jedno polecenie albo pytanie, a rozwiązanie jest wynikiem końcowym bez wskazania w jaki sposób ono zostało osiągnięte. Zadania złożone natomiast to takie, w których chcemy prześledzić sposób dojścia do rozwiązania zadania i w konsekwencji zamieniamy zadanie na złożone, polegające na tym, że wymagamy od rozwiązującego określenia wykonywanych operacji, bądź zacytowania przesłanek, z których korzystał wyprowadzając określony wniosek, albo jedno i drugie. Często takich zadań nie uważa się za testowe ze względu na trudności w standaryzacji, a dokładniej w jednoznacznym określeniu oczekiwań od rozwiązania oraz sposobu oceny rozwiązań i przypisania do tych ocen liczb. W zadaniu złożonym nie można sformułować poleceń wykonania kolejnych operacji potrzebnych do rozwiązania zadania ponieważ zadanie to między innymi polega na tym, że rozwiązujący ma zauważyć, jakie to operacje trzeba wykonać, aby rozwiązać zadanie. Byłoby to podpowiedzią znacznie zmniejszającą złożoność zadania. Polecenie dokumentowania dojścia do rozwiązania musi być zatem sformułowane ogólnie, ale jednocześnie tak, żeby każdy uczeń do którego skierowane jest to zadanie, jak również osoby oceniające jednoznacznie oraz tak samo rozumieli na czym ma polegać owo dokumentowanie rozwiązywania zadania. Jest to możliwe jednak tylko wtedy, gdy istnieją pewne standardowe sposoby zapisu wykonywanych operacji bądź przesłanek. Takie standardy istnieją np. w matematyce. Jednakże nawet na gruncie matematyki istnieją spory dotyczące sposobów dokumentowania rozwiązywania. Sporna jest także kwestia czy ocenianie ma obejmować także samą technologię rozwiąziązywania zadania czy nie. Odpowiedź może być tylko jedna a mianowicie: jeśli zadanie jest tak sformułowane, że z jego treści jednoznacznie wynika, jaką technologią ma być rozwiązywane to ocena obejmuje także technologię rozwiązywania zadania, w przeciwnym przypadku nie ma to żadnego uzasadnienia. Zagadnienie dodatkowo komplikuje fakt, że wiele zadań można rozwiązać różnymi sposobami. Powstaje pytanie czy wszystkie sposoby traktować jako równie dobre? Jak uwzględniać tą różność w ocenie rozwiązań. Proponuję przyjąć, że jeśli rozwiązanie zadania jest czasowo limitowane to nieistotne jest jakim sposobem zostało rozwiązane, byle by rozwiązujący zmieścił się w limicie czasu. W przypadku jednak zadania bez limitu czasowego preferowane powinno być rozwiązanie jak najkrótsze. Rozwiązujący powinni być powiadomieni, że nie tylko należy znaleźć rozwiązanie zadania lecz także należy zadbać o prostotę tego rozwiązania i powinno zostać w tym miejscu podane kryterium tej prostoty np. liczba i jakość wykonanych operacji.

Zadania zamknięte złożone dopełnienia są bardzo trudne w konstrukcji i trudne w ocenianiu, jednakże trud ich konstrukcji jest opłacalny, ponieważ stanowią źródło informacji jaką nie można zdobyć na innej drodze.

Zadania otwarte to zadania w których występuje określone polecenie. Polecenie to dotyczyć może: konstruowania, bądź komponowania całości z elementów, dekomponowania bądź destruowania całości na elementy, przystosowania własności całości bądź elementu. Operacje te mogą być wykonywane według projektu bądź planu albo bez projektu bądź planu. Zadanie może też polegać na wykonaniu samego projektu bądź planu. Konstruowanie dotyczy techniki, komponowanie sztuki. Komponowanie czy konstruowanie zachodzi w sytuacji, gdy przedmiot w postaci wyjściowej stanowi zbiór elementów, które należy ze sobą łączyć, tak aby w efekcie otrzymać jedną określoną całość. Elementy te mogą być jednorodne bądź różnorodne, tak jak sposób ich łączenia może być jednakowy bądź różny. Elementy mogą być gotowe bądź wymagające przystosowania, albo wyszukania.

Dekomponowanie czy destruowanie zachodzi wówczas, gdy przedmiot w postaci wyjściowej stanowi całość, którą należy rozebrać, tak aby otrzymać określone elementy. Relacje między konstruowaniem a komponowaniem oraz destruowaniem i dekomponowaniem nie są analogiczne. Konstruowanie dotyczy techniki a komponowanie sztuki. Natomiast destrukcja to rozebranie całości na elementy które tej całości już nie tworzą (nie musi dotyczyć techniki), w przeciwieństwie do dekompozycji, która polega na wyróżnieniu w całości elementów tak, że po dekompozycji elementy nadal tworzą tę sama całość.

Przystosowanie własności całości bądź elementu zachodzi wówczas, gdy zadanie polega na zmianie ich własności na określone. Zadania otwarte mogą być w swej naturze bardzo różnorodne, jednak wszystkie stwarzają trudności w określeniu własności wyniku wykonywania zadania tak, by ocenianie wykonania było obiektywne oraz możliwe do przedstawienia liczbą.

Przykładem testowych zadań zamkniętych dopełnienia mogłyby być (nie są) zadania z matury pisemnej z matematyki, natomiast przykładem zadania otwartego mogłaby być matura pisemna z języka polskiego, oczywiście jeśli zadania te spełniłyby wymogi zadań testowych, a więc wymogi standaryzacji i normalizacji.

Literatura

  1. Ajdukiewicz K., 1948, Propedeutyka filozofii, Wrocław-Warszawa, Książnica - Atlas
  2. Anastasi A., 1964, Psychological Testing, The Macmillan Company, New York
  3. Brzeziński J., 1980, Elementy metodologii badań psychologicznych, PWN, Warszawa
  4. Brzeziński J., 1996, Metodologia badań psychologicznych, PWN, Warszawa
  5. Choynowski M., 1971, Podstawy i zastosowania teorii rzetelności testów psychologicznych, PWN, Warszawa
  6. Denek K., 1977, Zagadnienia z metrologii dydaktycznej, Katowice
  7. Denek K., 1998, Ewaluacja rezultatów edukacji szkolnej część I, Wychowanie na co dzień, nr 10-11, Akapit
  8. Denek K., 1998, Ewaluacja rezultatów edukacji szkolnej część II, Wychowanie na co dzień, nr 12, Akapit
  9. Denek K., 1999, Ewaluacja rezultatów edukacji szkolnej część III, Wychowanie na co dzień, 1-2, Akapit
  10. Grzywak-Kaczyńska M., 1960, Testy w szkole, PZWS, Warszawa
  11. Hagen E., 1969, Measerement and evaluation in psychology and education, J.Wiley, New York
  12. Łobocki M., 1982; Metody badań pedagogicznych, PWN, Warszawa
  13. Magnuson D., 1981, Wprowadzenie do teorii testów, PWN, Warszawa
  14. Niemierko B., 1975, Testy osiągnięć szkolnych, WSiP, Warszawa
  15. Pilch T., 1995; Zasady badań pedagogicznych, Żak, Warszawa
  16. Skorny Z., 1974, Metody badań i diagnostyka psychologiczna, Zakład Narodowy im. Ossolińskich
  17. Thorndike R. L., 1961, Personal Selection. Test and measurement techniques, J.Wiley, New York
  18. Wołoszynowa L. red., 1965, Metody badań psychologicznych seria III Tom I II, PWN, Warszawa
  19. Zimny T.,1994, Systematyka formalna zadań dydaktycznych, Prace Naukowe WSP seria Pedagogika IV,
  20. Zimny T., 1999, Konieczne zmiany w procesie kontrolowania i oceniania pracy uczniów i nauczycieli, Andrzej Wiśniewski, Częstochowa
  21. Zimny Z, 1971, Pomiar dynamiki funkcji intelektualnych, [w:] Kozielecki J. (red.) Problemy psychologii matematycznej, PWN, Warszawa
  22. Zimny Z, 1999, Zarys metodologii badań społecznych, WSP Częstochowa

Uwaga:

Niniejszy tekst pochodzi z witryny Instytutu Pedagogiki Uniwersytetu Szczecińskiego

Adres: http://belfer.univ.szczecin.pl/~edipp/ewaluacja.htm