Dom » Liječenje » Što mjeri test na temelju kriterija? Visoka, budući da je glavna svrha testiranja razlikovati ispitanike prema razini obuke. Kriterijsko orijentirani testovi

Što mjeri test na temelju kriterija? Visoka, budući da je glavna svrha testiranja razlikovati ispitanike prema razini obuke. Kriterijsko orijentirani testovi

Samara 2000

Jeffrey Wyalford, Velika Britanija (prijevod i prilagodba domaćoj terminologiji - dr. sc. Kuznetsov V. G.)

Teorija i praksa suvremenog pedagoškog testiranja ima povijest ne dužu od jednog stoljeća. Razvoj psihologije i pedagogije od kraja 19. stoljeća do početka Prvog svjetskog rata usko je povezan s razvojem testnih tehnologija. Društveni i znanstveni uvjeti s kraja 19. i ranog 20. stoljeća natjerali su pedagoge i psihologe da rezultate testova razmatraju sa stajališta usporedbe relativnih sposobnosti ispitanika, što se s vremenom počelo nazivati normativno orijentiranim pristupom interpretacija rezultata ispitivanja.

Kada se pojedinačni rezultati tumače u odnosu na ispitanikovu stručnost u određenom sadržajnom području, a ne u usporedbi s rezultatima drugih ispitanika u skupini, tada se u ovom slučaju govori o kriterijskom pristupu testiranju .

Ideja o kriterijski orijentiranom testiranju i sam termin pojavili su se 60-ih godina našeg stoljeća. Do tog se vremena normativno orijentirano testiranje razvijalo više od pola stoljeća. Od 70-ih godina prošlog stoljeća kriterijski orijentirani testovi stekli su univerzalno priznanje i naširoko se koriste u području obrazovanja i stručne certifikacije osoblja.

Trenutno se široko koriste u obrazovanju, industriji i oružanim snagama SAD-a, Velike Britanije, Nizozemske, Japana i drugih razvijenih zemalja. Oni korisnicima testova pružaju vrijedne informacije koje se razlikuju od onih koje se mogu dobiti iz normativnih testova.

Kriterijski orijentirani testovi, ili kako se još nazivaju testovi usmjereni na domenu (testovi usmjereni na sadržajno područje) i testovi znanja (kvalifikacijski testovi), koriste se u mnogim obrazovnim institucijama u razvijenim zemljama i rješavaju različite probleme.

U posljednje vrijeme postalo je uobičajeno da javne obrazovne ustanove definiraju skup znanja, vještina i sposobnosti koje studenti moraju savladati kako bi prešli s jednog predmeta na drugi ili stekli odgovarajuću diplomu. U Rusiji je ta kombinacija utjelovljena u stvaranju državnih obrazovnih standarda. Upotreba kriterijski orijentiranih pedagoških testova temeljenih na državnim obrazovnim standardima za završnu i postupnu certifikaciju učenika iznimno je obećavajuća.

Jedna od najvažnijih primjena kriterijski orijentiranih testova je certifikacija i licenciranje u području profesionalne djelatnosti. U Sjedinjenim Državama, na primjer, postalo je uobičajeno da profesionalne organizacije uspostave certifikacijski ispit u obliku testa (ili niza testova) koji ispitanici moraju uspješno položiti kako bi dobili priliku vježbati u njihovo odabrano područje profesionalne djelatnosti. Mnoge od tih profesionalnih organizacija koriste testove temeljene na kriterijima za recertificiranje ispitanika. Tipični stručni ispit, koji se temelji na kriterijskim testovima, mjeri znanja, vještine i sposobnosti potrebne za profesionalnu djelatnost, a rezultati ispita tumače se u odnosu na minimalno utvrđeni standard ocjenjivanja.

Pojam normativnog i kriterijskog pedagoškog testa

Trenutačno postoje dva glavna pristupa razvoju testova za natjecateljsku i profesionalnu selekciju te za certificiranje studenata i specijalista: normativno orijentiran i kriterijski orijentiran. Ova se dva pristupa razlikuju u svim fazama razvoja od trenutka odabira sadržaja do trenutka interpretacije rezultata.

Njihova najopćenitija karakteristika je sljedeća .

Normativno orijentiran normirani pristup (na engleskom) omogućuje vam da međusobno usporedite obrazovna postignuća (razinu osposobljenosti, razinu stručnog znanja i vještina) pojedinih predmeta.

Orijentiran na kriterije pristup (na engleskom criterion-referenced) omogućuje procjenu u kojoj su mjeri ispitanici svladali potrebno obrazovno gradivo

Za certifikacijsko praćenje razine osposobljenosti, poznatiji i prirodniji zadatak rješava se u okviru pristupa usmjerenog na kriterije. Štoviše , U procesu ispitne kontrole oba su pristupa važna i neophodna.

Testovima se mjeri stupanj ovladanosti nastavnim gradivom, ovladavanje potrebnim znanjima, vještinama i sposobnostima, razina stručne osposobljenosti osoblja. Kao rezultat mjerenja, stupanj manifestacije bilo kojeg svojstva ispitanika izražava se rezultatom testa, koji je određeni broj. Postavite rezultate testa na posebne ljestvice koje su odabrali programeri.

Normativno orijentirani pedagoški testovi koriste se za dobivanje pouzdanih i normalno raspodijeljenih rezultata za usporedbu između ispitanika.

Kriterijski pedagoški testovi koriste se za tumačenje rezultata testa u skladu s razinom osposobljenosti ispitanika u točno definiranom sadržajnom području.

Iako su razlike između normativnih i kriterijskih testova značajne, imaju mnogo toga zajedničkog. Na prvi pogled na sam test prilično je teško odrediti koja se od ove dvije vrste odvija. Koriste iste oblike ispitnih zadataka i slične upute za subjekte.

Prva razlika je svrha izrade testa. Normativno orijentirani testovi osmišljeni su posebno kako bi omogućili usporedbu ispitanika u sadržajnom području kojem je test namijenjen. U tu svrhu koriste se normativne ili standardne ljestvice.

Testovi temeljeni na kriterijima osmišljeni su kako bi se potvrdila izvedba ispitanika u skladu s područjem specifičnih znanja, vještina i sposobnosti. Rezultati testiranja prema kriterijima mogu se koristiti za:

procjena završne razine osposobljavanja subjekta, usklađenost ove razine s državnim obrazovnim standardima ili programom osposobljavanja;
odabir studenata koji su postigli potrebnu razinu osposobljenosti, uključujući stručnu osposobljenost;
procjena učinkovitosti programa osposobljavanja u određenoj obrazovnoj ustanovi.

Rezultati testiranja prema kriterijima također se mogu koristiti za usporedbu razina pripremljenosti učenika, međutim, u ovom slučaju može se dobiti relativno niska pouzdanost ako je distribucija rezultata homogena i ima male varijacije.

Druga razlika ove dvije vrste testova je razina detalja u području sadržaja. Od razvijača obiju vrsta testova obično se traži da specificiraju sadržaj testa. Pisci testova na temelju kriterija moraju, u tipičnim slučajevima, pripremiti znatno detaljnije specifikacije sadržaja nego pisci testova na temelju normi. Ovo je neophodno kako bi se osiguralo da su korisnici testa sigurni u odgovarajuću interpretaciju rezultata testa.

Treća razlika leži u ravnini statističke obrade rezultata ispitivanja. Obrađeni (ili skalirani) bodovi temeljeni na rezultatima normativnog testiranja temelje se na statističkim podacima iz normativne skupine, odnosno specifičnog, prilično velikog uzorka ispitanika. U većini slučajeva za ovu vrstu testa koriste se posebne normativne ljestvice. Svaki pojedinačni rezultat za određeni test ima korespondenciju jedan-na-jedan s ekvivalentom percentila utvrđenim na normativnoj skupini. Ako pojedinačni rezultat određenog ispitanika ima ekvivalent percentila 75, to znači da je 75% ispitanika u normativnoj skupini imalo iste ili lošije rezultate testa. Obrađeni pojedinačni bodovi temeljeni na rezultatima kriterijskog testiranja ne odnose se ni na jednu normativnu skupinu ili uzorak ispitanika. Individualni rezultat ispitanika tumači se u odnosu na udio nastavnog gradiva koje je uspješno savladao. Učenički rezultat najčešće odražava postotak točno obavljenih zadataka i izražava se na postotnoj ljestvici.

Četvrta Glavna razlika je u tehnologiji analize i odabira ispitnih zadataka. U normativno orijentiranim testovima statistički pokazatelji ispitnih zadataka (razina težine i sposobnost razlikovanja) imaju važnu i često odlučujuću ulogu u odabiru zadataka. Općenito, zadaci s umjerenom razinom težine i visokom diskriminirajućom moći imaju veću šansu da budu odabrani za korištenje u ovoj vrsti testa, budući da daju značajan doprinos varijacijama u pojedinačnim rezultatima učenika. Pouzdanost testa općenito će biti veća ako se varijacija rezultata testa poveća. Naprotiv, u kriterijskim testovima statističke karakteristike (razina težine i diskriminatorne sposobnosti) zadataka nisu glavni razlog za njihovo uključivanje u test, ili obrnuto, isključenje iz njega. Glavni uvjet za odabir zadataka za kriterijski test je njihova usklađenost (podudarnost) sa specifikacijom i sadržajnim elementom. Statističke karakteristike testnih zadataka koriste se za sastavljanje paralelnih oblika kriterijski orijentiranih testova i odabir optimalnog standarda ocjenjivanja.

Ove dvije vrste testova razlikuju se u metodama dizajna i značajkama primjene. No, glavni kriterij za podjelu testova na normativne i kriterijske je pristup tumačenju rezultata testa.

Među njima postoji niz drugih važnih razlika. Karakteristične značajke ove dvije vrste testova mogu se sažeti u tablici 4.2.

Regulatorno orijentirani testovi

Većina programa testiranja u inozemstvu koristila je i trenutno koristi različite vrste skaliranih (obrađenih) rezultata. U praksi masovnog pedagoškog testiranja postoji više-manje standardni skup skaliranih rezultata koji informiraju korisnike testa o relativnim sposobnostima ispitanika. .

Ovi skalirani (obrađeni) rezultati uključuju: percentilne ekvivalente; standardne linearne ljestvice; standardne normativne ljestvice i druge vrste pedagoških ljestvica . Skalirani rezultati pomažu korisnicima testa da dobiju informacije o položaju ispitanika u odnosu na dobro definiranu skupinu određenog uzorka ispitanika.

Ovaj specifični uzorak subjekata često se naziva normativna skupina a budući da su obrađeni bodovi usmjereni na bodove u normativnoj skupini nazivaju se normativno orijentirani rezultati.

Interpretacija orijentirana na norme temelji se na usporedbi pojedinačnih rezultata testa određenog učenika s rezultatima koje su dobili drugi ispitanici. Najjednostavniji način za normativno tumačenje rezultata testa je izvješćivanje o tome koliki je postotak učenika u ispitnoj skupini imao lošije rezultate (niže ocjene), a koji postotak bolji (više ocjene). Međutim, pri takvom tumačenju javlja se sljedeća poteškoća: procjena pojedinačnih obrazovnih postignuća pokazuje se ovisnom o razini pripremljenosti cijele skupine učenika u kojoj je testiranje provedeno. Hipotetski, jedan od načina za prevladavanje ovog problema bio bi testiranje cijele populacije za koju je test razvijen i usporedba individualnog rezultata s dobivenim rezultatima. Populacija se odnosi na cjelokupni skup studenata koji studiraju u određenoj disciplini i prema određenom programu. Ako je test razvijen za korištenje u bilo kojoj obrazovnoj ustanovi, tada su u populaciju uključene sve obrazovne skupine koje se školuju po istom programu. Ako je test razvijen za upotrebu unutar regije ili zemlje, tada populacija poprima vrlo impresivnu veličinu. Gotovo je nemoguće testirati toliki broj ispitanika. Stoga se, kako bi se dobila informacija o tome kako su svi ispitanici proveli test, pribjegava formiranju tzv. standardizacijskog uzorka. Riječ je o posebno odabranoj skupini ispitanika koja adekvatno predstavlja populaciju za koju se test razvija. U standardizacijskom uzorku proporcionalno su zastupljene sve dobne, socijalne i druge skupine ispitanika koje čine populaciju. Rezultati ispitivanja na tako formiranom uzorku nazivaju se ispitnim normama. Odatle dolazi izraz "normativno orijentirano testiranje". Norme se prosuđuju prema tome kako bi test proveli svi ispitanici za koje se daje. namijenjeni. Ako standardizacijski uzorak adekvatno predstavlja populaciju, tada se usporedbom individualnog rezultata s normama može dobiti procjena razine obrazovnih postignuća predmeta u usporedbi s razinom obrazovnih postignuća ostalih učenika. Takva procjena više ne ovisi o skupini, u koje je testiranje provedeno .

Pedagoški testovi koji su posebno osmišljeni da pruže normativno tumačenje nazivaju se normativni testovi.

Regulatorno orijentirani testovi imaju svoje specifičnosti vezane uz svoju glavnu zadaću - razlikovati predmete. Kada razvijaju ovaj tip, pokušavaju postići visoke varijabilnost rezultata testa. Ako većina ispitanika ima samo niske, ili samo prosječne, ili samo visoke rezultate, teže ih je razlikovati. Ako je varijabilnost rezultata visoka (postoje niski, srednji i visoki rezultati), tada je lako razlikovati subjekte. Normativno orijentirani testovi koncipirani su tako da je raspodjela rezultata bliska normalnoj. Matematičke metode koje se koriste u dizajnu i evaluaciji normativnih testova dizajnirane su za model normalne distribucije i temelje se uglavnom na korelacijskoj analizi .

Normativni pristup iznimno je koristan kada su potrebne informacije o ispitaniku vezane uz njegovu relativnu sposobnost ili relativno učenje u usporedbi s drugim ispitanicima. Naravno, potencijalna vrijednost tumačenja normativnog pristupa ovisi i o prikladnosti normativne skupine za svrhu testiranja i o čistoći i brizi s kojom je normativna skupina sastavljena.

Za utvrđivanje matematičkih sposobnosti pristupnika vrlo je važno znati da je normativna skupina reprezentativna za cijelu skupinu pristupnika. Ponekad je za donošenje važnih odluka potrebno usredotočiti se na specifičniju normativnu skupinu. Na primjer, normativna skupina kandidata za inženjerstvo bit će prikladnija za tumačenje relativne sposobnosti kandidata za inženjerstvo na temelju rezultata normativnog testiranja nego jednostavno normativna skupina svih kandidata.

Napomenimo glavne nedostatke normativnog pristupa pedagoškom testiranju. Za većinu pedagoških testova potrebno je znati puno više o ispitaniku nego što to omogućuje normativni pristup. Na primjer, za nekog kandidata dobili smo 65 percentila ekvivalenta kao rezultat testiranja. To znači da je ovaj kandidat odgovorio na zadatke ovog testa ne lošije od 65% ispitanika iz cijele prilično velike normativne skupine. Ali ne znamo točno koje je koncepte ovaj kandidat savladao i koje probleme može riješiti. Je li ovaj test od ovog pristupnika tražio samo lako pamtljive algoritme za rješavanje ili se od njega tražilo kreativno rješenje, kreativan pristup rješavanju zadataka. Štoviše, ne znamo , koji je dio cjelokupnog programa čvrsto savladao ovaj predmet. Ovakva pitanja postaju važna kada namjeravana upotreba testa nadilazi utvrđivanje relativnih sposobnosti ispitanika. Utvrđivanje relativnih sposobnosti kandidata može biti važno za natjecateljske ispite, ali nakon provođenja procesa obuke neko vrijeme, nastavnici moraju znati koje je vrste koncepata svaki učenik savladao i koje vrste problema određeni učenik može riješiti, zapravo, koji je udio proučenog gradiva naučio.

Testovi temeljeni na kriterijima

Postoji, međutim, pristup koji se razlikuje od normativno orijentiranog, kada se obrađeni bodovi tumače u odnosu na pripremljenost samog ispitanika u određenom sadržajnom području, a ne u odnosu na komparativne sposobnosti s ostalim ispitanicima iz normativne skupine. U ovom slučaju kažu o pristupu usmjerenom na kriterije .

Takvi se testovi nazivaju kriterijima. Međutim, s posebnom tehnologijom sastavljanja i tumačenja, pedagoški test može korisnicima pružiti i normativne i kriterijske informacije.

U literaturi postoje mnoge definicije testa prema kriterijima. Autori različito koriste ovaj pojam, stoga je potrebno nedvosmisleno definirati kriterijski pristup. Svaki tip testa koji se temelji na kriterijima osmišljen je za tumačenje rezultata testa u odnosu na određeno područje sadržaja. To se tumačenje može izvesti na različite načine, ovisno o svrsi testa. Definicija testa trebala bi poslužiti kao osnova za utvrđivanje granica pojma. Kriterijski referentni test je onaj koji je namjerno osmišljen da proizvede pedagoška mjerenja i koji se može izravno interpretirati u smislu precizno definiranog standarda. Ta se pedagoška mjerenja provode odabirom reprezentativnog skupa ispitnih zadataka u relevantnom sadržajnom području. Testovi vezani uz kriterije posebno su dizajnirani za sumiranje pojedinačnih rezultata u odnosu na točno definiranu domenu ili područje sadržaja. . Štoviše, ispitni zadaci mogu uključivati i sadržajni test i test vještina i sposobnosti. Kaže se da je domena ili područje sadržaja dobro definirano ako je jasno koja kategorija ispitnih stavki potencijalno pripada određenom području sadržaja. Glavna upotreba testiranja temeljenog na kriterijima je određivanje statusa ispitanika u odnosu na određeni broj odabranih ispitnih stavki ili iz određenog područja sadržaja, na način koji korisniku testa omogućuje da donese sud o ispitanikovom obrazovna postignuća. Stoga je dobro definirano područje sadržaja nužan, ali ne i dovoljan uvjet za testiranje prema kriterijima.

Često možete pronaći prilično uske definicije koje podrazumijevaju samo jednu vrstu testova koji se odnose na kriterije. Šire definicije često pate od nepreciznih formulacija. U nastajanju dana je definicija koja možda najtočnije otkriva bit i specifičnosti ove vrste ispitivanja.

“Kriterijski pedagoški test je sustav zadataka koji omogućuje mjerenje razine obrazovnih postignuća u odnosu na cjelokupni obujam znanja, sposobnosti i vještina koje bi učenici trebali steći.”

Sadržajnim područjem testa nazvat ćemo cjelovitu količinu znanja, vještina i sposobnosti koje studenti moraju usvojiti kao rezultat određenog smjera učenja i čije se ovladavanje mjeri kriterijskim testom. Izvedba kriterijskog testa opisuje se u pravilu sadržajem nastavne discipline. Primjerice, na temelju rezultata testa može se prosuditi koliki je udio sadržaja učenik savladao, koje zadatke i na kojoj razini složenosti ispitanik može riješiti itd.

Dvije glavne vrste testova orijentiranih na kriterije

U literaturi o testologiji (ili pedagoškim mjerenjima) postoje dvije glavne vrste kriterijski orijentiranih testova, koji se međusobno razlikuju po nizu karakteristika. Na ruskom još nema utvrđenih naziva za ove vrste. U stranoj literaturi nazivlje još nije konačno utvrđeno. Testovi temeljeni na kriterijima namjerno su osmišljeni za procjenu razine postignuća učenika u odnosu na unaprijed određeno sadržajno područje. Od temeljnog interesa za njihov razvoj je stroga i precizna specifikacija područja ispitnog sadržaja. Ovo je neophodno kako bi se maksimalno povećala valjanost interpretacije pojedinačnih studentskih rezultata [Z, 4, 6]. Upravo je naglasak na području sadržaja (na engleskom - domena) potaknuo neke istraživače na ideju da takve testove nazovu domenski referenciranim, što se može prevesti kao "testovi usmjereni na područje sadržaja".

Stvaranje stavki za test usmjeren na područje sadržaja zahtijeva detaljnija i preciznija pravila. To zahtijeva preciznu i strogo definiranu specifikaciju područja ispitnog sadržaja. Ova vrsta kriterijski orijentiranih testova osmišljena je za procjenu udjela ukupne količine obrazovnog materijala koji je ispitanik savladao. U stranoj literaturi obično se naziva test referenciran na domenu. Ovu vrstu kriterijski orijentiranih testova nazvat ćemo terminom: testovi usmjereni na određeno sadržajno područje. Pretpostavlja se da kao rezultat obuke učenici moraju steći određenu količinu znanja, vještina i sposobnosti, što je sadržajno područje testa i konvencionalno se prihvaća kao 100 posto. Razina obrazovnog postignuća svakog ispitanika može se izraziti kao postotak ukupnog sadržaja testa. Za završnu kontrolu najprirodnije je koristiti ovu vrstu testa.

U praksi postoji još jedna vrsta kriterijski orijentiranih testova. Ovi testovi su tzv testovi majstorstva, tj. "testovi vještina" ili "testovi stručnosti" [Z, 4]. Koriste se za određivanje u skupini predmeta kvalificiranih i nekvalificiranih (magistra i nomastera) u nekom području. U ovom slučaju preporučuje se empirijski postupak analize ispitnih čestica kako bi se utvrdila “osjetljivost” ispitnih čestica na razliku između treniranih i netreniranih ispitanika.

Ova se vrsta koristi za klasifikaciju predmeta i njihovu podjelu u skupine na temelju unaprijed odabranog standarda ocjenjivanja (kriterijska ocjena). Najčešće se takvi testovi koriste za podjelu predmeta u dvije skupine: naučili i ne koji su ovladali potrebnom vještinom na temelju određenog sadržaja. Ponekad postoji podjela na više grupa. Na primjer, oni koji su vještinu u potpunosti svladali, i oni koji je trebaju učvrstiti, kao i grupa učenika koji trebaju početi učiti gradivo od samog početka. Da bi bio raspoređen u određenu skupinu, ispitanik mora postići traženi minimalni standard ocjenjivanja. Ovaj standard postavljaju tvorci testa i on je kriterij na temelju kojeg se donose odluke o ispitaniku. U testu se ovaj standard izražava određenim brojem točno riješenih zadataka. Važni elementi u razvoju takvih testova su: metode uspostavljanja standarda za procjenu kvalifikacija na temelju rezultata testa, procjena razine pogreške ovog standarda, određivanje redoslijeda donošenja odluke o kvalifikacijama ili nedovoljna pripremljenost studenta. .

Mnogi znanstvenici [Z, 4, 5] imajte na umu da je izraz "testiranje temeljeno na kriterijima" nesretan. Stvara se dojam da postoji neki kriterij prema kojem se rezultati testa uspoređuju. Jedna od pogrešnih predodžbi o testiranju prema kriterijima je nesporazum da taj izraz znači korištenje takozvanog kriterija ili "kriterijski (prolazni) rezultat". Testiranje temeljeno na kriterijima ne zahtijeva uvijek prolaznu ocjenu, iako za određene praktične primjene ova vrsta testiranja može zahtijevati takozvane standarde ocjenjivanja ili prolazne ocjene. Takav kriterij, odnosno standard procjene, zapravo se koristi, ali njegova prisutnost nije obavezna. Pogrešno tumačenje kriterija kao razine pripremljenosti jedna je od zabluda o kriterijskom testiranju. Pogrešno je shvaćanje da se izraz odnosi na korištenje takozvane "prolazne ocjene". Zapravo, testiranje prema kriterijima ne zahtijeva nužno prolaznu ocjenu, iako određene praktične primjene ove vrste testiranja mogu zahtijevati takozvane standarde ocjenjivanja. Poanta je da korisnik testa može koristiti ili postaviti prolaznu ocjenu za bilo koji test - kriterijski ili nekriterijski. Jednostavno postavljanje 80% točno riješenih zadataka kao "prolazna ocjena" za bilo koji test ne znači automatski da koristite dobro definirano područje sadržaja i izvješćujete o rezultatima testa u odnosu na to područje sadržaja. Sposobnost samog testa da pruži te informacije o predmetima, odnosno da da status predmeta u odnosu na određeno područje sadržaja je ono što test čini kriterijskim, a ne činjenica da koristio prolaznu ocjenu ili neki drugi kriterij ocjenjivanja.

Postoji još jedna zabluda, naime o vezi između kriterijski orijentiranog testa i kriterijske interpretacije pedagoškog mjerenja. Ponekad je test osmišljen na takav način da predviđa status ispitanika za drugi test ili za druge pedagoške mjere kao što su ispiti, testovi itd. Na primjer, neki testovi, kao što su dobro poznati SAT-I i SAT-II, osmišljeni su kako bi pomogli u predviđanju akademskog uspjeha kandidata za američka sveučilišta . Vrijednost varijable koja je određena za danu prognozu naziva se kriterijska vrijednost. Stoga su studentove konačne ocjene na sveučilištu kriterij za pristupni ispit. Određena pedagoška studija, kao što je SAT, provodi se kako bi se utvrdila korisnost, valjanost i suštinska kriterijska valjanost samog prijamnog testa kao prediktivnog testa statusa ispitanika u odnosu na kriterijsku varijablu. Upotreba izraza "temeljeno na kriterijima" u ovom se slučaju razlikuje od upotrebe istog izraza u vezi s testiranjem prema kriterijima.

Tablica 4.1

Karakteristike normativno orijentiranih i kriterijski orijentiranih testova

Regulatorno orijentirani testovi	Kriterijsko orijentirani testovi
1.Svrha testiranja: mogućnost međusobne usporedbe razine pripremljenosti ispitanika u sadržajnom području kojemu je test namijenjen. Primjer uporabe: natjecateljski odabir kandidata za osposobljavanje.	1.Svrha testiranja: mogućnost certificiranja predmeta u skladu s njegovim stupnjem ovladanosti određenim sadržajnim područjem. Primjer upotrebe: završna potvrda o razini osposobljenosti učenika, o razini stručne osposobljenosti osoblja.
2.Korištene vage: normativne (ili standardne) ljestvice. U odabranoj ljestvici potrebno je navesti srednju vrijednost i standardnu devijaciju.	2. Korišteno mjerilo- u osnovi, postotna ljestvica s jednim (ili više) odabranim rezultatom kriterija. Posebna pozornost posvećena je metodologiji optimalnog odabira kriterijske ocjene (ili bodova).
3. blizu normalnog, u većini slučajeva izgleda :	3. Raspodjela pojedinačnih bodova: proizvoljan, u većini slučajeva asimetričan i ima oblik:
4.- beznačajno. Autori testa odabiru najznačajnije elemente sadržaja.	4.Razina detalja područja sadržaja- detaljno. Autori testa razvijaju specifikaciju (plan) testa koja uključuje sve elemente sadržaja. Zatim se zadaci razvijaju prema ovoj specifikaciji.
5. Potrebna je normativna skupina predmeta. Obrađeni (ili skalirani) bodovi temeljeni na rezultatima normativnog testiranja temelje se na statističkim podacima iz normativne skupine, odnosno specifičnog, prilično velikog uzorka ispitanika. U većini slučajeva koriste se posebne normativne tablice, gdje svaki pojedinačni rezultat za određeni test ima korespondenciju jedan-na-jedan s ekvivalentom percentila određenim na normativnoj skupini.	5. Normativna skupina predmeta nije potrebna. Individualni rezultat ispitanika tumači se u odnosu na udio nastavnog gradiva koje je uspješno savladao. Učenički rezultat najčešće odražava postotak točno obavljenih zadataka i izražava se na postotnoj ljestvici.
6. Statistički pokazatelji ispitnih zadataka (uglavnom razina težine i sposobnost razlikovanja) imaju važnu ulogu u izboru zadataka. Odabiru se zadaci s prosječnom razinom težine (od 0,3 do 0,7) i visokom sposobnošću razlikovanja (većom od 0,3). Postoji niz drugih važnih statističkih pokazatelja kvalitete zadatka.	6.Statistička obrada i odabir ispitnih zadataka. Razina težine i diskriminirajuća sposobnost zadataka nisu značajni čimbenici za uključivanje u test, ili obrnuto, isključenje iz njega. Glavni uvjet za izbor zadataka je njihova usklađenost (podudarnost) sa specifikacijom i sadržajnim elementom. Statističke značajke ispitnih zadataka koriste se za sastavljanje paralelnih oblika (varijanti) testa i odabir optimalne kriterijske ocjene.
7.Test pouzdanosti. Ocjenjuje se pronalaženjem korelacije između rezultata dvaju testova ili dijeljenjem testa na dvije polovice u jednom testu.	7.Test pouzdanosti. Ocjenjuje se stupnjem dosljednosti u donošenju odluke o prolazu/padu tijekom dvostrukog testiranja.
8.Valjanost. Uz sadržajnu valjanost za natjecateljske selekcijske testove učenika, posebna se pozornost pridaje visokim razinama prediktivne valjanosti.	8.Valjanost. Posebna pažnja posvećena je valjanosti sadržaja. Kada se donose važne odluke na temelju rezultata testa, ispituje se kriterijska i konstruktna valjanost.

Avanesov V.S. Osnove znanstvene organizacije pedagoške kontrole u visokom obrazovanju. Tutorial. - M.: Istraživački centar, 1989. – 167 str.
Glass J., Stanley J. Statističke metode u pedagogiji i psihologiji. M.: Napredak. 1976. – 495 str.
Berk R.A. Mjerenje prema kriterijima: stanje tehnike. Baltimore, MD: Johns Hopkins University Press, 1980.
Mjerenje obrazovanja (ur. Linn R.) N.Y. Macmillan, 1989. – 610 str.
Služba za obrazovno testiranje. Standardi kvalitete i pravednosti. Princeton, NJ. 1987. godine.
Keeves J.P. (Ur.) Obrazovna istraživanja, metodologija i mjerenje: međunarodni priručnik. Oxford, Pergamon press, 1988.

Izvor unosa: Evsigneev A. E., Samara State Technical University, Fakultet za napredno usavršavanje nastavnika, dizajn informacijske tehnologije, Newsletter br. 1, Samara 2000.

Berry J.W. Ljudska ekologija i kognitivni stil. – N.Y., 1976.

Bruner J.S. Djela značenja. – L., 1990. (monografija).

Cronbach L.J., Drenth P.J.D.(Eds) Mentalni testovi i kulturna prilagodba. – N.Y., 1972. Priručnik ljudske inteligencije / Ed. Autor: R.J. Sternberg. – Cambridge, 1982.

Segall M.H., Campbell D.T. Utjecaj kulture na vizualnu percepciju. – Chicago, 1966.

Serpell R. Utjecaj kulture na ponašanje. – L., 1976.

Studije individualnih razlika / Ed.J. Jenkins, D. Patterson. – N.Y., 1961.

Super C.M., Harkness S. Razvojna niša: konceptualizacija na sučelju djeteta i kulture / Pierce R.A., Black M.A. (ur.). Životni razvoj: čitač o raznolikosti. – Kendall, 1993. – P. 61–77.

Vernon Ph.E. Inteligencija i kulturno okruženje. – L., 1969.

Wober M. Razlikovanje centrikulturalnih od međukulturalnih testova i istraživanja / Percept. I motoriku. – 1969. – V. 28. P. 201–233.

Poglavlje 21: Testiranje temeljeno na kriterijima

U posljednja 3-4 desetljeća pojavio se i proširio novi pokret u psihološkoj dijagnostici - Testiranje na temelju kriterija(KORT), koji je ponudio nov i potpuno adekvatan način ocjenjivanja materijala dobivenih tijekom ispitivanja. Testiranje temeljeno na kriterijima uključuje prilično duboko restrukturiranje cjelokupnog koncepta psihološke dijagnostike, novo razumijevanje cjelokupnog sustava proučavanja individualnih razlika. Trenutno možemo govoriti o dva koncepta CORT-a - Američki, o čijoj će se suštini dalje raspravljati, i Ruski, domaće, čije će glavne odredbe i praksa također biti objavljeni.

§1. Znanstvena osnova kriterijskog ispitivanja

Povijest razvoja i primjene kriterijskog testiranja u obrazovanju ukazuje na produbljivanje pojma “kriterij” i njegovu psihologizaciju. U razvoju ove vrste testiranja planiran je prijelaz s CORT-ova, usmjerenih na formalno-kvantitativne aspekte ovladavanja obujmom znanja i vještina, na metode usmjerene na referentne strukture obrazovne aktivnosti, na objektivne pokazatelje razine mentalne razvijenosti. razvoj, koji koreliraju s ključnim zahtjevima školskog obrazovnog programa.

Prvi koji je istaknuo samostalnu bit netradicionalnog oblika testiranja i odvojio ga od testiranja usmjerenog na statističku normu bio je R. Glaser. Također je nešto ranije uveo pojam “mjerenje orijentirano na kriterije”.

Posebnost CORT-a je procjena izvedbe testa u smislu njegove usklađenosti s kriterijem.

SUD mjeri ono što pojedinac zna ili može učiniti u usporedbi s onim što mora znati ili biti sposoban učiniti kako bi uspješno riješio problem. Aspekti izvršavanja obrazovnih zadataka, izraženi znanjima, sposobnostima, vještinama i umnim radnjama, kriterij su na koji se ispit usmjerava.

Kriterijski pristup dijagnostici ne samo da pruža mogućnost pravovremenog praćenja napredovanja svakog učenika u pojedinom obrazovnom gradivu, već otvara i put poboljšanju sadržajnih i strukturnih komponenti aktivnosti učenja učenika.

Razmotrimo opisano G. Wells dvije varijante treninga strijeljanja, od kojih je svaka povezana s tradicionalnim pristupom testiranju orijentiranim na statističke norme ili kriterijima. U jednom slučaju (pristupom statističke norme) strijelcu se daje kratko objašnjenje i naglašava da se njegovi rezultati neće uspoređivati s njegovim, već s rezultatima drugih strijelaca. Nakon izvršenog zadatka prijavljuje se rezultat, kao i mjesto koje je učenik zauzeo. U drugom slučaju (mogućnost korištenja pristupa koji uključuje fokusiranje na određeno područje sadržaja predmeta - "domena" u značenju "kriterija"), strijelac dobiva detaljne upute, dobiveni rezultati se uspoređuju s njegovim vlastitim prethodno dobivenih rezultata, strijelcu se ukazuje na mogući način otklanjanja pogrešaka i traži se nastavak treninga u svrhu njegova usavršavanja. G. Wells napominje da nije teško zamisliti nešto slično kada se uči matematika, književnost, glazba i drugi akademski predmeti.

Danas većina testologa shvaća da postoje značajne razlike između pristupa orijentiranih na kriterije i pristupa orijentiranih na norme. Svrhe za koje se testovi pripremaju, specifičnost informacija koje daju pri ocjenjivanju rezultata rješavanja obrazovnih zadataka, metode konstrukcije i obrade – sve to služi kao temelj za razliku između ove dvije vrste testova. KORT se od samog početka osmišljava s osvrtom na konkretan odgojno-obrazovni zadatak, unaprijed se planiraju odnosi smislene korespondencije između njega i zadatka. (relevantnost). U odnosu na CORT, obrazovna zadaća nije „vanjski kriterij“ s kojim će se naknadno korelirati pokazatelji testa, već stvarnost, ciljevi, sadržaj, metode ispunjavanja koje test otkriva.

Recimo, učenici V. razreda dobiju zadatak izraditi projekt o drveću i napisati izvješće koje sadrži crteže lokalnog drveća i njegovog lišća, informacije o drveću u smislu doprinosa ekologiji i kvaliteti života te preporuke kako pomoći u zaštiti drveća. Za takav zadatak, pisac testa definira kriterije za proces izvršenja i konačni proizvod. Sukladno tome, projekt stabla bit će ocijenjen prema sljedećim kriterijima:

· izvješće je pažljivo napravljeno;

· nacrtane su i označene najmanje tri različite vrste drveća;

· opisana je svaka vrsta stabla;

· opisuje se vrijednost stabala;

· opisani su načini zaštite stabala.

Sličan referentni model izvedbe zadatka može se koristiti za evaluaciju izvješća svakog učenika. Kako bi se bodovanje temeljeno na kriterijima pouzdano koristilo, mora se dati pet odgovora modela, po jedan za svaki rezultat od postojećih pet.

Najvažniji uvjet pri izradi CORT-a bit će razvoj zadatka koji na odgovarajući način odražava dovršetak zadatka učenja. Jesu li teški ili laki, doprinose li normalnoj raspodjeli rezultata ili ne – to ne određuje kvalitetu zadatka u takvom testu. Ako se potvrdi da se većina onih koji su prošli određeni stupanj obuke može nositi s ispitnim zadatkom, a većina onih koji nisu bili obučeni, to može poslužiti kao nužna osnova za uključivanje ovog zadatka. zadatak u CORT-u. Potrebno, ali ne i dovoljno. Istraživač također mora osigurati da su ispitanici koji su uspješno obavili zadatke stvarno primijenili vještine svojstvene kriterijima, a ne samo pokazali svoju sposobnost pamćenja traženih izraza ili mehaničke reprodukcije potrebnih algoritama radnji. Stoga bi se analiza zadataka u takvom testu trebala usredotočiti na pažljivo ispitivanje sastava izvedbe zadataka, a ne samo na njegova statistička svojstva. Suprotstavljanje CORT-a testu usmjerenom prema statističkoj normi ne isključuje mogućnost da se u praksi primjene prvog može koristiti postupak standardizacije. Standardi za njegovu provedbu u korelaciji su s obrazovnim standardima - skupom predmetnih znanja i vještina koje je potrebno usvojiti na određenom stupnju izobrazbe.

§2. Koncepti kriterija u CORT-u

Postao je široko rasprostranjen početkom 70-ih godina XX. stoljeća. u SAD-u i drugim zemljama praksa razvoja CORT-a temeljila se na konceptu kriterija kao referentni skup predmetnih znanja i vještina. U okviru ovog koncepta kriteriji kao npr razina izvršenja I razina vještine.

Tumačenje kriterija kao razina izvršenja bio cjelovito povezan s onim idejama psihologije obrazovanja prema kojima se obrazovni proces shvaća kao sekvencijalni razvoj svakog elementa obrazovnog ponašanja. Potonji se bilježe kao "repertoar" vidljivih vanjskih radnji koje su podložne nedvosmislenom mjerenju i odgovarajućoj kontroli. Istodobno, ciljevi odgojno-obrazovnog procesa podliježu obveznom "prevođenju" u vrste akcija koje su otvorene za promatranje i kontrolu. Tome se pridaje posebna važnost pri izradi ispitnih zadataka. Osobito se preporuča obrazovne ciljeve formulirati na način koji bi izravno ukazivao na radnje potrebne za njihovo postizanje. Nije slučajno da su kreatori kriterijskih testova u SAD-u (V. J. Popham, R. Svezy, N. Gronlund i dr.) naglašavali potrebu operacionalizacije cilja učenja. R. Svezi napominje da odgojno-obrazovni cilj mora jasno i nedvosmisleno označavati radnje koje omogućuju njegovo postizanje. Samo u tom slučaju postizanje ovog cilja podliježe mjerenju u KORT-u. Ovim pristupom smatra se da pojmovi “razumjeti”, “ocijeniti”, “pokazati svijest”, “uzeti u obzir”, “provesti” itd. iako su povezani sa specifičnim odgojno-obrazovnim ciljevima, oni ne ukazuju izravno na prirodu radnji koje je potrebno izvršiti da bi se oni postigli. S ove točke gledišta, pojmovi "pisati", "označiti", "izračunati", "podcrtati" su relevantniji za određeni cilj, a također jasno definiraju prirodu potrebnih radnji.

Postizanje cilja učenja obično se bilježi postotak točne razine dovršavanje KORT zadataka. Empirijski je utvrđeno da bi razina uspješnosti ispita koja odgovara potrebnom ovladavanju trebala biti reda veličine 80–100%. Kao što je praksa pokazala, popravljanje ove razine odražava stabilne pozitivne rezultate u svladavanju gradiva; većina učenika zadržava interes za predmet. Smanjenje razine kriterija na 75% rezultira pogoršanjem obrazovnih rezultata.

SUDI, dizajnirani na temelju razine izvedbe, naširoko se koriste u programiranoj nastavi. Valja napomenuti da su se prvi takvi testovi pojavili u vezi s uvođenjem nastavnih strojeva u obrazovni proces i korištenjem individualnih obrazovnih programa, a neadekvatnost statističke norme u utvrđivanju potrebne razine uspješnosti ovdje se posebno jasno pokazala. Do izražaja je došla potreba da se utvrdi što je od zadanog obujma programa učenik savladao i koliko je napredovao u svladavanju nastavnog gradiva u odnosu na ono što je prije znao. Ukoliko rezultati testa nisu zadovoljili kriterij - postotak točnog rezultata, studentu se preporučuje da se vrati na one dijelove nastavnog gradiva koji su zahtijevali dodatnu razradu.

Istraživači i nastavnici, koristeći se individualnim programima u obrazovnom procesu i koristeći kriterije za njihovu ovladanost, nisu mogli ne obratiti pozornost na činjenicu da neki učenici ne dostižu zadanu razinu jer nemaju potreban skup vještina. Predloženo je da se vještine i njihove sastavne operacije, bez dostatne razrade u obrazovnom procesu, ili ne formiraju ili se fiksiraju i integriraju u "neispravne" sustave. U teoriji i praksi CORT-a javlja se razumijevanje kriterija kao nivo vještine, oni. referentni skup svih operativnih komponenti koje čine određenu vještinu. S takvom karakteristikom nastavnik ili istraživač može usporediti ono što učenik radi s onim što bi trebao biti sposoban učiniti.

Posebnost kriterijskih testova kojima se utvrđuje razina usvojenosti je u tome što ne otkrivaju samo obim usvojenog gradiva, već ukazuju i na sposobnost učenika da aktivno koristi stečeno znanje u svladavanju novog, složenijeg gradiva. Kao što je spomenuto, testovi temeljeni na uspješnosti mogu utvrditi (i to je istina u njihovoj biti) da je učenik dovoljno spreman za prelazak na sljedeću fazu učenja. Pritom ostaje nejasno jesu li znanja i vještine učenika organizirane u standardne strukture prilagođene rješavanju specifičnih problema, kao i na kojoj se razini asimilacije nalaze. Razina svladanosti utjelovljuje kriterijske zahtjeve koji su prvenstveno određeni standardima i obrascima svladanosti utvrđenima u teoriji i metodici nastave. Potonji su zabilježeni u školskim obrazovnim programima kao sastav obrazovnih vještina.

Recimo, nastavna praksa zahtijevala je test kojim bi se pratilo koliko je kod učenika razvijeno razumijevanje pročitanog teksta. Ova se vještina može promatrati u smislu njezinih strukturnih komponenti. Evo njihovog okvirnog popisa: postavljanje pitanja uz pročitani tekst, preoblikovanje težih ulomaka, isticanje glavnih misli, izrada plana za pročitani tekst. Neće biti dovoljno navesti samo ove komponente. Svaki od njih mora biti specificiran prvenstveno u smislu njegovih vanjskih manifestacija, tj. provedbu svojih operacija. Na primjer, komponenta kao što je isticanje glavne ideje može se operativno predstaviti na sljedeći način:

1) podcrtajte rečenicu koja izražava glavnu ideju odlomka;

2) odabrati naslov odlomku;

3) navesti činjenice koje potvrđuju glavnu ideju, itd.

U takvom CORT-u, svaku od odabranih komponenti treba ispitati posebnim podtestom. Subtest će sadržavati zadatke koji prikazuju sve operativne oblike odgovarajuće komponente. Na temelju ovako pripremljenih rezultata CORT-a moći će se izvući konkretni zaključci o tome koje su sastavnice (i u kojim operativnim oblicima) učenika s razumijevanjem pročitanog teksta savladali ili nisu. To će nam omogućiti da procijenimo uzroke poteškoća i poduzmemo odgovarajuće korektivne mjere.

Rezultati testa koji koristi kriterij kao što je razina vještina mogu se pouzdano utvrditi pod uvjetom da je tzv. popis za dovršetak zadatka. Označava značajke ili karakteristike procesa izvršenja ili konačnog rezultata koji se mogu promatrati kako bi se potvrdila kvaliteta rješenja testnog zadatka.

Na primjer, ogledni test vježbe, Prepolovljavanje kuta, definira sljedeće korake:

· koristi se kompas;

· kraj šestara postavlja se na vrh kuta, između stranica povlači se luk;

· vrh šestara se postavlja na svako sjecište luka i stranice kuta, crtaju se jednaki lukovi;

· crta se povlači od vrha kuta do točke sjecišta lukova;

· prilikom provjere kutomjerom vidi se da su dva dobivena kuta međusobno jednaka.

Drugim riječima, popis za provjeru dovršetka je popis unaprijed određenih radnji koje određuju uspjeh danog zadatka. Promatrajući učenike kako izvršavaju takve zadatke, istraživač bilježi sve radnje koje izvode u skladu s popisom za provjeru i koristi ih kao osnovu za određivanje mjere usklađenosti sa standardom procesa zadatka.

Poznato je da uvijek postoji tijesna veza između razvoja dijagnostičkih testova i pedagoške teorije i prakse nastave kojoj su ti testovi namijenjeni. Sve one značajke koncepta kriterija u CORT-u koje su gore navedene temelje se na biheviorističkom modelu učenja. Odvajanje obrazovnih znanja i vještina od mentalnog razvoja koje postulira ovaj model odrazilo se na testiranje temeljeno na kriterijima. U pedagoškoj praksi, CORT postignuća koriste se za kontrolu i evaluaciju usvajanja gradiva školskog kurikuluma (vidi Poglavlje 8), dok se identifikacija mentalnih radnji provodi pomoću testova inteligencije i sposobnosti izgrađenih na tradicionalnoj osnovi.

Razvoj CORT-a, koji se bavi psihološkim uvjetima za izvršavanje obrazovnih zadataka, moguć je samo u kontekstu teorije koja učenje i razvoj smatra neraskidivo povezanima. U domaćoj psihološko-pedagoškoj literaturi više puta je napomenuto da se ovladavanjem strukturno-operacijskim sastavom odgojno-obrazovnog zadatka ne iscrpljuje analiza uspješnosti zadatka. Ovladavanje nastavnim gradivom pretpostavlja odgovarajući stupanj mentalnog razvoja, posebice formiranje misaonih radnji primjerenih gradivu. CORTS, u kojima izvedene mentalne radnje služe kao dijagnostički pokazatelji, utjelovljuju takav koncept kriterija kao što je logička i psihološka pripremljenost učenika za izvršavanje zadataka. Namjera takvih kriterija je utvrditi zadovoljava li mentalni razvoj učenika zahtjeve koje nameće gradivo u obrazovnim programima. S ovim pristupom, rezultati testa, u usporedbi s kriterijem, pružit će informacije o tome uključuje li učenikovo mišljenje mentalne radnje potrebne za svladavanje novih dijelova programa i može li ih pouzdano koristiti pri izvođenju novih vrsta zadataka.

Ovaj koncept kriterija implementiran je u razvoju i primjeni dva tipa CORT-a.

1. Neki koriste sljedeći kriterij: socio-psihološki standard – skup pojmova i logičkih vještina koje određuju mentalni inventar suvremenog školskog djeteta neophodan u određenoj obrazovnoj fazi. Definicija socio-psihološkog standarda sama po sebi sugerira da ovaj kriterij karakterizira logičku i psihološku pripremljenost subjekata za obavljanje zadataka u širokim predmetnim područjima, kao što su matematika, prirodne znanosti te društveno-humanističke discipline. Na njegovoj osnovi već je razvijen niz gestova mentalnog razvoja (SHTUR, ASTUR, TURP itd.), ao principima konstrukcije i praksi njihove primjene govorilo se u prethodnim poglavljima.

2. SUDOVI druge vrste služe kao alati za dijagnosticiranje logičke i psihološke spremnosti subjekata za obavljanje predmetno specifičnih zadataka iz pojedinih akademskih disciplina. Sukladno tome, razvijaju se matematički, lingvistički i biološki CORT-ovi, u kojima je kriterij predmetno-logički standard za ažuriranje mentalnih radnji. Ono što je predmet analize u ovakvim CORT-ovima je logička i psihološka spremnost da se izvrši ne bilo koji proizvoljno odabrani obrazovni zadatak, već onaj koji ispunjava sljedeće uvjete:

· gradivo prikazano u nastavnom zadatku mora karakterizirati interno završeno područje nastavnog sadržaja u određenom nastavnom predmetu;

Ovaj zadatak mora biti ključ ali u odnosu na druge zadatke u ovom dijelu predmetnog područja; pri izvođenju se u učenikovo razmišljanje uključuju novi pojmovi i pojmovi na temelju kojih se uspostavljaju logičke veze s prošlim i pojmovnim znanjima koja se usvajaju;

· obrazovni zadatak mora biti prikladan za što potpunije psihološko dekodiranje, tj. može se predstaviti u obliku sustavnog i sekvencijalnog popisa mentalnih radnji;

· mentalne radnje koje posreduju u realizaciji odgojno-obrazovnih zadataka moraju biti u formativnom stadiju, u tom su stadiju otvorene za logičko-psihološku analizu i naknadnu korekciju.

Trenutno su utvrđene teorijske pretpostavke za psihološku analizu odgojno-obrazovnog zadatka za CORT koji implementira ovu vrstu kriterija. Za razliku od testova usmjerenih na razinu izvedbe ili razinu majstorstva, CORT-ovi o kojima je riječ su testovi psihološkog sadržaja.

§3. Razvoj CORT-a s psihološkim sadržajem

Psihološki sadržaj CORT metoda određen je sljedećim:

· njihova posebna usmjerenost – usmjerenost testa na praćenje mentalnog razvoja i procjenu njegove razine. Metode CORT ispituju mentalne radnje koje utječu na izvođenje obrazovnih zadataka učenika. O kakvim se radnjama radi u pravilu nema naznaka u metodičkoj literaturi, a ako ih ima, daje im se najopćenitiji karakter – to su upućivanja na potrebu analize, sinteze, usporedbe, generalizacije bez definiranja smislenih pokazatelja. njihove implementacije na gradivu s specifičnostima predmeta. Ove radnje moraju se identificirati kako kroz logičku i psihološku analizu zadatka, tako i tijekom posebno organiziranog promatranja učenika kada izvršavaju zadatke koji im omogućuju da ocrtaju koje radnje treba izvršiti;

· korištenje metodičkih tehnika uz pomoć kojih se odabire sadržaj testnih zadataka, kao i analiza metoda orijentacije u gradivu predmeta, od kojih je svaka određena „subjektivnom logikom“ ovladavanja učenika potrebnim mentalnim akcije.

Sve se to uzima u obzir tijekom izrade specifikacije ispitivanja. Opisujući kriterij na koji je pojedini test usmjeren, specifikacija ujedno definira i granice sadržaja kojem test pripada.

Kako bismo pokazali kako se provodi specifikacija, osvrnimo se na postojeće iskustvo u razvoju CORT metoda. Test, o kojem će biti više riječi, razvijen je na temelju matematike (VI. razred srednje škole) i usmjeren je na prepoznavanje mentalnih radnji koje posreduju sposobnost sastavljanja jednadžbi prema terminima tekstualnih zadataka. Sposobnost pisanja jednadžbe ključna je za brojna matematička znanja i vještine. U V–VI razredu ova vještina se tek formira, a tu se polaže i njen psihološki sadržaj, tj. mentalne radnje koje određuju funkcioniranje vještine. U daljnjim fazama uloga ove vještine raste.

Kada pripremate specifikaciju testa, prvo morate otkriti kriterijsku vrijednost sadržaja koji se proučava. Za ovaj test je sljedeće: specifičnosti proučavanja matematike usko su povezane s aktualizacijom mentalnih radnji koje posreduju u formiranju tehnika razmišljanja učenika. Ove tehnike služe kao uvjet za istraživanje i rješavanje tekstualnih problema. U ovom slučaju, specifikacija napominje da je ono što je bitno u rješavanju tekstualnih problema konstrukcija niza modela problema, čija je konačna karika matematički model (jednadžba). Modeliranje odnosa među veličinama konstitutivna je karakteristika matematičkog mišljenja, a znakovni modeli i njihove transformacije djeluju kao smislena osnova mentalnih radnji. Orijentacija prema znakovnom modelu, koji je rezultat mentalne preobrazbe tekstualnog matematičkog problema, tako djeluje kao kriterij za formiranje mentalnih radnji. To je ono što je uključeno u ovaj test. Sastavljanje jednadžbe prema uvjetima tekstualnih zadataka pretpostavlja da učenik ovlada sljedećim mentalnim radnjama:

· obavlja analiza situacija zadatka, tj. utvrđuje uvjet koji je bitan za sastavljanje jednadžbe prema tekstu zadatka (osnova za jednadžbu);

· instalira identitet između ikoničkih modela različitih stupnjeva generalizacije i opisnog teksta;

· dijeli zadatke na nastava na bitnoj osnovi – vrsta odnosa među količinama;

· vidi sličnost u problemima, na temelju slične prirode modeliranja ovisnosti između veličina.

Identificirani skup mentalnih radnji čini osnovu za konstruiranje CORT metodologije. Zrelost svake radnje provjerava se posebnim podtestom. Predmetni test ima četiri takva podtesta (prema broju naznačenih radnji). Dobivaju sljedeće nazive: “Identifikacija bitnog”, “Četvrti nepar”, “Pronađi sličan”, “Uspostavljanje identiteta”.

Autor testa mora biti siguran da će test uključivati materijal koji je reprezentativan za sadržaj učenja koji se ispituje. U tu svrhu izvršena je katalogizacija tekstualnih matematičkih problema. Sadržao je informacije o plohama, značajkama zadataka, njihovom predmetnom sadržaju (tj. koje su količine predstavljene u problemu, međusobno povezane količine ili različite vrijednosti iste količine), vrste znakovnog modela odnosa između veličina uključenih u uvjeti zadatka. Zatim je određen okvirni udio svakog zadatka, tj. mjesto koje se daje problemu ove vrste u školskom udžbeniku matematike. Dakle, sve glavne vrste problema predstavljene u kurikulumu bile su uključene u podtestne zadatke. Prilikom izrade CORT metodologije, tekstovi odabranih zadataka su podvrgnuti nekim izmjenama vezanim uz uključivanje u uvjete poticajni materijal. Primjerice, za zadatke CORT metode poticajni materijal bili su takvi elementi sadržaja i strukture zadatka koji su mogli potaknuti učenike da koriste svoje postojeće metode orijentacije u gradivu - subjektivne “logike”. U uvjete zadatka uneseni su isti brojčani podaci, sličan vokabular i sl. Svi ti nevažni podaci, izvan stvarnog matematičkog sadržaja problema, obavljali su funkciju "šuma" namijenjenog "maskiranju" signala, tj. odnosi između veličina fiksirani znakovnim modelom određenog tipa.

Uvođenjem poticajnog materijala u zadatke moguće je utvrditi u kojoj mjeri stupanj formiranosti mentalne radnje odgovara utvrđenom kriteriju. Ako učenik još nije savladao predmetnu logiku aktualizacije mentalnog djelovanja, neće moći prevladati neadekvatne metode orijentacije u obrazovnom gradivu. Sve će to zorno demonstrirati CORT tehnika.

Predstavljamo ogledne zadatke sva četiri subtesta razmatranog CORT-a s naznakom značajnih pokazatelja njihove provedbe.

Subtest “Identifikacija bitnog”. Sadrži zadatke sljedećeg tipa: utvrditi koji je od odabranih (A, B, C, D) uvjeta bitan za određivanje prirode jednadžbe koju treba sastaviti za zadani zadatak.

Tvornica je morala ispuniti narudžbu za proizvodnju automobila za 15 dana (A), ali već 2 dana prije roka (B) tvornica ne samo da je ispunila plan, već je proizvela još 6 automobila (B) iznad plana, jer dnevno proizvedeno 2 automobila iznad plana (D). Koliko je automobila tvornica trebala proizvesti prema planu?

Ispravno rješavanje zadatka pretpostavlja da se student vodi uvjetom koji označava odnos između količina (uvjet B): „Proizvedena količina proizvodnje iznad plana je 6 automobila veća od planirane količine.“ Ovaj uvjet je “ključan” u prepoznavanju prirode jednadžbe, dok uvjeti A, B, D, iako sadrže matematičke informacije, određuju samo oblik pojedinačnih algebarskih izraza, ali ne i jednadžbu u cjelini.

Podtest "Četvrti nepar". Sadrži zadatke sljedećeg tipa: daju se četiri zadatka, tri jedne vrste, jedan druge, tj. suvišno, odnosi se na probleme drugačije vrste. Potrebno je utvrditi koji je od zadataka (A, B, C, D) suvišan.

A. Ekipa traktorista planirala je dnevno preorati 60 hektara. Međutim, dnevno je plan oranja bio premašen za 25%, pa je oranje završeno dan prije roka. Potrebno je utvrditi koliko je dana oranica bila orana.

B. Poljoprivrednik je planirao zasijati 25 hektara dnevno. No, uspio je povećati dnevnu sjetvu za 5 hektara, pa je posao završio tri dana prije roka. Kolika je površina njive koju je poljoprivrednik zasijao?

B. Električni vlak prijeđe udaljenost između dviju stanica za 1,2 sata. Zbog popravaka pruge vlak je smanjio brzinu za 20% i ovu udaljenost prešao za 1,5 sat. Nađi početnu brzinu vlaka.

D. Dvije veze prikupile su 8840 centnera kukuruza sa svojih parcela, pri čemu je prva veza dobila u prosjeku 150 centnera žitarica po hektaru, a druga po 108 centnera. Presjek druge karike bio je 35% veći od presjeka prve karike. Odredite područje prve veze,

Prilikom rješavanja zadatka bitno je da učenik uspoređuje i kombinira zadatke na temelju uobičajenog tipa odnosa između veličina (dodatni u nizu zadataka je zadatak D). Zajedničkost sižea (poljoprivredni radovi - zadaci A, B, D), sličnost pojedinih detalja (odnos između vrijednosti količina dat je u postotnom obliku - zadaci A, B, D) nije dovoljna osnova za zaključak da zadaci pripadaju istoj istoj vrsti.

Podtest "Pronađi nešto slično." Uključuje zadatke sljedeće vrste. Pronađite zadatak sličan ovome: nađite tri uzastopna neparna broja čiji je zbroj 81.

A. Uzica je bila izrezana na tri dijela, pri čemu je prvi dio bio dvostruko veći od drugog i trećeg dijela zasebno. Kolika je duljina svakog od ta tri dijela ako se zna da je drugi dio kraći od prvog za 81 cm?

B. Zbroj dva broja je 81. Ako se jedan od njih udvostruči, tada će zbroj dobivenih brojeva biti jednak 136. Kolika je vrijednost svakog od ta dva broja?

B. Zbroj kutova trokuta je 180 stupnjeva. Kutovi su proporcionalni brojevima 3,4 i 5. Odredite kutove trokuta.

D. Nađi dva broja čiji je zbroj 132 ako je 1/5 jednog broja jednaka 1/6 drugog.

Bitna pri aktualizaciji radnje pronalaženja analogije je usmjerenost na sličnost znakovnih modela problema koji se razmatra (zadatak B). Pronalaženje analogije na temelju sličnosti brojčanih podataka (A), pojedinih leksičkih jedinica uvjeta situacije zadatka (B), slične sintaktičke organizacije (D) ukazuje na to da učenik ne ovladava mentalnom radnjom predstavljenom u subtestu.

Subtest “Utvrđivanje identiteta”. Sadrži zadatke sljedećeg tipa: koji od sastavljenih zadataka odgovara jednadžbi oblika 6x–x=25?

A. Vitya je smislio dva broja. Njihov količnik je 6, a razlika je 25. Koje je brojeve Vitya imao na umu?

B. Mama je ispekla 25 pita s malinama i jabukama. Bilo je 6 puta više pita s malinama. Koliko je bilo pita od jabuka?

B. U jednoj sobi je 6 puta više ljudi nego u drugoj. Nakon što je 25 ljudi prešlo iz prve sobe u drugu, u obje sobe bio je jednak broj ljudi. Koliko je ljudi bilo u svakoj sobi na početku?

D. Nakon što je u prvom tjednu potrošena 1/6 ukupnog raspoloživog ugljena, u skladištu je ostalo 25 tona ugljena. Koliko je ugljena bilo u skladištu?

Predavanje 8. Pedagoški testovi, njihove vrste i svrha.

1. Normativno orijentirani i kriterijski pristupi u pedagoškim dimenzijama.

2. Zadaci provjere znanja i vrste provjere znanja.

3. Klasifikacija vrsta pedagoških testova.

4. Pojmovni aparat: predispitni zadatak, ispitni zadatak, pedagoški test.

1. Normativno orijentirani i kriterijski pristupi u pedagoškim dimenzijama

Opći pristupi tumačenju rezultata pedagoških mjerenja. U pedagoškom mjerenju, tumačenje rezultata učenika može varirati ovisno o načinu na koji se uspoređuju rezultati učenika. Jedan pristup uspoređuje rezultat svakog učenika s rezultatima određene grupe—uzorak učenika koji su polagali isti test—kako bi se odredilo mjesto svakog rezultata u odnosu na prosjek grupe (pristup temeljen na normi). Prema drugom pristupu, rezultati ispitanika tumače se u odnosu na područje sadržaja koje je uključeno u test i opremljeni su određenim kriterijima uspješnosti (pristup usmjeren na kriterije).

Oba pristupa daju informacije o pripremljenosti učenika, ali su različite prirode. U skladu s tim pristupima tumačenju rezultata ispitivanja razlikuju se normativno orijentirani i kriterijski orijentirani testovi.

Regulatorno orijentirani pristup i norme. Standardizacija testova . Glavni cilj normativnog testiranja je razlikovati ispitanike na temelju rezultata testiranja. Kod interpretacije rezultata relativni položaj ispitanika može se drugačije procijeniti jer će on izgledati bolje u usporedbi sa slabijom nego s jačom skupinom. Za ispravno tumačenje rezultata testa potrebno je usporediti rezultat svakog učenika standardi za izvođenje testa.

Norme su skup pokazatelja koji odražavaju rezultate testiranja jasno definiranog uzorka ispitanika – relevantne normativne skupine koja je reprezentativna za opću populaciju testiranih učenika. Norme obično uključuju prosječnu vrijednost testnih rezultata i pokazatelj disperzije (varijabilnosti) oko prosječne vrijednosti svih ostalih rezultata dobivenih na reprezentativnom uzorku testiranih učenika (metode izračuna prosječne vrijednosti i pokazatelja varijabilnosti dane su u 9. poglavlju). Imajući standarde, možete utvrditi poziciju svakog rezultata u odnosu na prosječnu ocjenu na testu, vidjeti koliko je učenikov rezultat iznad ili ispod prosjeka.

Proces definiranja standarda naziva se standardizacija testa. Standardizacija se uvijek provodi na reprezentativnom uzorku ispitanika, čije je formiranje obavezan korak u određivanju ispitnih normi.

Relativnost normi i standardizacija uzoraka . Testni standardi prikladni za tumačenje rezultata svih učenika na bilo kojem testu; ne postoji. Opseg primjenjivosti bilo koje norme ograničen je na određeni test i određenu populaciju ispitanika, stoga norme nisu apsolutne i nisu konstantne. Oni odražavaju rezultate standardizacijskog uzorka u vrijeme izrade testa i podložni su sustavnom ažuriranju i ponovnoj provjeri.

Na standarde se primjenjuju sljedeći zahtjevi:

Standardi se moraju razlikovati. Primjerice, testove za općeobrazovne i specijalizirane škole potrebno je standardizirati na različitim uzorcima, što će najvjerojatnije rezultirati bitno različitim normama;

Standardi moraju odražavati stvarnu populaciju i trenutne zahtjeve za kvalitetom obrazovnih postignuća koji proizlaze iz postojećeg stanja u obrazovanju;

Norme moraju biti reprezentativne, pa se uvijek utvrđuju empirijski u skladu s rezultatima ispitivanja uzorka standardizacije (savezni - za jedinstveni državni ispit, općinski - za certificiranje škola, unutar škole - za certificiranje učenika u školi) .

“Norma” je relativan koncept i usko je povezan s kvalitetom uzorka koji se koristi za standardizaciju. Uzorak mora točno odražavati kategoriju (ili kategorije) pojedinaca kojima je test namijenjen i mora biti dovoljno velik i uravnotežen da osigura da standardna pogreška bude tako mala da može biti zanemariva u procesu standardizacije testa. Dakle, pri formiranju standardizacijskog uzorka moraju se uzeti u obzir dvije varijable - volumen i reprezentativnost, što zajedno osigurava visoku točnost pri procjeni standarda izvedbe testa.

Stratifikacija uzorkovanja. Kako bi se osigurala ravnomjerna zastupljenost različitih skupina učenika u ispitnoj populaciji, koristi se poseban proces - stratifikacija. Stratifikacija je stratifikacija uzorka u stratume čije veličine trebaju biti proporcionalne veličinama odgovarajućih populacija u općoj populaciji učenika. Tipično, osnova za stratifikaciju su čimbenici koji su najviše povezani s mjernom varijablom. U Jedinstvenom državnom ispitu takvi čimbenici uključuju društveni status roditelja maturanta, regiju u kojoj se škola nalazi, je li seoska ili gradska škola itd.

Prisutnost mnogih faktora stratifikacije, potreba za analizom udjela opće populacije ispitanika i provođenje pilot testiranja za određivanje standarda čine posao standardizacije testova prilično skupim i dugotrajnim postupkom. Trenutačni stupanj razvoja ispitnih tehnologija omogućuje simulaciju testova uz korištenje predvidljivih standarda IRT , banka kalibriranih ispitnih predmeta i posebnih programa za računalno generiranje ispitnih opcija.

Informacije koje prate standardizirane testove . Standardizirani test mora uključivati:

Standardi izvedbe ispitivanja, koji se određuju na uzorku za standardizaciju;

Veličina standardizacijskog uzorka, osnova za njegovu stratifikaciju i vremensko razdoblje korištenja;

Neobrađeni rezultati ispitivanja za standardizacijski uzorak.

Usporedba normi za različita ispitivanja moguća je samo ako postoje razlozi za tvrdnju o primjerenosti standardizacijskih uzoraka.

Kriterijski pristup u pedagoškim dimenzijama . U pristupu pedagoškom mjerenju temeljenom na kriterijima, rezultati učenika tumače se u odnosu na područje sadržaja ili zahtjeve postavljene za akademska postignuća. Na dihotomna procjena(“1” ili “0”) rezultata rješavanja pojedinačnih zadataka, ocjena svakog učenika izračunava se preračunavanjem postotka točno riješenih zadataka u odnosu na ukupan broj ispitnih zadataka. Kada politomne procjene Omjer studentovog sirovog rezultata prikupljenog na zadacima i maksimalnog mogućeg rezultata na testu pretvara se u postotak. Postotak dobiven za svakog učenika uspoređuje se sa standardima izvedbe - kriterijima koje su utvrdili stručnjaci i empirijski potvrdili tijekom procesa izrade testa.

S pristupom usmjerenim na kriterije, na temelju rezultata testiranja možete:

- identificirati svladana i nesvladana znanja, vještine i sposobnosti te izgraditi individualnu obrazovnu putanju za svakog učenika;

Rangirati ispitanike prema postotku završetka i konstruirati ljestvice ocjenjivanja;

Podijelite predmete u dvije skupine s jednim kriterijskim bodom ili u više skupina s nekoliko kriterijskih bodova, dajući npr. školske ocjene - "dva", "tri", "četiri", "pet".

Nedostaci kriterijski orijentiranog pristupa. Pristup koji se temelji na kriterijima ima nedostatke povezane s potrebom da se u potpunosti pokrije sadržaj, uzet kao 100%, u jednom testu. Kriterijski certifikacijski testovi često se pokažu vrlo dugim - od 150 do 300 zadataka, koje je jednostavno nemoguće riješiti čak iu srednjoj školi uz jednokratnu prezentaciju. Stoga se tijekom certificiranja često koristi adaptivno testiranje koje omogućuje, optimiziranjem težine zadataka, značajno smanjenje duljine testa. Također koriste smanjenje sadržaja testa minimiziranjem ciljeva ocjenjivanja. U tu svrhu često se koriste kriterijski orijentirani testovi za provjeru jedne ili dvije sposobnosti ili vještine, a kada se obrađuju heterogeniji sadržaji biraju se normativni testovi.

Testovi temeljeni na kriterijima također imaju prilično ograničen opseg primjene. Pogodni su u slučajevima kada je moguće jasno definirati znanja, vještine i sposobnosti u određenom sadržajnom području te postaviti njihovu gornju i donju granicu kako bi se ispravno odredili kriteriji za izvođenje testova. U složenijim i manje strukturiranim područjima znanja povezanim s rješavanjem kreativnih problema često je nemoguće odrediti gornju granicu.

Nekad se učenik pri izvođenju takvih zadataka vodi znanjem, ali češće odlučuju domišljatost i pogađanje. Stoga pri izradi testova osmišljenih za praćenje izvedbe zadataka kreativne razine treba dati prednost normativno orijentiranom pristupu ili pokušati kombinirati oba pristupa u jednom testu.

Razlike u pristupu orijentiranom na norme i na kriterije. Normativno orijentirani i kriterijski orijentirani testovi razlikuju se po namjeni izrade, metodologiji odabira sadržaja, prirodi distribucije empirijskih rezultata, testiranju, metodama njihove obrade, kriterijima kvalitete testova i ispitnih zadataka, i što je najvažnije, u tumačenje rezultata ispitanika koji su završili test.

U kriterijskim testovima koji se koriste za certificiranje, zadaci su prilično jednostavni, budući da učitelji uvijek pokušavaju planirati postotak “dvojki” i ograničiti broj necertificiranih učenika. Na primjer, ako “dvojke” ne bi smjele prelaziti 10 %, a kriterij za izdvajanje neuspješnih učenika planira se postaviti na 70 % (svatko tko je riješio manje od 70 % ispitnih zadataka dobiva “dvojku”), onda je test mora sadržavati najmanje 70% lakih zadataka koje će 90% testiranih učenika moći riješiti (slika 9). Normativno orijentirani testovi obično su mnogo teži. Uključuju od 50 do 70% zadataka srednje težine, tj. one koje je samo polovica testiranih učenika uspjela točno ispuniti (slika 10).

Riža. 9. Podjela zadataka po težini u normativnom testu

Riža. 10. Podjela zadataka prema težini u kriterijskom testu

S obzirom na to da distribucije sirovih rezultata reprezentativnog uzorka ispitanika na normativnim i kriterijskim testovima u pravilu imaju različite oblike (slika 11), potrebno je koristiti različite metode za procjenu pouzdanosti i valjanosti. rezultata pedagoških mjerenja, tehnika skaliranja i usklađivanja.

Riža. 11. Tipična distribucija testnih rezultata za reprezentativni uzorak

uzorci učenika

Najznačajnije razlike između normativnih i kriterijski orijentiranih testova prikazane su u tablici. 1.

stol 1

Razlike između normiranih i kriterijskih testova

Karakteristike	Regulatorno orijentirani testovi	Testovi temeljeni na kriterijima
Tipičan prosječan broj učenika koji točno ispunjavaju gotovo sve ispitne zadatke
Prostor za usporedbu rezultata učenika	Rezultati drugih učenika
Opseg ciljeva revizije	Široki, pokriva mnoge ciljeve i vrste aktivnosti učenja	Usko, obično pokriva nekoliko ciljeva kontrole
Reprezentativnost obuhvata sadržaja predmeta	Umjereno, fragmentirano – obično nisu uključeni svi odjeljci	Velika, obično uključiti sve što se može operacionalizirati i uzeti kao 100%
Disperzija rezultata učenika (varijabilnost rezultata)	Visoka, budući da je glavna svrha testiranja razlikovati ispitanike prema stupanj obuke	Nizak, unutar rezultata grupe studenata koji su premašili prema svojim rezultatima kriterijska ocjena, gotovo bez varijabilnosti
Odabir zadataka po težini	Distribucija ocjena težine je blizu normalne. Glavni Neki zadaci imaju težinu od 40-60%	Distribucija je iskrivljena. Glavni dio zadataka ima težinu od 80-90%

Za učitelja je najinformativnija situacija kada se oba pristupa nadopunjuju. Stoga neki testovi su osmišljeni s očekivanjem da se uspjeh učenika može povezati i s normama i sa sadržajem testa. Primjer su kontrolni i mjerni materijali (CMM) Jedinstvenog državnog ispita.

2. Zadaci provjere znanja i vrste provjere znanja

Opća klasifikacija zadataka koji se rješavaju testovima . U skladu s vrstama kontrole tijekom ispitivanja razlikujemo:

Ciljevi na ulazu u trening (ulazna kontrola);

Tekući poslovi (tekuća kontrola);

Zadaci koji odgovaraju kraju određenog razdoblja obrazovnog procesa (završna kontrola).

Ispitivanje u ulaznoj inspekciji . Početak obuke odgovara ulaznom testu, koji nam omogućuje da utvrdimo stupanj ovladanosti osnovnim znanjima, vještinama i sposobnostima potrebnim za početak obuke, te da utvrdimo razinu savladanosti novog gradiva prije nego što se ono počne proučavati u učionici. . Posljednja se situacija ne čini tipičnom za školu, no dovoljno je prisjetiti se klasičnog primjera kada djeca koja dobro čitaju uđu u prvi razred i počnu se dosađivati na nastavi.

Ulazni inspekcijski testovi, obično se zovu prettestovi(preliminarni testovi) dijele se na dvije vrste.. Predtestovi prve vrste omogućuju nam da identificiramo spremnost za učenje novih znanja u učionici. Izrađuju se u okviru kriterijskog pristupa i sadrže zadatke za provjeru temeljnih znanja, vještina i sposobnosti potrebnih za svladavanje novog gradiva. Uglavnom, ovi predtestovi namijenjeni su najslabijim učenicima, koji su na granici između jasno pripremljenih i očito nepripremljenih za početak učenja novog gradiva. Na temelju rezultata predtestiranja ispitanici se dijele u dvije skupine, od kojih su jedna oni koji mogu ići dalje, a druga oni kojima je potreban dodatni rad i savjet nastavnika.

Predtestovi druge vrste razvijaju se u okviru normativno orijentiranog pristupa. Oni pokrivaju planirane rezultate nadolazeće obuke i u potpunosti su izgrađeni na novom materijalu. Na temelju rezultata predtestiranja nastavnik donosi odluku koja mu omogućuje uvođenje elemenata individualizacije u masovni obrazovni proces. Ako je učenik pokazao neka prethodna znanja o novom gradivu, tada se njegov nastavni plan mora restrukturirati i započeti s više razine kako bi nastavni materijal za njega imao stvarni karakter novine. Ponekad ulogu ulaznog predtesta ima završni test, koji je namijenjen budućoj procjeni rezultata svladavanja novog gradiva nakon završetka njegovog učenja.

Na sl. Slika 12 prikazuje moguće funkcije ulaznog testiranja u obrazovnom procesu.

Riža. 12. Pojednostavljeni model funkcija ulaznog testiranja u obrazovnom

procesa, u korelaciji sa zadacima nastavnika.

Ispitivanje u tekućoj kontroli . Korektivni i dijagnostički testovi razvijeni su za kontinuirano praćenje. Popravni testovi u pravilu su orijentirani na kriterije: ako postotak pogrešaka učenika premašuje kriterijski rezultat, tada njegovo znanje treba ispraviti. Uz pomoć popravnih testova možete pronaći slabosti u pripremi učenika i identificirati područja individualne pomoći u svladavanju novog gradiva.

Popravne kolokvije ne treba brkati sa sredstvima kontinuiranog praćenja znanja učenika, ali su donekle bliski, barem u smislu svrhe primjene. Međutim, između prvog i drugog sredstva postoje značajne tehnološke i sadržajne razlike. Tradicionalna sredstva tekuće kontrole manje su učinkovita i uglavnom su usmjerena na provjeru i sustavnu provjeru znanja učenika na malim jedinicama nastavnog materijala. Popravni testovi namijenjeni su utvrđivanju nedostataka u znanju u skupini nastavnih jedinica koje uključuju sadržaje nekoliko tema ili čak dijelova. Obično sadrže zadatke složene prema rastućoj težini kako bi se uočili prvi problemi u svladavanju nastavnog gradiva.

Ako su učenikove poteškoće u izvršavanju zadataka sustavne, tada učitelj može pribjeći pomoći dijagnostički testovi. Glavni cilj dijagnostike - utvrditi uzroke praznina u znanju učenika - postiže se posebnim odabirom sadržaja zadataka u testovima. U pravilu sadrže sadržajno neznatno različite zadatke, oblikovane prema obliku izlaganja kako bi se pratile pojedine faze rješavanja svakog zadatka popravnog kolokvija. Detaljno detaljiziranje omogućuje nam da identificiramo uzroke stalnih pogrešaka učenika, preciziramo prirodu poteškoća koje se javljaju i dobijemo zaključke o nezrelosti pojedinih obrazovnih vještina.

Na primjer, zadatak višestrukog izbora s popravnog testa iz matematike za osnovnu školu može izgledati ovako:

2+6:3 – 8:4=

A.2

B. 3

B.1

Maksimalan broj dijagnostičkih poslovatest je određen brojem radnji pri izvođenju popravnog ispitnog zadatka. Na primjer, za predmetni brojčani izraz možete ponuditi četiri zadatka ako nastavnik ne želi provjeravati učenikovo poznavanje postupka:

1) 6:3= A. 3 B. 2 C. 4

2) 8:4= A. 2 B. 4 C. 1

3) 2+6:3= A. 5 B. 6 C. 4

4) 2+6:3-8:4 = A. 3 B. 2 C. 0

Odabir zadataka za dijagnostički test provodi se individualizirano, ovisno o tim zadacima koju je svaki učenik netočno izveo na popravnom ispitu. Posebno su učinkoviti procesi korekcije i dijagnostike s računalnim generiranjem i prezentacijom testova u kombinaciji s modulima obuke za svaku jedinicu nenaučenog obrazovnog materijala. U ovom slučaju, ispravak se provodi odmah, jer nakon identificiranja sljedeće praznine i utvrđivanja njenog uzroka, računalo samo odabire modul obuke i odmah ga izdaje učeniku.

Pojednostavljeni model trenutnih funkcija testiranja prikazan je na slici. 13.

Riža. 1Z. Model ispitivanja funkcija u strujnom upravljanju

Završno testiranje. Glavni cilj završnog testiranja je osigurati objektivnu procjenu ishoda učenja koja je usmjerena na karakteristike svladavanja sadržaja predmeta (kriterijski testovi) ili na diferencijaciju učenika (normativno usmjereni testovi). Na sl. Slika 14. prikazuje model konačnih funkcija testiranja.

Riža. 14. Model finalnog testiranja funkcija

Završni testovi obično podliježu standardizaciji, jer se najčešće koriste za donošenje administrativno upravljačkih odluka u obrazovanju.Ako je provođenje ulaznog i tekućeg testiranja funkcija nastavnika, onda završno testiranje često provode vanjske strukture i ima prirodu neovisne provjere. Primjer neovisnog završnog testiranja u Rusiji je Jedinstveni državni ispit, testiranje za školsku certifikaciju itd. Unutar škole, završni testovi mogu se koristiti kod premještaja učenika iz razreda u razred, kod odabira učenika koji zaostaju u razvoju radi upućivanja na popravnu nastavu i sl.

3. Klasifikacija vrsta pedagoških testova

Osnovni pristupi klasifikaciji testova. U domaćoj i stranoj literaturi postoje različiti pristupi klasifikaciji pedagoških testova koji se razlikuju po karakteristikama na kojima se temelji razgraničenje tipova. Sukladno pristupu interpretaciji podataka postoje normativno orijentiran I testovi vezani uz kriterije.

Prema dimenziji konstrukta pedagoški testovi se dijele na homogena(koji mjere samo jednu varijablu i stoga su sadržajno homogeni) i heterogeni (koji mjere više od jedne varijable - slučaj višedimenzionalnog konstrukta) testovi. Heterogeni testovi su multidisciplinarni i interdisciplinarni. Multidisciplinarni testovi sastoje se od homogenih subtestova u pojedinim disciplinama. Rezultati učenika na podtestovima kombiniraju se kako bi se izračunali konačni rezultati za cijeli multidisciplinarni test. Za rješavanje zadataka interdisciplinarnih testova potrebno je korištenje generaliziranih, interdisciplinarnih, integrativnih znanja i vještina. Interdisciplinarni testovi uvijek su višedimenzionalni, njihov razvoj zahtijeva korištenje faktorskih metoda analize podataka, matematičkih i statističkih metoda višedimenzionalnog skaliranja itd.

Na temelju prirode varijabli koje se mjere, one se razlikuju testovi za provjeru znanja, obrazovnih, praktičnih vještina i Također testovi kompetencija. Ponekad se svrstavaju u posebnu skupinu testovi brzine, zahtijevaju strogo vremensko ograničenje za rješavanje svakog zadatka i uvijek sadrže prevelik broj zadataka koji ne dopuštaju ispunjavanje cijelog testa. Ovisno o obliku prezentacije postoje prazan I računalo, usmeno I pismeni testovi.

Najopćenitija klasifikacija testova u obrazovnom procesu omogućuje nam da ih podijelimo u dvije nejednake skupine: standardizirani testovi, imati standarde sukladnosti, i nestandardizirani testovi kojih ima mnogo više jer ih svaki učitelj priprema za korištenje u svakodnevnom obrazovnom procesu. Nestandardizirani testovi često se nazivaju učiteljski testovi ili autorski testovi.

Podjela prema vrstama kontrole, njihovim funkcijama i prirodi zadataka koji se rješavaju. Ako kao znak razgraničenja odaberemo vrste kontrole i prirodu zadataka koje učitelj rješava pomoću testova, dobit ćemo klasifikaciju vrsta pedagoških testova prikazanu na sl. 15.

Riža. 15. Klasifikacija pedagoških testova

Analiza klasifikacijske tablice omogućuje nam da identificiramo četiri vrste pedagoških testova kao temeljne, među kojima su konačni normativni testovi od najveće važnosti u smislu područja njihove uporabe.

Sve veći utjecaj testiranja na donošenje upravljačkih odluka na temelju podataka praćenja i analize kvalitete obrazovanja u mnogim zemljama doveo je do XXI stoljeće . do pojave nove vrste testova za administrativne i menadžerske svrhe (u engleskoj literaturi - High - Stakes testovi ). Podaci administrativnog i menadžerskog testiranja važan su izvor informacija za analizu posljedica obrazovnih reformi i inovacija u obrazovanju, provođenje komparativnih studija kvalitete pripremljenosti diplomanata iz različitih regija Rusije, certificiranje obrazovnih institucija i procjenu učinkovitosti njihovih aktivnosti.

4. Temeljne definicije pojmovnog aparata

Konceptualni aparat za izradu i korištenje testova. Učiteljima praktičarima nije uvijek jasna potreba za stvaranjem jasnog konceptualnog okvira za izradu testova. To se djelomično objašnjava očiglednom jednostavnošću samih koncepata, budući da se često bilo koji skup zadataka u testnom obliku povezuje s testom u učiteljevom umu. Takvi pseudotestovi često se objavljuju u posebnim zbirkama. Mogu se koristiti u rutinskom nadzoru, ali ne iu radu certifikacijskih centara.

Neusklađenost pseudotestova sa znanstveno utemeljenim kriterijima kvalitete može dovesti do značajne pogrešne komponente u procjeni pripremljenosti učenika, što će rezultirati pogrešnim zaključcima o učinkovitosti pojedinih nastavnika ili nastavnih timova. Stoga je konceptualni aparat neophodan jer služi u svrhu odvajanja testova od onoga što se često smatra njima.

Predtestni zadatak . Definicija stavke predispitivanja je osnovna i sadrži specifične zahtjeve kako bi se razlikovala od tradicionalne ispitne stavke. Predispitni zadatak je jedinica ispitnog gradiva čiji sadržaj, logična struktura i oblik prikaza zadovoljavaju niz zahtjeva i osiguravaju jednoznačnu procjenu rezultata izvedbe zahvaljujući standardiziranim pravilima testiranja.

U predispitnim zadatcima provjeravaju se najbitniji popratni elementi sadržaja discipline. U svakom predtestnom zadatku utvrđuje se ono što se jasno smatra točnim odgovorom s planiranim stupnjem potpunosti.

Zahtjevi za oblik predispitnih zadataka , mogu se podijeliti na posebne, koje odražavaju specifičnosti oblika, i opće, nepromjenjive u odnosu na odabrani oblik. Prema općim zahtjevima zadatak mora imati određeni redni broj, standardne upute za izvođenje, odgovarajući oblik, standard točnog odgovora, standardizirana pravila za ocjenjivanje rezultata njegove provedbe i itd. . (Vidi predavanje 10). Posebni zahtjevi za formu su dosta brojni, dijelom su prikazani u predavanju 10, posvećenom obrascima predispitnih zadataka.

Prednosti predispitnih zadataka u odnosu na tradicionalne kontrolne zadaće osigurane su izrazitom standardizacijom u prikazivanju i vrednovanju njihovih rezultata, što općenito povećava objektivnost studentskih rezultata na ispitima.

Test . Predispitni zadaci moraju proći obveznu empirijsku provjeru, prema rezultatima koje se neki od njih pretvaraju u ispitne zadatke, a preostali dio uklanjaju iz izvornog skupa ispitnih zadataka. Predispitni zadatak postaje ispitni zadatak ako kvantitativne ocjene njegovih karakteristika zadovoljavaju određene kriterije usmjerene na empirijski provjeravanje kvalitete sadržaja, forme i sustavotvornih svojstava predispitnih zadataka.

Obično su potrebna najmanje dva ili tri testa na temelju čijih se rezultata korigira sadržaj, oblik, težina zadatka, njegova valjanost i statistička svojstva koja karakteriziraju kvalitetu njegova rada uz ostale ispitne zadatke. Proučavanje sustavotvornih karakteristika ispitnog zadatka provodi se na temelju analize deskriptivne statistike, kao i metoda korelacijske, faktorske i latentne strukturne analize. Tumačenje rezultata analize uvijek je složen analitički rad, čiji rezultati ovise o mnogim uvjetima, uključujući vrstu testa koji se izrađuje. Statističke karakteristike ispitnih zadataka i zahtjevi za njihovu kvalitetu obrađeni su u predavanju 12 .

Uglavnom su završni testovi koji se koriste za donošenje upravljačkih odluka u obrazovanju koji zahtijevaju dugotrajno testiranje i ispravljanje. Primjerice, kod izrade nastavničkih testova za kontinuirano praćenje nisu potrebne korelacijske i faktorske analize, ali bit će vrlo korisna i deskriptivna statistika koja omogućuje lak izbor valjanih zadataka prihvatljive težine.

Pedagoški test. Za razliku od prve dvije definicije, koje su nepromjenjive s obzirom na svrhu testiranja i zadatke koji se rješavaju, definicija pedagoškog testa trebala bi biti usmjerena na određenu vrstu testa. Konkretno, završni normativno usmjereni test je sustav ispitnih zadataka, poredanih unutar određene strategije prezentacije i takvih karakteristika da osiguravaju visoku diferencijaciju, točnost i valjanost procjena kvalitete obrazovnih postignuća.

Iz ove definicije proizlaze dva važna zaključka. Prvo: kvalitetnih testova uopće nema i ne može biti, budući da procjena diferencirajućeg učinka testa, točnosti mjerenja (pouzdanosti) i njihove primjerenosti postavljenim ciljevima (validnosti) ne ovisi samo o karakteristikama testnim zadacima, ali i na karakteristikama studentske populacije koja se ispituje. Drugo: za procjenu kvalitete testa potrebni su podaci empirijskog testiranja dobiveni na reprezentativnom uzorku učenika. Radom na ispravljanju testova učvršćuje se sustav ispitnih zadataka - unutarnja povezanost i cjelovitost, postupno se povećava integrativnost sustava, a prelazi se sa skupa predispitnih zadataka na stručno izrađen test.

Završni kriterijski test je sustav ispitnih zadataka, poredanih unutar određene strategije prezentacije, koji imaju takva svojstva da daju valjanu smislenu interpretaciju obrazovnih postignuća u odnosu na utvrđene, statistički potkrijepljene kriterije uspješnosti. Definicija ne specificira osnovno područje sadržaja koje se koristi u interpretaciji, što dopušta da se koristi za različite vrste kriterijski orijentiranih testova.

U našoj zemlji i inozemstvu počeo se oblikovati novi pogled na testove u vezi s humanističkim kriterijima procjene čovjeka i smisla njegova postojanja. U tom pogledu posebno mjesto pripada akmeologiji kao znanosti o potpunom skladnom formiranju psihe odrasle osobe [Derkach A.A., 2002, 2004; Derkach A.A., Zazykin V.G., 2003].

Suvremena humanistička sociopsihologija pokazuje da je kriterij cjelovite životne aktivnosti kvaliteta razvoja. To znači da organizacija života osobe treba pomoći probuditi interes za razumijevanje svijeta oko sebe i intenzivirati vlastitu aktivnost i inicijativu. Tome pridonosi uključivanje pojedinca u društvo, koje se provodi, posebice, radom. Psiholozi, sociolozi i učitelji u svom praktičnom radu bave se cjelokupnom psihičkom stvarnošću čovjeka u onoj mjeri u kojoj mogu pridonijeti optimalnosti njegova psihičkog razvoja.

Psihološke službe u razvijenim zemljama (primjerice u Francuskoj) mogu mijenjati državne standarde ako onemogućuju progresivni razvoj pojedinca. Ciljevi psihološke službe su spriječiti neuspjeh koji osobu stresira, poticati socijalno učenje i socijalnu prilagodbu pojedinca, pomoći u teškim razvojnim situacijama da se uključi u opći tok društvenog napretka (što je upravo suprotno od cilja iznesene u prethodnim fazama usluge, usmjerene na odvajanje takvih ljudi), za promicanje općeg obrazovanja i profesionalnog rasta, poboljšanje kvalifikacija stručnjaka u području psiholoških usluga.

Inovativne tehnologije koje se temelje na ekološkoj (holističkoj, očuvanju, zaštitnoj) psihologiji individualnosti trebale bi, u smislu provođenja psihodijagnostike, prije svega uzeti u obzir značajke "zone" proksimalnog razvoja. Ovakvo usmjerenje metoda omogućuje psihologu konstruktivnu procjenu onih novih formacija ličnosti koje još nisu zabilježene u trenutku ispitivanja, ali se mogu formirati u interakciji osobe s društvom.

Domaće metode za procjenu i psihokorekciju mentalnog razvoja djece različite dobi široko su uvedene u praksu. Primjerice, školski test mentalnog razvoja (SHTUR) i skup korektivnih metoda, kako svjedoče iskustva školske psihološke službe, omogućuju formiranje nedovoljno razvijenih viših mentalnih funkcija prema društvenom standardu. Dostignuća u ovom području znanosti nagrađena su Državnom nagradom za osiguranje rada obrazovnih psiholoških službi.

Ovdje posebno ističemo humanističku usmjerenost ruske škole psihodijagnostike, psihokorekcije i rehabilitacije. Za razliku od tradicionalnih testova koji situacijski uvjetovanu dijagnozu pokušavaju prikazati kao dugoročnu prognozu budućeg uspjeha osobe, kod nas i u inozemstvu razvijaju se tzv. kriterijski orijentirani testovi (CORT). Temelje se na društvenim standardima za mentalni razvoj ljudi različite dobi, identificirajući odgovarajuće mentalne funkcije, procese i svojstva, koji zajedno mogu pružiti osobi ugodnu napetost u procesu svladavanja znanja, vještina i sposobnosti potrebnih za intenzivno mentalno razvoj. Pravovremena psihodijagnostika potonjeg omogućuje prepoznavanje "slabosti" presjeka karakteristika koje se razmatraju i, uz pomoć korektivnih tehnika, razvijanje razine potrebnih parametara do društveno fiksnih normativnih vrijednosti.

U tom smislu indikativne su strategije izrade školskog testa mentalnog razvoja (STID), koji je temeljan u radu školskog psihologa. Prva faza izrade ovog testa sastojala se od detaljne ankete i ispitivanja kompetentnih, autoritativnih nastavnika, psihologa i administratora obrazovnog sustava o njihovom mišljenju o tome što je potrebno da bi školarac učio u modernoj školi s ugodnim intenzitetom i visokim učinkom. Ti su materijali analizirani (prevedeni na jezik psihologije) ističući specifične psihičke funkcije, procese, individualna svojstva, znanja i vještine potrebne za svaku dob školovanja.

Zatim su za svaku analitički identificiranu komponentu (posebno za predškolce, učenike 1-3, 4-6, 7-9 razreda) konstruirani posebni kriterijski orijentirani testovi (u dva oblika - A i B), koji su pomno provjereni na pouzdanost, valjanost, korelacija testa i testa i druge potrebne kvalitete potpune metodologije ispitivanja. Pritom je važno naglasiti da su ove kriterije psiholozi a priori prepoznali kao privremene, uvjetovane današnjim zahtjevima društva za razvojem sposobnosti učenika. (Primjerice, sposobnost čitanja nekada je bila priznata kao posebna sposobnost koju su nasljedno posjedovali samo plemići – ljudi “plave” krvi. Danas se to mišljenje više ne priznaje u društvu).

Rehabilitacijska vrijednost takve strategije je očita. Psihološke tehnologije uvedene u društvenu praksu uklanjaju potrebu da se kobno unaprijed odrede putanje mentalnog razvoja osobe, što je prije pridonijelo stvaranju jedinstvenih psiholoških rezervi u društvu.

Aktualnost reforme obrazovanja koja je u tijeku (uključujući pitanja cjeloživotnog obrazovanja osoba različite dobi) određena je njezinim promijenjenim strateškim ciljevima. Usmjerenost „vremena stagnacije“ na formiranje specifičnih znanja, sposobnosti, vještina i osobina ličnosti potrebnih društvu u suvremenom svijetu postaje nedostatna zbog nepredvidivosti individualnih razvojnih putanja pod utjecajem složenih čimbenika u društvu.

Čovjek u razvoju danas je prisiljen djelovati u situacijama neizvjesnosti o predviđanju budućnosti koje su karakteristične za društvo. Psihološka specifičnost ovih situacija pridonosi fiksiranju stresnih stanja, čija ozbiljnost nepovoljno utječe na psihosomatsko zdravlje osobe i tempo mentalnog razvoja. Stoga planiranje sadržajne strane znanja koje pojedinac treba imati postaje danas vrlo težak problem. Optimizacija mentalnog razvoja ovdje je uvelike određena formalno-dinamičkom stranom životne aktivnosti (tempom, volumenom itd.), koja odražava individualizirane sklonosti sposobnosti osobe.

Praktična psihologija ističe važnost znanstveno utemeljenog kriterijskog testiranja, posebice u potpori psihičkog razvoja pojedinca u smislu rada pedagoške psihološke službe. Međutim, analitičke strategije tradicionalnih CORT-ova, koje su prikladne za rješavanje određenog spektra problema u školskom obrazovanju, ne mogu se izravno primijeniti na rad sa zrelom osobnošću, koja je često iracionalna, nepredvidiva i promjenjivo promjenjiva.

Rješavanje problema suočavanja s teškim i stresnim situacijama aktualnim za suvremeni svijet, otklanjanje fiksnih strahova, pitanja profesionalne selekcije i profesionalne selekcije, prepoznavanje bitnih odrednica formiranja inteligencije, očuvanje i povećanje zdravlja nacije zahtijevaju sustavna cjelovita analiza integracije procesa, stanja i svojstava pojedinca, osobnosti i subjekta djelatnosti u strukturu ličnosti. Odgovarajući problemi najpotpunije su razrađeni uzimajući u obzir poznavanje akmeoloških zakona formiranja cjelovite individualnosti kao prediktora jedinstvene strukture ljudske psihe.

Od posebnog značaja za modifikaciju tehnologija psihotestiranja bila je obnova obrazovnog sustava u Rusiji, usmjerena na demokratizaciju i humanizaciju obrazovnog procesa. Istodobno, dramatično su se promijenili ciljevi obrazovanja i osposobljavanja, koji nisu ukupnost znanja, vještina i sposobnosti, već slobodan razvoj pojedinca. Znanje, sposobnosti, vještine zadržavaju svoj značaj kao sredstvo za postizanje ciljeva predmeta. U tim uvjetima akmeološke tehnologije za formiranje individualne inicijative, neovisnosti i kreativnosti dolaze do izražaja, što će omogućiti učinkovito djelovanje u uvjetima neizvjesnosti predviđanja budućnosti (to je obilježje modernog društva, što dovodi do stres i psihosomatske bolesti te smanjeni mentalni razvoj).

Ove osobine ličnosti mogu pomoći u prevladavanju proturječja između tehničke i humanitarne kulture i osigurati uključivanje osobe u razvoju u nove društveno-ekonomske uvjete društva. Provedba ovih zadataka pretpostavlja formiranje akmeološke kulture osobnog samoodređenja, razumijevanje intrinzične vrijednosti ljudskog života, njegove individualnosti i jedinstvenosti.

Temeljito nova faza u razvoju psihodijagnostike otvara se u vezi s intenzivnim razvojem akmeologije, koja je prvi put u središte istraživanja postavila osobu koja se promjenjivo mijenja, gradi obitelj, odnose s ljudima, profesionalnu karijeru na životni put s visokom “letvom” planiranih postignuća. Ranije je psihologija proučavala ljudsku psihu u "posebnim uvjetima", na primjer, s patopsihološkim ili neuropsihološkim defektima, deformacijama ličnosti, u djetinjstvu, "rizičnim skupinama". Ustaljeni obrasci se teško mogu prenijeti na zrelu osobnost. Želio bih napomenuti da je visoki standard rezultata izvedbe planiran u slici cilja holistički formirajući čimbenik koji povezuje parametre života u "tvrde" poveznice, koje služe kao nepromjenjiva poveznica u širokom sadržajnom spektru svrhovitog djelovanja i utjecati na emocionalni i energetski "obris" života.

Interpretacija psihodijagnostičkih materijala

Interpretacija rezultata, u pravilu, povezana je sa završnom fazom psihodijagnostike, u kojoj se generaliziraju i objašnjavaju svi prethodno dobiveni eksperimentalni i klinički podaci; zapravo, to je kontinuirani proces koji utječe na sve faze studije. Proširujući koncept "tranzitivne dijagnoze", I. Shvantsara i suradnici (1978) primjećuju da tumačenje uključuje objašnjenje pojedinačnih dijagnostički značajnih činjenica tijekom studije. To psihologu pruža mogućnost fleksibilnog snalaženja u psihodijagnostičkom problemu i promjene programa istraživanja. Autori razlikuju ad hoc interpretaciju, koja se odnosi na stvaranje hipoteza na temelju parcijalnih rezultata i dovodi do promjene programa daljnjeg istraživanja, i post hoc interpretaciju, tijekom koje psiholog utvrđuje značenje pojedinačnih činjenica dobivenih u ukupnoj psihodijagnostici. slika slučaja.

Prilikom tumačenja podataka psihodijagnostičke studije, psiholog se oslanja na ideje o višestrukoj determiniranosti mentalnih fenomena i dvosmislenosti svakog psihodijagnostičkog rezultata. Točnost i primjerenost tumačenja stoga ovise o sposobnosti psihologa da uzme u obzir vjerojatne veze između dijagnostičkih podataka, njihovu situacijsku uvjetovanost i njihovo moguće osobno značenje.

Drugi važan aspekt koji se mora uzeti u obzir pri interpretaciji podataka i odražavati u psihodijagnostičkom zaključku je jesu li identificirane psihičke karakteristike (smetnje) situacijske, prolazne prirode ili se odnose na stalne karakteristike ličnosti, ponašanja i inteligencije ispitanika.

Psihološka dijagnostika temelj je profesionalne djelatnosti praktičnog psihologa, bez obzira kojom se vrstom posla bavi - psihološkim savjetovanjem, korekcijom ili edukacijom.

Psihodijagnostički materijali: članci, knjige, konferencijski sažeci, najave obrazovnih programa za ovladavanje dijagnostičkim alatima, video zapisi nastave s djecom i novosti iz područja psihodijagnostičke znanosti i prakse.

Iskorak u psihodijagnostici dogodio se zahvaljujući korištenju računalnog testiranja, koje omogućuje proučavanje proceduralnih aspekata aktivnosti modelirane testom, pomaže u prepoznavanju individualnih strategija u rješavanju zadataka, analizira poteškoće koje osoba ima prilikom obavljanja predloženi zadaci. Računalni testovi uključuju prikupljanje ispitnih informacija u načinu dijaloga između ispitanika i računala. Međutim, testovi koji uključuju računalnu obradu informacija prikupljenih na obrascima nisu računalni testovi. Kod računalnog testiranja postoji više mogućnosti za održavanje pouzdanosti testa, tj. osiguravanje zaštite svojih rezultata od svjesnih krivotvorina (laži, neiskrenosti subjekta) ili nenamjernih motivacijskih iskrivljenja. Povećava se i pouzdanost testiranja - stabilnost rezultata ispitivanja, stabilnost testa u odnosu na različite izvore smetnji (šum, faktori slučajnog ispitivanja).

Skrivene ljudske sposobnosti tijekom računalnog testiranja mogu se poboljšati i potpunije otkriti. U takvim testovima simulira se proces učenja ili razvoja, analiziraju se napori uloženi u učenje i ocjenjuju uspjesi, što omogućuje izvođenje zaključaka o intelektualnim sposobnostima ispitanika.

Test orijentiran na kriterije (na engleskom criterion-referenced) omogućuje procjenu u kojoj su mjeri ispitanici svladali potrebno obrazovno gradivo. Odnosi se na testovi postignuća. Vidi također Regulatorno orijentirani test
Nastali su u obrazovnom sustavu SAD-a 60-70-ih, kod nas 80-ih (novi trendovi u psihodijagnostici). Prije toga korištene su 2 vrste testova:

· - test inteligencije

· - provjera postignuća u sustavu obrazovanja

Test inteligencije: Karakteristike testova inteligencije su da sadržaj i zadatak nisu bili izravno vezani uz nastavni plan i program. Zaključak o uspješnosti odgojno-obrazovnih aktivnosti na temelju rezultata testiranja predstavljao je problem jer nije bilo podudarnosti između testova inteligencije i odgojno-obrazovnih zadataka. 0,5 – korelacija između uspješnosti testova inteligencije i uspješnosti treninga između njih. Nemoguće je identificirati uzrok specifičnih poteškoća učenika u izvođenju odgojno-obrazovnih aktivnosti i odrediti sadržaj korektivnoga rada s tim učenicima.

Testovi inteligencije ne mogu ocijeniti učenika u smislu njegove usklađenosti sa specifičnim zahtjevima nastavnog plana i programa, budući da su usmjereni na statističku normu.

Testovima postignuća prati se uspješnost svladavanja pojedinih obrazovnih znanja i vještina. Na temelju rezultata možemo zaključiti u kojoj mjeri učitelj zadovoljava zahtjeve školskog programa, koliko je napredovao i kakva mu je pomoć potrebna. Smjernice se ne temelje na statističkoj normi, već na kriteriju znanja. Nedostatak: izgrađeni su bihevioralni modeli učenja i kontroliran je konačni produkt asimilacije. Ali metode asimilacije se ne procjenjuju. U tom smislu testovi inteligencije dali su više informacija.

Godine 1963. Glasser je prvi upotrijebio termin mjerenje prema kriteriju.

Godine 1968. opisane su metode za konstruiranje testova temeljenih na kriterijima. Pojavio se u obrazovnom sustavu u Sjedinjenim Državama.

Početkom 70-ih godina pojavio se interes za praksu mjerenja temeljenog na kriterijima. CORTS je odražavao: što i kako se naučilo u procesu programiranog treninga. Uz pomoć CORT-a možete procijeniti koliko je osoba spremna za obavljanje bilo koje aktivnosti, može li se osoba nositi s određenom aktivnošću i na kojoj razini se određena aktivnost može obavljati? CORTS može biti koristan ne samo u obrazovnom sustavu, već iu profesionalnim aktivnostima.

Svrhe korištenja CORT-a:

1. Praćenje razvoja mentalnih funkcija, praćenje usvajanja nastavnog gradiva. Uz pomoć CORT-a možete procijeniti koliko je osoba napredovala u asimilaciji i razvoju.
2. Procijeniti koliko dobro razvoj određene asimilacijske funkcije zadovoljava specifične zahtjeve određenog položaja. Predvidite hoće li se osoba nositi s određenom aktivnošću.
Otuda glavna značajka CORT-a - testovi su usmjereni na vanjske zahtjeve, izražene u kriterijima razvoja ili asimilacije (kriterij uspješnosti).

CORT kriterij.

Pojam "kriterija". U prvoj fazi razmatraju se 2 koncepta kriterija:

1. Kriterij je razina vještine, izvedba na određenoj razini određene aktivnosti.
2. Kriterij su određeni sadržajni i operativni aspekti djelovanja. Skup znanja, vještina, radnji za bavljenje određenom aktivnošću.
U jedan su se stopila dva pojma: obavljanje aktivnosti i određena razina znanja i vještina koja odgovara određenoj razini vještine.

Razumijevanje kriterija je odbačeno jer je unijelo zabunu u testiranje. Stoga bi se moglo pomisliti da se bilo koji test može pretvoriti u CORT uvođenjem razine stručnosti (razine izvedbe testa) u fazi interpretacije testa. Kriterij odražava sadržajne i operativne elemente aktivnosti koji se moraju izvršiti kako bi se zadovoljili unaprijed određeni vanjski zahtjevi. Da bi odražavao koliko je osoba vješta u određenoj aktivnosti, CORT mora odražavati što osoba zna i može učiniti. CORT je posebna dijagnostička metoda. Razlika u prvoj fazi: razjašnjavanje ciljeva, za razliku od tradicionalnih testova.

Druga značajka CORT-a je da se njegovi rezultati prikazuju ne toliko u uvjetnim bodovima, koliko u specifičnim pokazateljima asimilacije i razvoja određenih znanja, vještina i sposobnosti. Glavna stvar nije broj obavljenih zadataka, već ono što osoba zna i koje operacije može učiniti.

Treća značajka CORT-a je da se pokazatelji uspješnosti ne procjenjuju usporedivošću s normom, već usporedbom CORT-a s kriterijem (vanjski specificirani kriterij). Što točno čovjek zna da računa na uspjeh u određenoj djelatnosti?

Pogledi