Gyldigheten av en test

Gyldigheten av en test / Eksperimentell psykologi

Hvis en test brukes til det som er ment, sier vi at det er gyldig. For eksempel a test av intelligens Det er gyldig dersom det måler intelligens. Pålitelighet er i hvilken grad et evalueringsverktøy gir stabile og konsistente resultater. Ctesting av testene er et mål på pålitelighet oppnådd ved å administrere samme test to ganger over en tidsperiode til en gruppe individer.

Du kan også være interessert i: Classic Test Theory

Gyldigheten av testene

Tester er gyldige i den grad de måler hva de skal måle. Vi kan skille mellom tilsynelatende gyldighet og bevist gyldighet:

  1. Tilsynelatende gyldighet : refererer til graden som testen ser ut til å måle hva du vil måle.
  2. Bevist gyldighet : Det er den som har blitt verifisert på noen empirisk eller eksperimentell måte. Bevist gyldighet er empirisk eller teoretisk.
  3. Empirisk gyldighet : Det er empirisk når det er bevist på en praktisk måte. For eksempel er en test for å velge drivere gyldig hvis du skiller de gode driverne fra de dårlige drivere, til tross for ikke å vite nøyaktig hvorfor du får det.
  4. Teoretisk gyldighet: Det reflekterer i hvilken grad det har blitt bevist med vitenskapelige argumenter at testen måler eiendommen eller egenskapen som den forsøker å måle.

For eksempel vil en etterretningstest ha teoretisk gyldighet når det er bevis på dette som er basert på en logisk og eksperimentell verifisering.

  1. Den tilsynelatende gyldigheten: En test har tilsynelatende gyldighet hvis det virker som det måler hva det prøver å måle. Det er ikke en tilstrekkelig gyldighet, selv om det ofte er nødvendig. Mange ganger er det praktisk at testen virker gyldig for fagene som må svare på det. På andre tidspunkter er det viktig at testen ikke ser ut til å måle hva den måler. Dette er det første kravet om effektiv gyldighet. For å oppnå dette er det ikke nok at testen virker gyldig, det må bekreftes at den er.
  2. Bevist gyldighet: Effektiv validitet er bevist gyldighet. Det er mange måter å bevise gyldighet, noen er empiriske og andre logisk-eksperimentelle..
  3. Empirisk eller kriteriumgyldighet: En test har empirisk gyldighet hvis det har blitt bevist at det tjener noe praktisk formål. For eksempel er en test gyldig for å velge drivere hvis du skiller de ulike graden av kompetanse i kjøring.

den empirisk gyldighet det kalles også kriterium gyldighet, og for å bekrefte det, må et eksternt kriterium for gyldighet defineres. I eksemplet som er diskutert, er det eksterne kriteriet kompetansen i kjøring. den testens koeffisient Det er sammenhengen mellom testen og kriteriet. Hvis de beste i testen er de som fører bedre, vil testen ha en høy validitetskoefficient i forhold til dette kriteriet, og vi vil få en empirisk gyldig test for å velge drivere.

Denne gyldigheten er vitenskapelig blind, fordi vi ikke vet hva testens gyldighet er basert på. Testen er gyldig for å velge drivere, vi vet ikke hvorfor. Den empiriske gyldigheten kan klassifiseres i:

  1. Prospektiv eller prediktiv validitet eller prognose: Det er den som er verifisert av sammenhengen mellom testen og et kriterium som blir målt senere. For eksempel, hvis vi har mange håperfulle piloter, og vi ønsker å velge de som er mer sannsynlige å bli, etter å ha studert og praktisert, i gode piloter. Vi kan bruke visse tester som setter pris på kravene til å være en god pilot, og innrømmer alle søkerne. Etter studiene og de praktiske rutene vil vi måle fagene i kriteriet som garanterer å være en god pilot. Hvis testene besvart av fagene ved opptakstidspunktet, har høy korrelasjon med ferdighetene som pilot, målt etter læring, kanskje år senere, kan det bekreftes at disse testene har høy prospektiv gyldighet. Denne gyldigheten har blitt kalt prospektiv, forutsigbar og prognostisk gyldighet, siden det gjør det mulig å forutsi eller praktisk forutsi resultatene av fagene i kriteriet, tjener det til å velge kandidater som mest sannsynlig vil være gode piloter..
  2. Inspektive eller samtidige eller samtidige gyldighet: Prediktiv validitet er vanligvis for dyrt å teste; Det er vanligvis utenfor psykologens praktiske muligheter. Av denne grunn benyttes ofte metode for inspeksjon, samtidig eller samtidig gyldighet. Det er det samme som forrige prosedyre, men testene og kriteriet måles i samme samtidige eller samtidige periode. For eksempel er en rettidig prøve av piloter valgt, de riktige testene blir brukt og de måles i ferdighetskriteriet. Koeffisienten av samtidig gyldighet vil være korrelasjonen mellom testene og kriteriet. Det informerer oss i hvilken grad de gode og de dårlige i testen er, for øyeblikket, gode og dårlige i kriteriet. Det garanterer ikke at de beste kandidatene i testene vil bli de beste piloter etterpå.
  3. Retrospectiv validitet: Det er sammenhengen mellom testene, brukt på et bestemt tidspunkt, og et kriterium som tidligere ble målt, kanskje år før. Hensikten er å forutsi et tidligere kriterium, for å finne ut av dagens faktorer og forhold som tidligere påvirket fagene, og som forklarer noen av de aktuelle egenskapene til fagene.
  4. Den teoretiske gyldigheten: En test har teoretisk gyldighet Hvis du måler hva du har tenkt å måle.

Mengden der den måles, er indikert av logiske og eksperimentelle argumenter som tilsvarer dens forhold til et internt kriterium. Det er flere typer teoretisk gyldighet, og de er følgende

  1. Innhold eller prøve gyldighet : Hovedsakelig refererer det til test av ytelse, kunnskap eller faglig kompetanse. For eksempel er en staveprøve gyldig hvis innholdet er passende. For å verifisere denne gyldigheten blir stavemåten undersøkt, og det blir verifisert at elementene som utgjør testen, er en upartisk og tilstrekkelig prøve av dette feltet. Denne typen gyldighet kan ikke angis i noen form for korrelasjon. Uttrykker forholdet mellom testen og det interne kriteriet som dannes av saken som testen refererer til. Forholdet vil bli høyere da hele emnet er bedre representert av testen. Denne gyldigheten oppnås da det er garantier for at de ulike aspektene av et bestemt fagområde eller kompetanse som testen forsøker å måle, er klart definert. Kritisering av prøvenes gyldighet av en test innebærer å vise at den ikke tilstrekkelig representerer feltet som det refererer til.
  2. Konstruer eller begrepsmessig gyldighet : Består i henhold til metodologien for vitenskapelig forskning at testen måler variabelen som den refererer til. Det forsøker å sikre vitenskapelig at variabelen som testen forsøker å måle, er en akseptabel variabel, hvis konsept har tilstrekkelig logisk konsistens innenfor det teoretiske psykologiske systemet og støttes av tilstrekkelige eksperimentelle verifikasjoner som bekrefter det. For eksempel, før du tilbyr en gyldig test for å måle intelligens, vil det være nødvendig å klargjøre hvilken intelligens som testen forsøker å måle.
  3. Faktorisk gyldighet: Oppstår når forskjellige tester er korrelert med en gitt funksjon og deretter utsatt for et faktorisk forhold.
  4. Kongruent validitet: Hvis vi måler forskjellige variabler med tester av samme type, må testene som refererer til en variabel ha høyere korrelasjoner med hverandre enn testene med andre variabler..
  5. Diskrimineringsgyldighet: Hvis vi måler forskjellige variabler med tester av samme type og samme variabel med tester av forskjellige typer, må disse tester av forskjellige typer som refererer til samme variabel ha høyere korrelasjoner enn tester av samme type som refererer til til forskjellige variabler.
  6. Strukturell gyldighet: Det er i hvilken grad testen måler en utarbeiding eller teoretisk trekk. Eventuelle data som gir litt informasjon om karakteren av egenskapen vi vurderer og betingelsene som påvirker dens utvikling og manifestasjoner, er nyttig for denne typen gyldighet.