Znanstvene mjere: Pouzdanost i valjanost

Mjerenje je važan dio znanstvenog procesa. Ključni aspekti koji se tiču ​​kvalitete znanstvenih mjera su pouzdanost i valjanost.

Pouzdanost je mjera unutarnje konzistencije i stabilnosti mjernog uređaja.

Valjanost nam daje naznaku mjeri li mjerni uređaj ono na što tvrdi.

Unutarnja dosljednost stupanj je u kojem stavke ili pitanja na mjeri dosljedno ocjenjuju istu konstrukciju. Svako pitanje treba biti usmjereno na mjerenje iste stvari. Unutarnja dosljednost često se mjeri pomoću Cronbach-ove alfe - super-korelacije svih stavki na ljestvici. Ako je ocjena 0,70 ili više, mjerenje je prihvatljivo. Međutim, poželjno je 0,80 ili više. Također je važno uzeti u obzir kontekst kada se razmatra ocjena koja odražava unutarnju dosljednost.

Stabilnost se često mjeri pouzdanošću ispitivanja / ponovnog ispitivanja. Ista osoba dva puta polaže isti test i uspoređuju se rezultati svakog testa. Visoka korelacija između dva testa znači da je test pouzdan. U većini se okolnosti korelacija od najmanje 70 smatra prihvatljivom. Međutim, ovo je općenita smjernica, a ne statistički test.

Pouzdanost interratera je još jedan koeficijent pouzdanosti koji se ponekad koristi za procjenu pouzdanosti. S pouzdanošću interratera različiti suci ili ocjenjivači (dva ili više) promatraju, bilježe svoja otkrića i zatim uspoređuju svoja zapažanja. Ako su ocjenjivači pouzdani, postotak slaganja trebao bi biti visok.

Kada pitamo je li mjera valjana, pitamo da li mjeri ono što bi trebalo. Valjanost je prosudba koja se temelji na prikupljenim podacima, a ne statistički test. Postoje dva osnovna načina utvrđivanja valjanosti: postojeće mjere i poznate razlike u skupinama.

Postojeći test mjera utvrđuje je li nova mjera u korelaciji s postojećim relevantnim važećim mjerama. Nova mjera trebala bi biti slična mjerama koje su zabilježene već uspostavljenim valjanim mjernim uređajima.

Poznate grupne razlike određuju razlikuje li nova mjera poznate grupne razlike. Ilustracija poznatih razlika u skupinama vidi se kada se različitim skupinama daje ista mjera, a očekuje se da će postići različit rezultat. Kao primjer, ako biste demokratima i republikancima dali test kojim se ocjenjuje snaga određenih političkih stavova, očekivali biste da postignu drugačiji rezultat. Njihova se gledišta bitno razlikuju po mnogim pitanjima. Da su ove dvije skupine postigle različit rezultat, kako se očekivalo, mogli bismo reći da mjera ukazuje na valjanost - mjerenje onoga za što tvrdi da mjeri.

Prilikom projektiranja novih mjernih uređaja neophodno je uzeti u obzir njihovu pouzdanost i valjanost. Mjera može biti pouzdana i nevaljana. Ali valjana mjera uvijek je pouzdana mjera.

!-- GDPR -->