Pagrindinis mokslas

Studento t-testo statistika

Studento t-testo statistika
Studento t-testo statistika

Video: Student's t-test 2024, Rugsėjis

Video: Student's t-test 2024, Rugsėjis
Anonim

Studentų t-testas statistikoje - hipotezių apie nedidelės imties, paimtos iš normaliai pasiskirstančios populiacijos, vidurkį, kai populiacijos standartinis nuokrypis nežinomas, vidurkis.

1908 m. William Sealy Gosset, anglas, leidžiantis pseudonimą Studentas, sukūrė „t-test“ ir „t“ paskirstymą. T pasiskirstymas yra kreivių šeima, kurioje laisvės laipsnių skaičius (imties nepriklausomų stebėjimų skaičius atėmus vieną) nurodo tam tikrą kreivę. Didėjant imties dydžiui (taigi ir laisvės laipsniams), t pasiskirstymas artėja prie standartinio normalaus pasiskirstymo varpo formos. Praktiškai bandymams, kurių vidutinis imties dydis yra didesnis nei 30, paprastai naudojamas normalusis pasiskirstymas.

Paprastai įprasta pirmiausia suformuluoti nulinę hipotezę, kurioje teigiama, kad nėra jokio veiksmingo skirtumo tarp stebimo imties vidurkio ir hipotezuoto ar nurodyto populiacijos vidurkio, ty kad bet koks išmatuotas skirtumas yra tik dėl atsitiktinumo. Pvz., Atlikus žemės ūkio tyrimą, hipotezė galėtų būti, kad tręšimas neturėjo jokios įtakos pasėlių derliui, ir bus atliktas eksperimentas, siekiant patikrinti, ar jis nepadidino derliaus. Paprastai t-testas gali būti dvipusis (taip pat vadinamas dvipusiu), kuriame paprasčiausiai nurodoma, kad priemonės nėra lygiavertės, arba vienpusis, nurodant, ar stebimas vidurkis yra didesnis, ar mažesnis už hipotezį. Tada apskaičiuojama bandymo statistika t. Jei stebima t-statistika yra kraštutinė, nei kritinė vertė, nustatyta pagal atitinkamą pamatinį pasiskirstymą, nulinė hipotezė atmetama. T-statistikai tinkamas pamatinis pasiskirstymas yra t pasiskirstymas. Kritinė vertė priklauso nuo testo reikšmingumo lygio (tikimybė klaidingai atmesti nulinę hipotezę).

Pavyzdžiui, tarkime, tyrėjas nori patikrinti hipotezę, kad n = 25 dydžio imties vidurkis x = 79 ir standartinis nuokrypis s = 10 buvo paimtas atsitiktinai iš populiacijos, kurios vidurkis μ = 75 ir nežinomas standartinis nuokrypis. Taikant t-statistikos formulę, apskaičiuota t lygi 2. Atliekant dvipusį bandymą, kurio bendras reikšmingumo lygis α = 0,05, t paskirstymo kritinės vertės, esant 24 laisvės laipsniams, yra –2,064 ir 2,064. Apskaičiuota t neviršija šių verčių, todėl niekinės hipotezės negalima atmesti 95 procentų patikimumu. (Pasitikėjimo lygis yra 1 - α.)

Antrasis t paskirstymo pritaikymas patikrina hipotezę, kad dviejų nepriklausomų atsitiktinių imčių vidurkis yra vienodas. T pasiskirstymas taip pat gali būti naudojamas apskaičiuojant pasitikėjimo intervalus pagal tikrąjį populiacijos vidurkį (pirmasis taikymas) arba skirtumui tarp dviejų imties vidurkių (antrasis taikymas). Taip pat žiūrėkite intervalo įvertinimą.