Hypoteesin testaus

Yksinkertainen ja lyhyt opas hypoteesitestaukseen Pythonin avulla

Kuva: http://www.advanceinnovationgroup.com/blog/median-based-hypotesis-testing

Tässä blogissa annan lyhyen oppaan hypoteesitestauksesta tilastollisilla menetelmillä Pythonissa. Hypoteesitestaus on osa tieteellistä menetelmää, johon me kaikki olemme tuttuja, jota olemme todennäköisesti oppineet varhaisissa koulutusvuosissamme. Tilastoinnissa tehdään kuitenkin monia kokeita väestönäytteelle.

”Sen määrittäminen, mitä havaintojoukko kertoo meille ehdotetusta selityksestä, vaatii yleensä tekemään päätelmän, tai kuten me tilastoijat kutsumme sitä, epävarmuuteen. Perustelu epävarmuudella on tilastollisen päättelyn ydin, ja se tehdään tyypillisesti menetelmällä, jota kutsutaan nollahypoteesimerkkien testaamiseksi. ” -Ovens.

Esimerkiksi tälle blogille käytän Kagglesta löytyvää eurooppalaista jalkapallatietojoukkoa ja suoritan hypoteesitestauksen. Aineisto löytyy täältä.

Vaihe 1

Tee havainto

Ensimmäinen askel on tarkkailla ilmiöitä. Tässä tapauksessa se tulee olemaan: Vaikuttaako puolustushyökkäys keskimäärin sallittuihin tavoitteisiin?

Vaihe 2

Tutki tutkimusta

Hyvä ajattelutapa on älykkäämpi, ei kovempi työskentely. Yksi hyvä asia on nähdä, onko havaintoasi liittyvää tutkimusta jo olemassa. Jos näin on, se voi auttaa vastaamaan kysymykseemme. Jo olemassa olevien tutkimusten tai kokeiden tuntemus auttaa meitä rakentamaan kokeilumme paremmin, tai ehkä jopa vastaamaan kysymykseemme eikä meidän tarvitse ensin suorittaa koetta.

Vaihe 3

Muodosta nollahypoteesi ja vaihtoehtoinen hypoteesi

Vaihtoehtoinen hypoteesi on koulutettu arvauksemme ja nollahypoteesi on yksinkertaisesti päinvastainen. Jos vaihtoehtoisessa hypoteesissa todetaan, että kahden muuttujan välillä on merkittävä yhteys, nollahypoteesissa todetaan, ettei ole merkittävää yhteyttä.

Nullhypoteesimme on: Ei tilastollisia eroja tavoitteissa, jotka sallitaan joukkueille, joiden puolustushyökkäysluokka on vähintään 65, verrattuna alle 65-vuotiaisiin joukkueisiin.

Vaihtoehtoinen hypoteesi: Tiimien välillä sallituissa tavoitteissa on sallittua joukkueille, joiden puolustushyökkäysluokka on vähintään 65 tai vähemmän, kun ryhmät ovat alle 65.

Vaihe 4

Selvitä, onko hypoteesimme yksisuuntainen testi vai kaksisuuntainen testi.

Yksisuuntainen testi

"Jos käytät merkitsevyystasoa 0,05, yksisuuntainen testi antaa kaikille alfa-yrityksillesi testata tilastollisen merkitsevyyden yhteen kiinnostuksen suuntaan." Esimerkki yksisuuntaisesta testistä olisi "Jalkapallojoukkueet, joiden aggressiivisuusluokka on alle 65, sallivat tilastollisesti merkittävästi enemmän tavoitteita kuin joukkueet, joiden luokitus on alle 65".

Kaksisuuntainen testi

”Jos käytät merkitsevyystasoa 0,05, kaksisuuntainen testi sallii puolet alfaasi testata tilastollisen merkitsevyyden toiseen suuntaan ja puolet alfaasi testata tilastollisen merkitsevyyden toiseen suuntaan. Tämä tarkoittaa, että 0,025 on testitilastosi jakauman jokaisessa häntässä. "

Kaksisuuntaisella testillä testaat tilastollista merkitsevyyttä molempiin suuntiin. Tapauksessamme testaamme tilastollista merkitsevyyttä molempiin suuntiin.

Vaihe 5

Aseta kynnysarvo (alfa)

(alfa-arvo): Marginaalikynnys, jolla voimme hylätä nollahypoteesin. Alfa-arvo voi olla mikä tahansa arvo, jonka asetamme välillä 0 - 1. Tieteen yleisin alfa-arvo on kuitenkin 0,05. 0,05: een asetettu alfa tarkoittaa, että hylkäämme nollahypoteesin, vaikka onkin 5% tai vähemmän mahdollisuus, että tulokset johtuvat sattumanvaraisuudesta.

P-arvo: Laskettu todennäköisyys saavuttaa nämä tiedot sattumanvaraisesti.

Jos laskem p-arvon ja se tulee arvoon 0,03, voimme tulkita tämän sanomalla: "On 3% mahdollisuus, että näkemäni tulokset johtuvat todella sattumanvaraisuudesta tai puhtaasta onnesta".

Kuva osoitteesta Learn.co

Tavoitteenamme on laskea p-arvo ja vertaa sitä alfa-arvoihimme. Mitä alempi alfa, sitä tiukempi testi on.

Vaihe 6

Suorita näytteenotto

Täällä meillä on tietojoukkomme nimeltään soccer. Testiämme varten tarvitsemme vain kaksi saraketta tietojoukkomme: team_def_aggr_rating ja goals_allowed. Suodatamme sen näihin kahteen sarakkeeseen ja luo sitten kaksi alajoukkoa joukkueille, joiden puolustava aggressiivisuusluokka on vähintään 65 ja joukkueille, joiden puolustava hyökkäysluokitus on alle 65.

Haluan vain kertoa hypoteesitestistämme:

Puolustushyökkäysten vaikutus keskimäärin sallittuihin tavoitteisiin. Nollahypoteesi: Ei tilastollista eroa tavoitteissa, jotka sallitaan joukkueissa, joiden puolustushyökkäysluokka on vähintään 65 tai vähemmän, verrattuna alle 65-vuotiaisiin joukkueisiin. Vaihtoehtoinen hypoteesi: Tiimissä on tavoiteero, joka sallitaan joukkueille, joiden puolustushyökkäysluokitus on suurempi vähintään 65 tai alle 65-vuotiaiden joukkueiden kanssa. Kaksisuuntainen testialfa: 0,05

Nyt meillä on kaksi luetteloa näytteistä, joilla voimme suorittaa tilastollisia testejä. Ennen tätä vaihetta piirrän kaksi jakaumaa kuvan saamiseksi.

Vaihe 7

Suorita kahden näytteen T-testi

Kahden näytteen t-testiä käytetään määrittämään onko kahden populaation keskiarvo yhtä suuri. Tätä varten käytämme Python-moduulia nimeltä statsmodels. En aio mennä liian yksityiskohtaisesti statsmalleihin, mutta voit nähdä asiakirjat täältä.

Vaihe 8

Arvioi ja tee johtopäätös

Muista, että asettamamme alfa oli a = 0,05. Kuten testituloksista voidaan nähdä, p-arvo on pienempi kuin alfa. Voimme hylätä nollahypoteesimme ja hyväksyä 95% luottamuksella vaihtoehtoisen hypoteesimme.

Kiitos, että luit! Tarkempia tietoja hypoteesitestauksesta voit tarkistaa tästä ryhmäprojektista GitHubissa, johon olin osallistunut täällä hypoteesitestauksessa.

resurssit:

Uunit, Matthew. “Tilastot ja” tieteellinen menetelmä ”noudettu YourStatsGurusta. https://www.yourstatsguru.com/secrets/scimethod-stats/?v=4442e4af0916

Johdatus SAS: ään. UCLA: Tilastollinen konsultointiryhmä. osoitteesta https://stats.idre.ucla.edu/other/mult-pkg/faq/general/faq-what-are-the-differences-between-one-tailed-and-two-tailed-tests/ (saapunut toukokuuhun 16, 2019).

Suunnittelutilastojen käsikirja. https://www.itl.nist.gov/div898/handbook/eda/section3/eda353.htm