పరికల్పన పరీక్ష

పైథాన్ ఉపయోగించి పరికల్పన పరీక్షపై సరళమైన మరియు సంక్షిప్త ట్యుటోరియల్

చిత్రం నుండి: http://www.advanceinnovationgroup.com/blog/median-based-hypothesis-testing

ఈ బ్లాగులో, పైథాన్లోని గణాంక పద్ధతులను ఉపయోగించి హైపోథెసిస్ టెస్టింగ్ యొక్క సంక్షిప్త ట్యుటోరియల్ ఇస్తాను. పరికల్పన పరీక్ష అనేది మనందరికీ తెలిసిన శాస్త్రీయ పద్ధతిలో భాగం, మన ప్రారంభ విద్యా సంవత్సరాల్లో మనం బహుశా నేర్చుకున్నది. ఏదేమైనా, గణాంకాలలో, జనాభా యొక్క నమూనాపై అనేక ప్రయోగాలు జరుగుతాయి.

"ప్రతిపాదిత వివరణ గురించి ఒక నమూనా పరిశీలన ఏమి చెబుతుందో నిర్ణయించడానికి, సాధారణంగా, మనకు ఒక అనుమానం అవసరం, లేదా మేము గణాంకవేత్తలు దీనిని పిలుస్తున్నప్పుడు, కారణం తో అనిశ్చితికి. అనిశ్చితితో రీజనింగ్ అనేది గణాంక అనుమితి యొక్క ప్రధాన అంశం మరియు సాధారణంగా శూన్య పరికల్పన ప్రాముఖ్యత పరీక్ష అనే పద్ధతిని ఉపయోగించి జరుగుతుంది. ” -Ovens.

ఈ బ్లాగుకు ఉదాహరణగా, నేను కాగ్లేలో కనిపించే యూరోపియన్ సాకర్ డేటా సెట్‌ను ఉపయోగిస్తాను మరియు పరికల్పన పరీక్షను నిర్వహిస్తాను. డేటాసెట్ ఇక్కడ చూడవచ్చు.

దశ 1

ఒక పరిశీలన చేయండి

మొదటి దశ దృగ్విషయాన్ని గమనించడం. ఈ సందర్భంలో, ఇది ఇలా ఉంటుంది: సగటు అనుమతించిన లక్ష్యాలపై రక్షణ దూకుడు ప్రభావం ఉందా?

దశ 2

పరిశోధనను పరిశీలించండి

వెళ్ళడానికి మంచి మనస్తత్వం కష్టం కాదు. మీ పరిశీలనకు సంబంధించిన పరిశోధనలు ఇప్పటికే ఉన్నాయో లేదో చూడటం ఒక మంచి విషయం. అలా అయితే ఇది మా ప్రశ్నకు సమాధానం ఇవ్వడంలో సహాయపడుతుంది. ఇప్పటికే ఉన్న పరిశోధన లేదా ప్రయోగాల గురించి తెలుసుకోవడం మా ప్రయోగాన్ని మెరుగ్గా రూపొందించడంలో సహాయపడుతుంది లేదా మా ప్రశ్నకు కూడా సమాధానం ఇవ్వవచ్చు మరియు ప్రయోగాన్ని మొదటి స్థానంలో నిర్వహించనవసరం లేదు.

దశ 3

శూన్య పరికల్పన మరియు ప్రత్యామ్నాయ పరికల్పనను రూపొందించండి

ప్రత్యామ్నాయ పరికల్పన మన విద్యావంతులైన అంచనా మరియు శూన్య పరికల్పన కేవలం వ్యతిరేకం. ప్రత్యామ్నాయ పరికల్పన రెండు వేరియబుల్స్ మధ్య ముఖ్యమైన సంబంధం ఉందని చెబితే, శూన్య పరికల్పన గణనీయమైన సంబంధం లేదని పేర్కొంది.

మా శూన్య పరికల్పన ఇలా ఉంటుంది: రక్షణ దూకుడు రేటింగ్ కలిగిన జట్లతో 65 కంటే తక్కువ లేదా 65 కంటే తక్కువ ఉన్న జట్లతో అనుమతించబడిన లక్ష్యాలలో గణాంక వ్యత్యాసం లేదు.

ప్రత్యామ్నాయ పరికల్పన: రక్షణ దూకుడు రేటింగ్ ఉన్న జట్లతో 65 కంటే తక్కువ లేదా 65 కంటే తక్కువ జట్లతో అనుమతించబడిన లక్ష్యాలలో గణాంక వ్యత్యాసం ఉంది.

దశ 4

మా పరికల్పన ఒక తోక పరీక్ష లేదా రెండు తోక పరీక్ష అని నిర్ణయించండి.

వన్-టెయిల్డ్ టెస్ట్

"మీరు 0.05 యొక్క ప్రాముఖ్యత స్థాయిని ఉపయోగిస్తుంటే, వన్-టెయిల్డ్ పరీక్ష మీ ఆల్ఫాను గణాంక ప్రాముఖ్యతను ఆసక్తి యొక్క ఒక దిశలో పరీక్షించడానికి అనుమతిస్తుంది." ఒక తోక పరీక్షకు ఉదాహరణ "65 కంటే తక్కువ దూకుడు రేటింగ్ ఉన్న సాకర్ జట్లు 65 కంటే తక్కువ రేటింగ్ ఉన్న జట్ల కంటే గణాంకపరంగా గణనీయంగా ఎక్కువ గోల్స్ అనుమతిస్తాయి."

రెండు తోక పరీక్ష

“మీరు 0.05 యొక్క ప్రాముఖ్యత స్థాయిని ఉపయోగిస్తుంటే, రెండు-తోక పరీక్ష మీ ఆల్ఫాలో సగం గణాంక ప్రాముఖ్యతను ఒక దిశలో మరియు మీ ఆల్ఫాలో సగం ఇతర దిశలో గణాంక ప్రాముఖ్యతను పరీక్షించడానికి అనుమతిస్తుంది. మీ పరీక్ష గణాంకాల పంపిణీ యొక్క ప్రతి తోకలో 0.025 ఉందని దీని అర్థం. ”

రెండు తోకల పరీక్షతో, మీరు రెండు దిశలలో గణాంక ప్రాముఖ్యతను పరీక్షిస్తున్నారు. మా విషయంలో, మేము రెండు దిశలలో గణాంక ప్రాముఖ్యతను పరీక్షిస్తున్నాము.

దశ 5

ప్రవేశ ప్రాముఖ్యత స్థాయిని (ఆల్ఫా) సెట్ చేయండి

(ఆల్ఫా విలువ): శూన్య పరికల్పనను తిరస్కరించడంలో మేము బాగానే ఉన్న ఉపాంత ప్రవేశం. ఆల్ఫా విలువ మనం 0 మరియు 1 మధ్య సెట్ చేసిన ఏదైనా విలువ కావచ్చు. అయితే, శాస్త్రంలో సర్వసాధారణమైన ఆల్ఫా విలువ 0.05. 0.05 కు ఆల్ఫా సెట్ చేయబడితే, ఫలితాలు యాదృచ్ఛికత కారణంగా 5% లేదా అంతకంటే తక్కువ అవకాశం ఉన్నప్పటికీ మేము శూన్య పరికల్పనను తిరస్కరించడంలో సరే.

పి-విలువ: యాదృచ్ఛికంగా ఈ డేటాను చేరుకోవటానికి లెక్కించిన సంభావ్యత.

మేము p- విలువను లెక్కిస్తే మరియు అది 0.03 కి వస్తుంది, దీనిని మనం "నేను చూస్తున్న ఫలితాలు వాస్తవానికి యాదృచ్ఛికత లేదా స్వచ్ఛమైన అదృష్టం వల్ల వచ్చే అవకాశం ఉందని 3% అవకాశం ఉంది" అని చెప్పవచ్చు.

Learn.co నుండి చిత్రం

పి-విలువను లెక్కించడం మరియు దానిని మా ఆల్ఫాతో పోల్చడం మా లక్ష్యం. తక్కువ ఆల్ఫా పరీక్ష మరింత కఠినమైనది.

దశ 6

నమూనా చేయండి

ఇక్కడ మనకు సాకర్ అని పిలువబడే మా డేటాసెట్ ఉంది. మా పరీక్ష కోసం, మా డేటా సెట్‌లో మాకు రెండు నిలువు వరుసలు మాత్రమే అవసరం: team_def_aggr_rating మరియు goals_allowed. మేము ఈ రెండు నిలువు వరుసలకు ఫిల్టర్ చేస్తాము, ఆపై డిఫెన్సివ్ దూకుడు రేటింగ్ 65 కంటే ఎక్కువ లేదా సమానమైన జట్లకు మరియు 65 కంటే తక్కువ డిఫెన్సివ్ దూకుడు రేటింగ్ ఉన్న జట్ల కోసం రెండు ఉపసమితులను సృష్టిస్తాము.

మా పరికల్పన పరీక్ష కోసం తిరిగి పొందటానికి:

సగటు అనుమతించిన లక్ష్యాలపై రక్షణ దూకుడు ప్రభావం. శూన్య పరికల్పన: 65 కంటే తక్కువ లేదా 65 కంటే తక్కువ జట్లతో రక్షణ దూకుడు రేటింగ్ ఉన్న జట్లతో అనుమతించబడిన లక్ష్యాలలో గణాంక వ్యత్యాసం లేదు. ప్రత్యామ్నాయ పరికల్పన: రక్షణ దూకుడు రేటింగ్ ఎక్కువ ఉన్న జట్లతో అనుమతించబడిన లక్ష్యాలలో గణాంక వ్యత్యాసం ఉంది 65 కంటే తక్కువ 65 ​​వర్సెస్ జట్లకు సమానం. రెండు తోక గల టెస్ట్ ఆల్ఫా: 0.05

ఇప్పుడు మనకు గణాంక పరీక్షలను అమలు చేయగల రెండు నమూనాల జాబితాలు ఉన్నాయి. ఆ దశకు ముందు, నేను విజువల్ పొందడానికి రెండు పంపిణీలను ప్లాట్ చేస్తాను.

దశ 7

రెండు-నమూనా టి-పరీక్షను జరుపుము

రెండు జనాభా సాధనాలు సమానంగా ఉన్నాయో లేదో తెలుసుకోవడానికి రెండు-నమూనా టి-పరీక్ష ఉపయోగించబడుతుంది. దీని కోసం, మేము స్టాట్స్‌మోడల్స్ అనే పైథాన్ మాడ్యూల్‌ని ఉపయోగిస్తాము. నేను గణాంకాల గురించి చాలా వివరంగా చెప్పను కాని మీరు ఇక్కడ డాక్యుమెంటేషన్ చూడవచ్చు.

దశ 8

మూల్యాంకనం మరియు తీర్మానం

మేము సెట్ చేసిన ఆల్ఫా = 0.05 అని గుర్తుంచుకోండి. మా పరీక్ష ఫలితాల నుండి p- విలువ మా ఆల్ఫా కంటే తక్కువగా ఉందని మనం చూడవచ్చు. మేము మా శూన్య పరికల్పనను తిరస్కరించవచ్చు మరియు 95% విశ్వాసంతో మా ప్రత్యామ్నాయ పరికల్పనను అంగీకరిస్తాము.

చదివినందుకు ధన్యవాదములు! పరికల్పన పరీక్షపై మరింత లోతైన సమాచారం కోసం, మీరు ఇక్కడ othes హాజనిత పరీక్షలో పాల్గొన్న గిట్‌హబ్‌లో ఈ సమూహ ప్రాజెక్టును చూడవచ్చు.

వనరులు:

ఓవెన్స్, మాథ్యూ. “గణాంకాలు మరియు“ శాస్త్రీయ విధానం ”యువర్‌స్టాట్స్‌గురు నుండి పొందబడింది. https://www.yourstatsguru.com/secrets/scimethod-stats/?v=4442e4af0916

SAS పరిచయం. UCLA: స్టాటిస్టికల్ కన్సల్టింగ్ గ్రూప్. https://stats.idre.ucla.edu/other/mult-pkg/faq/general/faq-what-are-the-differences-between-one-tailed-and-two-tailed-tests/ నుండి (యాక్సెస్ చేసిన మే 16, 2019).

ఇంజనీరింగ్ స్టాటిస్టిక్స్ హ్యాండ్బుక్. https://www.itl.nist.gov/div898/handbook/eda/section3/eda353.htm