SlideShare a Scribd company logo
1 of 30
Download to read offline
Hypothesis Testing – Level of Significance, degrees of freedom,
Types of Error, Power of Test
Compiled By: Dr. Vikramjit Singh
In research, when you have formulated a research hypothesis, it's
essential to test its validity or accuracy through a process called
hypothesis testing. Hypothesis testing involves comparing the observed
data from your study to what you would expect to observe if your
hypothesis were true. The parameters you test are critical aspects of your
hypothesis and include the following:
1. Formulate the Research Question:
Clearly define the research question or problem that you want to
investigate. What specific aspect of the problem are you interested in
studying?
2. Identify Variables:
Identify the variables involved in your research question. Variables
are characteristics, properties, or factors that can vary and are central to
your study. They can be independent (predictor) variables and dependent
(outcome) variables.
3. Define Operational Definitions:
For each variable, provide a precise and clear operational
definition. This definition describes how you will measure or manipulate
the variable in concrete, observable terms. Operational definitions
translate abstract concepts into specific actions or measurements.
Example: If you're studying "academic performance," you might
operationalize it as "average test scores in mathematics and science over
a oneyear period."
4. Develop a Research Hypothesis:
Based on your operational definitions, formulate a research
hypothesis that specifies the expected relationship between the variables.
This hypothesis should be testable using empirical data.
Example: "Increasing the amount of time spent studying
(independent variable) will lead to higher average test scores in
mathematics and science (dependent variable)."
5. Design the Research Study:
Develop the research methodology and design the study to test
your operational hypothesis. Determine the data collection methods,
such as surveys, experiments, observations, or archival data analysis,
based on your operational definitions.
Example: If you want to test the hypothesis mentioned above, you
might design an experiment where you randomly assign participants to
study for different amounts of time and then measure their test scores.
6. Collect Data:
Implement the research study according to your design and collect
relevant data as per your operational definitions. Ensure that your data
collection procedures align with your operationalizations.
7. Analyze Data:
Use appropriate statistical or analytical techniques to analyze the
collected data. The analysis should test whether the observed results are
consistent with the predictions made in your operational hypothesis.
8. Draw Conclusions:
Based on the data analysis, draw conclusions about whether the
observed results support or contradict your operational hypothesis.
Example: If the data analysis shows that participants who studied
more indeed had higher average test scores, then your operational
hypothesis is supported.
9. Report Findings:
Communicate your findings in a clear and concise manner through
research reports, presentations, or publications. Describe how you
operationalized your variables and how your study's results relate to
your operational hypothesis.
Ø Key parameters involved in Hypothesis testing :
To test a framed hypothesis we need to formulate it in operational term
either in null form or alternative form. Operational hypotheses are vital
in research because they bridge the gap between abstract concepts and
concrete measurements or manipulations. By specifying how variables
will be treated in a study, researchers ensure that their research is both
valid and replicable. This systematic approach to hypothesis testing
contributes to the overall rigor of scientific research.
Example: If you hypothesize that the new method of teaching is
effective –
The null hypothesis (H0) can be – "There is no significant difference
between the mean gain scores in the achievement test of experimental
group learning through blended learning and the control group learning
through the traditional learning approach"
Whereas the alternative hypothesis (Ha) can be "There is significant
difference between the mean gain scores in the achievement test of
experimental group learning through blended learning and the control
group learning through the traditional learning approach"
I. Test Statistic: The test statistic is a numerical value that summarizes
the information from your data and helps you determine whether you
should reject the null hypothesis. The choice of test statistic depends on
the research design and the type of data you are analyzing (e.g., t-test,
chi-squared test, Ftest, correlation coefficient).
Example: In a ttest comparing two means (e.g., the effectiveness of
two methods), the test statistic is the tvalue.
Types of error in hypothesis testing:
1. Type I Error (False Positive):
A Type I error occurs when the null hypothesis (H0) is rejected
when it is actually true. In other words, you conclude that there is a
significant effect or difference when there isn't one in reality.
The probability of committing a Type I error is denoted by the
symbol α (alpha) and is known as the level of significance.
Commonly used levels of significance are 0.05 (5%) or 0.01 (1%).
Choosing a lower α reduces the chance of making a Type I error but may
increase the risk of Type II error.
Type I errors are often considered more serious in certain contexts,
such as medical testing, where false positives can lead to unnecessary
treatments or interventions.
Example of Type I Error:
Suppose a medical researcher is testing a new drug for a particular
disease. The null hypothesis (H0) states that the drug has no effect (i.e.,
it's not better than a placebo), and the alternative hypothesis (Ha) is that
the drug is effective.
Null Hypothesis (H0): The drug has no effect.
Alternative Hypothesis (Ha): The drug is effective.
If, based on a clinical trial, the researcher incorrectly rejects the null
hypothesis (H0) and concludes that the drug is effective when, in fact, it
isn't (the drug is just a placebo), this would be a Type I error. In this
case, patients might be exposed to unnecessary treatment with no actual
benefit.
2. Type II Error (False Negative):
A Type II error occurs when the null hypothesis (H0) is not rejected
when it is actually false. In other words, you fail to detect a significant
effect or difference when there is one in reality.
The probability of committing a Type II error is often denoted by
the symbol β (beta). The complement of β, which is 1-β, is referred to as
the "power" of the test and represents the probability of correctly
rejecting a false null hypothesis (i.e., correctly detecting an effect if it
exists).
The risk of Type II error is influenced by factors such as the
sample size, the effect size, and the chosen level of significance (α).
Larger sample sizes and larger effect sizes generally reduce the risk of
Type II error.
Type II errors are significant in situations where failing to detect an
effect has real world consequences, such as in clinical trials where a
lifesaving treatment might be missed.
Example of Type II Error:
Continuing with the medical research example, let's say the null
hypothesis (H0) is still that the drug has no effect, and the alternative
hypothesis (Ha) is that the drug is effective.
Null Hypothesis (H0): The drug has no effect.
Alternative Hypothesis (Ha): The drug is effective.
If, based on a clinical trial, the researcher fails to reject the null
hypothesis (H0) and concludes that the drug is not effective when, in
reality, it does have a positive effect (the drug is effective in treating the
disease), this would be a Type II error. In this case, patients might miss
out on a potentially lifesaving treatment.
The relationship between Type I and Type II errors can be summarized
as follows:
Increasing the level of significance (α) to reduce Type I errors will
increase the risk of Type II errors.
Increasing the sample size or effect size can reduce the risk of Type II
errors while possibly increasing the risk of Type I errors.
Example Null Hypothesis is
False(Real)
Null Hypothesis is
True (Real)
Model thinks Null
Hypothesis is False
True Positive False Positive
Type 1 (α Error)
Model thinks Null
Hypothesis is True
False Negative
Type 2 (β Error)
True Negative
Example Case
Example Defendant is
guilty(Real)
Defendant is
innocent(Real)
Courts rules
defendant is guilty
True Positive –
Criminal gets
convicted
False Positive
Type 1 (α Error) –
Innocent gets
convicted
Court rules
defendant is
innocents
False Negative
Type 2 (β Error)-
Criminal gets free
True Negative-
Innocent gets free
Overall we can say that, Type I errors involve mistakenly concluding
that there is an effect or difference when there isn't, while Type II errors
involve failing to detect an effect or difference that actually exists. The
balance between these two types of errors is a critical consideration in
statistical hypothesis testing, and researchers must choose appropriate
levels of significance (α) and sample sizes to minimize the risk of both
types of errors based on the specific context and consequences of the
research.
II. Level of Significance (Alpha, α): The level of significance, often
denoted as α, represents the probability of making a Type I error
(rejecting the null hypothesis when it's true). Commonly used levels of
significance are 0.05 (5%) or 0.01 (1%), but researchers can choose a
significance level based on the context and desired level of confidence.
Example: If you set α = 0.05, you are willing to accept a 5%
chance of making a Type I error.
III. Critical Value:
Critical values are values on a statistical distribution that mark the
boundary of the critical region. The critical region is the range of values
of a test statistic beyond which you would reject the null hypothesis.
Critical values are determined based on the chosen level of
significance (α), the desired confidence level, and the statistical
distribution being used (e.g., normal distribution, t distribution, chi
squared distribution).
The critical value(s) are chosen so that the probability of observing
a test statistic in the critical region, assuming the null hypothesis is true,
is equal to α.
IV. Degrees of Freedom (df):
Degrees of freedom represent the number of values in the final
calculation of a statistic that are free to vary.
Degrees of freedom are specific to the statistical test being
performed. For example:
In a onesample ttest, df = n 1, where n is the sample size.
In a chisquared test, df is related to the number of categories or
groups being compared.
Degrees of freedom are important because they affect the shape of
the statistical distribution and, consequently, the critical values.
V. Critical Region (Rejection Region): The critical region is a range of
values for the test statistic that, if the observed test statistic falls within
it, leads to the rejection of the null hypothesis. The boundaries of the
critical region are determined by the chosen level of significance and the
statistical distribution being used.
Example: In a normal distribution, if α = 0.05, the critical region
might be the extreme 5% of the distribution (2.5% in each tail) based on
the chosen test statistic.
VI. P value: The p value is a calculated probability that indicates the
likelihood of obtaining results as extreme as or more extreme than those
observed, assuming the null hypothesis is true. If the p value is smaller
than the chosen level of significance (α), you may reject the null
hypothesis.
Example: If you calculate a p value of 0.03 and α = 0.05, you
would typically reject the null hypothesis because 0.03 < 0.05.
Precaution for increasing the Power of the test and lower the risk of
Type-1 or Type –II error
1. Choose a Lower Significance Level (α):
The significance level (α) represents the probability of making a
Type I error. By choosing a lower α, you make it more stringent to reject
the null hypothesis.
Commonly used significance levels are 0.05 (5%) or 0.01 (1%).
Lowering α to 0.01, for example, reduces the probability of making a
Type I error, but it may increase the risk of Type II errors (false
negatives).
2. Conduct a Bonferroni Correction:
If you are performing multiple hypothesis tests simultaneously
(e.g., in a family of tests), consider applying a Bonferroni correction.
This correction adjusts the significance level to account for multiple
comparisons, making it more stringent for each individual test.
The Bonferroni correction divides the desired overall α level by the
number of tests being conducted.
3. Increase Sample Size:
A larger sample size provides more data, which can lead to a more
accurate estimation of population parameters. With a larger sample, the
variability in the data may decrease, making it less likely to observe
extreme results that lead to Type I errors.
However, increasing the sample size might not always be feasible
due to cost or practical constraints.
4. Perform Pre study Power Analysis:
Conducting a power analysis before starting your study allows you to
estimate the minimum sample size needed to achieve a desired level of
statistical power (the probability of correctly rejecting a false null
hypothesis).
A well powered study minimizes both Type I and Type II errors by
ensuring that the sample size is adequate to detect meaningful effects.
5. Use One Tailed Tests Sparingly:
One tailed tests are more likely to result in Type I errors than two
tailed tests because they focus on a specific direction of effect. Use one
tailed tests only when you have a strong theoretical justification for
doing so.
6. Be Cautious with Outliers and Extreme Values:
Outliers or extreme values in your data can lead to significant
results that might not be representative of the overall population.
Carefully examine and, if necessary, investigate and address outliers.
7. Replicate Findings:
Replicating research findings in independent studies can help reduce
the likelihood of Type I errors. If the same result is consistently found
across multiple studies, it strengthens the evidence in favor of the
alternative hypothesis.
8. Be Mindful of Research Design:
Ensure that your research design is appropriate for the question
you are addressing. Consider factors such as control groups,
randomization, and blinding to minimize biases and potential sources of
Type I errors.
9. Expert Peer Review:
Seek peer review from experts in the field before conducting your
study or publishing your findings. Experienced researchers can provide
valuable input and help identify potential sources of Type I errors.
10. Increase Statistical Power:
Statistical power is the probability of correctly rejecting a false null
hypothesis (i.e., detecting an effect when it exists). A higher power
reduces the risk of Type II errors.
You can increase power by using a more sensitive statistical test,
choosing appropriate measurement instruments, and reducing
measurement error.
11. Use More Sensitive Tests or Measures:
Utilize statistical tests or measurement instruments that are more
sensitive to the effect or difference you are trying to detect. Sensitivity
increases the likelihood of detecting real effects.
12. Extend the Duration of Data Collection:
In some cases, collecting data over a longer period may reveal
more significant effects or differences. Seasonal variations or longterm
trends may not be apparent in shortduration studies.
13. Perform Posthoc Power Analysis:
After data collection, conduct a posthoc power analysis to evaluate
the power of your study based on the observed effect size and sample
size. If power is low, it may indicate that your study had a high risk of
Type II errors.
14. Replicate the Study:
Replicate your study independently to verify the results. If multiple
studies consistently find the same effect, it strengthens the evidence and
reduces the likelihood of Type II errors.
15. Consider Bayesian Analysis:
Bayesian analysis offers an alternative approach to traditional
frequentist hypothesis testing. It allows for the quantification of
uncertainty and the calculation of posterior probabilities of hypotheses.
Bayesian methods can provide insight into the likelihood of Type II
errors.
16. Control for Confounding Variables:
Ensure that your study design controls for potential confounding
variables that could weaken the effect you are trying to detect.
Confounding variables can increase the risk of Type II errors.
17. Perform Sensitivity Analyses:
Conduct sensitivity analyses by varying assumptions or model
parameters to assess how robust your results are to different scenarios.
This can help identify the conditions under which an effect is more
likely to be detected.
परिकल्पना परीक्षण - महत्व का स्तर, स्वतंत्रता की डिग्री,
त्रुटि क
े प्रकार, परीक्षण की शक्ति
संकलन: डॉ. विक्रमजीत सिंह
शोध में, जब आपने एक शोध परिकल्पना तैयार की है, तो परिकल्पना
परीक्षण नामक प्रक्रिया क
े माध्यम से इसकी वैधता या सटीकता का
परीक्षण करना आवश्यक है। परिकल्पना परीक्षण में आपक
े अध्ययन से
देखे गए डेटा की तुलना इस बात से की जाती है कि यदि आपकी
परिकल्पना सत्य थी तो आप क्या देखने की उम्मीद करेंगे। आपक
े द्वारा
परीक्षण किए गए पैरामीटर आपकी परिकल्पना क
े महत्वपूर्ण पहलू हैं और
इनमें निम्नलिखित शामिल हैं:
1. शोध प्रश्न तैयार करें:
उस शोध प्रश्न या समस्या को स्पष्ट रूप से परिभाषित करें जिसकी आप
जांच करना चाहते हैं। आप समस्या क
े किस विशिष्ट पहलू का अध्ययन
करने में रुचि रखते हैं?
2. चरों को पहचानें:
अपने शोध प्रश्न में शामिल चरों को पहचानें। चर वे विशेषताएँ, गुण या
कारक हैं जो भिन्न हो सकते हैं और आपक
े अध्ययन क
े क
ें द्र में हैं। वे
स्वतंत्र (भविष्यवक्ता) चर और आश्रित (परिणाम) चर हो सकते हैं।
3. परिचालन परिभाषाएँ परिभाषित करें:
प्रत्येक चर क
े लिए, एक सटीक और स्पष्ट परिचालन परिभाषा प्रदान
करें। यह परिभाषा बताती है कि आप चर को ठोस, अवलोकन योग्य शब्दों
में क
ै से मापेंगे या उसमें हेरफ
े र करेंगे। परिचालनात्मक परिभाषाएँ अमूर्त
अवधारणाओं को विशिष्ट क्रियाओं या मापों में परिवर्तित करती हैं।
उदाहरण: यदि आप "शैक्षणिक प्रदर्शन" का अध्ययन कर रहे हैं, तो आप
इसे "एक वर्ष की अवधि में गणित और विज्ञान में औसत परीक्षण स्कोर"
क
े रूप में संचालित कर सकते हैं।
4. एक शोध परिकल्पना विकसित करें:
अपनी परिचालन परिभाषाओं क
े आधार पर, एक शोध परिकल्पना तैयार
करें जो चर क
े बीच अपेक्षित संबंध को निर्दिष्ट करती है। यह परिकल्पना
अनुभवजन्य डेटा का उपयोग करक
े परीक्षण योग्य होनी चाहिए।
उदाहरण: "अध्ययन में बिताए गए समय (स्वतंत्र चर) को बढ़ाने से गणित
और विज्ञान (आश्रित चर) में औसत परीक्षण स्कोर में वृद्धि होगी।"
5. अनुसंधान अध्ययन डिजाइन करें:
अनुसंधान पद्धति विकसित करें और अपनी परिचालन परिकल्पना का
परीक्षण करने क
े लिए अध्ययन डिजाइन करें। अपनी परिचालन
परिभाषाओं क
े आधार पर डेटा संग्रह विधियों, जैसे सर्वेक्षण, प्रयोग,
अवलोकन, या अभिलेखीय डेटा विश्लेषण का निर्धारण करें।
उदाहरण: यदि आप ऊपर उल्लिखित परिकल्पना का परीक्षण करना
चाहते हैं, तो आप एक प्रयोग डिज़ाइन कर सकते हैं जहां आप प्रतिभागियों
को अलग-अलग समय क
े लिए अध्ययन करने क
े लिए यादृच्छिक रूप से
नियुक्त करते हैं और फिर उनक
े परीक्षण स्कोर को मापते हैं।
6. डेटा एकत्र करें:
अपने डिज़ाइन क
े अनुसार शोध अध्ययन लागू करें और अपनी
परिचालन परिभाषाओं क
े अनुसार प्रासंगिक डेटा एकत्र करें। सुनिश्चित
करें कि आपकी डेटा संग्रह प्रक्रियाएँ आपक
े परिचालन क
े साथ संरेखित
हों।
7. डेटा का विश्लेषण करें:
एकत्रित डेटा का विश्लेषण करने क
े लिए उपयुक्त सांख्यिकीय या
विश्लेषणात्मक तकनीकों का उपयोग करें। विश्लेषण को यह परीक्षण
करना चाहिए कि क्या देखे गए परिणाम आपकी परिचालन परिकल्पना में
की गई भविष्यवाणियों क
े अनुरूप हैं।
8. निष्कर्ष निकालें:
डेटा विश्लेषण क
े आधार पर, इस बारे में निष्कर्ष निकालें कि देखे गए
परिणाम आपकी परिचालन परिकल्पना का समर्थन करते हैं या खंडन
करते हैं।
उदाहरण: यदि डेटा विश्लेषण से पता चलता है कि जिन प्रतिभागियों ने
अधिक अध्ययन किया, उनक
े औसत परीक्षण स्कोर वास्तव में अधिक थे,
तो आपकी परिचालन परिकल्पना समर्थित है।
9. रिपोर्ट क
े निष्कर्ष:
शोध रिपोर्टों, प्रस्तुतियों या प्रकाशनों क
े माध्यम से अपने निष्कर्षों को
स्पष्ट और संक्षिप्त तरीक
े से संप्रेषित करें। वर्णन करें कि आपने अपने
वेरिएबल्स को क
ै से संचालित किया और आपक
े अध्ययन क
े परिणाम
आपकी परिचालन परिकल्पना से क
ै से संबंधित हैं।
Ø परिकल्पना परीक्षण में शामिल प्रमुख पैरामीटर:
किसी फ़्र
े मयुक्त परिकल्पना का परीक्षण करने क
े लिए हमें इसे क्रियात्मक
रूप में या तो शून्य रूप में या वैकल्पिक रूप में तैयार करने की
आवश्यकता है। अनुसंधान में संचालनात्मक परिकल्पनाएँ महत्वपूर्ण हैं
क्योंकि वे अमूर्त अवधारणाओं और ठोस माप या जोड़-तोड़ क
े बीच क
े
अंतर को पाटती हैं। यह निर्दिष्ट करक
े कि किसी अध्ययन में चरों क
े साथ
क
ै से व्यवहार किया जाएगा, शोधकर्ता यह सुनिश्चित करते हैं कि उनका
शोध वैध और अनुकरणीय दोनों है। परिकल्पना परीक्षण क
े लिए यह
व्यवस्थित दृष्टिकोण वैज्ञानिक अनुसंधान की समग्र कठोरता में योगदान
देता है।
उदाहरण: यदि आप परिकल्पना करते हैं कि शिक्षण की नई पद्धति
प्रभावी है -
शून्य परिकल्पना (H0) हो सकती है - "मिश्रित शिक्षण क
े माध्यम से
प्रयोगात्मक समूह सीखने और पारंपरिक शिक्षण दृष्टिकोण क
े माध्यम से
नियंत्रण समूह सीखने क
े उपलब्धि परीक्षण में औसत लाभ स्कोर क
े बीच
कोई महत्वपूर्ण अंतर नहीं है"
जबकि वैकल्पिक परिकल्पना (Ha) हो सकती है "मिश्रित शिक्षण क
े
माध्यम से प्रयोगात्मक समूह सीखने और पारंपरिक शिक्षण दृष्टिकोण क
े
माध्यम से नियंत्रण समूह सीखने क
े उपलब्धि परीक्षण में औसत लाभ
स्कोर क
े बीच महत्वपूर्ण अंतर है"
I. परीक्षण आँकड़ा: परीक्षण आँकड़ा एक संख्यात्मक मान है जो आपक
े
डेटा से जानकारी का सारांश देता है और आपको यह निर्धारित करने में
मदद करता है कि आपको शून्य परिकल्पना को अस्वीकार करना चाहिए
या नहीं। परीक्षण आँकड़ों का चुनाव अनुसंधान डिज़ाइन और आपक
े द्वारा
विश्लेषण किए जा रहे डेटा क
े प्रकार पर निर्भर करता है (उदाहरण क
े लिए,
टी-टेस्ट, ची-स्क्वायर टेस्ट, एफटीटेस्ट, सहसंबंध गुणांक)।
उदाहरण: दो साधनों (उदाहरण क
े लिए, दो तरीकों की प्रभावशीलता) की
तुलना करने वाले परीक्षण में, परीक्षण आँकड़ा मूल्य है।
परिकल्पना परीक्षण में त्रुटि क
े प्रकार:
1. टाइप I त्रुटि (गलत सकारात्मक):
टाइप I त्रुटि तब होती है जब शून्य परिकल्पना (H0) को अस्वीकार कर
दिया जाता है जबकि यह वास्तव में सत्य है। दूसरे शब्दों में, आप यह
निष्कर्ष निकालते हैं कि एक महत्वपूर्ण प्रभाव या अंतर है जब
वास्तविकता में ऐसा कोई नहीं है।
टाइप I त्रुटि होने की संभावना को प्रतीक α (अल्फा) द्वारा दर्शाया जाता है
और इसे महत्व क
े स्तर क
े रूप में जाना जाता है।
आमतौर पर उपयोग किए जाने वाले महत्व क
े स्तर 0.05 (5%) या 0.01
(1%) हैं। कम α चुनने से टाइप I त्रुटि होने की संभावना कम हो जाती है
लेकिन टाइप II त्रुटि का खतरा बढ़ सकता है।
टाइप I त्रुटियों को अक्सर क
ु छ संदर्भों में अधिक गंभीर माना जाता है, जैसे
कि चिकित्सा परीक्षण, जहां झूठी सकारात्मकता अनावश्यक उपचार या
हस्तक्षेप का कारण बन सकती है।
प्रकार I त्रुटि का उदाहरण:
मान लीजिए कि एक चिकित्सा शोधकर्ता किसी विशेष बीमारी क
े लिए
एक नई दवा का परीक्षण कर रहा है। शून्य परिकल्पना (H0) बताती है कि
दवा का कोई प्रभाव नहीं है (यानी, यह प्लेसबो से बेहतर नहीं है), और
वैकल्पिक परिकल्पना (Ha) यह है कि दवा प्रभावी है।
शून्य परिकल्पना (H0): दवा का कोई प्रभाव नहीं पड़ता है।
वैकल्पिक परिकल्पना (हा): दवा प्रभावी है।
यदि, नैदानिक ​
​
परीक्षण क
े आधार पर, शोधकर्ता शून्य परिकल्पना (H0)
को गलत तरीक
े से खारिज कर देता है और निष्कर्ष निकालता है कि दवा
प्रभावी है, जबकि वास्तव में ऐसा नहीं है (दवा सिर्फ एक प्लेसबो है), तो
यह टाइप I त्रुटि होगी . इस मामले में, रोगियों को बिना किसी वास्तविक
लाभ क
े अनावश्यक उपचार का सामना करना पड़ सकता है।
2. टाइप II त्रुटि (गलत नकारात्मक):
टाइप II त्रुटि तब होती है जब शून्य परिकल्पना (H0) को अस्वीकार नहीं
किया जाता है जबकि यह वास्तव में गलत है। दूसरे शब्दों में, जब
वास्तविकता में कोई महत्वपूर्ण प्रभाव या अंतर मौजूद होता है तो आप
उसका पता लगाने में असफल हो जाते हैं।
टाइप II त्रुटि होने की संभावना को अक्सर प्रतीक β (बीटा) द्वारा दर्शाया
जाता है। β का पूरक, जो कि 1-β है, को परीक्षण की "शक्ति" क
े रूप में
जाना जाता है और एक गलत शून्य परिकल्पना को सही ढंग से खारिज
करने की संभावना का प्रतिनिधित्व करता है (यानी, यदि कोई प्रभाव
मौजूद है तो उसका सही ढंग से पता लगाना)।
टाइप II त्रुटि का जोखिम नमूना आकार, प्रभाव आकार और महत्व क
े चुने
हुए स्तर (α) जैसे कारकों से प्रभावित होता है। बड़े नमूना आकार और बड़े
प्रभाव आकार आमतौर पर टाइप II त्रुटि क
े जोखिम को कम करते हैं।
टाइप II त्रुटियां उन स्थितियों में महत्वपूर्ण होती हैं जहां किसी प्रभाव का
पता लगाने में विफल होने पर वास्तविक दुनिया क
े परिणाम होते हैं, जैसे
कि नैदानिक ​
​
​
​
परीक्षणों में जहां जीवनरक्षक उपचार छ
ू ट सकता है।
प्रकार II त्रुटि का उदाहरण:
चिकित्सा अनुसंधान उदाहरण को जारी रखते हुए, मान लें कि शून्य
परिकल्पना (H0) अभी भी यह है कि दवा का कोई प्रभाव नहीं है, और
वैकल्पिक परिकल्पना (Ha) यह है कि दवा प्रभावी है।
शून्य परिकल्पना (H0): दवा का कोई प्रभाव नहीं पड़ता है।
वैकल्पिक परिकल्पना (हा): दवा प्रभावी है।
यदि, नैदानिक ​
​
परीक्षण क
े आधार पर, शोधकर्ता शून्य परिकल्पना (H0)
को अस्वीकार करने में विफल रहता है और निष्कर्ष निकालता है कि दवा
प्रभावी नहीं है, जबकि वास्तव में इसका सकारात्मक प्रभाव पड़ता है (दवा
बीमारी क
े इलाज में प्रभावी है), तो यह टाइप II त्रुटि होगी. इस मामले में,
मरीज संभावित जीवनरक्षक उपचार से चूक सकते हैं।
टाइप I और टाइप II त्रुटियों क
े बीच संबंध को निम्नानुसार संक्षेप में
प्रस्तुत किया जा सकता है:
टाइप I त्रुटियों को कम करने क
े लिए महत्व क
े स्तर (α) को बढ़ाने से
टाइप II त्रुटियों का खतरा बढ़ जाएगा।
नमूना आकार या प्रभाव आकार बढ़ाने से टाइप II त्रुटियों का जोखिम कम
हो सकता है जबकि संभवतः टाइप I त्रुटियों का जोखिम बढ़ सकता है।
Example Null Hypothesis is
False(Real)
Null Hypothesis is
True (Real)
Model thinks Null
Hypothesis is
False
True Positive False Positive
Type 1 (α Error)
Model thinks Null
Hypothesis is
True
False Negative
Type 2 (β Error)
True Negative
Example Case
Example Defendant is
guilty(Real)
Defendant is
innocent(Real)
Courts rules
defendant is
guilty
True Positive –
Criminal gets
convicted
False Positive
Type 1 (α Error) –
Innocent gets
convicted
Court rules
defendant is
innocents
False Negative
Type 2 (β Error)-
Criminal gets free
True Negative-
Innocent gets free
क
ु ल मिलाकर हम यह कह सकते हैं कि, टाइप I त्रुटियों में गलती से यह
निष्कर्ष निकालना शामिल है कि कोई प्रभाव या अंतर है, जबकि ऐसा नहीं
है, जबकि टाइप II त्रुटियों में वास्तव में मौजूद प्रभाव या अंतर का पता
लगाने में असफल होना शामिल है। इन दो प्रकार की त्रुटियों क
े बीच
संतुलन सांख्यिकीय परिकल्पना परीक्षण में एक महत्वपूर्ण विचार है, और
शोधकर्ताओं को अनुसंधान क
े विशिष्ट संदर्भ और परिणामों क
े आधार पर
दोनों प्रकार की त्रुटियों क
े जोखिम को कम करने क
े लिए महत्व क
े उचित
स्तर (α) और नमूना आकार का चयन करना चाहिए। .
द्वितीय. महत्व का स्तर (अल्फा, α): महत्व का स्तर, जिसे अक्सर α क
े
रूप में दर्शाया जाता है, टाइप I त्रुटि बनाने की संभावना को दर्शाता है (जब
यह सत्य हो तो शून्य परिकल्पना को अस्वीकार कर देता है)। आम तौर
पर उपयोग किए जाने वाले महत्व क
े स्तर 0.05 (5%) या 0.01 (1%)
होते हैं, लेकिन शोधकर्ता संदर्भ और आत्मविश्वास क
े वांछित स्तर क
े
आधार पर महत्व स्तर चुन सकते हैं।
उदाहरण: यदि आप α = 0.05 सेट करते हैं, तो आप टाइप I त्रुटि होने की
5% संभावना स्वीकार करने को तैयार हैं।
तृतीय. महत्वपूर्ण मान:
महत्वपूर्ण मूल्य एक सांख्यिकीय वितरण पर मूल्य हैं जो महत्वपूर्ण क्षेत्र
की सीमा को चिह्नित करते हैं। महत्वपूर्ण क्षेत्र एक परीक्षण आँकड़े क
े
मूल्यों की सीमा है जिसक
े आगे आप शून्य परिकल्पना को अस्वीकार कर
देंगे।
महत्वपूर्ण मान महत्व क
े चुने हुए स्तर (α), वांछित आत्मविश्वास स्तर
और उपयोग किए जा रहे सांख्यिकीय वितरण (उदाहरण क
े लिए, सामान्य
वितरण, टी वितरण, ची वर्ग वितरण) क
े आधार पर निर्धारित किए जाते
हैं।
महत्वपूर्ण मानों को चुना जाता है ताकि शून्य परिकल्पना को सत्य मानते
हुए महत्वपूर्ण क्षेत्र में एक परीक्षण आँकड़ा देखने की संभावना α क
े बराबर
हो।
चतुर्थ. स्वतंत्रता की डिग्री (डीएफ):
स्वतंत्रता की डिग्री किसी आँकड़े की अंतिम गणना में मूल्यों की संख्या का
प्रतिनिधित्व करती है जो भिन्न होने क
े लिए स्वतंत्र हैं।
स्वतंत्रता की डिग्री प्रदर्शन किए जा रहे सांख्यिकीय परीक्षण क
े लिए
विशिष्ट होती है। उदाहरण क
े लिए:
एक नमूना परीक्षण में, df = n 1, जहां n नमूना आकार है।
एक चिस्क्वेर्ड परीक्षण में, डीएफ तुलना की जा रही श्रेणियों या समूहों की
संख्या से संबंधित है।
स्वतंत्रता की डिग्री महत्वपूर्ण हैं क्योंकि वे सांख्यिकीय वितरण क
े आकार
को प्रभावित करती हैं और, परिणामस्वरूप, महत्वपूर्ण मूल्यों को प्रभावित
करती हैं।
वी. क्रिटिकल रीजन (अस्वीकृ ति क्षेत्र): क्रिटिकल रीजन परीक्षण आँकड़ों
क
े लिए मूल्यों की एक श्रृंखला है, यदि देखा गया परीक्षण आँकड़ा इसक
े
अंतर्गत आता है, तो शून्य परिकल्पना की अस्वीकृ ति हो जाती है।
महत्वपूर्ण क्षेत्र की सीमाएं महत्व क
े चुने हुए स्तर और उपयोग किए जा
रहे सांख्यिकीय वितरण द्वारा निर्धारित की जाती हैं।
उदाहरण: सामान्य वितरण में, यदि α = 0.05, तो चुने गए परीक्षण
आंकड़ों क
े आधार पर महत्वपूर्ण क्षेत्र वितरण का चरम 5% (प्रत्येक पूंछ
में 2.5%) हो सकता है।
VI. पी मान: पी मान एक परिकलित संभाव्यता है जो शून्य परिकल्पना
को सच मानते हुए देखे गए परिणामों की तुलना में चरम या अधिक चरम
परिणाम प्राप्त करने की संभावना को इंगित करता है। यदि पी मान चुने
गए महत्व क
े स्तर (α) से छोटा है, तो आप शून्य परिकल्पना को
अस्वीकार कर सकते हैं।
उदाहरण: यदि आप 0.03 और α = 0.05 क
े एपी मान की गणना करते हैं,
तो आप आमतौर पर शून्य परिकल्पना को अस्वीकार कर देंगे क्योंकि
0.03 <0.05।
परीक्षण की शक्ति बढ़ाने और टाइप-1 या टाइप-II त्रुटि क
े जोखिम को
कम करने क
े लिए सावधानी
1. निम्न महत्व स्तर चुनें (α):
महत्व स्तर (α) टाइप I त्रुटि होने की संभावना को दर्शाता है। निम्न α
चुनकर, आप शून्य परिकल्पना को अस्वीकार करना अधिक कठोर बना
देते हैं।
आमतौर पर उपयोग किए जाने वाले महत्व स्तर 0.05 (5%) या 0.01
(1%) हैं। उदाहरण क
े लिए, α को 0.01 तक कम करने से टाइप I त्रुटि
होने की संभावना कम हो जाती है, लेकिन इससे टाइप II त्रुटियों (झूठी
नकारात्मक) का खतरा बढ़ सकता है।
2. बोनफ
े रोनी सुधार का संचालन करें:
यदि आप एक साथ कई परिकल्पना परीक्षण कर रहे हैं (उदाहरण क
े लिए,
परीक्षणों क
े एक परिवार में), तो बोनफ
े रोनी सुधार लागू करने पर विचार
करें। यह सुधार कई तुलनाओं को ध्यान में रखते हुए महत्व स्तर को
समायोजित करता है, जिससे यह प्रत्येक व्यक्तिगत परीक्षण क
े लिए
अधिक कठोर हो जाता है।
बोनफ
े रोनी सुधार वांछित समग्र α स्तर को आयोजित परीक्षणों की संख्या
से विभाजित करता है।
3. नमूना आकार बढ़ाएँ:
एक बड़ा नमूना आकार अधिक डेटा प्रदान करता है, जिससे जनसंख्या
मापदंडों का अधिक सटीक अनुमान लगाया जा सकता है। बड़े नमूने क
े
साथ, डेटा में परिवर्तनशीलता कम हो सकती है, जिससे टाइप I त्रुटियों को
जन्म देने वाले चरम परिणामों को देखने की संभावना कम हो जाती है।
हालाँकि, लागत या व्यावहारिक बाधाओं क
े कारण नमूना आकार बढ़ाना
हमेशा संभव नहीं हो सकता है।
4. अध्ययन पूर्व शक्ति विश्लेषण करें:
अपना अध्ययन शुरू करने से पहले शक्ति विश्लेषण करने से आपको
वांछित स्तर की सांख्यिकीय शक्ति (झूठी शून्य परिकल्पना को सही ढंग
से खारिज करने की संभावना) प्राप्त करने क
े लिए आवश्यक न्यूनतम
नमूना आकार का अनुमान लगाने की अनुमति मिलती है।
एक अच्छी तरह से संचालित अध्ययन यह सुनिश्चित करक
े टाइप I और
टाइप II दोनों त्रुटियों को कम करता है कि सार्थक प्रभावों का पता लगाने
क
े लिए नमूना आकार पर्याप्त है।
5. वन टेल्ड टेस्ट का संयम से उपयोग करें:
दो टेल्ड परीक्षणों की तुलना में वन टेल्ड परीक्षणों में टाइप I त्रुटियों की
संभावना अधिक होती है क्योंकि वे प्रभाव की एक विशिष्ट दिशा पर ध्यान
क
ें द्रित करते हैं। वन-टेल्ड परीक्षणों का उपयोग क
े वल तभी करें जब आपक
े
पास ऐसा करने क
े लिए एक मजबूत सैद्धांतिक औचित्य हो।
6. बाहरी और चरम मूल्यों से सावधान रहें:
आपक
े डेटा में बाहरी या अत्यधिक मान महत्वपूर्ण परिणाम दे सकते हैं
जो समग्र जनसंख्या का प्रतिनिधित्व नहीं कर सकते हैं। सावधानीपूर्वक
जांच करें और, यदि आवश्यक हो, जांच करें और आउटलेर्स का समाधान
करें।
7. निष्कर्षों को दोहराएँ:
स्वतंत्र अध्ययनों में शोध निष्कर्षों को दोहराने से टाइप I त्रुटियों की
संभावना को कम करने में मदद मिल सकती है। यदि कई अध्ययनों में
एक ही परिणाम लगातार पाया जाता है, तो यह वैकल्पिक परिकल्पना क
े
पक्ष में साक्ष्य को मजबूत करता है।
8. अनुसंधान डिजाइन क
े प्रति सचेत रहें:
सुनिश्चित करें कि आपका शोध डिज़ाइन उस प्रश्न क
े लिए उपयुक्त है
जिसे आप संबोधित कर रहे हैं। पूर्वाग्रहों और टाइप I त्रुटियों क
े संभावित
स्रोतों को कम करने क
े लिए नियंत्रण समूह, यादृच्छिकीकरण, और
ब्लाइंडिंग जैसे कारकों पर विचार करें।
9. विशेषज्ञ सहकर्मी समीक्षा:
अपना अध्ययन करने या अपने निष्कर्ष प्रकाशित करने से पहले क्षेत्र क
े
विशेषज्ञों से सहकर्मी समीक्षा लें। अनुभवी शोधकर्ता मूल्यवान इनपुट
प्रदान कर सकते हैं और टाइप I त्रुटियों क
े संभावित स्रोतों की पहचान
करने में सहायता कर सकते हैं।
10. सांख्यिकीय शक्ति बढ़ाएँ:
सांख्यिकीय शक्ति एक झूठी अशक्त परिकल्पना को सही ढंग से
अस्वीकार करने की संभावना है (यानी, किसी प्रभाव क
े मौजूद होने पर
उसका पता लगाना)। उच्च शक्ति प्रकार II त्रुटियों क
े जोखिम को कम कर
देती है।
आप अधिक संवेदनशील सांख्यिकीय परीक्षण का उपयोग करक
े , उपयुक्त
माप उपकरण चुनकर और माप त्रुटि को कम करक
े शक्ति बढ़ा सकते हैं।
11. अधिक संवेदनशील परीक्षण या उपाय का प्रयोग करें:
सांख्यिकीय परीक्षणों या माप उपकरणों का उपयोग करें जो उस प्रभाव या
अंतर क
े प्रति अधिक संवेदनशील हों जिसे आप पहचानने का प्रयास कर
रहे हैं। संवेदनशीलता से वास्तविक प्रभावों का पता लगाने की संभावना
बढ़ जाती है।
12. डेटा संग्रह की अवधि बढ़ाएँ:
क
ु छ मामलों में, लंबी अवधि में डेटा एकत्र करने से अधिक महत्वपूर्ण
प्रभाव या अंतर सामने आ सकते हैं। अल्पावधि अध्ययनों में मौसमी
बदलाव या दीर्घकालिक रुझान स्पष्ट नहीं हो सकते हैं।
13. पोस्टहॉक पावर विश्लेषण करें:
डेटा संग्रह क
े बाद, देखे गए प्रभाव आकार और नमूना आकार क
े आधार
पर अपने अध्ययन की शक्ति का मूल्यांकन करने क
े लिए पोस्टहॉक
पावर विश्लेषण करें। यदि बिजली कम है, तो यह संक
े त दे सकता है कि
आपक
े अध्ययन में टाइप II त्रुटियों का उच्च जोखिम था।
14. अध्ययन को दोहराएँ:
परिणामों को सत्यापित करने क
े लिए अपने अध्ययन को स्वतंत्र रूप
से दोहराएं। यदि कई अध्ययनों में लगातार समान प्रभाव पाया जाता है,
तो यह साक्ष्य को मजबूत करता है और टाइप II त्रुटियों की संभावना को
कम करता है।
15. बायेसियन विश्लेषण पर विचार करें:
बायेसियन विश्लेषण पारंपरिक बारंबारवादी परिकल्पना परीक्षण क
े लिए
एक वैकल्पिक दृष्टिकोण प्रदान करता है। यह अनिश्चितता की मात्रा
निर्धारित करने और परिकल्पनाओं की पिछली संभावनाओं की गणना
करने की अनुमति देता है। बायेसियन विधियाँ टाइप II त्रुटियों की
संभावना क
े बारे में जानकारी प्रदान कर सकती हैं।
16. चरों को मिलाने क
े लिए नियंत्रण:
सुनिश्चित करें कि आपका अध्ययन डिज़ाइन संभावित भ्रमित करने वाले
चरों पर नियंत्रण रखता है जो उस प्रभाव को कमजोर कर सकते हैं जिसका
आप पता लगाने का प्रयास कर रहे हैं। भ्रमित करने वाले चर प्रकार II
त्रुटियों क
े जोखिम को बढ़ा सकते हैं।
17. संवेदनशीलता विश्लेषण करें:
विभिन्न परिदृश्यों में आपक
े परिणाम कितने मजबूत हैं, इसका आकलन
करने क
े लिए अलग-अलग धारणाओं या मॉडल मापदंडों क
े आधार पर
संवेदनशीलता विश्लेषण करें। इससे उन स्थितियों की पहचान करने में
मदद मिल सकती है जिनक
े तहत किसी प्रभाव का पता चलने की अधिक
संभावना है।

More Related Content

More from Vikramjit Singh

Correlational Research in Detail with all Steps- Dr. Vikramjit Singh.pdf
Correlational Research in Detail with all Steps- Dr. Vikramjit  Singh.pdfCorrelational Research in Detail with all Steps- Dr. Vikramjit  Singh.pdf
Correlational Research in Detail with all Steps- Dr. Vikramjit Singh.pdfVikramjit Singh
 
Vikramjit Singh-Descriptive Research-Survey research.pdf
Vikramjit Singh-Descriptive Research-Survey research.pdfVikramjit Singh-Descriptive Research-Survey research.pdf
Vikramjit Singh-Descriptive Research-Survey research.pdfVikramjit Singh
 
Basics of Hypothesis_ Vikramjit Singh.pdf
Basics of Hypothesis_ Vikramjit Singh.pdfBasics of Hypothesis_ Vikramjit Singh.pdf
Basics of Hypothesis_ Vikramjit Singh.pdfVikramjit Singh
 
5E model lesson plan.pdf
5E model lesson plan.pdf5E model lesson plan.pdf
5E model lesson plan.pdfVikramjit Singh
 
Experiments and Prospects of Globalisation Towards Higher Education in India
Experiments and Prospects of Globalisation Towards Higher Education in IndiaExperiments and Prospects of Globalisation Towards Higher Education in India
Experiments and Prospects of Globalisation Towards Higher Education in IndiaVikramjit Singh
 
5E model lesson plan.pdf
5E model lesson plan.pdf5E model lesson plan.pdf
5E model lesson plan.pdfVikramjit Singh
 
E-Content-MCC-08- ICON Model.pdf
E-Content-MCC-08- ICON Model.pdfE-Content-MCC-08- ICON Model.pdf
E-Content-MCC-08- ICON Model.pdfVikramjit Singh
 
E-Content-MCC-07-The System Analysis Approach to Curriculum Development.pdf
E-Content-MCC-07-The System Analysis Approach  to Curriculum Development.pdfE-Content-MCC-07-The System Analysis Approach  to Curriculum Development.pdf
E-Content-MCC-07-The System Analysis Approach to Curriculum Development.pdfVikramjit Singh
 
E-Content-MCC-08-Portfolio Assessment.pdf
E-Content-MCC-08-Portfolio Assessment.pdfE-Content-MCC-08-Portfolio Assessment.pdf
E-Content-MCC-08-Portfolio Assessment.pdfVikramjit Singh
 
E-Content-MCC-08-5 E Model-Hindi.pdf
E-Content-MCC-08-5 E Model-Hindi.pdfE-Content-MCC-08-5 E Model-Hindi.pdf
E-Content-MCC-08-5 E Model-Hindi.pdfVikramjit Singh
 
E-Content-MCC-07- Humanistic Models of Curriculum Development.pdf
E-Content-MCC-07- Humanistic Models of Curriculum Development.pdfE-Content-MCC-07- Humanistic Models of Curriculum Development.pdf
E-Content-MCC-07- Humanistic Models of Curriculum Development.pdfVikramjit Singh
 
E-Content-MCC-07-Criteria of an Effective Curriculum.pdf
E-Content-MCC-07-Criteria of an Effective Curriculum.pdfE-Content-MCC-07-Criteria of an Effective Curriculum.pdf
E-Content-MCC-07-Criteria of an Effective Curriculum.pdfVikramjit Singh
 
E-Content-MCC-07-Curriculum Implemantation-India.pdf
E-Content-MCC-07-Curriculum Implemantation-India.pdfE-Content-MCC-07-Curriculum Implemantation-India.pdf
E-Content-MCC-07-Curriculum Implemantation-India.pdfVikramjit Singh
 
E-Content- MSC-05-Challenges of ICT Integration-Copy.pdf
E-Content- MSC-05-Challenges of ICT Integration-Copy.pdfE-Content- MSC-05-Challenges of ICT Integration-Copy.pdf
E-Content- MSC-05-Challenges of ICT Integration-Copy.pdfVikramjit Singh
 
E-Content-MCC-07- Issues and Trends in Curriculum Development.pdf
E-Content-MCC-07- Issues and Trends in Curriculum Development.pdfE-Content-MCC-07- Issues and Trends in Curriculum Development.pdf
E-Content-MCC-07- Issues and Trends in Curriculum Development.pdfVikramjit Singh
 
E-Content- MCC-07- Taba Model of Curriculum Development.pdf
E-Content- MCC-07- Taba Model of Curriculum Development.pdfE-Content- MCC-07- Taba Model of Curriculum Development.pdf
E-Content- MCC-07- Taba Model of Curriculum Development.pdfVikramjit Singh
 
E-Content-MCC-08-5 E Model and Lesson Plan Format.pdf
E-Content-MCC-08-5 E Model and Lesson Plan Format.pdfE-Content-MCC-08-5 E Model and Lesson Plan Format.pdf
E-Content-MCC-08-5 E Model and Lesson Plan Format.pdfVikramjit Singh
 
E-Content- MCC-07-Approaches to Curriculum Development & Tyler Model.pdf
E-Content- MCC-07-Approaches to Curriculum Development & Tyler Model.pdfE-Content- MCC-07-Approaches to Curriculum Development & Tyler Model.pdf
E-Content- MCC-07-Approaches to Curriculum Development & Tyler Model.pdfVikramjit Singh
 
E-Content- MCC-07 - Curriculum Construction Approaches.pdf
E-Content- MCC-07 - Curriculum Construction Approaches.pdfE-Content- MCC-07 - Curriculum Construction Approaches.pdf
E-Content- MCC-07 - Curriculum Construction Approaches.pdfVikramjit Singh
 

More from Vikramjit Singh (20)

Correlational Research in Detail with all Steps- Dr. Vikramjit Singh.pdf
Correlational Research in Detail with all Steps- Dr. Vikramjit  Singh.pdfCorrelational Research in Detail with all Steps- Dr. Vikramjit  Singh.pdf
Correlational Research in Detail with all Steps- Dr. Vikramjit Singh.pdf
 
Vikramjit Singh-Descriptive Research-Survey research.pdf
Vikramjit Singh-Descriptive Research-Survey research.pdfVikramjit Singh-Descriptive Research-Survey research.pdf
Vikramjit Singh-Descriptive Research-Survey research.pdf
 
Basics of Hypothesis_ Vikramjit Singh.pdf
Basics of Hypothesis_ Vikramjit Singh.pdfBasics of Hypothesis_ Vikramjit Singh.pdf
Basics of Hypothesis_ Vikramjit Singh.pdf
 
5E model lesson plan.pdf
5E model lesson plan.pdf5E model lesson plan.pdf
5E model lesson plan.pdf
 
Micro Lesson Plan
Micro Lesson PlanMicro Lesson Plan
Micro Lesson Plan
 
Experiments and Prospects of Globalisation Towards Higher Education in India
Experiments and Prospects of Globalisation Towards Higher Education in IndiaExperiments and Prospects of Globalisation Towards Higher Education in India
Experiments and Prospects of Globalisation Towards Higher Education in India
 
5E model lesson plan.pdf
5E model lesson plan.pdf5E model lesson plan.pdf
5E model lesson plan.pdf
 
E-Content-MCC-08- ICON Model.pdf
E-Content-MCC-08- ICON Model.pdfE-Content-MCC-08- ICON Model.pdf
E-Content-MCC-08- ICON Model.pdf
 
E-Content-MCC-07-The System Analysis Approach to Curriculum Development.pdf
E-Content-MCC-07-The System Analysis Approach  to Curriculum Development.pdfE-Content-MCC-07-The System Analysis Approach  to Curriculum Development.pdf
E-Content-MCC-07-The System Analysis Approach to Curriculum Development.pdf
 
E-Content-MCC-08-Portfolio Assessment.pdf
E-Content-MCC-08-Portfolio Assessment.pdfE-Content-MCC-08-Portfolio Assessment.pdf
E-Content-MCC-08-Portfolio Assessment.pdf
 
E-Content-MCC-08-5 E Model-Hindi.pdf
E-Content-MCC-08-5 E Model-Hindi.pdfE-Content-MCC-08-5 E Model-Hindi.pdf
E-Content-MCC-08-5 E Model-Hindi.pdf
 
E-Content-MCC-07- Humanistic Models of Curriculum Development.pdf
E-Content-MCC-07- Humanistic Models of Curriculum Development.pdfE-Content-MCC-07- Humanistic Models of Curriculum Development.pdf
E-Content-MCC-07- Humanistic Models of Curriculum Development.pdf
 
E-Content-MCC-07-Criteria of an Effective Curriculum.pdf
E-Content-MCC-07-Criteria of an Effective Curriculum.pdfE-Content-MCC-07-Criteria of an Effective Curriculum.pdf
E-Content-MCC-07-Criteria of an Effective Curriculum.pdf
 
E-Content-MCC-07-Curriculum Implemantation-India.pdf
E-Content-MCC-07-Curriculum Implemantation-India.pdfE-Content-MCC-07-Curriculum Implemantation-India.pdf
E-Content-MCC-07-Curriculum Implemantation-India.pdf
 
E-Content- MSC-05-Challenges of ICT Integration-Copy.pdf
E-Content- MSC-05-Challenges of ICT Integration-Copy.pdfE-Content- MSC-05-Challenges of ICT Integration-Copy.pdf
E-Content- MSC-05-Challenges of ICT Integration-Copy.pdf
 
E-Content-MCC-07- Issues and Trends in Curriculum Development.pdf
E-Content-MCC-07- Issues and Trends in Curriculum Development.pdfE-Content-MCC-07- Issues and Trends in Curriculum Development.pdf
E-Content-MCC-07- Issues and Trends in Curriculum Development.pdf
 
E-Content- MCC-07- Taba Model of Curriculum Development.pdf
E-Content- MCC-07- Taba Model of Curriculum Development.pdfE-Content- MCC-07- Taba Model of Curriculum Development.pdf
E-Content- MCC-07- Taba Model of Curriculum Development.pdf
 
E-Content-MCC-08-5 E Model and Lesson Plan Format.pdf
E-Content-MCC-08-5 E Model and Lesson Plan Format.pdfE-Content-MCC-08-5 E Model and Lesson Plan Format.pdf
E-Content-MCC-08-5 E Model and Lesson Plan Format.pdf
 
E-Content- MCC-07-Approaches to Curriculum Development & Tyler Model.pdf
E-Content- MCC-07-Approaches to Curriculum Development & Tyler Model.pdfE-Content- MCC-07-Approaches to Curriculum Development & Tyler Model.pdf
E-Content- MCC-07-Approaches to Curriculum Development & Tyler Model.pdf
 
E-Content- MCC-07 - Curriculum Construction Approaches.pdf
E-Content- MCC-07 - Curriculum Construction Approaches.pdfE-Content- MCC-07 - Curriculum Construction Approaches.pdf
E-Content- MCC-07 - Curriculum Construction Approaches.pdf
 

Vikramjit Singh-Hypothesis Testing Basics_ Errors,Df,Power of Test,Level of Sig.pdf

  • 1. Hypothesis Testing – Level of Significance, degrees of freedom, Types of Error, Power of Test Compiled By: Dr. Vikramjit Singh In research, when you have formulated a research hypothesis, it's essential to test its validity or accuracy through a process called hypothesis testing. Hypothesis testing involves comparing the observed data from your study to what you would expect to observe if your hypothesis were true. The parameters you test are critical aspects of your hypothesis and include the following: 1. Formulate the Research Question: Clearly define the research question or problem that you want to investigate. What specific aspect of the problem are you interested in studying? 2. Identify Variables: Identify the variables involved in your research question. Variables are characteristics, properties, or factors that can vary and are central to your study. They can be independent (predictor) variables and dependent (outcome) variables. 3. Define Operational Definitions: For each variable, provide a precise and clear operational definition. This definition describes how you will measure or manipulate
  • 2. the variable in concrete, observable terms. Operational definitions translate abstract concepts into specific actions or measurements. Example: If you're studying "academic performance," you might operationalize it as "average test scores in mathematics and science over a oneyear period." 4. Develop a Research Hypothesis: Based on your operational definitions, formulate a research hypothesis that specifies the expected relationship between the variables. This hypothesis should be testable using empirical data. Example: "Increasing the amount of time spent studying (independent variable) will lead to higher average test scores in mathematics and science (dependent variable)." 5. Design the Research Study: Develop the research methodology and design the study to test your operational hypothesis. Determine the data collection methods, such as surveys, experiments, observations, or archival data analysis, based on your operational definitions. Example: If you want to test the hypothesis mentioned above, you might design an experiment where you randomly assign participants to study for different amounts of time and then measure their test scores. 6. Collect Data:
  • 3. Implement the research study according to your design and collect relevant data as per your operational definitions. Ensure that your data collection procedures align with your operationalizations. 7. Analyze Data: Use appropriate statistical or analytical techniques to analyze the collected data. The analysis should test whether the observed results are consistent with the predictions made in your operational hypothesis. 8. Draw Conclusions: Based on the data analysis, draw conclusions about whether the observed results support or contradict your operational hypothesis. Example: If the data analysis shows that participants who studied more indeed had higher average test scores, then your operational hypothesis is supported. 9. Report Findings: Communicate your findings in a clear and concise manner through research reports, presentations, or publications. Describe how you operationalized your variables and how your study's results relate to your operational hypothesis. Ø Key parameters involved in Hypothesis testing :
  • 4. To test a framed hypothesis we need to formulate it in operational term either in null form or alternative form. Operational hypotheses are vital in research because they bridge the gap between abstract concepts and concrete measurements or manipulations. By specifying how variables will be treated in a study, researchers ensure that their research is both valid and replicable. This systematic approach to hypothesis testing contributes to the overall rigor of scientific research. Example: If you hypothesize that the new method of teaching is effective – The null hypothesis (H0) can be – "There is no significant difference between the mean gain scores in the achievement test of experimental group learning through blended learning and the control group learning through the traditional learning approach" Whereas the alternative hypothesis (Ha) can be "There is significant difference between the mean gain scores in the achievement test of experimental group learning through blended learning and the control group learning through the traditional learning approach" I. Test Statistic: The test statistic is a numerical value that summarizes the information from your data and helps you determine whether you should reject the null hypothesis. The choice of test statistic depends on the research design and the type of data you are analyzing (e.g., t-test, chi-squared test, Ftest, correlation coefficient).
  • 5. Example: In a ttest comparing two means (e.g., the effectiveness of two methods), the test statistic is the tvalue. Types of error in hypothesis testing: 1. Type I Error (False Positive): A Type I error occurs when the null hypothesis (H0) is rejected when it is actually true. In other words, you conclude that there is a significant effect or difference when there isn't one in reality. The probability of committing a Type I error is denoted by the symbol α (alpha) and is known as the level of significance. Commonly used levels of significance are 0.05 (5%) or 0.01 (1%). Choosing a lower α reduces the chance of making a Type I error but may increase the risk of Type II error. Type I errors are often considered more serious in certain contexts, such as medical testing, where false positives can lead to unnecessary treatments or interventions. Example of Type I Error: Suppose a medical researcher is testing a new drug for a particular disease. The null hypothesis (H0) states that the drug has no effect (i.e., it's not better than a placebo), and the alternative hypothesis (Ha) is that the drug is effective. Null Hypothesis (H0): The drug has no effect. Alternative Hypothesis (Ha): The drug is effective.
  • 6. If, based on a clinical trial, the researcher incorrectly rejects the null hypothesis (H0) and concludes that the drug is effective when, in fact, it isn't (the drug is just a placebo), this would be a Type I error. In this case, patients might be exposed to unnecessary treatment with no actual benefit. 2. Type II Error (False Negative): A Type II error occurs when the null hypothesis (H0) is not rejected when it is actually false. In other words, you fail to detect a significant effect or difference when there is one in reality. The probability of committing a Type II error is often denoted by the symbol β (beta). The complement of β, which is 1-β, is referred to as the "power" of the test and represents the probability of correctly rejecting a false null hypothesis (i.e., correctly detecting an effect if it exists). The risk of Type II error is influenced by factors such as the sample size, the effect size, and the chosen level of significance (α). Larger sample sizes and larger effect sizes generally reduce the risk of Type II error. Type II errors are significant in situations where failing to detect an effect has real world consequences, such as in clinical trials where a lifesaving treatment might be missed. Example of Type II Error:
  • 7. Continuing with the medical research example, let's say the null hypothesis (H0) is still that the drug has no effect, and the alternative hypothesis (Ha) is that the drug is effective. Null Hypothesis (H0): The drug has no effect. Alternative Hypothesis (Ha): The drug is effective. If, based on a clinical trial, the researcher fails to reject the null hypothesis (H0) and concludes that the drug is not effective when, in reality, it does have a positive effect (the drug is effective in treating the disease), this would be a Type II error. In this case, patients might miss out on a potentially lifesaving treatment. The relationship between Type I and Type II errors can be summarized as follows: Increasing the level of significance (α) to reduce Type I errors will increase the risk of Type II errors. Increasing the sample size or effect size can reduce the risk of Type II errors while possibly increasing the risk of Type I errors. Example Null Hypothesis is False(Real) Null Hypothesis is True (Real) Model thinks Null Hypothesis is False True Positive False Positive Type 1 (α Error)
  • 8. Model thinks Null Hypothesis is True False Negative Type 2 (β Error) True Negative Example Case Example Defendant is guilty(Real) Defendant is innocent(Real) Courts rules defendant is guilty True Positive – Criminal gets convicted False Positive Type 1 (α Error) – Innocent gets convicted Court rules defendant is innocents False Negative Type 2 (β Error)- Criminal gets free True Negative- Innocent gets free
  • 9. Overall we can say that, Type I errors involve mistakenly concluding that there is an effect or difference when there isn't, while Type II errors involve failing to detect an effect or difference that actually exists. The balance between these two types of errors is a critical consideration in statistical hypothesis testing, and researchers must choose appropriate levels of significance (α) and sample sizes to minimize the risk of both types of errors based on the specific context and consequences of the research. II. Level of Significance (Alpha, α): The level of significance, often denoted as α, represents the probability of making a Type I error
  • 10. (rejecting the null hypothesis when it's true). Commonly used levels of significance are 0.05 (5%) or 0.01 (1%), but researchers can choose a significance level based on the context and desired level of confidence. Example: If you set α = 0.05, you are willing to accept a 5% chance of making a Type I error. III. Critical Value: Critical values are values on a statistical distribution that mark the boundary of the critical region. The critical region is the range of values of a test statistic beyond which you would reject the null hypothesis. Critical values are determined based on the chosen level of significance (α), the desired confidence level, and the statistical distribution being used (e.g., normal distribution, t distribution, chi squared distribution). The critical value(s) are chosen so that the probability of observing a test statistic in the critical region, assuming the null hypothesis is true, is equal to α. IV. Degrees of Freedom (df): Degrees of freedom represent the number of values in the final calculation of a statistic that are free to vary. Degrees of freedom are specific to the statistical test being performed. For example: In a onesample ttest, df = n 1, where n is the sample size.
  • 11. In a chisquared test, df is related to the number of categories or groups being compared. Degrees of freedom are important because they affect the shape of the statistical distribution and, consequently, the critical values. V. Critical Region (Rejection Region): The critical region is a range of values for the test statistic that, if the observed test statistic falls within it, leads to the rejection of the null hypothesis. The boundaries of the critical region are determined by the chosen level of significance and the statistical distribution being used. Example: In a normal distribution, if α = 0.05, the critical region might be the extreme 5% of the distribution (2.5% in each tail) based on the chosen test statistic. VI. P value: The p value is a calculated probability that indicates the likelihood of obtaining results as extreme as or more extreme than those observed, assuming the null hypothesis is true. If the p value is smaller than the chosen level of significance (α), you may reject the null hypothesis. Example: If you calculate a p value of 0.03 and α = 0.05, you would typically reject the null hypothesis because 0.03 < 0.05.
  • 12. Precaution for increasing the Power of the test and lower the risk of Type-1 or Type –II error 1. Choose a Lower Significance Level (α): The significance level (α) represents the probability of making a Type I error. By choosing a lower α, you make it more stringent to reject the null hypothesis. Commonly used significance levels are 0.05 (5%) or 0.01 (1%). Lowering α to 0.01, for example, reduces the probability of making a Type I error, but it may increase the risk of Type II errors (false negatives). 2. Conduct a Bonferroni Correction: If you are performing multiple hypothesis tests simultaneously (e.g., in a family of tests), consider applying a Bonferroni correction. This correction adjusts the significance level to account for multiple comparisons, making it more stringent for each individual test. The Bonferroni correction divides the desired overall α level by the number of tests being conducted. 3. Increase Sample Size: A larger sample size provides more data, which can lead to a more accurate estimation of population parameters. With a larger sample, the
  • 13. variability in the data may decrease, making it less likely to observe extreme results that lead to Type I errors. However, increasing the sample size might not always be feasible due to cost or practical constraints. 4. Perform Pre study Power Analysis: Conducting a power analysis before starting your study allows you to estimate the minimum sample size needed to achieve a desired level of statistical power (the probability of correctly rejecting a false null hypothesis). A well powered study minimizes both Type I and Type II errors by ensuring that the sample size is adequate to detect meaningful effects. 5. Use One Tailed Tests Sparingly: One tailed tests are more likely to result in Type I errors than two tailed tests because they focus on a specific direction of effect. Use one tailed tests only when you have a strong theoretical justification for doing so. 6. Be Cautious with Outliers and Extreme Values: Outliers or extreme values in your data can lead to significant results that might not be representative of the overall population. Carefully examine and, if necessary, investigate and address outliers.
  • 14. 7. Replicate Findings: Replicating research findings in independent studies can help reduce the likelihood of Type I errors. If the same result is consistently found across multiple studies, it strengthens the evidence in favor of the alternative hypothesis. 8. Be Mindful of Research Design: Ensure that your research design is appropriate for the question you are addressing. Consider factors such as control groups, randomization, and blinding to minimize biases and potential sources of Type I errors. 9. Expert Peer Review: Seek peer review from experts in the field before conducting your study or publishing your findings. Experienced researchers can provide valuable input and help identify potential sources of Type I errors. 10. Increase Statistical Power: Statistical power is the probability of correctly rejecting a false null hypothesis (i.e., detecting an effect when it exists). A higher power reduces the risk of Type II errors.
  • 15. You can increase power by using a more sensitive statistical test, choosing appropriate measurement instruments, and reducing measurement error. 11. Use More Sensitive Tests or Measures: Utilize statistical tests or measurement instruments that are more sensitive to the effect or difference you are trying to detect. Sensitivity increases the likelihood of detecting real effects. 12. Extend the Duration of Data Collection: In some cases, collecting data over a longer period may reveal more significant effects or differences. Seasonal variations or longterm trends may not be apparent in shortduration studies. 13. Perform Posthoc Power Analysis: After data collection, conduct a posthoc power analysis to evaluate the power of your study based on the observed effect size and sample size. If power is low, it may indicate that your study had a high risk of Type II errors. 14. Replicate the Study:
  • 16. Replicate your study independently to verify the results. If multiple studies consistently find the same effect, it strengthens the evidence and reduces the likelihood of Type II errors. 15. Consider Bayesian Analysis: Bayesian analysis offers an alternative approach to traditional frequentist hypothesis testing. It allows for the quantification of uncertainty and the calculation of posterior probabilities of hypotheses. Bayesian methods can provide insight into the likelihood of Type II errors. 16. Control for Confounding Variables: Ensure that your study design controls for potential confounding variables that could weaken the effect you are trying to detect. Confounding variables can increase the risk of Type II errors. 17. Perform Sensitivity Analyses: Conduct sensitivity analyses by varying assumptions or model parameters to assess how robust your results are to different scenarios. This can help identify the conditions under which an effect is more likely to be detected.
  • 17. परिकल्पना परीक्षण - महत्व का स्तर, स्वतंत्रता की डिग्री, त्रुटि क े प्रकार, परीक्षण की शक्ति संकलन: डॉ. विक्रमजीत सिंह शोध में, जब आपने एक शोध परिकल्पना तैयार की है, तो परिकल्पना परीक्षण नामक प्रक्रिया क े माध्यम से इसकी वैधता या सटीकता का परीक्षण करना आवश्यक है। परिकल्पना परीक्षण में आपक े अध्ययन से देखे गए डेटा की तुलना इस बात से की जाती है कि यदि आपकी परिकल्पना सत्य थी तो आप क्या देखने की उम्मीद करेंगे। आपक े द्वारा परीक्षण किए गए पैरामीटर आपकी परिकल्पना क े महत्वपूर्ण पहलू हैं और इनमें निम्नलिखित शामिल हैं: 1. शोध प्रश्न तैयार करें: उस शोध प्रश्न या समस्या को स्पष्ट रूप से परिभाषित करें जिसकी आप जांच करना चाहते हैं। आप समस्या क े किस विशिष्ट पहलू का अध्ययन करने में रुचि रखते हैं? 2. चरों को पहचानें: अपने शोध प्रश्न में शामिल चरों को पहचानें। चर वे विशेषताएँ, गुण या कारक हैं जो भिन्न हो सकते हैं और आपक े अध्ययन क े क ें द्र में हैं। वे स्वतंत्र (भविष्यवक्ता) चर और आश्रित (परिणाम) चर हो सकते हैं। 3. परिचालन परिभाषाएँ परिभाषित करें: प्रत्येक चर क े लिए, एक सटीक और स्पष्ट परिचालन परिभाषा प्रदान करें। यह परिभाषा बताती है कि आप चर को ठोस, अवलोकन योग्य शब्दों में क ै से मापेंगे या उसमें हेरफ े र करेंगे। परिचालनात्मक परिभाषाएँ अमूर्त अवधारणाओं को विशिष्ट क्रियाओं या मापों में परिवर्तित करती हैं।
  • 18. उदाहरण: यदि आप "शैक्षणिक प्रदर्शन" का अध्ययन कर रहे हैं, तो आप इसे "एक वर्ष की अवधि में गणित और विज्ञान में औसत परीक्षण स्कोर" क े रूप में संचालित कर सकते हैं। 4. एक शोध परिकल्पना विकसित करें: अपनी परिचालन परिभाषाओं क े आधार पर, एक शोध परिकल्पना तैयार करें जो चर क े बीच अपेक्षित संबंध को निर्दिष्ट करती है। यह परिकल्पना अनुभवजन्य डेटा का उपयोग करक े परीक्षण योग्य होनी चाहिए। उदाहरण: "अध्ययन में बिताए गए समय (स्वतंत्र चर) को बढ़ाने से गणित और विज्ञान (आश्रित चर) में औसत परीक्षण स्कोर में वृद्धि होगी।" 5. अनुसंधान अध्ययन डिजाइन करें: अनुसंधान पद्धति विकसित करें और अपनी परिचालन परिकल्पना का परीक्षण करने क े लिए अध्ययन डिजाइन करें। अपनी परिचालन परिभाषाओं क े आधार पर डेटा संग्रह विधियों, जैसे सर्वेक्षण, प्रयोग, अवलोकन, या अभिलेखीय डेटा विश्लेषण का निर्धारण करें। उदाहरण: यदि आप ऊपर उल्लिखित परिकल्पना का परीक्षण करना चाहते हैं, तो आप एक प्रयोग डिज़ाइन कर सकते हैं जहां आप प्रतिभागियों को अलग-अलग समय क े लिए अध्ययन करने क े लिए यादृच्छिक रूप से नियुक्त करते हैं और फिर उनक े परीक्षण स्कोर को मापते हैं। 6. डेटा एकत्र करें: अपने डिज़ाइन क े अनुसार शोध अध्ययन लागू करें और अपनी परिचालन परिभाषाओं क े अनुसार प्रासंगिक डेटा एकत्र करें। सुनिश्चित करें कि आपकी डेटा संग्रह प्रक्रियाएँ आपक े परिचालन क े साथ संरेखित हों। 7. डेटा का विश्लेषण करें:
  • 19. एकत्रित डेटा का विश्लेषण करने क े लिए उपयुक्त सांख्यिकीय या विश्लेषणात्मक तकनीकों का उपयोग करें। विश्लेषण को यह परीक्षण करना चाहिए कि क्या देखे गए परिणाम आपकी परिचालन परिकल्पना में की गई भविष्यवाणियों क े अनुरूप हैं। 8. निष्कर्ष निकालें: डेटा विश्लेषण क े आधार पर, इस बारे में निष्कर्ष निकालें कि देखे गए परिणाम आपकी परिचालन परिकल्पना का समर्थन करते हैं या खंडन करते हैं। उदाहरण: यदि डेटा विश्लेषण से पता चलता है कि जिन प्रतिभागियों ने अधिक अध्ययन किया, उनक े औसत परीक्षण स्कोर वास्तव में अधिक थे, तो आपकी परिचालन परिकल्पना समर्थित है। 9. रिपोर्ट क े निष्कर्ष: शोध रिपोर्टों, प्रस्तुतियों या प्रकाशनों क े माध्यम से अपने निष्कर्षों को स्पष्ट और संक्षिप्त तरीक े से संप्रेषित करें। वर्णन करें कि आपने अपने वेरिएबल्स को क ै से संचालित किया और आपक े अध्ययन क े परिणाम आपकी परिचालन परिकल्पना से क ै से संबंधित हैं। Ø परिकल्पना परीक्षण में शामिल प्रमुख पैरामीटर: किसी फ़्र े मयुक्त परिकल्पना का परीक्षण करने क े लिए हमें इसे क्रियात्मक रूप में या तो शून्य रूप में या वैकल्पिक रूप में तैयार करने की आवश्यकता है। अनुसंधान में संचालनात्मक परिकल्पनाएँ महत्वपूर्ण हैं क्योंकि वे अमूर्त अवधारणाओं और ठोस माप या जोड़-तोड़ क े बीच क े अंतर को पाटती हैं। यह निर्दिष्ट करक े कि किसी अध्ययन में चरों क े साथ क ै से व्यवहार किया जाएगा, शोधकर्ता यह सुनिश्चित करते हैं कि उनका शोध वैध और अनुकरणीय दोनों है। परिकल्पना परीक्षण क े लिए यह
  • 20. व्यवस्थित दृष्टिकोण वैज्ञानिक अनुसंधान की समग्र कठोरता में योगदान देता है। उदाहरण: यदि आप परिकल्पना करते हैं कि शिक्षण की नई पद्धति प्रभावी है - शून्य परिकल्पना (H0) हो सकती है - "मिश्रित शिक्षण क े माध्यम से प्रयोगात्मक समूह सीखने और पारंपरिक शिक्षण दृष्टिकोण क े माध्यम से नियंत्रण समूह सीखने क े उपलब्धि परीक्षण में औसत लाभ स्कोर क े बीच कोई महत्वपूर्ण अंतर नहीं है" जबकि वैकल्पिक परिकल्पना (Ha) हो सकती है "मिश्रित शिक्षण क े माध्यम से प्रयोगात्मक समूह सीखने और पारंपरिक शिक्षण दृष्टिकोण क े माध्यम से नियंत्रण समूह सीखने क े उपलब्धि परीक्षण में औसत लाभ स्कोर क े बीच महत्वपूर्ण अंतर है" I. परीक्षण आँकड़ा: परीक्षण आँकड़ा एक संख्यात्मक मान है जो आपक े डेटा से जानकारी का सारांश देता है और आपको यह निर्धारित करने में मदद करता है कि आपको शून्य परिकल्पना को अस्वीकार करना चाहिए या नहीं। परीक्षण आँकड़ों का चुनाव अनुसंधान डिज़ाइन और आपक े द्वारा विश्लेषण किए जा रहे डेटा क े प्रकार पर निर्भर करता है (उदाहरण क े लिए, टी-टेस्ट, ची-स्क्वायर टेस्ट, एफटीटेस्ट, सहसंबंध गुणांक)। उदाहरण: दो साधनों (उदाहरण क े लिए, दो तरीकों की प्रभावशीलता) की तुलना करने वाले परीक्षण में, परीक्षण आँकड़ा मूल्य है। परिकल्पना परीक्षण में त्रुटि क े प्रकार: 1. टाइप I त्रुटि (गलत सकारात्मक): टाइप I त्रुटि तब होती है जब शून्य परिकल्पना (H0) को अस्वीकार कर दिया जाता है जबकि यह वास्तव में सत्य है। दूसरे शब्दों में, आप यह निष्कर्ष निकालते हैं कि एक महत्वपूर्ण प्रभाव या अंतर है जब वास्तविकता में ऐसा कोई नहीं है।
  • 21. टाइप I त्रुटि होने की संभावना को प्रतीक α (अल्फा) द्वारा दर्शाया जाता है और इसे महत्व क े स्तर क े रूप में जाना जाता है। आमतौर पर उपयोग किए जाने वाले महत्व क े स्तर 0.05 (5%) या 0.01 (1%) हैं। कम α चुनने से टाइप I त्रुटि होने की संभावना कम हो जाती है लेकिन टाइप II त्रुटि का खतरा बढ़ सकता है। टाइप I त्रुटियों को अक्सर क ु छ संदर्भों में अधिक गंभीर माना जाता है, जैसे कि चिकित्सा परीक्षण, जहां झूठी सकारात्मकता अनावश्यक उपचार या हस्तक्षेप का कारण बन सकती है। प्रकार I त्रुटि का उदाहरण: मान लीजिए कि एक चिकित्सा शोधकर्ता किसी विशेष बीमारी क े लिए एक नई दवा का परीक्षण कर रहा है। शून्य परिकल्पना (H0) बताती है कि दवा का कोई प्रभाव नहीं है (यानी, यह प्लेसबो से बेहतर नहीं है), और वैकल्पिक परिकल्पना (Ha) यह है कि दवा प्रभावी है। शून्य परिकल्पना (H0): दवा का कोई प्रभाव नहीं पड़ता है। वैकल्पिक परिकल्पना (हा): दवा प्रभावी है। यदि, नैदानिक ​ ​ परीक्षण क े आधार पर, शोधकर्ता शून्य परिकल्पना (H0) को गलत तरीक े से खारिज कर देता है और निष्कर्ष निकालता है कि दवा प्रभावी है, जबकि वास्तव में ऐसा नहीं है (दवा सिर्फ एक प्लेसबो है), तो यह टाइप I त्रुटि होगी . इस मामले में, रोगियों को बिना किसी वास्तविक लाभ क े अनावश्यक उपचार का सामना करना पड़ सकता है। 2. टाइप II त्रुटि (गलत नकारात्मक): टाइप II त्रुटि तब होती है जब शून्य परिकल्पना (H0) को अस्वीकार नहीं किया जाता है जबकि यह वास्तव में गलत है। दूसरे शब्दों में, जब वास्तविकता में कोई महत्वपूर्ण प्रभाव या अंतर मौजूद होता है तो आप उसका पता लगाने में असफल हो जाते हैं।
  • 22. टाइप II त्रुटि होने की संभावना को अक्सर प्रतीक β (बीटा) द्वारा दर्शाया जाता है। β का पूरक, जो कि 1-β है, को परीक्षण की "शक्ति" क े रूप में जाना जाता है और एक गलत शून्य परिकल्पना को सही ढंग से खारिज करने की संभावना का प्रतिनिधित्व करता है (यानी, यदि कोई प्रभाव मौजूद है तो उसका सही ढंग से पता लगाना)। टाइप II त्रुटि का जोखिम नमूना आकार, प्रभाव आकार और महत्व क े चुने हुए स्तर (α) जैसे कारकों से प्रभावित होता है। बड़े नमूना आकार और बड़े प्रभाव आकार आमतौर पर टाइप II त्रुटि क े जोखिम को कम करते हैं। टाइप II त्रुटियां उन स्थितियों में महत्वपूर्ण होती हैं जहां किसी प्रभाव का पता लगाने में विफल होने पर वास्तविक दुनिया क े परिणाम होते हैं, जैसे कि नैदानिक ​ ​ ​ ​ परीक्षणों में जहां जीवनरक्षक उपचार छ ू ट सकता है। प्रकार II त्रुटि का उदाहरण: चिकित्सा अनुसंधान उदाहरण को जारी रखते हुए, मान लें कि शून्य परिकल्पना (H0) अभी भी यह है कि दवा का कोई प्रभाव नहीं है, और वैकल्पिक परिकल्पना (Ha) यह है कि दवा प्रभावी है। शून्य परिकल्पना (H0): दवा का कोई प्रभाव नहीं पड़ता है। वैकल्पिक परिकल्पना (हा): दवा प्रभावी है। यदि, नैदानिक ​ ​ परीक्षण क े आधार पर, शोधकर्ता शून्य परिकल्पना (H0) को अस्वीकार करने में विफल रहता है और निष्कर्ष निकालता है कि दवा प्रभावी नहीं है, जबकि वास्तव में इसका सकारात्मक प्रभाव पड़ता है (दवा बीमारी क े इलाज में प्रभावी है), तो यह टाइप II त्रुटि होगी. इस मामले में, मरीज संभावित जीवनरक्षक उपचार से चूक सकते हैं। टाइप I और टाइप II त्रुटियों क े बीच संबंध को निम्नानुसार संक्षेप में प्रस्तुत किया जा सकता है:
  • 23. टाइप I त्रुटियों को कम करने क े लिए महत्व क े स्तर (α) को बढ़ाने से टाइप II त्रुटियों का खतरा बढ़ जाएगा। नमूना आकार या प्रभाव आकार बढ़ाने से टाइप II त्रुटियों का जोखिम कम हो सकता है जबकि संभवतः टाइप I त्रुटियों का जोखिम बढ़ सकता है। Example Null Hypothesis is False(Real) Null Hypothesis is True (Real) Model thinks Null Hypothesis is False True Positive False Positive Type 1 (α Error) Model thinks Null Hypothesis is True False Negative Type 2 (β Error) True Negative Example Case Example Defendant is guilty(Real) Defendant is innocent(Real) Courts rules defendant is guilty True Positive – Criminal gets convicted False Positive Type 1 (α Error) – Innocent gets convicted Court rules defendant is innocents False Negative Type 2 (β Error)- Criminal gets free True Negative- Innocent gets free
  • 24. क ु ल मिलाकर हम यह कह सकते हैं कि, टाइप I त्रुटियों में गलती से यह निष्कर्ष निकालना शामिल है कि कोई प्रभाव या अंतर है, जबकि ऐसा नहीं है, जबकि टाइप II त्रुटियों में वास्तव में मौजूद प्रभाव या अंतर का पता लगाने में असफल होना शामिल है। इन दो प्रकार की त्रुटियों क े बीच संतुलन सांख्यिकीय परिकल्पना परीक्षण में एक महत्वपूर्ण विचार है, और शोधकर्ताओं को अनुसंधान क े विशिष्ट संदर्भ और परिणामों क े आधार पर दोनों प्रकार की त्रुटियों क े जोखिम को कम करने क े लिए महत्व क े उचित स्तर (α) और नमूना आकार का चयन करना चाहिए। . द्वितीय. महत्व का स्तर (अल्फा, α): महत्व का स्तर, जिसे अक्सर α क े रूप में दर्शाया जाता है, टाइप I त्रुटि बनाने की संभावना को दर्शाता है (जब यह सत्य हो तो शून्य परिकल्पना को अस्वीकार कर देता है)। आम तौर पर उपयोग किए जाने वाले महत्व क े स्तर 0.05 (5%) या 0.01 (1%)
  • 25. होते हैं, लेकिन शोधकर्ता संदर्भ और आत्मविश्वास क े वांछित स्तर क े आधार पर महत्व स्तर चुन सकते हैं। उदाहरण: यदि आप α = 0.05 सेट करते हैं, तो आप टाइप I त्रुटि होने की 5% संभावना स्वीकार करने को तैयार हैं। तृतीय. महत्वपूर्ण मान: महत्वपूर्ण मूल्य एक सांख्यिकीय वितरण पर मूल्य हैं जो महत्वपूर्ण क्षेत्र की सीमा को चिह्नित करते हैं। महत्वपूर्ण क्षेत्र एक परीक्षण आँकड़े क े मूल्यों की सीमा है जिसक े आगे आप शून्य परिकल्पना को अस्वीकार कर देंगे। महत्वपूर्ण मान महत्व क े चुने हुए स्तर (α), वांछित आत्मविश्वास स्तर और उपयोग किए जा रहे सांख्यिकीय वितरण (उदाहरण क े लिए, सामान्य वितरण, टी वितरण, ची वर्ग वितरण) क े आधार पर निर्धारित किए जाते हैं। महत्वपूर्ण मानों को चुना जाता है ताकि शून्य परिकल्पना को सत्य मानते हुए महत्वपूर्ण क्षेत्र में एक परीक्षण आँकड़ा देखने की संभावना α क े बराबर हो। चतुर्थ. स्वतंत्रता की डिग्री (डीएफ): स्वतंत्रता की डिग्री किसी आँकड़े की अंतिम गणना में मूल्यों की संख्या का प्रतिनिधित्व करती है जो भिन्न होने क े लिए स्वतंत्र हैं। स्वतंत्रता की डिग्री प्रदर्शन किए जा रहे सांख्यिकीय परीक्षण क े लिए विशिष्ट होती है। उदाहरण क े लिए: एक नमूना परीक्षण में, df = n 1, जहां n नमूना आकार है। एक चिस्क्वेर्ड परीक्षण में, डीएफ तुलना की जा रही श्रेणियों या समूहों की संख्या से संबंधित है। स्वतंत्रता की डिग्री महत्वपूर्ण हैं क्योंकि वे सांख्यिकीय वितरण क े आकार को प्रभावित करती हैं और, परिणामस्वरूप, महत्वपूर्ण मूल्यों को प्रभावित करती हैं।
  • 26. वी. क्रिटिकल रीजन (अस्वीकृ ति क्षेत्र): क्रिटिकल रीजन परीक्षण आँकड़ों क े लिए मूल्यों की एक श्रृंखला है, यदि देखा गया परीक्षण आँकड़ा इसक े अंतर्गत आता है, तो शून्य परिकल्पना की अस्वीकृ ति हो जाती है। महत्वपूर्ण क्षेत्र की सीमाएं महत्व क े चुने हुए स्तर और उपयोग किए जा रहे सांख्यिकीय वितरण द्वारा निर्धारित की जाती हैं। उदाहरण: सामान्य वितरण में, यदि α = 0.05, तो चुने गए परीक्षण आंकड़ों क े आधार पर महत्वपूर्ण क्षेत्र वितरण का चरम 5% (प्रत्येक पूंछ में 2.5%) हो सकता है। VI. पी मान: पी मान एक परिकलित संभाव्यता है जो शून्य परिकल्पना को सच मानते हुए देखे गए परिणामों की तुलना में चरम या अधिक चरम परिणाम प्राप्त करने की संभावना को इंगित करता है। यदि पी मान चुने गए महत्व क े स्तर (α) से छोटा है, तो आप शून्य परिकल्पना को अस्वीकार कर सकते हैं। उदाहरण: यदि आप 0.03 और α = 0.05 क े एपी मान की गणना करते हैं, तो आप आमतौर पर शून्य परिकल्पना को अस्वीकार कर देंगे क्योंकि 0.03 <0.05। परीक्षण की शक्ति बढ़ाने और टाइप-1 या टाइप-II त्रुटि क े जोखिम को कम करने क े लिए सावधानी 1. निम्न महत्व स्तर चुनें (α): महत्व स्तर (α) टाइप I त्रुटि होने की संभावना को दर्शाता है। निम्न α चुनकर, आप शून्य परिकल्पना को अस्वीकार करना अधिक कठोर बना देते हैं।
  • 27. आमतौर पर उपयोग किए जाने वाले महत्व स्तर 0.05 (5%) या 0.01 (1%) हैं। उदाहरण क े लिए, α को 0.01 तक कम करने से टाइप I त्रुटि होने की संभावना कम हो जाती है, लेकिन इससे टाइप II त्रुटियों (झूठी नकारात्मक) का खतरा बढ़ सकता है। 2. बोनफ े रोनी सुधार का संचालन करें: यदि आप एक साथ कई परिकल्पना परीक्षण कर रहे हैं (उदाहरण क े लिए, परीक्षणों क े एक परिवार में), तो बोनफ े रोनी सुधार लागू करने पर विचार करें। यह सुधार कई तुलनाओं को ध्यान में रखते हुए महत्व स्तर को समायोजित करता है, जिससे यह प्रत्येक व्यक्तिगत परीक्षण क े लिए अधिक कठोर हो जाता है। बोनफ े रोनी सुधार वांछित समग्र α स्तर को आयोजित परीक्षणों की संख्या से विभाजित करता है। 3. नमूना आकार बढ़ाएँ: एक बड़ा नमूना आकार अधिक डेटा प्रदान करता है, जिससे जनसंख्या मापदंडों का अधिक सटीक अनुमान लगाया जा सकता है। बड़े नमूने क े साथ, डेटा में परिवर्तनशीलता कम हो सकती है, जिससे टाइप I त्रुटियों को जन्म देने वाले चरम परिणामों को देखने की संभावना कम हो जाती है। हालाँकि, लागत या व्यावहारिक बाधाओं क े कारण नमूना आकार बढ़ाना हमेशा संभव नहीं हो सकता है। 4. अध्ययन पूर्व शक्ति विश्लेषण करें: अपना अध्ययन शुरू करने से पहले शक्ति विश्लेषण करने से आपको वांछित स्तर की सांख्यिकीय शक्ति (झूठी शून्य परिकल्पना को सही ढंग से खारिज करने की संभावना) प्राप्त करने क े लिए आवश्यक न्यूनतम नमूना आकार का अनुमान लगाने की अनुमति मिलती है।
  • 28. एक अच्छी तरह से संचालित अध्ययन यह सुनिश्चित करक े टाइप I और टाइप II दोनों त्रुटियों को कम करता है कि सार्थक प्रभावों का पता लगाने क े लिए नमूना आकार पर्याप्त है। 5. वन टेल्ड टेस्ट का संयम से उपयोग करें: दो टेल्ड परीक्षणों की तुलना में वन टेल्ड परीक्षणों में टाइप I त्रुटियों की संभावना अधिक होती है क्योंकि वे प्रभाव की एक विशिष्ट दिशा पर ध्यान क ें द्रित करते हैं। वन-टेल्ड परीक्षणों का उपयोग क े वल तभी करें जब आपक े पास ऐसा करने क े लिए एक मजबूत सैद्धांतिक औचित्य हो। 6. बाहरी और चरम मूल्यों से सावधान रहें: आपक े डेटा में बाहरी या अत्यधिक मान महत्वपूर्ण परिणाम दे सकते हैं जो समग्र जनसंख्या का प्रतिनिधित्व नहीं कर सकते हैं। सावधानीपूर्वक जांच करें और, यदि आवश्यक हो, जांच करें और आउटलेर्स का समाधान करें। 7. निष्कर्षों को दोहराएँ: स्वतंत्र अध्ययनों में शोध निष्कर्षों को दोहराने से टाइप I त्रुटियों की संभावना को कम करने में मदद मिल सकती है। यदि कई अध्ययनों में एक ही परिणाम लगातार पाया जाता है, तो यह वैकल्पिक परिकल्पना क े पक्ष में साक्ष्य को मजबूत करता है। 8. अनुसंधान डिजाइन क े प्रति सचेत रहें: सुनिश्चित करें कि आपका शोध डिज़ाइन उस प्रश्न क े लिए उपयुक्त है जिसे आप संबोधित कर रहे हैं। पूर्वाग्रहों और टाइप I त्रुटियों क े संभावित स्रोतों को कम करने क े लिए नियंत्रण समूह, यादृच्छिकीकरण, और ब्लाइंडिंग जैसे कारकों पर विचार करें। 9. विशेषज्ञ सहकर्मी समीक्षा:
  • 29. अपना अध्ययन करने या अपने निष्कर्ष प्रकाशित करने से पहले क्षेत्र क े विशेषज्ञों से सहकर्मी समीक्षा लें। अनुभवी शोधकर्ता मूल्यवान इनपुट प्रदान कर सकते हैं और टाइप I त्रुटियों क े संभावित स्रोतों की पहचान करने में सहायता कर सकते हैं। 10. सांख्यिकीय शक्ति बढ़ाएँ: सांख्यिकीय शक्ति एक झूठी अशक्त परिकल्पना को सही ढंग से अस्वीकार करने की संभावना है (यानी, किसी प्रभाव क े मौजूद होने पर उसका पता लगाना)। उच्च शक्ति प्रकार II त्रुटियों क े जोखिम को कम कर देती है। आप अधिक संवेदनशील सांख्यिकीय परीक्षण का उपयोग करक े , उपयुक्त माप उपकरण चुनकर और माप त्रुटि को कम करक े शक्ति बढ़ा सकते हैं। 11. अधिक संवेदनशील परीक्षण या उपाय का प्रयोग करें: सांख्यिकीय परीक्षणों या माप उपकरणों का उपयोग करें जो उस प्रभाव या अंतर क े प्रति अधिक संवेदनशील हों जिसे आप पहचानने का प्रयास कर रहे हैं। संवेदनशीलता से वास्तविक प्रभावों का पता लगाने की संभावना बढ़ जाती है। 12. डेटा संग्रह की अवधि बढ़ाएँ: क ु छ मामलों में, लंबी अवधि में डेटा एकत्र करने से अधिक महत्वपूर्ण प्रभाव या अंतर सामने आ सकते हैं। अल्पावधि अध्ययनों में मौसमी बदलाव या दीर्घकालिक रुझान स्पष्ट नहीं हो सकते हैं। 13. पोस्टहॉक पावर विश्लेषण करें: डेटा संग्रह क े बाद, देखे गए प्रभाव आकार और नमूना आकार क े आधार पर अपने अध्ययन की शक्ति का मूल्यांकन करने क े लिए पोस्टहॉक
  • 30. पावर विश्लेषण करें। यदि बिजली कम है, तो यह संक े त दे सकता है कि आपक े अध्ययन में टाइप II त्रुटियों का उच्च जोखिम था। 14. अध्ययन को दोहराएँ: परिणामों को सत्यापित करने क े लिए अपने अध्ययन को स्वतंत्र रूप से दोहराएं। यदि कई अध्ययनों में लगातार समान प्रभाव पाया जाता है, तो यह साक्ष्य को मजबूत करता है और टाइप II त्रुटियों की संभावना को कम करता है। 15. बायेसियन विश्लेषण पर विचार करें: बायेसियन विश्लेषण पारंपरिक बारंबारवादी परिकल्पना परीक्षण क े लिए एक वैकल्पिक दृष्टिकोण प्रदान करता है। यह अनिश्चितता की मात्रा निर्धारित करने और परिकल्पनाओं की पिछली संभावनाओं की गणना करने की अनुमति देता है। बायेसियन विधियाँ टाइप II त्रुटियों की संभावना क े बारे में जानकारी प्रदान कर सकती हैं। 16. चरों को मिलाने क े लिए नियंत्रण: सुनिश्चित करें कि आपका अध्ययन डिज़ाइन संभावित भ्रमित करने वाले चरों पर नियंत्रण रखता है जो उस प्रभाव को कमजोर कर सकते हैं जिसका आप पता लगाने का प्रयास कर रहे हैं। भ्रमित करने वाले चर प्रकार II त्रुटियों क े जोखिम को बढ़ा सकते हैं। 17. संवेदनशीलता विश्लेषण करें: विभिन्न परिदृश्यों में आपक े परिणाम कितने मजबूत हैं, इसका आकलन करने क े लिए अलग-अलग धारणाओं या मॉडल मापदंडों क े आधार पर संवेदनशीलता विश्लेषण करें। इससे उन स्थितियों की पहचान करने में मदद मिल सकती है जिनक े तहत किसी प्रभाव का पता चलने की अधिक संभावना है।