सहमति मानदंड का उपयोग. सांख्यिकीय नवाचार प्रौद्योगिकियों में फिट की अच्छाई का परीक्षण

बच्चों के लिए ज्वरनाशक दवाएं बाल रोग विशेषज्ञ द्वारा निर्धारित की जाती हैं। लेकिन बुखार के लिए आपातकालीन स्थितियाँ होती हैं जब बच्चे को तुरंत दवा देने की आवश्यकता होती है। तब माता-पिता जिम्मेदारी लेते हैं और ज्वरनाशक दवाओं का उपयोग करते हैं। शिशुओं को क्या देने की अनुमति है? आप बड़े बच्चों में तापमान कैसे कम कर सकते हैं? कौन सी दवाएं सबसे सुरक्षित हैं?

समझौते के लिए मानदंड (अनुपालन)

वितरण के सैद्धांतिक कानून के साथ अनुभवजन्य वितरण के पत्राचार के बारे में परिकल्पना का परीक्षण करने के लिए, विशेष सांख्यिकीय संकेतकों का उपयोग किया जाता है - उपयुक्तता मानदंड (या अनुपालन मानदंड)। इनमें पियर्सन, कोलमोगोरोव, रोमानोव्स्की, यास्ट्रेमस्की आदि मानदंड शामिल हैं। फिट मानदंडों की अधिकांश अच्छाई सैद्धांतिक से अनुभवजन्य आवृत्तियों के विचलन के उपयोग पर आधारित हैं। जाहिर है, ये विचलन जितने छोटे होंगे, सैद्धांतिक वितरण उतना ही बेहतर अनुभवजन्य से मेल खाता है (या वर्णन करता है)।

सहमति मानदंड -ये सैद्धांतिक संभाव्यता वितरण के अनुभवजन्य वितरण के पत्राचार के बारे में परिकल्पनाओं का परीक्षण करने के मानदंड हैं। ऐसे मानदंड दो वर्गों में विभाजित हैं: सामान्य और विशेष। सामान्य अच्छाई-की-फिट मानदंड एक परिकल्पना के सबसे सामान्य सूत्रीकरण पर लागू होते हैं, अर्थात् वह परिकल्पना जिसके देखे गए परिणाम किसी पूर्व-कल्पित संभाव्यता वितरण से सहमत होते हैं। विशेष अच्छाई-की-फिट परीक्षण विशेष अशक्त परिकल्पनाओं का संकेत देते हैं जो संभाव्यता वितरण के एक निश्चित रूप के साथ समझौता तैयार करते हैं।

स्थापित वितरण कानून के आधार पर फिट मानदंड की अच्छाई, यह स्थापित करना संभव बनाती है कि सैद्धांतिक और अनुभवजन्य आवृत्तियों के बीच विसंगतियों को कब महत्वहीन (यादृच्छिक) के रूप में पहचाना जाना चाहिए, और कब - महत्वपूर्ण (गैर-यादृच्छिक)। इससे यह पता चलता है कि उपयुक्तता की अच्छाई मानदंड अनुभवजन्य श्रृंखला में वितरण की प्रकृति के बारे में श्रृंखला को समतल करते समय सामने रखी गई परिकल्पना की शुद्धता को अस्वीकार करना या पुष्टि करना संभव बनाता है और यह उत्तर देना संभव बनाता है कि क्या इसे स्वीकार करना संभव है किसी दिए गए अनुभवजन्य वितरण के लिए कुछ सैद्धांतिक वितरण कानून द्वारा व्यक्त मॉडल।

पियर्सन का x2 (ची-स्क्वायर) फिट-ऑफ-फिट परीक्षण मुख्य फिट-ऑफ-फिट मानदंडों में से एक है। अनुभवजन्य और सैद्धांतिक वितरण की आवृत्तियों के बीच विसंगतियों की यादृच्छिकता (महत्व) का आकलन करने के लिए अंग्रेजी गणितज्ञ कार्ल पियर्सन (1857-1936) द्वारा प्रस्तावित:

कहाँ क-उन समूहों की संख्या जिनमें अनुभवजन्य वितरण विभाजित है; फाईविशेषता की अनुभवजन्य आवृत्ति मैं-वां समूह; / ts °р - विशेषता की सैद्धांतिक आवृत्ति i-वेंसमूह।

मानदंड आवेदन योजना य)सैद्धांतिक और अनुभवजन्य वितरण की स्थिरता का आकलन करने के लिए निम्नलिखित को कम किया गया है।

  • 1. विसंगति का परिकलित माप % 2 एसीसी निर्धारित किया जाता है।
  • 2. स्वतंत्रता की कोटि की संख्या निर्धारित की जाती है।
  • 3. स्वतंत्रता की डिग्री की संख्या के अनुसार, एक विशेष तालिका का उपयोग करके, % ^ बीएल
  • 4. यदि % 2 asch >x 2 abl, तो दिए गए महत्व स्तर a और स्वतंत्रता की डिग्री की संख्या v के लिए, विसंगतियों की महत्वहीनता (यादृच्छिकता) की परिकल्पना को खारिज कर दिया जाता है। अन्यथा, परिकल्पना को प्राप्त प्रयोगात्मक डेटा का खंडन नहीं करने के रूप में पहचाना जा सकता है, और संभाव्यता (1 - ए) के साथ यह तर्क दिया जा सकता है कि सैद्धांतिक और अनुभवजन्य आवृत्तियों के बीच विसंगतियां यादृच्छिक हैं।

महत्वपूर्ण स्तर -आगे रखी गई परिकल्पना की गलत अस्वीकृति की संभावना है, अर्थात। संभावना है कि सही परिकल्पना अस्वीकार कर दी जाएगी। सांख्यिकीय अध्ययनों में, हल किए जा रहे कार्यों के महत्व और जिम्मेदारी के आधार पर, महत्व के निम्नलिखित तीन स्तरों का उपयोग किया जाता है:

  • 1) ए = 0.1, फिर पी = 0,9;
  • 2) ए = 0.05, फिर पी = 0,95;
  • 3) ए = 0.01, फिर पी = 0,99.

उपयुक्तता की अच्छाई का उपयोग करना य),निम्नलिखित शर्तों का पालन किया जाना चाहिए।

  • 1. अध्ययन की गई जनसंख्या की मात्रा को शर्त को पूरा करना चाहिए एन > 50, जबकि समूह की आवृत्ति या आकार कम से कम 5 होना चाहिए। यदि इस शर्त का उल्लंघन किया जाता है, तो आपको पहले छोटी आवृत्तियों (5 से कम) को मर्ज करना होगा।
  • 2. अनुभवजन्य वितरण में यादृच्छिक चयन के परिणामस्वरूप प्राप्त डेटा शामिल होना चाहिए, अर्थात। उन्हें स्वतंत्र होना चाहिए.

पियर्सन की अच्छाई-की-फिट कसौटी का नुकसान अवलोकन परिणामों को अंतरालों में समूहित करने और व्यक्तिगत अंतरालों को कम संख्या में अवलोकनों के साथ संयोजित करने की आवश्यकता से जुड़ी कुछ प्रारंभिक जानकारी का नुकसान है। इस संबंध में, मानदंड के अनुसार वितरण के पत्राचार के सत्यापन को पूरक करने की सिफारिश की जाती है य)अन्य मानदंड. यह विशेष रूप से सच है जब नमूना आकार हो पी ~ 100.

आंकड़ों में, कोलमोगोरोव अच्छाई-की-फिट परीक्षण (कोलमोगोरोव-स्मिरनोव अच्छाई-की-फिट परीक्षण के रूप में भी जाना जाता है) का उपयोग यह निर्धारित करने के लिए किया जाता है कि क्या दो अनुभवजन्य वितरण एक ही कानून का पालन करते हैं, या यह निर्धारित करने के लिए कि परिणामी वितरण एक कल्पित मॉडल का पालन करता है या नहीं . कोलमोगोरोव मानदंड संचित आवृत्तियों या अनुभवजन्य या सैद्धांतिक वितरण की आवृत्तियों के बीच अधिकतम अंतर निर्धारित करने पर आधारित है। कोलमोगोरोव मानदंड की गणना निम्नलिखित सूत्रों के अनुसार की जाती है:

कहाँ डीऔर डी-क्रमशः, संचित आवृत्तियों (/-/") और संचित आवृत्तियों के बीच अधिकतम अंतर ( आरआर") वितरण की अनुभवजन्य और सैद्धांतिक श्रृंखला; एन-जनसंख्या में इकाइयों की संख्या.

मूल्य की गणना करने के बाद एक्स,एक विशेष तालिका उस संभावना को निर्धारित करती है जिसके साथ यह तर्क दिया जा सकता है कि सैद्धांतिक आवृत्तियों से अनुभवजन्य आवृत्तियों का विचलन यादृच्छिक है। यदि चिह्न 0.3 तक मान लेता है, तो इसका मतलब है कि आवृत्तियों का पूर्ण संयोग है। बड़ी संख्या में अवलोकनों के साथ, कोलमोगोरोव परीक्षण परिकल्पना से किसी भी विचलन का पता लगाने में सक्षम है। इसका मतलब यह है कि बहुत सारे अवलोकन होने पर सैद्धांतिक वितरण से नमूना वितरण में कोई अंतर इसकी मदद से पता लगाया जाएगा। इस संपत्ति का व्यावहारिक महत्व महत्वपूर्ण नहीं है, क्योंकि ज्यादातर मामलों में निरंतर परिस्थितियों में बड़ी संख्या में अवलोकन प्राप्त करने पर भरोसा करना मुश्किल है, वितरण कानून का सैद्धांतिक विचार जिसका नमूना पालन करना चाहिए वह हमेशा अनुमानित होता है, और सांख्यिकीय जांच की सटीकता चुने हुए मॉडल की सटीकता से अधिक नहीं होनी चाहिए।

रोमानोव्स्की का फिट-ऑफ-फिट परीक्षण पियर्सन के परीक्षण के उपयोग पर आधारित है, अर्थात। पहले से ही पाए गए मान x 2 > और स्वतंत्रता की डिग्री की संख्या:

जहां v भिन्नता की स्वतंत्रता की डिग्री की संख्या है।

रोमानोव्स्की मानदंड x 2 के लिए तालिकाओं की अनुपस्थिति में सुविधाजनक है। अगर के आरको? >3, तो वे यादृच्छिक नहीं हैं और सैद्धांतिक वितरण अध्ययन के तहत अनुभवजन्य वितरण के लिए एक मॉडल के रूप में काम नहीं कर सकता है।

बी. एस. यस्त्रेम्स्की ने फिट की अच्छाई की कसौटी में स्वतंत्रता की डिग्री की संख्या का नहीं, बल्कि समूहों की संख्या का उपयोग किया ( ), समूहों की संख्या के आधार पर एक विशेष मान 0, और एक ची-स्क्वायर मान। यस्त्रेम्स्की के समझौते के मानदंड का अर्थ रोमानोव्स्की के मानदंड के समान है और इसे सूत्र द्वारा व्यक्त किया गया है

जहां x 2 - पियर्सन की सहमति की कसौटी; /ई जीआर - समूहों की संख्या; 0 - गुणांक, 20 से कम समूहों की संख्या के लिए 0.6 के बराबर।

यदि 1f अधिनियम > 3, सैद्धांतिक और अनुभवजन्य वितरण के बीच विसंगतियां यादृच्छिक नहीं हैं, यानी। अनुभवजन्य वितरण सामान्य वितरण की आवश्यकताओं को पूरा नहीं करता है। यदि 1f अधिनियम

सैद्धांतिक और अनुभवजन्य आवृत्तियाँ। सामान्य वितरण के लिए परीक्षण करें

परिवर्तनशील वितरण श्रृंखला का विश्लेषण करते समय, यह बहुत महत्वपूर्ण है कि कैसे अनुभवजन्य वितरणचिन्ह मेल खाता है सामान्य. इसके लिए, वास्तविक वितरण की आवृत्तियों की तुलना सैद्धांतिक वितरण से की जानी चाहिए, जो सामान्य वितरण की विशेषता है। इसका मतलब यह है कि सामान्य वितरण वक्र की सैद्धांतिक आवृत्तियों की गणना करना आवश्यक है, जो वास्तविक डेटा से सामान्यीकृत विचलन का एक कार्य है।

दूसरे शब्दों में, अनुभवजन्य वितरण वक्र को सामान्य वितरण वक्र के साथ संरेखित किया जाना चाहिए।

अनुपालन की वस्तुनिष्ठ विशेषता सैद्धांतिकऔर प्रयोगसिद्ध आवृत्तियोंविशेष सांख्यिकीय संकेतकों का उपयोग करके प्राप्त किया जा सकता है, जिन्हें कहा जाता है सहमति मानदंड.

सामंजस्य की कसौटीएक मानदंड कहा जाता है जो आपको यह निर्धारित करने की अनुमति देता है कि क्या विसंगति है प्रयोगसिद्धऔर सैद्धांतिकवितरण यादृच्छिक या महत्वपूर्ण, अर्थात क्या अवलोकन संबंधी डेटा आगे रखी गई सांख्यिकीय परिकल्पना के अनुरूप है या सुसंगत नहीं है। सामान्य जनसंख्या का वह वितरण, जो उसने सामने रखी गई परिकल्पना के आधार पर प्राप्त किया है, सैद्धांतिक कहलाता है।

स्थापित करने की आवश्यकता है मानदंड(नियम) जो किसी को यह निर्णय लेने की अनुमति देगा कि अनुभवजन्य और सैद्धांतिक वितरण के बीच विसंगति यादृच्छिक या महत्वपूर्ण है या नहीं। यदि विसंगति है यादृच्छिक, तो वे मानते हैं कि अवलोकन संबंधी डेटा (नमूना) सामान्य जनसंख्या के वितरण के कानून के बारे में सामने रखी गई परिकल्पना के अनुरूप है और इसलिए, परिकल्पना स्वीकार की जाती है; यदि विसंगति है महत्वपूर्ण, तो अवलोकन संबंधी डेटा परिकल्पना से सहमत नहीं है और इसे अस्वीकार कर देता है।

आमतौर पर अनुभवजन्य और सैद्धांतिक आवृत्तियाँ इस तथ्य के कारण भिन्न होती हैं कि:

    विसंगति यादृच्छिक है और सीमित संख्या में टिप्पणियों से जुड़ी है;

    विसंगति आकस्मिक नहीं है और इसे इस तथ्य से समझाया गया है कि सांख्यिकीय परिकल्पना कि सामान्य आबादी सामान्य रूप से वितरित होती है, गलत है।

इस प्रकार, सहमति मानदंडअनुभवजन्य श्रृंखला में वितरण की प्रकृति के बारे में श्रृंखला को समतल करते समय सामने रखी गई परिकल्पना की शुद्धता को अस्वीकार या पुष्टि करने की अनुमति दें।

अनुभवजन्य आवृत्तियाँअवलोकन से प्राप्त किया गया। सैद्धांतिक आवृत्तियाँसूत्रों द्वारा गणना की गई।

के लिए सामान्य वितरण कानूनउन्हें इस प्रकार पाया जा सकता है:

    Σ˒ i- संचित (संचयी) अनुभवजन्य आवृत्तियों का योग

    एच - दो आसन्न विकल्पों के बीच का अंतर

    σ - नमूना मानक विचलन

    टी-सामान्यीकृत (मानकीकृत) विचलन

    φ(t) सामान्य वितरण का संभाव्यता घनत्व फ़ंक्शन है (t के संबंधित मान के लिए स्थानीय लाप्लास फ़ंक्शन के मानों की तालिका से खोजें)

फिट की गुणवत्ता के कई परीक्षण हैं, जिनमें से सबसे आम हैं: ची-स्क्वायर (पियर्सन का) परीक्षण, कोलमोगोरोव का परीक्षण, रोमानोव्स्की का परीक्षण।

पियर्सन गुडनेस-ऑफ़-फ़िट परीक्षण χ 2 - मुख्य में से एक, जिसे सैद्धांतिक (एफ टी) और अनुभवजन्य (एफ) आवृत्तियों के बीच सैद्धांतिक आवृत्तियों के वर्ग अंतर के अनुपात के योग के रूप में दर्शाया जा सकता है:

    k उन समूहों की संख्या है जिनमें अनुभवजन्य वितरण विभाजित है,

    f i, i-वें समूह में लक्षण की देखी गई आवृत्ति है,

    f T सैद्धांतिक आवृत्ति है।

वितरण के लिए χ 2 तालिकाएँ संकलित की गई हैं, जो महत्व के चुने हुए स्तर α और स्वतंत्रता की डिग्री डीएफ (या ν) के लिए फिट मानदंड χ 2 के महत्वपूर्ण मूल्य को दर्शाती हैं। महत्व स्तर α आगे रखी गई परिकल्पना की गलत अस्वीकृति की संभावना है, अर्थात। संभावना है कि सही परिकल्पना अस्वीकार कर दी जाएगी। आर - सांख्यिकीय वैधतासही परिकल्पना को स्वीकार करना। आँकड़ों में, महत्व के तीन स्तरों का सबसे अधिक उपयोग किया जाता है:

α=0.10, फिर P=0.90 (100 में से 10 मामलों में)

α=0.05, फिर Р=0.95 (100 में से 5 मामलों में)

α=0.01, तो P=0.99 (100 में से 1 मामले में) सही परिकल्पना को अस्वीकार किया जा सकता है

स्वतंत्रता की डिग्री डीएफ की संख्या को वितरण श्रृंखला में समूहों की संख्या घटाकर बांड की संख्या के रूप में परिभाषित किया गया है: डीएफ = के-जेड। कनेक्शन की संख्या को सैद्धांतिक आवृत्तियों की गणना में उपयोग की जाने वाली अनुभवजन्य श्रृंखला के संकेतकों की संख्या के रूप में समझा जाता है, अर्थात। अनुभवजन्य और सैद्धांतिक आवृत्तियों को जोड़ने वाले संकेतक। उदाहरण के लिए, घंटी वक्र संरेखण में, तीन संबंध होते हैं। इसलिए, जब संरेखण घंटी वक्रस्वतंत्रता की कोटि की संख्या को df =k–3 के रूप में परिभाषित किया गया है। भौतिकता का आकलन करने के लिए, परिकलित मान की तुलना सारणीबद्ध χ 2 तालिका से की जाती है

सैद्धांतिक और अनुभवजन्य वितरण के पूर्ण संयोग के साथ χ 2 =0, अन्यथा χ 2 >0. यदि χ 2 कैल्क > χ 2 टैब, तो दिए गए महत्व के स्तर और स्वतंत्रता की डिग्री की संख्या के लिए, हम विसंगतियों की महत्वहीनता (यादृच्छिकता) की परिकल्पना को अस्वीकार करते हैं। यदि χ 2 कैल्क< χ 2 табл то гипотезу принимаем и с вероятностью Р=(1-α) можно утверждать, что расхождение между теоретическими и эмпирическими частотами случайно. Следовательно, есть основания утверждать, что эмпирическое распределение подчиняетсяसामान्य वितरण. यदि जनसंख्या का आकार काफी बड़ा है (एन>50) तो पियर्सन के फिट-ऑफ-फिट परीक्षण का उपयोग किया जाता है, जबकि प्रत्येक समूह की आवृत्ति कम से कम 5 होनी चाहिए।

कोलमोगोरोव की अच्छाई-की-फिट कसौटीसंचित अनुभवजन्य और सैद्धांतिक आवृत्तियों के बीच अधिकतम विसंगति निर्धारित करने पर आधारित है:

जहां डी और डी क्रमशः संचयी आवृत्तियों और अनुभवजन्य और सैद्धांतिक वितरण की संचयी आवृत्तियों के बीच अधिकतम अंतर हैं। कोलमोगोरोव के आँकड़ों की वितरण तालिका के अनुसार, संभावना निर्धारित की जाती है, जो 0 से 1 तक भिन्न हो सकती है। P(λ)=1- पर आवृत्तियों का पूर्ण संयोग होता है, P(λ)=0 - एक पूर्ण विचलन। यदि संभाव्यता मान P, पाए गए मान λ के संबंध में महत्वपूर्ण है, तो यह माना जा सकता है कि सैद्धांतिक और अनुभवजन्य वितरण के बीच विसंगतियां महत्वहीन हैं, यानी, वे यादृच्छिक प्रकृति की हैं। कोलमोगोरोव मानदंड का उपयोग करने के लिए मुख्य शर्त पर्याप्त रूप से बड़ी संख्या में अवलोकन हैं।

कोलमोगोरोव की अच्छाई-की-फिट कसौटी

विचार करें कि कोलमोगोरोव मानदंड (λ) कब कैसे लागू किया जाता है सामान्य वितरण की परिकल्पना का परीक्षण करनासामान्य जनसंख्या. सामान्य वितरण वक्र के साथ वास्तविक वितरण के संरेखण में कई चरण होते हैं:

    वास्तविक और सैद्धांतिक आवृत्तियों की तुलना करें।

    वास्तविक आंकड़ों के अनुसार, सामान्य वितरण वक्र की सैद्धांतिक आवृत्तियाँ निर्धारित की जाती हैं, जो सामान्यीकृत विचलन का एक कार्य है।

    जांचें कि सुविधा का वितरण किस हद तक सामान्य से मेल खाता है।

तालिका के IV कॉलम के लिए:

एमएस एक्सेल में, सामान्यीकृत विचलन (t) की गणना NORMALIZE फ़ंक्शन का उपयोग करके की जाती है। विकल्पों की संख्या (स्प्रेडशीट की पंक्तियाँ) के आधार पर मुक्त कोशिकाओं की एक श्रृंखला का चयन करना आवश्यक है। चयन को हटाए बिना, सामान्यीकरण फ़ंक्शन को कॉल करें। दिखाई देने वाले संवाद बॉक्स में, निम्नलिखित कक्षों को निर्दिष्ट करें, जिनमें क्रमशः देखे गए मान (X i), औसत (X) और मानक विचलन Ϭ शामिल हैं। ऑपरेशन पूरा होना चाहिए एक साथ Ctrl+Shift+Enter दबाकर

तालिका के V कॉलम के लिए:

सामान्य वितरण φ(t) का संभाव्यता घनत्व फ़ंक्शन सामान्यीकृत विचलन (t) के संबंधित मान के लिए स्थानीय लाप्लास फ़ंक्शन के मानों की तालिका से पाया जाता है।

तालिका के VI कॉलम के लिए:

कोलमोगोरोव फिट मानदंड की अच्छाई (λ)मापांक को विभाजित करके निर्धारित किया जाता है अधिकतम अंतरअवलोकनों की संख्या के प्रति वर्गमूल अनुभवजन्य और सैद्धांतिक संचयी आवृत्तियों के बीच:

फिट मानदंड λ की अच्छाई के लिए एक विशेष संभाव्यता तालिका का उपयोग करके, हम यह निर्धारित करते हैं कि मान λ=0.59 0.88 (λ) की संभावना से मेल खाता है

अनुभवजन्य और सैद्धांतिक आवृत्तियों का वितरण, सैद्धांतिक वितरण की संभाव्यता घनत्व

यह जांचने के लिए कि क्या कोई प्रेक्षित (अनुभवजन्य) वितरण सैद्धांतिक वितरण के अनुरूप है, फिट-ऑफ-फिट परीक्षण लागू करते समय, किसी को सरल और जटिल परिकल्पनाओं के परीक्षण के बीच अंतर करना चाहिए।

एक-नमूना कोलमोगोरोव-स्मिरनोव सामान्यता परीक्षण पर आधारित है अधिकतम अंतरनमूने के संचयी अनुभवजन्य वितरण और निहित (सैद्धांतिक) संचयी वितरण के बीच। यदि डी कोलमोगोरोव-स्मिरनोव आँकड़ा महत्वपूर्ण है, तो परिकल्पना कि संबंधित वितरण सामान्य है, को अस्वीकार कर दिया जाना चाहिए।

यादृच्छिकता का परीक्षण करने और आउटलेर्स का मूल्यांकन करने के लिए मानदंड। साहित्य परिचय प्रयोगात्मक डेटा के सांख्यिकीय विश्लेषण के अभ्यास में, मुख्य रुचि अपने आप में कुछ आंकड़ों की गणना नहीं है, बल्कि इस प्रकार के प्रश्नों के उत्तर हैं। तदनुसार, सामने रखी गई सांख्यिकीय परिकल्पनाओं का परीक्षण करने के लिए कई मानदंड विकसित किए गए हैं। सांख्यिकीय परिकल्पनाओं के परीक्षण के लिए सभी मानदंड दो बड़े समूहों में विभाजित हैं: पैरामीट्रिक और गैर-पैरामीट्रिक।


सामाजिक नेटवर्क पर काम साझा करें

यदि यह कार्य आपको पसंद नहीं आता है, तो पृष्ठ के नीचे समान कार्यों की एक सूची है। आप खोज बटन का भी उपयोग कर सकते हैं


परीक्षा

सहमति मानदंड का उपयोग करना

परिचय

साहित्य

परिचय

प्रयोगात्मक डेटा के सांख्यिकीय विश्लेषण के अभ्यास में, मुख्य रुचि अपने आप में कुछ आँकड़ों की गणना नहीं है, बल्कि इस प्रकार के प्रश्नों के उत्तर हैं। क्या जनसंख्या का मतलब वास्तव में एक निश्चित संख्या है? क्या सहसंबंध गुणांक शून्य से काफी भिन्न है? क्या दोनों नमूनों के प्रसरण बराबर हैं? और विशिष्ट शोध कार्य के आधार पर ऐसे कई प्रश्न हो सकते हैं। तदनुसार, सामने रखी गई सांख्यिकीय परिकल्पनाओं का परीक्षण करने के लिए कई मानदंड विकसित किए गए हैं। हम उनमें से कुछ सबसे आम पर विचार करेंगे। मूल रूप से, वे साधन, भिन्नता, सहसंबंध गुणांक और जनसंख्या वितरण का उल्लेख करेंगे।

सांख्यिकीय परिकल्पनाओं के परीक्षण के लिए सभी मानदंड दो बड़े समूहों में विभाजित हैं: पैरामीट्रिक और गैर-पैरामीट्रिक। पैरामीट्रिक परीक्षण इस धारणा पर आधारित हैं कि नमूना डेटा एक ज्ञात वितरण वाली आबादी से लिया गया है, और मुख्य कार्य इस वितरण के मापदंडों का अनुमान लगाना है। गैर-पैरामीट्रिक परीक्षणों के लिए, वितरण की प्रकृति के बारे में किसी धारणा की आवश्यकता नहीं है, सिवाय इस धारणा के कि यह निरंतर है।

आइए पहले पैरामीट्रिक मानदंड पर विचार करें। परीक्षण अनुक्रम में एक शून्य परिकल्पना और एक वैकल्पिक परिकल्पना तैयार करना, बनाई जाने वाली धारणाओं को तैयार करना, परीक्षण में प्रयुक्त नमूना आंकड़ों का निर्धारण करना और परीक्षण किए जाने वाले आंकड़ों का एक नमूना वितरण तैयार करना, चयनित मानदंड के लिए महत्वपूर्ण क्षेत्रों का निर्धारण करना शामिल होगा। और नमूना आँकड़ों के लिए एक विश्वास अंतराल का निर्माण करना।

1 साधनों के लिए उपयुक्त मानदंड की अच्छाई

माना कि जिस परिकल्पना का परीक्षण किया जा रहा है वह जनसंख्या का पैरामीटर है। उदाहरण के लिए, ऐसी जाँच की आवश्यकता निम्नलिखित स्थिति में उत्पन्न हो सकती है। आइए मान लें कि, व्यापक शोध के आधार पर, किसी निश्चित स्थान से तलछट में जीवाश्म मोलस्क के खोल का व्यास स्थापित किया गया है। आइए हमारे पास किसी अन्य स्थान पर पाए जाने वाले निश्चित संख्या में गोले भी हों, और हम यह धारणा बनाते हैं कि कोई विशेष स्थान गोले के व्यास को प्रभावित नहीं करता है, यानी। कि एक नए स्थान पर रहने वाले मोलस्क की पूरी आबादी के लिए शेल व्यास का औसत मूल्य पहले निवास स्थान में मोलस्क की इस प्रजाति का अध्ययन करते समय प्राप्त ज्ञात मूल्य के बराबर है।

यदि यह ज्ञात मान बराबर है, तो शून्य परिकल्पना और वैकल्पिक परिकल्पना इस प्रकार लिखी जाती है: मान लें कि विचाराधीन जनसंख्या में चर x का सामान्य वितरण है, और जनसंख्या विचरण अज्ञात है।

हम आँकड़ों का उपयोग करके परिकल्पना का परीक्षण करेंगे:

, (1)
नमूना मानक विचलन कहां है.

यह दिखाया गया कि यदि सत्य है, तो अभिव्यक्ति (1) में टी में स्वतंत्रता की एन-1 डिग्री के साथ एक छात्र का टी-वितरण है। यदि हम महत्व के स्तर (सही परिकल्पना को अस्वीकार करने की संभावना) को बराबर चुनते हैं, तो, पिछले अध्याय में चर्चा के अनुसार, हम परीक्षण के लिए महत्वपूर्ण मान निर्धारित कर सकते हैं =0।

इस मामले में, चूंकि छात्र का वितरण सममित है, तो n-1 डिग्री की स्वतंत्रता के साथ इस वितरण के वक्र के नीचे क्षेत्र का (1-) हिस्सा बिंदुओं के बीच संलग्न होगा और, जो पूर्ण रूप से एक दूसरे के बराबर हैं कीमत। इसलिए, चुने गए महत्व स्तर पर स्वतंत्रता की दी गई डिग्री के साथ टी-वितरण के लिए नकारात्मक से कम और सकारात्मक से अधिक सभी मूल्य महत्वपूर्ण क्षेत्र का गठन करेंगे। यदि नमूना मान t इस क्षेत्र में आता है, तो वैकल्पिक परिकल्पना स्वीकार की जाती है।

आत्मविश्वास अंतराल पहले वर्णित विधि के अनुसार बनाया गया है और निम्नलिखित अभिव्यक्ति से निर्धारित किया गया है

(2)

तो, हमारे मामले में यह ज्ञात है कि जीवाश्म मोलस्क के खोल का व्यास 18.2 मिमी है। हमारे पास 50 नए पाए गए गोले का एक नमूना है, जिसके लिए मिमी, ए = 2.18 मिमी। जाँच करें: = 18.2 बनाम हमारे पास है

यदि महत्व स्तर = 0.05 चुना जाता है, तो महत्वपूर्ण मान। इससे यह निष्कर्ष निकलता है कि महत्व स्तर =0.05 पर इसे पक्ष में अस्वीकार किया जा सकता है। इस प्रकार, हमारे काल्पनिक उदाहरण के लिए, यह तर्क दिया जा सकता है (स्वाभाविक रूप से, कुछ संभावना के साथ) कि एक निश्चित प्रजाति के जीवाश्म मोलस्क के खोल का व्यास उन स्थानों पर निर्भर करता है जहां वे रहते थे।

इस तथ्य के कारण कि टी-वितरण सममित है, इस वितरण के टी के केवल सकारात्मक मान महत्व के चुने हुए स्तरों और स्वतंत्रता की डिग्री की संख्या पर दिए गए हैं। इसके अलावा, न केवल टी मान के दाईं ओर वितरण वक्र के तहत क्षेत्र के हिस्से को ध्यान में रखा जाता है, बल्कि -टी मान के बाईं ओर भी। यह इस तथ्य के कारण है कि ज्यादातर मामलों में, परिकल्पनाओं का परीक्षण करते समय, हम अपने आप में विचलन के महत्व में रुचि रखते हैं, भले ही ये विचलन ऊपर या नीचे हों, यानी। हम इसके विरुद्ध जाँच करते हैं, विरुद्ध नहीं: >a या:

आइए अब अपने उदाहरण पर लौटते हैं। 100(1-)% विश्वास अंतराल के लिए है

18,92,01

आइए अब उस मामले पर विचार करें जब दो आबादी के औसत की तुलना करना आवश्यक हो। परीक्षण की गई परिकल्पना इस तरह दिखती है: : =0, : 0. यह भी माना जाता है कि इसमें माध्य और विचरण के साथ एक सामान्य वितरण होता है, और माध्य और समान विचरण के साथ एक सामान्य वितरण होता है। इसके अलावा, हम मानते हैं कि जिन नमूनों से सामान्य आबादी का अनुमान लगाया जाता है, उन्हें एक-दूसरे से स्वतंत्र रूप से निकाला जाता है और क्रमशः मात्रा होती है, और नमूनों की स्वतंत्रता से, यह इस प्रकार है कि यदि हम उनमें से एक बड़ी संख्या लेते हैं और गणना करते हैं प्रत्येक जोड़ी के लिए औसत मान, तो औसत के इन जोड़ों का सेट पूरी तरह से असंबंधित होगा।

शून्य परिकल्पना परीक्षण सांख्यिकी का उपयोग करके किया जाता है

(3)

पहले और दूसरे नमूनों के लिए क्रमशः विचरण अनुमान कहां और कहां हैं। यह देखना आसान है कि (3) (1) का सामान्यीकरण है।

यह दिखाया गया कि आँकड़ा (3) में स्वतंत्रता की डिग्री के साथ छात्र का टी-वितरण है। यदि और बराबर हैं, अर्थात = = सूत्र (3) सरलीकृत है और इसका स्वरूप है

(4)

एक उदाहरण पर विचार करें. मान लीजिए कि दो मौसमों के दौरान एक ही पौधे की आबादी के तने की पत्तियों को मापते समय निम्नलिखित परिणाम प्राप्त होते हैं: हम मानते हैं कि छात्र की कसौटी का उपयोग करने की शर्तें, अर्थात्। सामान्य आबादी की सामान्यता, जहां से नमूने लिए गए हैं, इन आबादी के लिए एक अज्ञात लेकिन समान भिन्नता का अस्तित्व, और नमूनों की स्वतंत्रता संतुष्ट हैं। हम महत्व स्तर =0.01 पर अनुमान लगाते हैं। हमारे पास है

तालिका मान t = 2.58. इसलिए, दो मौसमों के दौरान पौधों की आबादी के लिए तने की पत्तियों की लंबाई के औसत मूल्यों की समानता के बारे में परिकल्पना को महत्व के चुने हुए स्तर पर खारिज कर दिया जाना चाहिए।

ध्यान! गणितीय आंकड़ों में शून्य परिकल्पना वह परिकल्पना है कि तुलना किए गए संकेतकों के बीच कोई महत्वपूर्ण अंतर नहीं है, भले ही हम औसत, भिन्नता या अन्य आंकड़ों के बारे में बात कर रहे हों। और इन सभी मामलों में, यदि मानदंड का अनुभवजन्य (सूत्र द्वारा परिकलित) मान सैद्धांतिक मान (तालिका से चयनित) से अधिक है, तो इसे अस्वीकार कर दिया जाता है। यदि अनुभवजन्य मूल्य तालिका मूल्य से कम है, तो इसे स्वीकार किया जाता है।

इन दो सामान्य आबादी के साधनों के बीच अंतर के लिए आत्मविश्वास अंतराल बनाने के लिए, हम इस तथ्य पर ध्यान देते हैं कि छात्र का टी-टेस्ट, जैसा कि सूत्र (3) से देखा जा सकता है, के बीच अंतर के महत्व का मूल्यांकन करता है इस अंतर की मानक त्रुटि के सापेक्ष मतलब है. पहले से ही माने गए संबंधों और बनाई गई धारणाओं का उपयोग करके, यह सत्यापित करना आसान है कि (3) में हर बिल्कुल इस मानक त्रुटि का प्रतिनिधित्व करता है। दरअसल, हम इसे सामान्य तौर पर जानते हैं

यदि x और y स्वतंत्र हैं, तो

x और y के बजाय नमूना मान लेना और इस धारणा को याद रखना कि दोनों आबादी में समान भिन्नता है, हमें मिलता है

(5)

भिन्नता का अनुमान निम्नलिखित संबंध से प्राप्त किया जा सकता है

(6)

(हम विभाजित करते हैं क्योंकि नमूनों से दो मात्राओं का अनुमान लगाया जाता है और इसलिए, स्वतंत्रता की डिग्री की संख्या दो से कम होनी चाहिए।)

यदि अब हम (6) को (5) में प्रतिस्थापित करें और वर्गमूल लें, तो हमें अभिव्यक्ति (3) में हर प्राप्त होता है।

इस विषयांतर के बाद, हम - के लिए एक विश्वास अंतराल के निर्माण पर लौटेंगे।

हमारे पास है

आइए हम टी-टेस्ट के निर्माण में प्रयुक्त मान्यताओं से संबंधित कुछ टिप्पणियाँ करें। सबसे पहले, यह दिखाया गया कि सामान्यता की धारणा के उल्लंघन का 30 के लिए परीक्षण के महत्व स्तर और शक्ति पर नगण्य प्रभाव पड़ता है। दोनों आबादी के भिन्नताओं की एकरूपता की धारणा का उल्लंघन, जहां से नमूने लिए गए हैं लिया गया भी महत्वहीन है, लेकिन केवल तभी जब नमूना आकार बराबर हो। हालाँकि, यदि दोनों आबादी की भिन्नताएँ एक-दूसरे से भिन्न हैं, तो पहले और दूसरे प्रकार की त्रुटियों की संभावनाएँ अपेक्षित त्रुटियों से काफी भिन्न होंगी।

इस मामले में, जाँच के लिए मानदंड का उपयोग किया जाना चाहिए

(7)

स्वतंत्रता की डिग्री की संख्या के साथ

. (8)

एक नियम के रूप में, यह एक भिन्नात्मक संख्या बन जाती है, इसलिए, टी-वितरण की तालिकाओं का उपयोग करते समय, निकटतम पूर्णांक मानों के लिए सारणीबद्ध मान लेना और प्राप्त के अनुरूप टी खोजने के लिए प्रक्षेप करना आवश्यक है। एक।

एक उदाहरण पर विचार करें. मार्श मेंढक की दो उप-प्रजातियों का अध्ययन करते समय, शरीर की लंबाई और टिबिया की लंबाई के अनुपात की गणना की गई। आयतन =49 और =27 के साथ दो नमूने लिए गए। हमारे लिए ब्याज के अनुपात का माध्य और विचरण क्रमशः =2.34 निकला; =2.08; =0.21; =0.35. यदि अब हम सूत्र (2) का उपयोग करके परिकल्पना का परीक्षण करते हैं, तो हमें वह मिलता है

=0.05 के महत्व स्तर पर, हमें शून्य परिकल्पना (सारणीबद्ध मान t=1.995) को अस्वीकार करना चाहिए और मान लेना चाहिए कि दो मेंढक उप-प्रजातियों के लिए मापा मापदंडों के औसत मूल्यों के बीच चुने हुए महत्व स्तर पर सांख्यिकीय रूप से महत्वपूर्ण अंतर हैं।

सूत्र (6) और (7) का उपयोग करते समय, हमारे पास है

इस मामले में, समान महत्व स्तर =0.05 के लिए, तालिका मान t=2.015, और शून्य परिकल्पना स्वीकार की जाती है।

यह उदाहरण स्पष्ट रूप से दिखाता है कि एक या दूसरे मानदंड की व्युत्पत्ति में अपनाई गई शर्तों की उपेक्षा से ऐसे परिणाम हो सकते हैं जो वास्तव में होने वाले परिणामों के सीधे विपरीत होते हैं। बेशक, इस मामले में, एक पूर्व निर्धारित तथ्य की अनुपस्थिति में कि दोनों आबादी में मापा संकेतक के भिन्नताएं सांख्यिकीय रूप से बराबर हैं, विभिन्न आकारों के नमूने होने पर, सूत्र (7) और (8) का उपयोग किया जाना चाहिए था, जो अनुपस्थिति दिखाता है सांख्यिकीय रूप से महत्वपूर्ण अंतर।

इसलिए, मैं एक बार फिर दोहराना चाहूंगा कि किसी विशेष मानदंड को प्राप्त करते समय बनाई गई सभी मान्यताओं के अनुपालन का सत्यापन उसके सही उपयोग के लिए एक अत्यंत आवश्यक शर्त है।

टी-परीक्षण के उपरोक्त दोनों संशोधनों में एक अपरिहार्य आवश्यकता यह थी कि नमूने एक-दूसरे से स्वतंत्र हों। हालाँकि, व्यवहार में, अक्सर ऐसी स्थितियाँ उत्पन्न होती हैं जब वस्तुनिष्ठ कारणों से इस आवश्यकता को पूरा नहीं किया जा सकता है। उदाहरण के लिए, कुछ संकेतक किसी बाहरी कारक आदि की कार्रवाई से पहले और बाद में उसी जानवर या क्षेत्र के क्षेत्र पर मापे जाते हैं। और इन मामलों में, हमें परिकल्पना का परीक्षण करने में रुचि हो सकती है। हम यह मानते रहेंगे कि दोनों नमूने समान भिन्नता के साथ सामान्य आबादी से लिए गए हैं।

इस मामले में, आप इस तथ्य का उपयोग कर सकते हैं कि सामान्य रूप से वितरित मूल्यों के बीच अंतर का भी सामान्य वितरण होता है, और इसलिए आप फॉर्म (1) में छात्र के टी-टेस्ट का उपयोग कर सकते हैं। इस प्रकार, यह परिकल्पना कि n अंतर सामान्य रूप से वितरित सामान्य जनसंख्या से शून्य के बराबर माध्य वाला एक नमूना है, का परीक्षण किया जाएगा।

i-वें अंतर को निरूपित करते हुए, हमारे पास है

, (9)
कहाँ

एक उदाहरण पर विचार करें. आइए उत्तेजना की क्रिया से पहले () और बाद में () एक निश्चित समय अंतराल के लिए एक व्यक्तिगत तंत्रिका कोशिका के आवेगों की संख्या पर डेटा हमारे पास उपलब्ध है:

इसलिए यह ध्यान में रखते हुए कि (9) में एक टी-वितरण है, और एक महत्व स्तर =0.01 का चयन करते हुए, हम परिशिष्ट में संबंधित तालिका से पाते हैं कि एन-1=10-1=9 स्वतंत्रता की डिग्री के लिए टी का महत्वपूर्ण मूल्य 3.25 है. टी-सांख्यिकी के सैद्धांतिक और अनुभवजन्य मूल्यों की तुलना से पता चलता है कि उत्तेजना दिए जाने से पहले और बाद में आवेगों की आवृत्ति के बीच सांख्यिकीय रूप से महत्वपूर्ण अंतर की अनुपस्थिति की शून्य परिकल्पना को खारिज कर दिया जाना चाहिए। यह निष्कर्ष निकाला जा सकता है कि प्रयुक्त उत्तेजना सांख्यिकीय रूप से आवेगों की आवृत्ति को महत्वपूर्ण रूप से बदल देती है।

प्रायोगिक अध्ययनों में, जैसा कि ऊपर बताया गया है, आश्रित नमूने अक्सर सामने आते हैं। हालाँकि, इस तथ्य को कभी-कभी नजरअंदाज कर दिया जाता है और फॉर्म (3) में टी-टेस्ट का गलत इस्तेमाल किया जाता है।

असंबद्ध और सहसंबद्ध साधनों के बीच अंतर की मानक त्रुटियों पर विचार करके इसे अमान्य माना जा सकता है। पहले मामले में

और दूसरे में

अंतर की मानक त्रुटि d है

इसे ध्यान में रखते हुए, (9) में हर का रूप होगा

आइए अब इस तथ्य पर ध्यान दें कि अभिव्यक्ति (4) और (9) के अंश मेल खाते हैं:

इसलिए, उनमें t के मान का अंतर हर पर निर्भर करता है।

इस प्रकार, यदि आश्रित नमूनों के साथ समस्या में सूत्र (3) का उपयोग किया जाता है, और नमूनों का सकारात्मक सहसंबंध होगा, तो टी के परिणामी मान सूत्र (9) का उपयोग करते समय होने से कम होंगे, और एक स्थिति यह उत्पन्न हो सकता है कि शून्य परिकल्पना असत्य होने पर स्वीकार कर ली जाएगी। विपरीत स्थिति तब उत्पन्न हो सकती है जब नमूनों के बीच नकारात्मक सहसंबंध हो, अर्थात। इस मामले में, ऐसे अंतरों को महत्वपूर्ण माना जाएगा, जो वास्तव में नहीं हैं।

आइए आवेग गतिविधि के साथ उदाहरण पर वापस जाएं और सूत्र (3) का उपयोग करके दिए गए डेटा के लिए टी के मूल्य की गणना करें, इस तथ्य पर ध्यान न दें कि नमूने जुड़े हुए हैं। हमारे पास है: स्वतंत्रता की डिग्री की संख्या 18 के बराबर, और महत्व का स्तर = 0.01, सारणीबद्ध मान टी = 2.88 और, पहली नज़र में, ऐसा लगता है कि कुछ भी नहीं हुआ, यहां तक ​​​​कि दी गई शर्तों के लिए अनुपयुक्त सूत्र का उपयोग करने पर भी . और इस मामले में, t का परिकलित मान शून्य परिकल्पना की अस्वीकृति की ओर ले जाता है, अर्थात। उसी निष्कर्ष पर जो सूत्र (9) का उपयोग करके निकाला गया था, जो इस स्थिति में सही है।

हालाँकि, आइए मौजूदा डेटा को दोबारा आकार दें और इसे निम्नलिखित रूप में प्रस्तुत करें (2):

ये वही मूल्य हैं, और इन्हें कुछ प्रयोगों में बहुत अच्छी तरह से प्राप्त किया जा सकता है। चूँकि दोनों नमूनों में सभी मान सहेजे गए हैं, तो सूत्र (3) में छात्र के टी-परीक्षण का उपयोग पहले प्राप्त मूल्य =3.32 देता है और उसी निष्कर्ष पर ले जाता है जो पहले ही बनाया जा चुका है।

और अब हम सूत्र (9) के अनुसार t के मान की गणना करते हैं, जिसका उपयोग इस मामले में किया जाना चाहिए। हमारे पास है: चुने गए महत्व स्तर और स्वतंत्रता की नौ डिग्री पर टी का महत्वपूर्ण मूल्य 3.25 है। नतीजतन, हमारे पास अशक्त परिकल्पना को अस्वीकार करने का कोई कारण नहीं है, हम इसे स्वीकार करते हैं, और यह पता चलता है कि यह निष्कर्ष सीधे उस निष्कर्ष के विपरीत है जो तब बनाया गया था जब सूत्र (3) का उपयोग किया गया था।

इस उदाहरण में, हम फिर से आश्वस्त हो गए कि प्रयोगात्मक डेटा का विश्लेषण करते समय सही निष्कर्ष प्राप्त करने के लिए उन सभी आवश्यकताओं का सख्ती से पालन करना कितना महत्वपूर्ण है जो एक या दूसरे मानदंड को निर्धारित करने का आधार थे।

छात्र के मानदंड में विचार किए गए संशोधनों का उद्देश्य दो नमूनों के औसत के संबंध में परिकल्पना का परीक्षण करना है। हालाँकि, परिस्थितियाँ तब उत्पन्न होती हैं जब एक साथ k औसत की समानता के बारे में निष्कर्ष निकालना आवश्यक हो जाता है। इस मामले के लिए, एक निश्चित सांख्यिकीय प्रक्रिया भी विकसित की गई है, जिस पर बाद में विचरण के विश्लेषण से संबंधित मुद्दों पर चर्चा करते समय विचार किया जाएगा।

2 भिन्नताओं के लिए उपयुक्तता की अच्छाई

सामान्य जनसंख्या की भिन्नताओं के संबंध में सांख्यिकीय परिकल्पनाओं का परीक्षण उसी क्रम में किया जाता है जैसे कि साधनों के लिए। आइए संक्षेप में इस क्रम को याद करें।

1. एक शून्य परिकल्पना तैयार की गई है (तुलना किए गए भिन्नताओं के बीच सांख्यिकीय रूप से महत्वपूर्ण अंतर की अनुपस्थिति के बारे में)।

2. आँकड़ों के नमूना वितरण के संबंध में कुछ धारणाएँ बनाई जाती हैं, जिनकी सहायता से परिकल्पना में शामिल पैरामीटर का अनुमान लगाने की योजना बनाई जाती है।

3. परिकल्पना का परीक्षण करने के लिए एक महत्व स्तर चुना जाता है।

4. हमारे लिए रुचिकर आँकड़ों के मूल्य की गणना की जाती है और शून्य परिकल्पना की सत्यता के संबंध में निर्णय लिया जाता है।

और अब आइए इस परिकल्पना का परीक्षण शुरू करें कि सामान्य जनसंख्या का विचरण = a, यानी। ख़िलाफ़। यदि हम मानते हैं कि चर x का सामान्य वितरण है, और आकार n का एक नमूना जनसंख्या से यादृच्छिक रूप से लिया गया है, तो अशक्त परिकल्पना का परीक्षण करने के लिए आंकड़ों का उपयोग किया जाता है

(10)

विचरण की गणना के सूत्र को याद करते हुए, हम (10) को इस प्रकार फिर से लिखते हैं:

. (11)

इस अभिव्यक्ति से यह देखा जा सकता है कि अंश सामान्य रूप से वितरित मात्राओं के माध्य से वर्ग विचलन का योग है। इनमें से प्रत्येक विचलन भी सामान्य रूप से वितरित होता है। इसलिए, हमें ज्ञात वितरण के अनुसार, सांख्यिकी (10) और (11) के सामान्य रूप से वितरित मूल्यों के वर्गों के योग में स्वतंत्रता की एन-1 डिग्री के साथ एक वितरण होता है।

टी-वितरण के उपयोग के अनुरूप, चयनित महत्व स्तर की जांच करते समय, वितरण तालिका शून्य परिकल्पना को स्वीकार करने की संभावनाओं के अनुरूप महत्वपूर्ण बिंदु स्थापित करती है। चयनित होने पर विश्वास अंतराल का निर्माण इस प्रकार किया जाता है:

. (12)

एक उदाहरण पर विचार करें. मान लीजिए, व्यापक प्रायोगिक अध्ययनों के आधार पर, यह स्थापित किया गया है कि एक निश्चित क्षेत्र से एक पौधे की प्रजाति की क्षारीय सामग्री का फैलाव 4.37 पारंपरिक इकाइयाँ है। n=28 ऐसे पौधों का एक नमूना, संभवतः उसी क्षेत्र से, एक विशेषज्ञ के पास आता है। विश्लेषण से पता चला कि इस नमूने के लिए =5.01 और यह सुनिश्चित करना आवश्यक है कि यह और पहले से ज्ञात भिन्नताएं महत्व स्तर =0.1 पर सांख्यिकीय रूप से अप्रभेद्य हैं।

सूत्र (10) के अनुसार हमारे पास है

प्राप्त मूल्य की तुलना महत्वपूर्ण मूल्यों /2=0.05 और 1--/2=0.95 से की जानी चाहिए। स्वतंत्रता की 27 डिग्री के लिए परिशिष्ट तालिका से, हमारे पास क्रमशः 40.1 और 16.2 हैं, जिससे यह निष्कर्ष निकलता है कि शून्य परिकल्पना को स्वीकार किया जा सकता है। इसके लिए संगत आत्मविश्वास अंतराल 3.37 है<<8,35.

नमूने के बारे में परिकल्पनाओं के परीक्षण के विपरीत, छात्र के टी-टेस्ट का उपयोग करना, जब पहली और दूसरी तरह की त्रुटियां मामूली रूप से बदल गईं जब आबादी के सामान्य वितरण की धारणा का उल्लंघन किया गया, भिन्नता के बारे में परिकल्पना के मामले में, जब सामान्यता की स्थिति होती है पूरा नहीं होने पर, त्रुटियाँ महत्वपूर्ण रूप से बदल जाती हैं।

ऊपर दिए गए कुछ निश्चित मानों में विचरण की समानता की समस्या सीमित रुचि की है, क्योंकि ऐसी स्थितियाँ काफी दुर्लभ होती हैं जब सामान्य जनसंख्या का विचरण ज्ञात होता है। अधिक दिलचस्प वह मामला है जब यह जांचना आवश्यक है कि क्या दो आबादी के भिन्नताएं बराबर हैं, यानी। एक विकल्प के विरुद्ध एक परिकल्पना का परीक्षण करना। यह माना जाता है कि आकार के नमूने यादृच्छिक रूप से भिन्नताओं वाली आबादी से लिए गए हैं।

शून्य परिकल्पना का परीक्षण करने के लिए, फिशर विचरण अनुपात परीक्षण का उपयोग किया जाता है

(13)

चूँकि उनके माध्य मानों से सामान्य रूप से वितरित यादृच्छिक चर के वर्ग विचलन के योग का एक वितरण होता है, तो अंश और हर (13) दोनों को क्रमशः और से विभाजित मान वितरित किए जाते हैं, और इसलिए उनके अनुपात में एफ-वितरण होता है स्वतंत्रता की -1 और -1 डिग्री के साथ।

यह आम तौर पर स्वीकार किया जाता है - और इस प्रकार एफ-वितरण की तालिकाओं का निर्माण किया जाता है - कि सबसे बड़े भिन्नता को (13) में अंश के रूप में लिया जाता है, और इसलिए महत्व के चुने हुए स्तर के अनुरूप केवल एक महत्वपूर्ण बिंदु निर्धारित किया जाता है .

आइए हमारे पास सामान्य और अंडाकार तालाब के घोंघों की आबादी से मात्रा के दो नमूने =11 और =28 हैं, जिनके लिए ऊंचाई-से-चौड़ाई अनुपात में भिन्नताएं =0.59 और =0.38 हैं। महत्व स्तर = 0.05 पर अध्ययन की गई आबादी के लिए इन संकेतकों के इन भिन्नताओं की समानता के बारे में परिकल्पना का परीक्षण करना आवश्यक है। हमारे पास है

साहित्य में, कोई भी कभी-कभी यह कथन पा सकता है कि छात्र की कसौटी पर साधनों की समानता के बारे में परिकल्पना का परीक्षण करने से पहले भिन्नताओं की समानता के बारे में परिकल्पना का परीक्षण किया जाना चाहिए। यह गलत सिफ़ारिश है. इसके अलावा, इससे गलतियाँ हो सकती हैं जिनका पालन न करने पर टाला जा सकता है।

दरअसल, फिशर के परीक्षण का उपयोग करके भिन्नताओं की समानता की परिकल्पना के परीक्षण के परिणाम काफी हद तक इस धारणा पर निर्भर करते हैं कि नमूने सामान्य वितरण वाली आबादी से लिए गए हैं। साथ ही, छात्र का टी-टेस्ट सामान्यता के उल्लंघन के प्रति असंवेदनशील है, और यदि समान आकार के नमूने प्राप्त करना संभव है, तो भिन्नताओं की समानता की धारणा भी आवश्यक नहीं है। असमान n के मामले में, सत्यापन के लिए सूत्र (7) और (8) का उपयोग किया जाना चाहिए।

भिन्नताओं की समानता के बारे में परिकल्पनाओं का परीक्षण करते समय, आश्रित नमूनों से जुड़ी गणनाओं में कुछ विशेषताएं उत्पन्न होती हैं। इस मामले में, सांख्यिकी का उपयोग विकल्प के विरुद्ध परिकल्पना का परीक्षण करने के लिए किया जाता है।

(14)

यदि शून्य परिकल्पना सत्य है, तो सांख्यिकी (14) में स्वतंत्रता की n-2 डिग्री के साथ एक छात्र का t-वितरण है।

35 कोटिंग नमूनों की चमक को मापने पर, =134.5 का फैलाव प्राप्त हुआ। दो सप्ताह बाद दोहराया गया माप =199.1 दिखा। इस मामले में, युग्मित मापों के बीच सहसंबंध गुणांक =0.876 निकला। यदि हम इस तथ्य पर ध्यान नहीं देते हैं कि नमूने निर्भर हैं और परिकल्पना का परीक्षण करने के लिए फिशर मानदंड का उपयोग करते हैं, तो हमें F=1.48 मिलता है। यदि आप महत्व स्तर =0.05 चुनते हैं, तो शून्य परिकल्पना स्वीकार की जाएगी, क्योंकि =35-1=34 और =35-1=34 स्वतंत्रता की डिग्री के लिए एफ-वितरण का महत्वपूर्ण मूल्य 1.79 है।

उसी समय, यदि हम इस मामले के लिए उपयुक्त सूत्र (14) का उपयोग करते हैं, तो हमें t=2.35 मिलेगा, जबकि 33 डिग्री स्वतंत्रता और चुने गए महत्व स्तर =0.05 के लिए t का महत्वपूर्ण मान 2.03 है। इसलिए, इन दोनों नमूनों में भिन्नताओं की समानता के बारे में शून्य परिकल्पना को खारिज कर दिया जाना चाहिए। इस प्रकार, यह उदाहरण दिखाता है कि, साधनों की समानता की परिकल्पना के परीक्षण के मामले में, एक मानदंड का उपयोग जो प्रयोगात्मक डेटा की विशिष्टताओं को ध्यान में नहीं रखता है, एक त्रुटि की ओर जाता है।

अनुशंसित साहित्य में, कोई बार्टलेट परीक्षण पा सकता है जिसका उपयोग k भिन्नताओं की एक साथ समानता के बारे में परिकल्पनाओं के परीक्षण में किया जाता है। इस तथ्य के अलावा कि इस परीक्षण के आंकड़ों की गणना काफी श्रमसाध्य है, इस परीक्षण का मुख्य नुकसान यह है कि यह उन आबादी के सामान्य वितरण की धारणा से विचलन के प्रति असामान्य रूप से संवेदनशील है जहां से नमूने लिए गए हैं। इस प्रकार, इसका उपयोग करते समय, कोई भी यह सुनिश्चित नहीं कर सकता है कि शून्य परिकल्पना वास्तव में खारिज कर दी गई है क्योंकि भिन्नताएं सांख्यिकीय रूप से काफी भिन्न हैं, और इसलिए नहीं कि नमूने सामान्य रूप से वितरित नहीं होते हैं। इसलिए, कई भिन्नताओं की तुलना करने की समस्या के मामले में, समस्या के ऐसे विवरण की तलाश करना आवश्यक है जब फिशर मानदंड या इसके संशोधनों का उपयोग करना संभव हो।

शेयरों पर समझौते के लिए 3 मानदंड

अक्सर आबादी का विश्लेषण करना आवश्यक होता है जिसमें वस्तुओं को दो श्रेणियों में से एक को सौंपा जा सकता है। उदाहरण के लिए, एक निश्चित आबादी में लिंग के आधार पर, मिट्टी में एक निश्चित ट्रेस तत्व की उपस्थिति से, कुछ पक्षी प्रजातियों में अंडों के गहरे या हल्के रंग से, आदि।

एक निश्चित गुणवत्ता वाले तत्वों के अनुपात को पी द्वारा दर्शाया जाएगा, जहां पी उस गुणवत्ता वाली वस्तुओं का अनुपात है जिसमें हम समग्र रूप से सभी वस्तुओं में रुचि रखते हैं।

आइए इस परिकल्पना का परीक्षण करें कि कुछ पर्याप्त बड़ी आबादी में हिस्सा P कुछ संख्या a (0) के बराबर है

द्विभाजित (दो ग्रेडेशन वाले) चर के लिए, जैसा कि हमारे मामले में, पी मात्रात्मक रूप से मापी गई चर की आबादी के औसत के समान भूमिका निभाता है। दूसरी ओर, पहले यह संकेत दिया गया था कि अंश P की मानक त्रुटि को इस प्रकार दर्शाया जा सकता है

फिर, यदि परिकल्पना सत्य है, तो आँकड़े

, (19)
जहाँ p, P का नमूना मान है, एक इकाई सामान्य वितरण है। हमें तुरंत एक आरक्षण करना चाहिए कि ऐसा अनुमान मान्य है यदि उत्पादों में से छोटा एनपी या (1-पी)एन 5 से अधिक है।

साहित्य के आंकड़ों से ज्ञात हो कि झील मेंढकों की आबादी में पीठ पर अनुदैर्ध्य धारी वाले व्यक्तियों का अनुपात 62% या 0.62 है। हमारे पास 125 (एन) व्यक्तियों का एक नमूना है, जिनमें से 93 (एफ) की पीठ पर एक अनुदैर्ध्य पट्टी है। यह पता लगाना आवश्यक है कि जिस जनसंख्या से नमूना लिया गया था उसमें रुचि के लक्षण वाले व्यक्तियों का अनुपात ज्ञात डेटा से मेल खाता है या नहीं। हमारे पास है: p=f/n=93/125=0.744, a=0.62, n(1-p)=125(1-0.744)=32>5 और

इसलिए, महत्व स्तर = 0.05 और = 0.01 दोनों के लिए, शून्य परिकल्पना को अस्वीकार कर दिया जाना चाहिए, क्योंकि = 0.05 के लिए महत्वपूर्ण मान 1.96 है, और = 0.01 - 2.58 के लिए।

यदि दो बड़ी आबादी हैं जिनमें हमारे लिए रुचि की संपत्ति के साथ वस्तुओं का अनुपात क्रमशः और है, तो परिकल्पना का परीक्षण करना दिलचस्प है: = बनाम विकल्प:। सत्यापन के लिए, वॉल्यूम के दो नमूने यादृच्छिक और स्वतंत्र रूप से निकाले जाते हैं। इन नमूनों के आधार पर आंकड़ों का अनुमान और निर्धारण किया जाता है।

(20)

पहले और दूसरे नमूने में क्रमशः उन वस्तुओं की संख्या कहां और कितनी है जिनमें यह सुविधा है।

सूत्र (20) से यह समझा जा सकता है कि इसकी व्युत्पत्ति में उसी सिद्धांत का उपयोग किया गया था, जिसका सामना हमने पहले किया था। अर्थात्, सांख्यिकीय परिकल्पनाओं का परीक्षण करने के लिए, हमारे लिए रुचि के संकेतकों के बीच अंतर बनाने वाले मानक विचलन की संख्या निर्धारित की जाती है, वास्तव में, मान (+)/(+) दोनों में दी गई विशेषता वाली वस्तुओं का अनुपात है नमूने एक साथ. यदि हम इसे इससे निरूपित करते हैं, तो हर (20) के दूसरे कोष्ठक में अभिव्यक्ति (1-) है और यह स्पष्ट हो जाता है कि अभिव्यक्ति (20) शून्य परिकल्पना के परीक्षण के सूत्र के बराबर है:

क्योंकि।

दूसरी ओर, मानक त्रुटि. इस प्रकार, (20) को इस प्रकार लिखा जा सकता है

. (21)

इस आँकड़े और साधनों के बारे में परिकल्पनाओं के परीक्षण में प्रयुक्त आँकड़ों के बीच एकमात्र अंतर यह है कि z में t-वितरण के बजाय एक इकाई सामान्य वितरण है।

बता दें कि लोगों के एक समूह (= 82) के अध्ययन से पता चलता है कि इलेक्ट्रोएन्सेफलोग्राम में -रिदम वाले लोगों का अनुपात 0.84 या 84% है। दूसरे क्षेत्र (=51) में लोगों के एक समूह के अध्ययन से पता चला कि यह अनुपात 0.78 है। =0.05 के महत्व स्तर के लिए, यह जांचना आवश्यक है कि जिन सामान्य आबादी से नमूने लिए गए थे, उनमें मस्तिष्क अल्फा गतिविधि वाले व्यक्तियों का अनुपात समान है।

सबसे पहले, आइए सुनिश्चित करें कि उपलब्ध प्रयोगात्मक डेटा हमें सांख्यिकी (20) का उपयोग करने की अनुमति देता है। हमारे पास है:

और चूँकि z सामान्य रूप से वितरित है, जिसके लिए =0.05 पर क्रांतिक बिंदु 1.96 है, शून्य परिकल्पना स्वीकार की जाती है।

माना गया मानदंड मान्य है यदि नमूने जिनके लिए हमारे लिए रुचि की विशेषता वाली वस्तुओं के अनुपात की तुलना की गई थी, वे स्वतंत्र हैं। यदि यह आवश्यकता पूरी नहीं होती है, उदाहरण के लिए, जब सेट को क्रमिक समय अंतराल में माना जाता है, तो इन अंतरालों में एक ही वस्तु में यह सुविधा हो भी सकती है और नहीं भी।

आइए हम वस्तु में रुचि की किसी विशेषता की उपस्थिति को 1 के रूप में दर्शाते हैं, और उसकी अनुपस्थिति को 0 के रूप में दर्शाते हैं। फिर हम तालिका 3 पर पहुंचते हैं, जहां (a+c) पहले नमूने में उन वस्तुओं की संख्या है जिनमें कुछ विशेषताएं हैं, ( a+c) दूसरे नमूने में इस सुविधा के साथ वस्तुओं की संख्या है, और n जांच की गई वस्तुओं की कुल संख्या है। यह स्पष्ट है कि यह पहले से ही एक प्रसिद्ध चार-फ़ील्ड तालिका है, जिसमें गुणांक का उपयोग करके संबंध का अनुमान लगाया जाता है

ऐसी मेज और छोटी के लिए (<10) значений в каждой клетке Р.Фишером было найдено точное распределение для, которое позволяет проверять гипотезу: =. Это распределение имеет довольно сложный вид, и его критические точки приводятся в специальных таблицах. В реальных ситуациях, как правило, значения в каждой клетке больше 10, и было показано, что в этих случаях для проверки нулевой гипотезы можно использовать статистику

(22)
जो, यदि शून्य परिकल्पना सत्य है, तो स्वतंत्रता की एक डिग्री के साथ काई-स्क्वायर वितरण होता है।

एक उदाहरण पर विचार करें. बता दें कि साल के अलग-अलग समय पर दिए जाने वाले मलेरिया के टीकों की प्रभावशीलता का दो साल तक परीक्षण किया जाता है। इस परिकल्पना का परीक्षण किया जा रहा है कि टीकाकरण की प्रभावशीलता साल के उस समय पर निर्भर नहीं करती है जब वे लगाए गए हैं। हमारे पास है

=0.05 के लिए सारणीबद्ध मान 3.84 है और =0.01 के लिए 6.64 है। इसलिए, महत्व के इनमें से किसी भी स्तर पर, शून्य परिकल्पना को खारिज कर दिया जाना चाहिए, और इस काल्पनिक उदाहरण में (जो, हालांकि, वास्तविकता के लिए प्रासंगिक है), यह निष्कर्ष निकाला जा सकता है कि वर्ष की दूसरी छमाही में बनाई गई बियर काफी अधिक हैं असरदार।

चार-फ़ील्ड तालिका के लिए कनेक्शन गुणांक का एक प्राकृतिक सामान्यीकरण, जैसा कि पहले उल्लेख किया गया है, चुप्रोव पारस्परिक संयुग्मन गुणांक है। इस गुणांक के लिए, सटीक वितरण अज्ञात है, इसलिए, इस वितरण के लिए महत्वपूर्ण बिंदुओं के साथ गणना मूल्य और चयनित महत्व स्तर की तुलना करके परिकल्पना की वैधता का आकलन किया जाता है। स्वतंत्रता की डिग्री की संख्या अभिव्यक्ति (आर-1)(सी-1) से निर्धारित की जाती है, जहां आर और सी प्रत्येक सुविधा के लिए ग्रेडेशन की संख्या हैं।

गणना सूत्र याद करें

जिन लोगों में दृश्य विसंगतियाँ नहीं हैं, उनमें दायीं और बायीं आँखों से दृष्टि की सीमा के अध्ययन के दौरान प्राप्त डेटा प्रस्तुत किया गया है। परंपरागत रूप से, इस सीमा को चार श्रेणियों में विभाजित किया गया है, और हम बाईं और दाईं आंखों की दृष्टि की सीमा के बीच संबंध की विश्वसनीयता में रुचि रखते हैं। पहले हम दोहरे योग में सभी पद ज्ञात करते हैं। ऐसा करने के लिए, तालिका में दिए गए प्रत्येक मान के वर्ग को उस पंक्ति और स्तंभ के योग से विभाजित किया जाता है जिससे चयनित संख्या संबंधित होती है। हमारे पास है

इस मान का उपयोग करने पर, हमें =3303.6 और T=0.714 मिलता है।

जनसंख्या वितरण की तुलना के लिए 4 मानदंड

मटर प्रजनन पर शास्त्रीय प्रयोगों में, जिसने आनुवंशिकी की शुरुआत को चिह्नित किया, जी. मेंडल ने पौधों को गोल पीले बीज और झुर्रीदार हरे बीज के साथ पार करके प्राप्त विभिन्न प्रकार के बीजों की आवृत्तियों का अवलोकन किया।

इस और इसी तरह के मामलों में, सामान्य आबादी के वितरण कार्यों की समानता के बारे में शून्य परिकल्पना का परीक्षण करना दिलचस्प है, जहां से नमूने लिए गए हैं। सैद्धांतिक गणनाओं से पता चला है कि ऐसी समस्या को हल करते समय सांख्यिकी का उपयोग किया जा सकता है

= (23)

इस सांख्यिकी का उपयोग करने वाला मानदंड के. पियर्सन द्वारा प्रस्तावित किया गया था और उसका नाम उन्हीं के नाम पर रखा गया है। पियर्सन का परीक्षण समूहीकृत डेटा पर लागू किया जाता है, भले ही उनका वितरण निरंतर या असतत हो। (23) में, k क्लस्टरिंग अंतरालों की संख्या है, अनुभवजन्य प्रचुरता है, और अपेक्षित या सैद्धांतिक प्रचुरता (=n) है। यदि शून्य परिकल्पना सत्य है, तो सांख्यिकी (23) में - स्वतंत्रता की k-1 डिग्री के साथ वितरण होता है।

तालिका में दिए गए डेटा के लिए

=0.05 और =0.01 के लिए 3 डिग्री स्वतंत्रता के साथ -वितरण के महत्वपूर्ण बिंदु क्रमशः 7.81 और 11.3 हैं। इसलिए, शून्य परिकल्पना स्वीकार की जाती है और यह निष्कर्ष निकाला जाता है कि संतानों में अलगाव सैद्धांतिक कानूनों के साथ अच्छी तरह मेल खाता है।

आइए एक और उदाहरण पर विचार करें। गिनी सूअरों की कॉलोनी में, जनवरी से शुरू होकर, वर्ष के दौरान महीनों के आधार पर पुरुषों की निम्नलिखित जन्म संख्या प्राप्त की गई: 65, 64, 65, 41, 72, 80, 88, 114, 80, 129, 112, 99। एक समान वितरण के लिए, अर्थात वह वितरण जिसमें कुछ महीनों में जन्म लेने वाले पुरुषों की संख्या औसतन समान होती है? यदि हम इस परिकल्पना को स्वीकार करते हैं, तो जन्म लेने वाले पुरुषों की अपेक्षित औसत संख्या बराबर होगी। तब

स्वतंत्रता की 11 डिग्री और = 0.01 के साथ वितरण का महत्वपूर्ण मूल्य 24.7 है, इसलिए चुने हुए महत्व स्तर पर शून्य परिकल्पना खारिज कर दी जाती है। प्रायोगिक डेटा के आगे के विश्लेषण से पता चलता है कि वर्ष की दूसरी छमाही में नर गिनी सूअरों के जन्म की संभावना बढ़ जाती है।

ऐसे मामले में जहां सैद्धांतिक वितरण को एक समान माना जाता है, सैद्धांतिक संख्याओं की गणना में कोई समस्या नहीं है। अन्य वितरणों के मामले में, गणनाएँ अधिक जटिल हो जाती हैं। आइए उदाहरण देखें कि सामान्य और पॉइसन वितरण के लिए सैद्धांतिक संख्याओं की गणना कैसे की जाती है, जो अनुसंधान अभ्यास में काफी सामान्य हैं।

आइए सामान्य वितरण के लिए सैद्धांतिक संख्याओं की परिभाषा से शुरुआत करें। विचार हमारे अनुभवजन्य वितरण को शून्य माध्य और इकाई विचरण वाले वितरण में बदलना है। स्वाभाविक रूप से, इस मामले में, वर्ग-अंतराल की सीमाएं मानक विचलन की इकाइयों में व्यक्त की जाएंगी, और फिर, यह याद रखते हुए कि प्रत्येक अंतराल के ऊपरी और निचले मानों से घिरे वक्र के अनुभाग के अंतर्गत क्षेत्र बराबर है इस अंतराल में गिरने की संभावना, इस संभावना को नमूनों की कुल संख्या से गुणा करने पर, हमें वांछित सैद्धांतिक संख्या प्राप्त होगी।

मान लीजिए कि हमारे पास ओक के पत्तों की लंबाई के लिए एक अनुभवजन्य वितरण है और यह जांचना आवश्यक है कि क्या इसे महत्व स्तर = 0.05 के साथ माना जा सकता है कि यह वितरण सामान्य से काफी अलग नहीं है।

आइए हम बताते हैं कि तालिका में दिए गए मानों की गणना कैसे की गई। सबसे पहले, समूहीकृत डेटा के लिए मानक विधि के अनुसार, माध्य और मानक विचलन की गणना की गई, जो =10.3 और =2.67 निकला। इन मूल्यों के आधार पर, अंतराल की सीमाएं मानक विचलन की इकाइयों में पाई गईं, यानी। मानकीकृत मान मिले उदाहरण के लिए, अंतराल (46) की सीमाओं के लिए हमारे पास है: (4-10.3)/2.67=-2.36; (6-10.3)/2.67=-1.61. फिर, प्रत्येक अंतराल के लिए, इसमें गिरने की संभावना की गणना की गई। उदाहरण के लिए, सामान्य वितरण तालिका से अंतराल (-0.110.64) के लिए, हमारे पास बिंदु के बाईं ओर (-0.11) इकाई सामान्य वितरण के क्षेत्र का 0.444 है, और बाईं ओर बिंदु (0.64) - इस क्षेत्र का 0.739। इस प्रकार, इस अंतराल में गिरने की संभावना 0.739-0.444=0.295 है। बाकी गणनाएँ स्पष्ट हैं। n और के बीच अंतर स्पष्ट करें। यह इस तथ्य के कारण उत्पन्न होता है कि सैद्धांतिक सामान्य वितरण को व्यावहारिक उद्देश्यों के लिए एक अंतराल पर केंद्रित माना जा सकता है। प्रयोग में ऐसा कोई मान नहीं है जो माध्य से अधिक विचलन करता हो। अतः अनुभवजन्य वितरण वक्र के अंतर्गत क्षेत्रफल इकाई के बराबर नहीं है, जिसके कारण त्रुटि उत्पन्न होती है। हालाँकि, यह त्रुटि अंतिम परिणामों में महत्वपूर्ण परिवर्तन नहीं करती है।

अनुभवजन्य और सैद्धांतिक वितरणों की तुलना करते समय, -वितरण के लिए स्वतंत्रता की डिग्री की संख्या संबंध f=m-1-l से पाई जाती है, जहां m वर्ग-अंतराल की संख्या है, और l स्वतंत्र वितरण मापदंडों की संख्या है नमूने से अनुमान लगाया गया। सामान्य वितरण के लिए, l=2, क्योंकि यह दो मापदंडों पर निर्भर करता है: और।

स्वतंत्रता की डिग्री की संख्या भी 1 से कम हो गई है, क्योंकि किसी भी वितरण के लिए एक शर्त है कि \u003d 1, और इसलिए, स्वतंत्र रूप से निर्धारित संभावनाओं की संख्या k-1 है, k नहीं।

दिए गए उदाहरण के लिए, f = 8-2-1 = 5 और 5 डिग्री स्वतंत्रता के साथ एक .alpha.-वितरण के लिए =0.05 पर महत्वपूर्ण मान 11.07 है। अतः शून्य परिकल्पना स्वीकृत की जाती है।

हम घोड़े के खुर के प्रहार से प्रशिया सेना में प्रति माह ड्रैगून की मौतों की संख्या के उत्कृष्ट उदाहरण का उपयोग करके पॉइसन वितरण के साथ अनुभवजन्य वितरण की तुलना करने की तकनीक पर विचार करेंगे। डेटा 19वीं सदी को संदर्भित करता है, और मौतों की संख्या 0, 1, 2, आदि है। लगभग 20 वर्षों के अवलोकन में प्रशिया की घुड़सवार सेना में इन दुखद, लेकिन, सौभाग्य से, अपेक्षाकृत दुर्लभ घटनाओं की विशेषताएँ बताई गई हैं।

जैसा कि आप जानते हैं, पॉइसन वितरण का निम्नलिखित रूप है:

वितरण पैरामीटर माध्य के बराबर कहां है,

K=0,1,2,...,n.

चूंकि वितरण अलग है, इसलिए हमारे लिए रुचि की संभावनाएं सीधे सूत्र द्वारा पाई जाती हैं।

आइए, उदाहरण के लिए, दिखाएं कि k=3 के लिए सैद्धांतिक संख्या कैसे निर्धारित की जाती है। सामान्य तरीके से, हम पाते हैं कि इस वितरण में औसत 0.652 है। इस मान से हम पाते हैं

यहाँ से

यदि =0.05 चुना जाता है, तो 2-डीओएफ β-वितरण के लिए महत्वपूर्ण मान 5.99 है, और इसलिए यह परिकल्पना स्वीकार की जाती है कि महत्व के चुने हुए स्तर पर अनुभवजन्य वितरण पॉइसन वितरण से भिन्न नहीं है। इस मामले में स्वतंत्रता की डिग्री की संख्या दो के बराबर है, क्योंकि पॉइसन वितरण एक पैरामीटर पर निर्भर करता है, और इसलिए, अनुपात एफ = एम-1-एल में, नमूने से अनुमानित पैरामीटर की संख्या एल = 1 है, और f=4-1-1=2.

कभी-कभी व्यवहार में यह जानना महत्वपूर्ण होता है कि क्या दो वितरण एक-दूसरे से भिन्न हैं, भले ही यह तय करना मुश्किल हो कि उन्हें किस सैद्धांतिक वितरण द्वारा अनुमानित किया जा सकता है। यह उन मामलों में विशेष रूप से महत्वपूर्ण है, जहां, उदाहरण के लिए, उनके साधन और/या भिन्नताएं सांख्यिकीय रूप से एक-दूसरे से महत्वपूर्ण रूप से भिन्न नहीं होती हैं। वितरण पैटर्न में महत्वपूर्ण अंतर खोजने से शोधकर्ता को उन संभावित कारकों के बारे में अनुमान लगाने में मदद मिल सकती है जो इन अंतरों को जन्म देते हैं।

इस मामले में, सांख्यिकी (23) का उपयोग किया जा सकता है, और एक वितरण के मूल्यों को अनुभवजन्य संख्याओं के रूप में उपयोग किया जाता है, और दूसरे वितरण के मूल्यों को सैद्धांतिक संख्याओं के रूप में उपयोग किया जाता है। स्वाभाविक रूप से, इस मामले में, अंतरालों के एक वर्ग में विभाजन दोनों वितरणों के लिए समान होना चाहिए। इसका मतलब यह है कि दोनों नमूनों के सभी डेटा के लिए, न्यूनतम और अधिकतम मान चुने जाते हैं, चाहे वे किसी भी नमूने के हों, और फिर, वर्ग अंतराल की चयनित संख्या के अनुसार, उनकी चौड़ाई और वस्तुओं की संख्या निर्धारित की जाती है। जो अलग-अलग अंतरालों में आते हैं, उनकी गणना प्रत्येक नमूने के लिए अलग से की जाती है।

इस मामले में, यह पता चल सकता है कि कुछ वर्गों को या तो कुछ (35) मान नहीं मिलते हैं या मिलते हैं। यदि प्रत्येक अंतराल में कम से कम 35 मान आते हैं तो पियर्सन मानदंड का उपयोग संतोषजनक परिणाम देता है। इसलिए, यदि यह आवश्यकता पूरी नहीं होती है, तो आसन्न अंतरालों को मर्ज करना आवश्यक है। बेशक, यह दोनों वितरणों के लिए किया जाता है।

और, अंत में, महत्व के चुने हुए स्तर के अनुसार परिकलित मूल्य और उसके लिए महत्वपूर्ण बिंदुओं की तुलना के संबंध में एक और टिप्पणी। हम पहले से ही जानते हैं कि यदि >, तो शून्य परिकल्पना अस्वीकृत हो जाती है। हालाँकि, दाईं ओर महत्वपूर्ण बिंदु 1- के करीब के मान भी हमारे संदेह को जगा सकते हैं, क्योंकि अनुभवजन्य और सैद्धांतिक वितरण या दो अनुभवजन्य वितरण के बीच इतना अच्छा समझौता (आखिरकार, इस मामले में संख्याएं बहुत थोड़ी भिन्न होंगी) एक दूसरे से) यादृच्छिक वितरण के घटित होने की संभावना नहीं है। इस मामले में, दो वैकल्पिक स्पष्टीकरण संभव हैं: या तो हम एक कानून के साथ काम कर रहे हैं, और फिर प्राप्त परिणाम आश्चर्यजनक नहीं है, या प्रयोगात्मक डेटा किसी कारण से एक-दूसरे के लिए "फिट" हैं, जिसके लिए उनके पुन: सत्यापन की आवश्यकता होती है।

वैसे, मटर के उदाहरण में, हमारे पास सिर्फ पहला मामला है, यानी। संतानों में विभिन्न चिकनाई और रंग के बीजों की उपस्थिति कानून द्वारा निर्धारित की जाती है, और इसलिए यह आश्चर्य की बात नहीं है कि गणना मूल्य इतना छोटा निकला।

अब आइए दो अनुभवजन्य वितरणों की पहचान के बारे में सांख्यिकीय परिकल्पना के परीक्षण पर वापस लौटें। विभिन्न आवासों से लिए गए एनीमोन फूलों की पंखुड़ियों की संख्या के वितरण पर डेटा दिया गया है।

सारणीबद्ध डेटा से यह देखा जा सकता है कि पहले दो और अंतिम दो अंतरालों को संयोजित किया जाना चाहिए, क्योंकि उनमें आने वाले मूल्यों की संख्या पियर्सन मानदंड का सही ढंग से उपयोग करने के लिए पर्याप्त नहीं है। यह उदाहरण यह भी दर्शाता है कि यदि केवल आवास ए से वितरण का विश्लेषण किया जाता, तो 4 पंखुड़ियों वाला वर्ग-अंतराल बिल्कुल भी मौजूद नहीं होता। यह इस तथ्य के परिणामस्वरूप प्रकट हुआ कि दो वितरणों को एक साथ माना जाता है, और दूसरे वितरण में ऐसा वर्ग होता है।

तो, आइए इस परिकल्पना का परीक्षण करें कि ये दोनों वितरण एक दूसरे से भिन्न नहीं हैं। हमारे पास है

4 की स्वतंत्रता की कई डिग्री और यहां तक ​​कि 0.001 के महत्व स्तर के लिए, शून्य परिकल्पना खारिज कर दी जाती है।

दो नमूना वितरणों की तुलना करने के लिए, एन.वी. स्मिरनोव द्वारा प्रस्तावित और ए.एन. कोलमोगोरोव द्वारा पहले पेश किए गए आंकड़ों के आधार पर एक गैर-पैरामीट्रिक मानदंड का भी उपयोग किया जा सकता है। (इसीलिए इस परीक्षण को कभी-कभी कोलमोगोरोव-स्मिरनोव परीक्षण भी कहा जाता है।) यह परीक्षण संचयी आवृत्ति श्रृंखला की तुलना पर आधारित है। इस मानदंड के आँकड़े इस प्रकार पाए जाते हैं

अधिकतम, (24)
संचयी आवृत्ति वितरण वक्र कहां और कहां हैं।

संबंध से सांख्यिकी के लिए महत्वपूर्ण बिंदु (24) मिलते हैं

, (25)
पहले और दूसरे नमूने के आयतन कहाँ और क्या हैं।

=0.1;=0.05 के लिए महत्वपूर्ण मान; और =0.01 क्रमशः 1.22 के बराबर हैं; 1.36; 1.63. आइए हम समूहीकृत डेटा पर स्मिरनोव मानदंड के उपयोग का वर्णन करें और दो अलग-अलग जिलों के एक ही उम्र के स्कूली बच्चों की वृद्धि का प्रतिनिधित्व करें।

संचयी आवृत्ति वक्रों के बीच अधिकतम अंतर 0.124 है। यदि हम महत्व स्तर =0.05 चुनते हैं, तो सूत्र (25) से हमारे पास है

0,098.

इस प्रकार, अधिकतम अनुभवजन्य अंतर सैद्धांतिक रूप से अपेक्षित से अधिक है, इसलिए, महत्व के स्वीकृत स्तर पर, दो माने गए वितरणों की पहचान के बारे में शून्य परिकल्पना खारिज कर दी जाती है।

स्मिरनोव परीक्षण का उपयोग गैर-समूहित डेटा के लिए भी किया जा सकता है, एकमात्र आवश्यकता यह है कि डेटा को निरंतर वितरण के साथ आबादी से लिया जाना चाहिए। यह भी वांछनीय है कि प्रत्येक नमूने में मानों की संख्या कम से कम 40-50 हो।

शून्य परिकल्पना का परीक्षण करने के लिए, जिसके अनुसार आकार n और m के दो स्वतंत्र नमूने समान वितरण कार्यों के अनुरूप हैं, एफ. विलकॉक्सन ने एक गैर-पैरामीट्रिक मानदंड प्रस्तावित किया, जिसे जी. मान और एफ. व्हिटनी के कार्यों में प्रमाणित किया गया था। इसलिए, साहित्य में इस मानदंड को या तो विलकॉक्सन मानदंड या मैन-व्हिटनी मानदंड कहा जाता है। जब प्राप्त नमूनों की मात्रा छोटी हो और अन्य मानदंडों का उपयोग अवैध हो तो इस मानदंड का उपयोग करना उचित है।

नीचे दी गई गणना मानदंड के निर्माण के दृष्टिकोण को दर्शाती है जो नमूना मूल्यों से संबंधित नहीं बल्कि उनके रैंक से संबंधित आंकड़ों का उपयोग करती है।

आइए हमारे पास आयतन n और m मानों के दो नमूने हैं। आइए हम उनसे एक सामान्य परिवर्तनशील श्रृंखला बनाएं, और इनमें से प्रत्येक मान की तुलना उसके रैंक () से करें, अर्थात। वह क्रमांक जो वह रैंक की गई पंक्ति में रखता है। यदि शून्य परिकल्पना सत्य है, तो रैंकों का कोई भी वितरण समसंभाव्य है, और दिए गए n और m के लिए रैंकों के संभावित संयोजनों की कुल संख्या, m द्वारा N=n+m तत्वों के संयोजनों की संख्या के बराबर है।

विलकॉक्सन परीक्षण आंकड़ों पर आधारित है

. (26)

औपचारिक रूप से, अशक्त परिकल्पना का परीक्षण करने के लिए, रैंकों के सभी संभावित संयोजनों की गणना करना आवश्यक है जिसके लिए आँकड़े डब्ल्यू एक विशेष रैंक श्रृंखला के लिए प्राप्त मूल्यों के बराबर या उससे कम मान लेते हैं, और इस संख्या का कुल अनुपात ज्ञात करते हैं। दोनों नमूनों के लिए रैंकों के संभावित संयोजनों की संख्या। चयनित महत्व स्तर के साथ प्राप्त मूल्य की तुलना शून्य परिकल्पना को स्वीकार या अस्वीकार करने की अनुमति देगी। इस दृष्टिकोण की तर्कसंगतता यह है कि यदि एक वितरण दूसरे के सापेक्ष पक्षपाती है, तो यह इस तथ्य में प्रकट होगा कि छोटी रैंक मुख्य रूप से एक नमूने के अनुरूप होनी चाहिए, और बड़ी रैंक दूसरे के अनुरूप होनी चाहिए। इसके आधार पर, रैंकों का संगत योग छोटा या बड़ा होना चाहिए, यह इस पर निर्भर करता है कि कौन सा विकल्प होता है।

माप के दोनों तरीकों की विशेषता वाले वितरण कार्यों की समानता के बारे में परिकल्पना का महत्व स्तर = 0.05 के साथ परीक्षण करना आवश्यक है।

इस उदाहरण में n=3, m=2, N = 2+3 = 5, और विधि बी द्वारा माप के अनुरूप रैंकों का योग 1+3 = 4 है।

आइए रैंकों और उनके योगों के सभी =10 संभावित वितरण लिखें:

रैंक: 1.2 1.3 1.4 1.5 2.3 2.4 2.5 3.4 3.5 4.5

राशियाँ: 3 4 5 6 5 5 6 7 7 8 9

रैंकों के संयोजनों की संख्या का अनुपात, जिसका योग विधि बी के लिए 4 के प्राप्त मूल्य से अधिक नहीं है, रैंकों के संभावित संयोजनों की कुल संख्या का अनुपात 2/10=0.2>0.05 है, इसलिए इस उदाहरण के लिए, शून्य परिकल्पना स्वीकृत की जाती है।

एन और एम के छोटे मूल्यों के लिए, रैंकों के संबंधित योगों के संयोजनों की संख्या की सीधे गणना करके शून्य परिकल्पना का परीक्षण किया जा सकता है। हालाँकि, बड़े नमूनों के लिए, यह व्यावहारिक रूप से असंभव हो जाता है, इसलिए डब्ल्यू सांख्यिकी के लिए एक अनुमान प्राप्त किया गया था, जो, जैसा कि यह निकला, उपयुक्त मापदंडों के साथ एक सामान्य वितरण की ओर जाता है। हम रैंकों के आधार पर सांख्यिकीय मानदंडों के संश्लेषण के दृष्टिकोण को स्पष्ट करने के लिए इन मापदंडों की गणना करेंगे। ऐसा करने में, हम अध्याय 37 में प्रस्तुत परिणामों का उपयोग करेंगे।

मान लीजिए कि W किसी एक नमूने के अनुरूप रैंकों का योग है, उदाहरण के लिए, आयतन m वाला। आइए इन रैंकों का अंकगणितीय माध्य बनें। मूल्य की गणितीय अपेक्षा है

चूँकि अशक्त परिकल्पना के तहत, आकार m के नमूने के तत्वों की रैंक 1, 2,...,N (N=n+m) की परिमित जनसंख्या से एक नमूना है। ह ज्ञात है कि

इसीलिए।

विचरण की गणना करते समय, हम इस तथ्य का उपयोग करते हैं कि दोनों नमूनों के मूल्यों से बनी समग्र रैंक श्रृंखला के वर्ग रैंकों का योग बराबर है

सामान्य आबादी और नमूनों की भिन्नता का अनुमान लगाने के लिए पहले प्राप्त संबंधों को ध्यान में रखते हुए, हमारे पास है

अत: यह उसका अनुसरण करता है

आंकड़ों से पता चला है

(27)

बड़े n और m के लिए एक असम्बद्ध रूप से इकाई सामान्य वितरण होता है।

एक उदाहरण पर विचार करें. मान लीजिए कि दो आयु समूहों के लिए रक्त सीरम फ़िल्ट्रेट की पोलारोग्राफ़िक गतिविधि पर डेटा प्राप्त किया गया है। महत्व स्तर = 0.05 के साथ परिकल्पना का परीक्षण करना आवश्यक है कि नमूने समान वितरण कार्यों के साथ सामान्य आबादी से लिए गए हैं। पहले नमूने के लिए रैंकों का योग 30 है, दूसरे के लिए - 90। रैंकों के योग की गणना की शुद्धता की जाँच करना शर्त की पूर्ति है। हमारे मामले में 30+90=(7+8)(7+8+1):

:2=120. सूत्र (27) के अनुसार, दूसरे नमूने की रैंकों के योग का उपयोग करते हुए, हमारे पास है

यदि हम पहले नमूने के लिए रैंकों के योग का उपयोग करते हैं, तो हमें मान = -3.01 मिलता है। चूंकि गणना किए गए आँकड़ों में एक इकाई सामान्य वितरण होता है, इसलिए यह स्वाभाविक है कि पहले और दूसरे दोनों मामलों में शून्य परिकल्पना खारिज कर दी जाती है, क्योंकि 5% महत्व स्तर के लिए महत्वपूर्ण मान मॉड्यूलो 1.96 है।

विलकॉक्सन परीक्षण का उपयोग करते समय, दोनों नमूनों में समान मान होने पर कुछ कठिनाइयाँ उत्पन्न होती हैं, क्योंकि उपरोक्त सूत्र के उपयोग से परीक्षण की शक्ति में कमी आती है, जो कभी-कभी बहुत महत्वपूर्ण होती है।

ऐसे मामलों में त्रुटियों को कम करने के लिए, निम्नलिखित नियम का उपयोग करने की सलाह दी जाती है। पहली बार जब विभिन्न नमूनों से संबंधित समान मान सामने आते हैं, तो विविधता श्रृंखला में किसे पहले रखा जाए यह संयोग से निर्धारित होता है, उदाहरण के लिए, एक सिक्का उछालकर। यदि ऐसे कई मान हैं, तो, पहले को यादृच्छिक रूप से निर्धारित करने के बाद, दोनों नमूनों से शेष समान मान एक के माध्यम से वैकल्पिक होते हैं। उन मामलों में जहां अन्य समान मूल्य भी होते हैं, ऐसा करें। यदि समान मूल्यों के पहले समूह में, पहला मान यादृच्छिक रूप से कुछ नमूनों में से एक से चुना गया था, तो समान मूल्यों के अगले समूह में, पहला मान दूसरे नमूने से चुना गया है, और इसी तरह।

5. यादृच्छिकता का परीक्षण करने और आउटलेर्स का मूल्यांकन करने के लिए मानदंड

अक्सर, डेटा समय या स्थान में श्रृंखला में प्राप्त किया जाता है। उदाहरण के लिए, साइकोफिजियोलॉजिकल प्रयोगों के संचालन की प्रक्रिया में, जो कई घंटों, कई दसियों या सैकड़ों बार चल सकता है, प्रस्तुत दृश्य उत्तेजना की प्रतिक्रिया की अव्यक्त (अव्यक्त अवधि) को मापा जाता है, या भौगोलिक सर्वेक्षणों में, जब स्थित साइटों पर कुछ स्थानों पर, उदाहरण के लिए, जंगलों के किनारे, एक निश्चित प्रजाति के पौधों की संख्या की गणना की जाती है, आदि। दूसरी ओर, विभिन्न आँकड़ों की गणना करते समय, यह माना जाता है कि इनपुट डेटा स्वतंत्र और समान रूप से वितरित हैं। इसलिए, इस धारणा का परीक्षण करना दिलचस्प है।

सबसे पहले, समान रूप से सामान्य रूप से वितरित चर की स्वतंत्रता की शून्य परिकल्पना का परीक्षण करने के लिए एक मानदंड पर विचार करें। इस प्रकार, यह मानदंड पैरामीट्रिक है। यह क्रमिक अंतरों के माध्य वर्गों की गणना पर आधारित है

. (28)

यदि हम एक नया आँकड़ा प्रस्तुत करते हैं, तो, जैसा कि सिद्धांत से ज्ञात होता है, यदि शून्य परिकल्पना सत्य है, तो आँकड़ा

(29)
n>10 के लिए मानक सामान्य वितरण के अनुसार स्पर्शोन्मुख रूप से वितरित किया जाता है।

एक उदाहरण पर विचार करें. साइकोफिजियोलॉजिकल प्रयोगों में से एक में विषय का प्रतिक्रिया समय () दिया गया है।

हमारे पास है: कहाँ

चूँकि =0.05 के लिए महत्वपूर्ण मान 1.96 है, परिणामी श्रृंखला की स्वतंत्रता के बारे में शून्य परिकल्पना को महत्व के चयनित स्तर के साथ स्वीकार किया जाता है।

एक और प्रश्न जो प्रयोगात्मक डेटा के विश्लेषण में अक्सर उठता है वह यह है कि कुछ अवलोकनों के साथ क्या किया जाए जो अधिकांश अवलोकनों से बिल्कुल भिन्न होते हैं। इस तरह के असाधारण अवलोकन पद्धति संबंधी त्रुटियों, कम्प्यूटेशनल त्रुटियों आदि से उत्पन्न हो सकते हैं। उन सभी मामलों में जहां प्रयोगकर्ता को पता है कि अवलोकन में कोई त्रुटि आ गई है, उसे इस मान को बाहर करना होगा, चाहे इसकी भयावहता कुछ भी हो। अन्य मामलों में, केवल गलती का संदेह होता है, और फिर एक या दूसरा निर्णय लेने के लिए उचित मानदंड का उपयोग करना आवश्यक होता है, अर्थात। बाहरी टिप्पणियों को बाहर निकालें या छोड़ें।

सामान्य मामले में, प्रश्न इस प्रकार प्रस्तुत किया जाता है: क्या अवलोकन एक ही सामान्य जनसंख्या पर किए गए थे, या क्या कुछ भाग या व्यक्तिगत मूल्य किसी अन्य सामान्य जनसंख्या को संदर्भित करते थे?

बेशक, व्यक्तिगत टिप्पणियों को खारिज करने का एकमात्र विश्वसनीय तरीका उन परिस्थितियों का सावधानीपूर्वक अध्ययन करना है जिनके तहत ये टिप्पणियां की जाती हैं। यदि किसी कारण से स्थितियाँ मानक से भिन्न हैं, तो टिप्पणियों को आगे के विश्लेषण से बाहर रखा जाना चाहिए। लेकिन कुछ मामलों में, मौजूदा मानदंड, हालांकि अपूर्ण हैं, महत्वपूर्ण लाभ हो सकते हैं।

हम यहां बिना प्रमाण के कई संबंध प्रस्तुत करते हैं जिनका उपयोग इस परिकल्पना का परीक्षण करने के लिए किया जा सकता है कि अवलोकन एक ही सामान्य जनसंख्या पर यादृच्छिक रूप से किए जाते हैं। हमारे पास है

(30)

(31)

(32)

जहां एक अवलोकन के बाह्य होने का संदेह है। यदि श्रृंखला के सभी मानों को क्रमबद्ध किया जाए, तो बाह्य अवलोकन उसमें nवाँ स्थान लेगा।

सांख्यिकी (30) के लिए, वितरण फ़ंक्शन सारणीबद्ध है। इस वितरण के महत्वपूर्ण बिंदु कुछ n के लिए दिए गए हैं।

n के आधार पर आँकड़ों के लिए महत्वपूर्ण मान (31) हैं

4,0; 6

4,5; 100

5.0; n>1000.

सूत्र (31) में, यह माना जाता है कि और संदिग्ध अवलोकन को ध्यान में रखे बिना गणना की जाती है।

आँकड़ों (32) के साथ स्थिति अधिक जटिल है। इसके लिए यह दिखाया गया है कि यदि उन्हें समान रूप से वितरित किया जाता है, तो गणितीय अपेक्षा और भिन्नता का रूप होता है:

महत्वपूर्ण क्षेत्र छोटे मानों से बनता है जो बड़े मानों के अनुरूप होते हैं। यदि आप सबसे छोटे मान के "बाहरी" की जाँच करने में रुचि रखते हैं, तो पहले डेटा को रूपांतरित करें ताकि अंतराल पर उनका एक समान वितरण हो, और फिर इन समान मानों को 1 में जोड़ें और सूत्र का उपयोग करके जाँच करें ( 32).

अवलोकनों की निम्नलिखित क्रमबद्ध श्रृंखला के लिए उपरोक्त मानदंडों के उपयोग पर विचार करें: 3,4,5,5,6,7,8,9,9,10,11,17। आपको यह तय करना होगा कि 17 के सबसे बड़े मान को अस्वीकार करना है या नहीं।

हमारे पास है: सूत्र (30) =(17-11)/3.81=1.57 के अनुसार, और शून्य परिकल्पना =0.01 पर स्वीकार की जानी चाहिए। सूत्र (31) =(17-7.0)/2.61=3.83 द्वारा, और शून्य परिकल्पना को भी स्वीकार किया जाना चाहिए। तीसरे मानदंड का उपयोग करने के लिए, हम =5.53 पाते हैं

डब्ल्यू आँकड़ा आम तौर पर शून्य माध्य और इकाई विचरण के साथ वितरित किया जाता है, और इसलिए = 0.05 पर शून्य परिकल्पना स्वीकार की जाती है।

सांख्यिकी (32) का उपयोग करने की जटिलता नमूना मूल्यों के वितरण के कानून के बारे में प्राथमिक जानकारी रखने की आवश्यकता है, और फिर विश्लेषणात्मक रूप से इस वितरण को अंतराल पर एक समान वितरण में बदल देती है।

साहित्य

1. एलिसेवा आई.आई. सांख्यिकी का सामान्य सिद्धांत: विश्वविद्यालयों के लिए एक पाठ्यपुस्तक / आई.आई. एलिसेवा, एम.एम. युज़्बाशेव; ईडी। आई.आई. एलिसेवा। एम.: वित्त एवं सांख्यिकी, 2009. 656 पी.

2. एफिमोवा एम.आर. सांख्यिकी के सामान्य सिद्धांत पर कार्यशाला: विश्वविद्यालयों के लिए पाठ्यपुस्तक / एम.आर. एफिमोवा और अन्य। एम.: वित्त और सांख्यिकी, 2007. 368 पी।

3. मेल्कुमोव हां.एस. सामाजिक-आर्थिक आँकड़े: शिक्षण सहायता। एम.: इम्पे-पब्लिश, 2007. 200 पी.

4. सांख्यिकी का सामान्य सिद्धांत: व्यावसायिक गतिविधि के अध्ययन में सांख्यिकीय पद्धति: विश्वविद्यालयों के लिए एक पाठ्यपुस्तक / ओ.ई. बशीना और अन्य; ईडी। ओ.ई. बशीना, ए.ए. स्पिरिन। - एम.: वित्त और सांख्यिकी, 2008. 440 पी।

5. सेलिन वी.एन. वित्तीय और आर्थिक प्रोफ़ाइल में विशेषज्ञों के प्रशिक्षण के लिए सांख्यिकी के सिद्धांत का पाठ्यक्रम: पाठ्यपुस्तक / वी.एन. सेलिन, ई.यू. चुरिलोवा। एम.: वित्त एवं सांख्यिकी, 2007. 480 पी.

6. सामाजिक-आर्थिक आँकड़े: कार्यशाला: पाठ्यपुस्तक / वी.एन. सेलिन और अन्य; ईडी। वी.एन. सलीना, ई.पी. शपाकोव्स्काया। एम.: वित्त एवं सांख्यिकी, 2009. 192 पी.

7. सांख्यिकी: पाठ्यपुस्तक / ए.वी. बगत और अन्य; ईडी। वी.एम. सिमचेरी. एम.: वित्त एवं सांख्यिकी, 2007. 368 पी.

8. सांख्यिकी: पाठ्यपुस्तक/आई.आई. एलिसेवा और अन्य; ईडी। आई.आई. एलिसेवा। एम.: उच्च शिक्षा, 2008. - 566 पी।

9. सांख्यिकी का सिद्धांत: विश्वविद्यालयों के लिए एक पाठ्यपुस्तक / आर.ए. श्मोयलोव और अन्य; ईडी। आर.ए. श्मोयलोवा. - एम.: वित्त और सांख्यिकी, 2007. 656 पी.

10. श्मोयलोवा आर.ए. सांख्यिकी के सिद्धांत पर कार्यशाला: विश्वविद्यालयों के लिए पाठ्यपुस्तक / आर.ए. श्मोयलोव और अन्य; ईडी। आर.ए. श्मोयलोवा. - एम.: वित्त और सांख्यिकी, 2007. 416 पी।

पेज \* मर्जफॉर्मेट 1

अन्य संबंधित कार्य जिनमें आपकी रुचि हो सकती है.vshm>

17926. औद्योगिक रोबोटिक्स के लिए कॉम्पैक्टनेस मानदंड का विश्लेषण 1.77एमबी
रोबोट की सघनता का आकलन करने के लिए सॉफ़्टवेयर समाधान। लघु रोबोट उद्घाटन के संकीर्ण अंतराल संरचनाओं में प्रवेश कर सकते हैं और आगे बढ़ सकते हैं, जो उन्हें सीमित स्थानों में विभिन्न कार्यों को करने के लिए उपयोग करने की अनुमति देता है, उदाहरण के लिए, कई मिलीमीटर के क्रम के आकार के साथ छोटे व्यास के पाइप। व्यावहारिक रूप से उद्योग की सभी शाखाओं में, एक्चुएटर्स और तंत्रों के लघुकरण के मुद्दे प्राथमिकता वाले कार्यों में से हैं; वे कम संसाधन वाली तकनीकी प्रक्रियाओं के लिए बहुत महत्वपूर्ण हैं...
1884. क्यूएमएस के लिए ओजेएससी कज़ान-ऑर्गसिंटेज़ में प्रभावी कार्मिक प्रबंधन के लिए मानदंड का विकास 204.77KB
कार्मिक प्रबंधन प्रणाली के मुख्य सैद्धांतिक पहलू। प्रबंधन की वस्तु के रूप में कार्मिक। क्यूएमएस के लिए कार्मिक प्रबंधन प्रणाली की अनुसंधान विधियाँ। कार्मिक प्रबंधन की दक्षता में सुधार के तरीके।
16316. और यह सिद्धांत इस दुविधा का समाधान करता है; बी इस दुविधा के समाधान के लिए इस सिद्धांत के मानदंडों के अस्तित्व की आवश्यकता है। 12.12KB
लेखक का तर्क है कि एक निश्चित विनिमय दर के तहत व्यापक आर्थिक नीति की दुविधा का मूल कारण टिनबर्गेन नियम का उल्लंघन नहीं है, जो वास्तव में एक परिणाम है और एक कारण नहीं है, बल्कि विनिमय को ठीक करने के लिए आवश्यक आर्थिक पूर्वापेक्षाओं का अभाव है। इष्टतम मुद्रा क्षेत्रों के सिद्धांत में प्रस्तुत दर। इस दुविधा का कारण आमतौर पर टिनबर्गेन के नियम का उल्लंघन माना जाता है, जिसके अनुसार, एक निश्चित संख्या में आर्थिक लक्ष्यों को प्राप्त करने के लिए, राज्य को...
18273. कानून के शासन और शक्तियों के पृथक्करण के सिद्धांत के लिए आम तौर पर स्वीकृत मानदंडों के दृष्टिकोण से कजाकिस्तान गणराज्य के राष्ट्रपति की कानूनी स्थिति का विश्लेषण 73.64KB
राष्ट्रपति के दृष्टिकोण का सार यह था कि देश का स्वाभाविक विकासवादी तरीके से विकास होना चाहिए। राष्ट्रपति सरकार - राज्य के संविधान द्वारा निर्धारित एक निश्चित क्षेत्रीय प्रशासनिक इकाई के स्व-सरकारी संस्थानों की गतिविधियों की समाप्ति और राज्य के प्रमुख द्वारा नियुक्त अधिकृत व्यक्तियों के माध्यम से उत्तरार्द्ध का प्रबंधन - राष्ट्रपति और उसके प्रति जवाबदेह व्यक्ति ; राज्य के मुखिया के संविधान में निहित - पूरे पैमाने पर आपातकालीन शक्तियों के राष्ट्रपति ...
5713. DotNetNuke का उपयोग करना 1.87एमबी
इस टर्म पेपर में हम DotNetNuke का अध्ययन करेंगे। DotNetNuke (DNN के रूप में संक्षिप्त) एक वेब सामग्री प्रबंधन प्रणाली (वेब ​​सामग्री प्रबंधन प्रणाली, abbr. WCMS) है, जो वेब प्रोजेक्ट निर्माण प्रौद्योगिकियों के क्षेत्र में सभी बेहतरीन उपलब्धियों को शामिल करती है।
7073. इंटरफ़ेस का उपयोग करना 56.59KB
इंटरफ़ेस शब्द अस्पष्ट है और विभिन्न संदर्भों में इसके अलग-अलग अर्थ हैं। एक सॉफ्टवेयर या हार्डवेयर इंटरफ़ेस की अवधारणा है, लेकिन ज्यादातर मामलों में इंटरफ़ेस शब्द वस्तुओं या प्रक्रियाओं के बीच किसी प्रकार के संचार से जुड़ा होता है।
6471. रजिस्टरों की संरचना और उपयोग 193.04KB
रजिस्टरों की संरचना और उपयोग रजिस्टरों को मल्टी-बिट बाइनरी संख्याओं को संग्रहीत और परिवर्तित करने के लिए डिज़ाइन किया गया है। रजिस्टरों को फ्लिप-फ्लॉप के क्रमबद्ध अनुक्रम के रूप में बनाया गया है। माइक्रोप्रोसेसरों में, रजिस्टर डिजिटल जानकारी को त्वरित रूप से याद रखने और संग्रहीत करने का मुख्य साधन हैं। जिन तत्वों से रजिस्टर बनाए जाते हैं वे गतिशील कटऑफ या स्थिर नियंत्रण के साथ डी आरएस जेके फ्लिप-फ्लॉप हैं।
6472. काउंटरों की संरचना और उपयोग 318.58KB
अतुल्यकालिक काउंटरों के निर्माण का वर्गीकरण और सिद्धांत एक काउंटर एक उपकरण है जिसके आउटपुट पर काउंटर के इनपुट पर प्राप्त दालों की संख्या को व्यक्त करते हुए एक बाइनरी कोड बनता है। संभावित प्रति अवस्थाओं की संख्या को इसका मापांक या गणना कारक कहा जाता है और दर्शाया जाता है। काउंटरों की मुख्य समय विशेषताएँ: गिनती दालों के आगमन की अधिकतम आवृत्ति; एक राज्य से दूसरे राज्य में संक्रमण का समय; वास्तव में एक या अधिक के आधार पर निर्मित काउंटर माइक्रो सर्किट और सर्किट होते हैं...
7066. ऐप में मेनू का उपयोग करना 240.2KB
प्रोग्राम मेनू प्रोग्राम मेनू को प्रोग्राम के मुख्य मोड के अनुरूप होना चाहिए, इसलिए, मेनू आइटम और व्यक्तिगत आइटम के कमांड की पसंद को विशेष देखभाल के साथ व्यवहार किया जाना चाहिए। कार्यक्रमों में मेनू का उपयोग करने की तकनीक की बेहतर समझ के लिए, आइए निम्नलिखित प्रशिक्षण कार्यक्रम को हल करते समय क्रियाओं के अनुक्रम पर विचार करें। सभी क्रियाएं मेनू का उपयोग करके की जाती हैं।
7067. संवाद मेनू का उपयोग करना 73.13KB
एक मेनू और एक टूलबार के साथ एक एप्लिकेशन के विकास को जारी रखते हुए, हमें 6 * 6 मैट्रिक्स बनाने और हमारे एप्लिकेशन के क्लाइंट क्षेत्र में मैट्रिक्स को प्रदर्शित (प्रिंट) करने के लिए कमांड के लिए संदेश हैंडलर कोड लिखना होगा। मैट्रिक्स का निर्माण हैंडलर के सफल समापन के बारे में स्क्रीन पर एक संदेश प्रदर्शित करके पूरा किया जाना चाहिए, उदाहरण के लिए, "मैट्रिक्स बनाया गया है।"

परिचय

इस विषय की प्रासंगिकता यह है कि जैवसांख्यिकी की मूल बातों के अध्ययन के दौरान, हमने मान लिया कि सामान्य जनसंख्या के वितरण का नियम ज्ञात है। लेकिन क्या होगा यदि वितरण कानून अज्ञात है, लेकिन यह मानने का कारण है कि इसका एक निश्चित रूप है (आइए इसे ए कहते हैं), तो शून्य परिकल्पना की जांच की जाती है: सामान्य जनसंख्या को कानून ए के अनुसार वितरित किया जाता है। इस परिकल्पना का परीक्षण किया जाता है एक विशेष रूप से चयनित यादृच्छिक चर का उपयोग करना - समझौते की कसौटी।

सैद्धांतिक संभाव्यता वितरण के लिए अनुभवजन्य वितरण के पत्राचार के बारे में परिकल्पनाओं का परीक्षण करने के लिए अच्छाई-की-फिट परीक्षण मानदंड हैं। ये मानदंड दो श्रेणियों में आते हैं:

  • III सामान्य अच्छाई-की-फिट मानदंड एक परिकल्पना के सबसे सामान्य सूत्रीकरण पर लागू होते हैं, अर्थात् परिकल्पना कि देखे गए परिणाम किसी पूर्व-कल्पित संभाव्यता वितरण से सहमत हैं।
  • III विशेष अच्छाई-की-फिट परीक्षण विशेष अशक्त परिकल्पनाओं का संकेत देते हैं जो संभाव्यता वितरण के एक निश्चित रूप के साथ समझौता तैयार करते हैं।

अच्छाई मानदंड

सबसे आम अच्छाई-की-फिट परीक्षण ओमेगा-स्क्वायर, ची-स्क्वायर, कोलमोगोरोव और कोलमोगोरोव-स्मिरनोव हैं।

समझौते कोलमोगोरोव, स्मिरनोव, ओमेगा स्क्वायर के गैर-पैरामीट्रिक परीक्षण व्यापक रूप से उपयोग किए जाते हैं। हालाँकि, वे सांख्यिकीय विधियों के अनुप्रयोग में व्यापक त्रुटियों से भी जुड़े हैं।

तथ्य यह है कि सूचीबद्ध मानदंड पूरी तरह से ज्ञात सैद्धांतिक वितरण के साथ समझौते का परीक्षण करने के लिए विकसित किए गए थे। गणना सूत्र, वितरण तालिकाएँ और महत्वपूर्ण मान व्यापक रूप से उपयोग किए जाते हैं। कोलमोगोरोव, ओमेगा वर्ग और समान मानदंड का मुख्य विचार अनुभवजन्य वितरण फ़ंक्शन और सैद्धांतिक वितरण फ़ंक्शन के बीच की दूरी को मापना है। ये मानदंड वितरण कार्यों के स्थान में दूरियों के रूप में भिन्न होते हैं।

एक साधारण परिकल्पना के लिए पियर्सन का पी2 फिट-ऑफ-फिट परीक्षण

के. पियर्सन का प्रमेय परिणामों की एक सीमित संख्या के साथ स्वतंत्र परीक्षणों को संदर्भित करता है, अर्थात। बर्नौली परीक्षणों के लिए (कुछ हद तक विस्तारित अर्थ में)। यह किसी को यह निर्णय लेने की अनुमति देता है कि क्या इन परिणामों की आवृत्ति के बड़ी संख्या में परीक्षणों में अवलोकन उनकी अनुमानित संभावनाओं के अनुरूप हैं।

कई व्यावहारिक समस्याओं में, सटीक वितरण कानून अज्ञात है। इसलिए, मौजूदा अनुभवजन्य कानून के पत्राचार के बारे में एक परिकल्पना सामने रखी गई है, जो टिप्पणियों के आधार पर, कुछ सैद्धांतिक कानून के आधार पर बनाई गई है। इस परिकल्पना के लिए सांख्यिकीय परीक्षण की आवश्यकता है, जिसके परिणामों की या तो पुष्टि की जाएगी या खंडन किया जाएगा।

माना कि अध्ययन के अंतर्गत X यादृच्छिक चर है। परिकल्पना H0 का परीक्षण करने के लिए यह आवश्यक है कि यह यादृच्छिक चर वितरण कानून F(x) का पालन करता है। ऐसा करने के लिए, n स्वतंत्र अवलोकनों का एक नमूना बनाना और उसमें से एक अनुभवजन्य वितरण कानून F "(x) बनाना आवश्यक है। अनुभवजन्य और काल्पनिक कानूनों की तुलना करने के लिए, फिट मानदंड नामक नियम का उपयोग किया जाता है। सबसे अधिक में से एक के. पियर्सन का ची-स्क्वायर फिट परीक्षण लोकप्रिय है। इसमें ची-स्क्वायर सांख्यिकी की गणना की जाती है:

जहाँ N अंतरालों की संख्या है जिसके अनुसार अनुभवजन्य वितरण कानून बनाया गया था (संबंधित हिस्टोग्राम के स्तंभों की संख्या), i अंतराल की संख्या है, pt i संभावना है कि यादृच्छिक चर का मान गिरता है सैद्धांतिक वितरण कानून के लिए i-वें अंतराल, pe i संभावना है कि यादृच्छिक चर का मान अनुभवजन्य वितरण कानून के लिए i-वें अंतराल में आता है। इसे ची-स्क्वायर वितरण का पालन करना होगा।

यदि आँकड़ों का परिकलित मान किसी दिए गए महत्व स्तर के लिए k-p-1 डिग्री की स्वतंत्रता के साथ ची-स्क्वायर वितरण मात्रा से अधिक है, तो H0 परिकल्पना खारिज कर दी जाती है। अन्यथा, इसे महत्व के दिए गए स्तर पर स्वीकार किया जाता है। यहां k अवलोकनों की संख्या है, p वितरण कानून के अनुमानित मापदंडों की संख्या है।

आइए आंकड़ों पर नजर डालें:

सरल परिकल्पना के लिए पी2 आँकड़ा को पियर्सन का ची-स्क्वेर्ड आँकड़ा कहा जाता है।

यह स्पष्ट है कि पी2 दो आर-आयामी वैक्टरों के बीच कुछ दूरी का वर्ग है: सापेक्ष आवृत्तियों का वेक्टर (एमआई /एन, …, एमआर /एन) और संभाव्यता वेक्टर (पीआई,…, पीआर)। यह दूरी यूक्लिडियन दूरी से केवल इस मायने में भिन्न है कि अलग-अलग निर्देशांक अलग-अलग भार के साथ इसमें प्रवेश करते हैं।

आइए उस स्थिति में h2 सांख्यिकी के व्यवहार पर चर्चा करें जब परिकल्पना H सत्य है और उस स्थिति में जब H गलत है। यदि H सत्य है, तो n > के लिए ch2 का स्पर्शोन्मुख व्यवहार? के. पियर्सन के प्रमेय को इंगित करता है। यह समझने के लिए कि (2.2) का क्या होता है जब H गलत है, ध्यान दें कि, बड़ी संख्या के नियम के अनुसार, n > ? के लिए mi /n > pi, i = 1, …, r के लिए। इसलिए, n > ? के लिए:

यह मान 0 के बराबर है। इसलिए, यदि H गलत है, तो h2 >? (कब n > ?).

जो कहा गया है उससे यह निष्कर्ष निकलता है कि यदि प्रयोग में प्राप्त h2 का मान बहुत बड़ा है तो H को अस्वीकार कर दिया जाना चाहिए। यहां, हमेशा की तरह, शब्द "बहुत बड़ा" का अर्थ है कि n2 का मनाया गया मान महत्वपूर्ण मान से अधिक है, जिसे इस मामले में ची-स्क्वायर वितरण तालिकाओं से लिया जा सकता है। दूसरे शब्दों में, संभाव्यता P(p2 npi p2) एक छोटा मान है और इसलिए, प्रयोग में गलती से इसके समान होने की संभावना नहीं है, या आवृत्ति वेक्टर और संभाव्यता वेक्टर के बीच और भी अधिक विसंगति होने की संभावना नहीं है।

के. पियर्सन के प्रमेय की स्पर्शोन्मुख प्रकृति, जो इस नियम को रेखांकित करती है, के व्यावहारिक उपयोग में सावधानी की आवश्यकता है। इस पर केवल बड़े n के लिए ही भरोसा किया जा सकता है। यह निर्धारित करने के लिए कि क्या n पर्याप्त बड़ा है, संभावनाओं pi,…, pr को ध्यान में रखना आवश्यक है। इसलिए, उदाहरण के लिए, यह नहीं कहा जा सकता कि एक सौ अवलोकन पर्याप्त होंगे, क्योंकि न केवल n बड़ा होना चाहिए, बल्कि उत्पाद npi, ..., npr (अपेक्षित आवृत्तियाँ) भी छोटे नहीं होने चाहिए। इसलिए, सांख्यिकीय ch2, जिसका वितरण अलग है, के लिए ch2 (निरंतर वितरण) का अनुमान लगाने की समस्या कठिन हो गई। सैद्धांतिक और प्रायोगिक तर्कों के संयोजन से यह विश्वास पैदा हुआ कि यह सन्निकटन तब लागू होता है जब सभी अपेक्षित आवृत्तियाँ npi>10 हों। यदि संख्या r (विभिन्न परिणामों की संख्या) बढ़ती है, तो इसकी सीमा कम कर दी जाती है (यदि r कई दहाई के क्रम पर है तो 5 तक या 3 तक भी)। इन आवश्यकताओं को पूरा करने के लिए, व्यवहार में कभी-कभी कई परिणामों को संयोजित करना आवश्यक होता है, अर्थात्। छोटे आर के साथ बर्नौली योजना पर जाएं।

समझौते की जाँच के लिए वर्णित विधि न केवल बर्नौली परीक्षणों पर लागू की जा सकती है, बल्कि यादृच्छिक नमूनों पर भी लागू की जा सकती है। उनके अवलोकनों को पहले समूहीकरण द्वारा बर्नौली परीक्षणों में परिवर्तित किया जाना चाहिए। वे इसे इस तरह से करते हैं: अवलोकन स्थान को गैर-अतिव्यापी क्षेत्रों की एक सीमित संख्या में विभाजित किया जाता है, और फिर प्रत्येक क्षेत्र के लिए देखी गई आवृत्ति और काल्पनिक संभावना की गणना की जाती है।

इस मामले में, सन्निकटन की पहले सूचीबद्ध कठिनाइयों में, एक और जोड़ा जाता है - मूल स्थान के उचित विभाजन का विकल्प। साथ ही, इस बात का ध्यान रखा जाना चाहिए कि, सामान्य तौर पर, नमूने के प्रारंभिक वितरण के बारे में परिकल्पना का परीक्षण करने का नियम संभावित विकल्पों के प्रति पर्याप्त रूप से संवेदनशील है। अंत में, मैं नोट करता हूं कि बर्नौली योजना में कमी के आधार पर सांख्यिकीय मानदंड, एक नियम के रूप में, सभी विकल्पों के खिलाफ मान्य नहीं हैं। इसलिए सहमति सत्यापित करने की यह विधि सीमित मूल्य की है।

अपने शास्त्रीय रूप में कोलमोगोरोव-स्मिरनोव अच्छाई-की-फिट परीक्षण h2 परीक्षण से अधिक शक्तिशाली है और इसका उपयोग इस परिकल्पना का परीक्षण करने के लिए किया जा सकता है कि अनुभवजन्य वितरण ज्ञात मापदंडों के साथ किसी भी सैद्धांतिक निरंतर वितरण F(x) से मेल खाता है। बाद की परिस्थिति यांत्रिक परीक्षणों के परिणामों के विश्लेषण में इस मानदंड के व्यापक व्यावहारिक अनुप्रयोग की संभावना पर प्रतिबंध लगाती है, क्योंकि एक नियम के रूप में, यांत्रिक गुणों की विशेषताओं के वितरण फ़ंक्शन के मापदंडों का अनुमान डेटा से लगाया जाता है। नमूना ही.

कोलमोगोरोव-स्मिरनोव मानदंड का उपयोग असमूहीकृत डेटा के लिए या छोटी अंतराल चौड़ाई के मामले में समूहीकृत डेटा के लिए किया जाता है (उदाहरण के लिए, बल मीटर, लोड चक्र काउंटर इत्यादि के स्केल डिवीजन के बराबर)। मान लीजिए कि n नमूनों की एक श्रृंखला का परीक्षण परिणाम यांत्रिक गुणों की विशेषताओं की एक भिन्नता श्रृंखला है

x1? x2? ...? ग्यारहवीं? ...? xn. (3.93)

शून्य परिकल्पना का परीक्षण करना आवश्यक है कि नमूना वितरण (3.93) सैद्धांतिक कानून एफ(एक्स) से संबंधित है।

कोलमोगोरोव-स्मिरनोव मानदंड वितरण फ़ंक्शन के मूल्य से संचित विशेष के अधिकतम विचलन के वितरण पर आधारित है। इसका उपयोग करते समय आंकड़ों की गणना की जाती है

जो कोलमोगोरोव परीक्षण का एक आँकड़ा है। यदि असमानता

डीएनवीएन? माथा (3.97)

बड़े नमूना आकारों के लिए (n > 35) या

डीएन(वीएन + 0.12 + 0.11/वीएन)? माथा (3.98)

एन के लिए? 35, शून्य परिकल्पना अस्वीकार नहीं की जाती है।

यदि असमानताएं (3.97) और (3.98) संतुष्ट नहीं हैं, तो वैकल्पिक परिकल्पना स्वीकार की जाती है कि नमूना (3.93) अज्ञात वितरण से संबंधित है।

lb के महत्वपूर्ण मान हैं: л0.1 = 1.22; एल0.05 = 1.36; एल0.01 = 1.63.

यदि फ़ंक्शन F(x) के पैरामीटर पहले से ज्ञात नहीं हैं, लेकिन नमूना डेटा से अनुमानित हैं, तो कोलमोगोरोव-स्मिरनोव मानदंड अपनी सार्वभौमिकता खो देता है और इसका उपयोग केवल कुछ विशिष्ट वितरण के साथ प्रयोगात्मक डेटा के अनुपालन की जांच करने के लिए किया जा सकता है। कार्य.

जब एक अशक्त परिकल्पना के रूप में उपयोग किया जाता है, चाहे प्रयोगात्मक डेटा सामान्य या लॉग-सामान्य वितरण से संबंधित हो, आंकड़ों की गणना की जाती है:

जहां Ц(zi) लाप्लास फ़ंक्शन का मान है

Ц(zi) = (xi - xср)/s किसी भी नमूना आकार n के लिए कोलमोगोरोव-स्मिरनोव मानदंड इस प्रकार लिखा गया है

इस मामले में lb के महत्वपूर्ण मान हैं: л0.1 = 0.82; एल0.05 = 0.89; एल0.01 = 1.04.

यदि *** घातीय वितरण के साथ नमूने के अनुपालन के बारे में परिकल्पना की जाँच की जाती है, जिसके पैरामीटर का अनुमान प्रायोगिक डेटा से लगाया जाता है, तो समान आँकड़ों की गणना की जाती है:

मानदंड अनुभवजन्य संभाव्यता

और कोलमोगोरोव-स्मिरनोव मानदंड बनाएं।

इस मामले के लिए lb के महत्वपूर्ण मान हैं: λ0.1 = 0.99; एल0.05 = 1.09; एल0.01 = 1.31.

वितरण के सैद्धांतिक कानून के साथ अनुभवजन्य वितरण के पत्राचार के बारे में परिकल्पना का परीक्षण करने के लिए, विशेष सांख्यिकीय संकेतकों का उपयोग किया जाता है - उपयुक्तता मानदंड (या अनुपालन मानदंड)। इनमें पियर्सन, कोलमोगोरोव, रोमानोव्स्की, यास्त्रेम्स्की आदि के मानदंड शामिल हैं। फिट मानदंडों की अधिकांश अच्छाई सैद्धांतिक से अनुभवजन्य आवृत्तियों के विचलन के उपयोग पर आधारित हैं। जाहिर है, ये विचलन जितने छोटे होंगे, सैद्धांतिक वितरण उतना ही बेहतर अनुभवजन्य से मेल खाता है (या वर्णन करता है)।

सहमति मानदंड- ये सैद्धांतिक संभाव्यता वितरण के अनुभवजन्य वितरण के पत्राचार के बारे में परिकल्पनाओं का परीक्षण करने के मानदंड हैं। ऐसे मानदंड दो वर्गों में विभाजित हैं: सामान्य और विशेष। सामान्य अच्छाई-की-फिट मानदंड एक परिकल्पना के सबसे सामान्य सूत्रीकरण पर लागू होते हैं, अर्थात्, इस परिकल्पना पर कि देखे गए परिणाम किसी पूर्व-कल्पित संभाव्यता वितरण से सहमत हैं। विशेष अच्छाई-की-फिट परीक्षण विशेष अशक्त परिकल्पनाओं का संकेत देते हैं जो संभाव्यता वितरण के एक निश्चित रूप के साथ समझौता तैयार करते हैं।

स्थापित वितरण कानून के आधार पर फिट मानदंड की अच्छाई, यह स्थापित करना संभव बनाती है कि सैद्धांतिक और अनुभवजन्य आवृत्तियों के बीच विसंगतियों को कब महत्वहीन (यादृच्छिक) के रूप में पहचाना जाना चाहिए, और कब - महत्वपूर्ण (गैर-यादृच्छिक)। इससे यह पता चलता है कि उपयुक्तता की अच्छाई मानदंड अनुभवजन्य श्रृंखला में वितरण की प्रकृति के बारे में श्रृंखला को समतल करते समय सामने रखी गई परिकल्पना की शुद्धता को अस्वीकार करना या पुष्टि करना संभव बनाता है और यह उत्तर देना संभव बनाता है कि क्या इसे स्वीकार करना संभव है किसी दिए गए अनुभवजन्य वितरण के लिए कुछ सैद्धांतिक वितरण कानून द्वारा व्यक्त मॉडल।

पियर्सन अच्छाई-की-फिट परीक्षणसी 2 (ची-स्क्वायर) मुख्य अच्छाई-फिट मानदंडों में से एक है। अनुभवजन्य और सैद्धांतिक वितरण की आवृत्तियों के बीच विसंगतियों की यादृच्छिकता (महत्व) का आकलन करने के लिए अंग्रेजी गणितज्ञ कार्ल पियर्सन (1857-1936) द्वारा प्रस्तावित:

सैद्धांतिक और अनुभवजन्य वितरण की स्थिरता का आकलन करने के लिए सी 2 मानदंड लागू करने की योजना इस प्रकार है:

1. विसंगति का परिकलित माप निर्धारित किया जाता है।

2. स्वतंत्रता की कोटि की संख्या निर्धारित की जाती है।

3. स्वतंत्रता की डिग्री n की संख्या एक विशेष तालिका का उपयोग करके निर्धारित की जाती है।

4. यदि, तो दिए गए महत्व के स्तर α और स्वतंत्रता की डिग्री n की संख्या के लिए, विसंगतियों की महत्वहीनता (यादृच्छिकता) की परिकल्पना खारिज कर दी जाती है। अन्यथा, परिकल्पना को प्राप्त प्रयोगात्मक डेटा का खंडन नहीं करने के रूप में पहचाना जा सकता है, और एक संभावना (1 - α) के साथ यह तर्क दिया जा सकता है कि सैद्धांतिक और अनुभवजन्य आवृत्तियों के बीच विसंगतियां यादृच्छिक हैं।

महत्वपूर्ण स्तरआगे रखी गई परिकल्पना की गलत अस्वीकृति की संभावना है, अर्थात। संभावना है कि सही परिकल्पना अस्वीकार कर दी जाएगी। सांख्यिकीय अध्ययनों में, हल किए जा रहे कार्यों के महत्व और जिम्मेदारी के आधार पर, महत्व के निम्नलिखित तीन स्तरों का उपयोग किया जाता है:

1) ए = 0.1, फिर आर = 0,9;

2) ए = 0.05, फिर आर = 0,95;

3) ए = 0.01, फिर आर = 0,99.

फिट की अच्छाई मानदंड सी 2 का उपयोग करते हुए, निम्नलिखित शर्तों को पूरा किया जाना चाहिए:

1. अध्ययन की गई जनसंख्या का आयतन काफी बड़ा होना चाहिए ( एन≥ 50), जबकि समूह की आवृत्ति या आकार कम से कम 5 होना चाहिए। यदि इस शर्त का उल्लंघन किया जाता है, तो पहले छोटी आवृत्तियों (5 से कम) को मर्ज करना आवश्यक है।

2. अनुभवजन्य वितरण में यादृच्छिक चयन के परिणामस्वरूप प्राप्त डेटा शामिल होना चाहिए, अर्थात। उन्हें स्वतंत्र होना चाहिए.

पियर्सन की अच्छाई-की-फिट कसौटी का नुकसान अवलोकन परिणामों को अंतरालों में समूहित करने और व्यक्तिगत अंतरालों को कम संख्या में अवलोकनों के साथ संयोजित करने की आवश्यकता से जुड़ी कुछ प्रारंभिक जानकारी का नुकसान है। इस संबंध में, 2 अन्य मानदंडों के साथ मानदंड के अनुसार वितरण के पत्राचार के सत्यापन को पूरक करने की सिफारिश की गई है। यह विशेष रूप से तब आवश्यक है जब नमूना आकार अपेक्षाकृत छोटा हो ( एन ≈ 100).

आंकड़ों में कोलमोगोरोव का फिट-ऑफ-फिट परीक्षण(कोलमोगोरोव-स्मिरनोव अच्छाई-की-फिट परीक्षण के रूप में भी जाना जाता है) का उपयोग यह निर्धारित करने के लिए किया जाता है कि क्या दो अनुभवजन्य वितरण एक ही कानून का पालन करते हैं, या यह निर्धारित करने के लिए कि परिणामी वितरण प्रस्तावित मॉडल का पालन करता है या नहीं। कोलमोगोरोव मानदंड संचित आवृत्तियों या अनुभवजन्य या सैद्धांतिक वितरण की आवृत्तियों के बीच अधिकतम अंतर निर्धारित करने पर आधारित है। कोलमोगोरोव मानदंड की गणना निम्नलिखित सूत्रों के अनुसार की जाती है:

कहाँ डीऔर डी- क्रमशः, संचित आवृत्तियों के बीच अधिकतम अंतर ( एफएफ¢) और संचित आवृत्तियों के बीच ( पीपी¢) वितरण की अनुभवजन्य और सैद्धांतिक श्रृंखला; एन- जनसंख्या में इकाइयों की संख्या.

λ के मूल्य की गणना करने के बाद, एक विशेष तालिका संभावना निर्धारित करती है जिसके साथ यह तर्क दिया जा सकता है कि सैद्धांतिक आवृत्तियों से अनुभवजन्य आवृत्तियों के विचलन यादृच्छिक हैं। यदि चिह्न 0.3 तक मान लेता है, तो इसका मतलब है कि आवृत्तियों का पूर्ण संयोग है। बड़ी संख्या में अवलोकनों के साथ, कोलमोगोरोव परीक्षण परिकल्पना से किसी भी विचलन का पता लगाने में सक्षम है। इसका मतलब यह है कि बहुत सारे अवलोकन होने पर सैद्धांतिक वितरण से नमूना वितरण में कोई अंतर इसकी मदद से पता लगाया जाएगा। इस संपत्ति का व्यावहारिक महत्व महत्वपूर्ण नहीं है, क्योंकि ज्यादातर मामलों में निरंतर परिस्थितियों में बड़ी संख्या में अवलोकन प्राप्त करने पर भरोसा करना मुश्किल है, वितरण कानून का सैद्धांतिक विचार जिसका नमूना पालन करना चाहिए वह हमेशा अनुमानित होता है, और सांख्यिकीय जांच की सटीकता चुने हुए मॉडल की सटीकता से अधिक नहीं होनी चाहिए।

रोमानोव्स्की की अच्छाई-की-फिट कसौटीपियर्सन मानदंड के उपयोग के आधार पर, अर्थात मान पहले ही मिल चुके हैं सी 2 , और स्वतंत्रता की डिग्री की संख्या:

जहां n भिन्नता की स्वतंत्रता की डिग्री की संख्या है।

के लिए तालिकाओं के अभाव में रोमानोव्स्की मानदंड सुविधाजनक है। अगर< 3, то расхождения распределений случайны, если же >3, तो वे यादृच्छिक नहीं हैं और सैद्धांतिक वितरण अध्ययन के तहत अनुभवजन्य वितरण के लिए एक मॉडल के रूप में काम नहीं कर सकता है।

बी. एस. यस्त्रेम्स्की ने फिट की अच्छाई की कसौटी में स्वतंत्रता की डिग्री की संख्या का नहीं, बल्कि समूहों की संख्या का उपयोग किया ( ), समूहों की संख्या के आधार पर एक विशेष मान q, और एक ची-वर्ग मान। यस्त्रेम्स्की का समझौता मानदंडइसका अर्थ रोमानोव्स्की मानदंड के समान है और सूत्र द्वारा व्यक्त किया गया है

जहां सी 2 - पियर्सन की सहमति की कसौटी; - समूहों की संख्या; क्यू - गुणांक, 20 से कम समूहों की संख्या के लिए 0.6 के बराबर।

अगर एलतथ्य > 3, सैद्धांतिक और अनुभवजन्य वितरण के बीच विसंगतियां यादृच्छिक नहीं हैं, यानी। अनुभवजन्य वितरण सामान्य वितरण की आवश्यकताओं को पूरा नहीं करता है। अगर एलतथ्य< 3, расхождения между эмпирическим и теоретическим распределениями считаются случайными.



परियोजना का समर्थन करें - लिंक साझा करें, धन्यवाद!
ये भी पढ़ें
पोस्टिनॉर एनालॉग सस्ते हैं पोस्टिनॉर एनालॉग सस्ते हैं दूसरा ग्रीवा कशेरुका कहलाता है दूसरा ग्रीवा कशेरुका कहलाता है महिलाओं में पानी जैसा स्राव: आदर्श और विकृति विज्ञान महिलाओं में पानी जैसा स्राव: आदर्श और विकृति विज्ञान