लापता मानों को माध्य से लगाने के क्या दोष हैं?

विषयसूची:

लापता मानों को माध्य से लगाने के क्या दोष हैं?
लापता मानों को माध्य से लगाने के क्या दोष हैं?

वीडियो: लापता मानों को माध्य से लगाने के क्या दोष हैं?

वीडियो: लापता मानों को माध्य से लगाने के क्या दोष हैं?
वीडियो: कुंडली में मातृदोष द्वितीय मातृदोष को दूर करने के उपाय और उपाय, सरिता गुप्ता द्वारा 2024, नवंबर
Anonim

माध्य आरोपण चरों के बीच संबंधों को विकृत करता है लेकिन माध्य आरोपण भी बहुभिन्नरूपी संबंधों को विकृत करता है और सहसंबंध जैसे आंकड़ों को प्रभावित करता है। उदाहरण के लिए, PROC CORR को निम्न कॉल Orig_Height चर और वज़न और आयु चर के बीच सहसंबंध की गणना करती है।

लापता डेटा के लिए माध्य का उपयोग करना एक बुरा विचार क्यों है?

मीन डेटा की भिन्नता को कम करता है गणित में गहराई से जाने पर, एक छोटा विचरण संभाव्यता वितरण में संकीर्ण आत्मविश्वास अंतराल की ओर जाता है[3]। इससे हमारे मॉडल में पूर्वाग्रह की शुरुआत करने के अलावा और कुछ नहीं होता है।

मूल्यों की कमी एक समस्या क्यों है?

लापता डेटा विभिन्न समस्याओं को प्रस्तुत करता है। सबसे पहले, डेटा की अनुपस्थिति सांख्यिकीय शक्ति को कम करती है, जो इस संभावना को संदर्भित करता है कि परीक्षण गलत होने पर अशक्त परिकल्पना को अस्वीकार कर देगा। दूसरा, खोया हुआ डेटा मापदंडों के आकलन में पूर्वाग्रह पैदा कर सकता है। तीसरा, यह नमूनों की प्रतिनिधित्व क्षमता को कम कर सकता है।

माध्य दोष क्यों खराब है?

समस्या 1: मतलब आरोपण चरों के बीच संबंधों को संरक्षित नहीं करता है। सच है, माध्य लगाने से प्रेक्षित डेटा का माध्य सुरक्षित रहता है। इसलिए यदि डेटा पूरी तरह से यादृच्छिक रूप से गायब है, तो माध्य का अनुमान निष्पक्ष रहता है।

क्या आपको लापता डेटा को माध्य से बदलना चाहिए?

आउटलेर्स डेटा पॉइंट्स का माध्य पर महत्वपूर्ण प्रभाव पड़ेगा और इसलिए, ऐसे मामलों में, लापता मानों को बदलने के लिए माध्य का उपयोग करने की अनुशंसा नहीं की जाती है। लापता मूल्यों को बदलने के लिए माध्य मानों का उपयोग करना एक महान मॉडल नहीं बना सकता है और इसलिए इसे खारिज कर दिया जाता है।

सिफारिश की: