हम पूर्वाग्रह को नज़रअंदाज करने के लिए मानक त्रुटि को क्यों परिभाषित करते हैं (एमएसई के विपरीत जिसमें पूर्वाग्रह शामिल है)?

image

एक अनुमानक की मानक त्रुटि $\hat \theta$ को $$se = \sqrt{Var(\hat \theta)}$$ के रूप में क्यों परिभाषित किया गया है, न कि $$se = \sqrt {MSE(\hat \theta)} = के रूप में \sqrt{Bias^2(\hat \theta) + Var(\hat \theta)}.$$

अर्थात, मानक त्रुटि माध्य वर्ग त्रुटि का वर्गमूल होनी चाहिए। निःसंदेह, यदि अनुमानकर्ता निष्पक्ष है, तो कोई अंतर नहीं है। लेकिन किसी भी मामले में मैं सोच सकता हूं कि हम मानक त्रुटि का उपयोग कहां करते हैं, यदि अनुमानक पक्षपाती है, तो उस पूर्वाग्रह को त्रुटि का हिस्सा होना चाहिए।

उदाहरण के लिए, वाल्ड परीक्षण करने पर विचार करें। यदि हम पूर्वाग्रह को बढ़ाने के इच्छुक हैं तो हम हमेशा मनमाने ढंग से कम विचरण के $\sigma^2$ के अनुमानक के साथ आ सकते हैं। उदाहरण के लिए, $\hat \sigma^2$ दिया गया है, $$\hat \sigma_1^2 = (1-t)\hat \sigma^2 + tk$$ को मनमाने स्थिरांकों के लिए परिभाषित करें $t,k$ ऐसा देगा अनुमानक यदि हम इसका उपयोग वाल्ड परीक्षण करने के लिए करते हैं, तो हम जो भी $\alpha$ चाहते हैं, वह प्राप्त कर सकते हैं, केवल से को कम करके, वास्तव में परीक्षण में सुधार किए बिना।

यह समस्या हल हो जाएगी यदि से की परिभाषा होगी पूर्वाग्रह शामिल करें - और यह मानक त्रुटि शब्दों के साथ अधिक सुसंगत होगा। हम ऐसा क्यों नहीं करते?

शब्दावली को छोड़कर, यहां एक प्रभावशाली प्रश्न है: ऐसे मामलों में जहां हमारा अनुमानक वास्तव में पक्षपाती है, क्या हमें परिकल्पना परीक्षण में मानक त्रुटि या उपरोक्त परिभाषा का उपयोग करना चाहिए? ऐसे मामले हैं जहां इससे परीक्षा परिणाम में फर्क पड़ेगा।

यह गलत नहीं हो सकता (यह एक परिभाषा है), और इसे वास्तव में बदला नहीं जा सकता (यह बहुत मानक है), इसलिए प्रश्न यह है कि क्या यह किसी तरह से मददगार है या एक खेदजनक ऐतिहासिक गलती है (जैसे 'त्रुटि' और 'प्रतिगमन' शब्द)।

मुझे लगता है कि यह वास्तव में एक उपयोगी परिभाषा है, क्योंकि यह अंतराल अनुमान के लिए मायने रखता है, जहां आप पूर्वाग्रह और परिवर्तनशीलता पर अलग से विचार करने की आवश्यकता है। यहीं पर हम आम तौर पर मानक त्रुटि की रिपोर्ट करते हैं और उसका उपयोग करते हैं (बिंदु भविष्यवाणी के सारांश के रूप में एमएसई या आरएमएसई के विपरीत)।

दूसरा कारण यह है कि जब उम्मीद करने का अच्छा कारण होता है तो पूर्वाग्रह अनिश्चितता के सापेक्ष छोटा होता है (सुचारू परिमित-आयामी मापदंडों के अनुमानकर्ताओं के लिए एक बहुत ही सामान्य स्थिति) हम पूर्वाग्रह का अनुमान लगाए बिना मानक त्रुटि का अनुमान लगा सकते हैं। पूर्वाग्रह का अनुमान लगाना (कम से कम डेटा विश्लेषण में, सिमुलेशन के बजाय) बहुत कठिन है।

कारण यह है कि "मानक त्रुटि" द्वारा दर्शाई गई मात्रा का एक नाम है क्योंकि हम केवल दोनों चीजों के लिए नामित अवधारणाओं को नहीं चाहते हैं उन्हीं में से एक है। एक को अनुमानक की "मानक त्रुटि" कहा जाता है और एक को अनुमानक की "मूल-माध्य-वर्ग-त्रुटि" कहा जाता है। इन दोनों चीज़ों के लिए अवधारणाओं का नामकरण करना और यह ध्यान रखना ठीक है कि दोनों अवधारणाएँ क्या करती हैं और क्या नहीं।

उस विशेष नाम का उपयोग क्यों किया जाता है, इसका उत्तर काफी हद तक ऐतिहासिक है। ऐसा लगता है कि शब्द "मानक त्रुटि" यूल (1897) में पेश किया गया था और फिर उसके बाद के परिचयात्मक सांख्यिकी पाठ यूल (1911) में इस्तेमाल किया गया था। उत्तरार्द्ध बीसवीं सदी की शुरुआत में सांख्यिकी के लिए एक लोकप्रिय पाठ्यपुस्तक थी और इसलिए नाम चिपक गया। जहां तक ​​"मूल-माध्य-वर्ग-त्रुटि" का सवाल है, यह और भी पीछे चला जाता है। गॉस (1821) में "माध्य त्रुटि" शब्द यह वर्णन करने के लिए प्रकट होता है कि अब हम मूल-माध्य-वर्ग-त्रुटि को क्या कहेंगे।$^\dagger$

आप अपने प्रश्न में जो मान रहे हैं उसके विपरीत, मात्र तथ्य यह है कि हमारे पास इन दोनों अवधारणाओं के लिए नाम हैं, और वे एक-दूसरे से कुछ हद तक मिलते-जुलते हैं, इससे पेशे में कोई गंभीर भ्रम पैदा नहीं होता है। यह सर्वविदित है कि कम "मानक त्रुटि" आवश्यक रूप से बेहतर अनुमानक का संकेत नहीं देती है। (वास्तव में, यह सर्वविदित है कि एक स्थिरांक शून्य मानक त्रुटि वाला एक अनुमानक है और वास्तव में एक घटिया अनुमानक है!) ऐतिहासिक प्रक्रियाओं से प्राप्त नामकरण वाले किसी भी लंबे समय से चले आ रहे अनुशासन की तरह, गणित और सांख्यिकी में कुछ क्षेत्र हैं जहां यह कुछ चीजों का नाम बदलना और उन्हें फिर से परिभाषित करना अच्छा हो सकता है, ताकि नामकरण अधिक आसानी से फिट हो सके। यह वास्तव में उनमें से एक नहीं है --- सांख्यिकीविद् और अन्य अनुभवी सांख्यिकीय उपयोगकर्ता वह गलती नहीं करते हैं जो आप सुझा रहे हैं, इसलिए वे वास्तव में इसे "" के रूप में नहीं देखते हैं।

Ask AI
#1 #2 #3 #4 #5 #6 #7 #8 #9 #10 #11 #12 #13 #14 #15 #16 #17 #18 #19 #20 #21 #22 #23 #24 #25 #26 #27 #28 #29 #30 #31 #32 #33 #34 #35 #36 #37 #38 #39 #40 #41 #42 #43 #44 #45 #46 #47 #48 #49 #50 #51 #52 #53 #54 #55 #56 #57 #58 #59 #60 #61 #62 #63 #64 #65 #66 #67 #68 #69 #70