आईक्यू को कैसे मिलता है उसका सामान्य वितरण
हैमिंग चैप्टर 29 का खुला हुआ एक सावधान विचार-विमर्श आईक्यू टेस्ट के साथ।
दावा: बुद्धिमत्ता आबादी में सामान्य वितरण का अनुसरण करती है। माप: स्कोर्स को एक समग्र प्रॉबैबिलिटी स्केल (प्रॉबैबिलिटी पेपर) पर प्लॉट करें। स्कोर्स एक सीधी रेखा पर गिरते हैं - संकेत देते हुए कि वे सामान्य वितरण का अनुसरण करते हैं।
हैमिंग द्वारा पहचानी गई समस्या: यह खोज नहीं है। यह निर्माण है। आईक्यू टेस्ट को केवल निर्देशों के साथ काम करने वाले प्राथमिक स्कोर्स को लेता है और एक एक-समान परिवर्तित्र का उपयोग करके कुमुलेटिव डिस्ट्रीब्यूशन को सामान्य प्रॉबैबिलिटी स्केल पर मजबूत करता है। फिर नतीजे को बुद्धिमत्ता को मापने वाला घोषित किया जाता है, जो कि कैलिब्रेशन प्रक्रिया द्वारा मापा जाता है।
परिणाम: बुद्धिमत्ता को जो टेस्ट मापता है, वह सामान्य वितरण का होता है - यह डिज़ाइन किया गया था। सामान्य वितरण बुद्धिमत्ता की दुनिया में एक गुण नहीं है; यह कैलिब्रेशन प्रक्रिया का गुण है।
हैमिंग की सामान्यीकरण: आप क्या मापते हैं वह आपको मिलता है। उपकरण, कैलिब्रेशन प्रक्रिया और परिभाषा स्वतंत्र नहीं हैं। वे एक बंद सर्किट बनाते हैं। उपकरण क्या मापता है, वह वास्तविकता के बारे में परिभाषा बन जाती है।
उसके गणितीय परीक्षा उदाहरण: वह चाहे तो किसी भी ग्रेड डिस्ट्रीब्यूशन का निर्माण कर सकता है जो वह चाहता है, प्रश्नों की कठिनाई वितरण चुनकर। एक सामान्य रूप से कठिन परीक्षा एक द्विमodal वितरण पैदा करती है (विद्यार्थी इसे जानते हैं या नहीं जानते हैं)। एक मिश्रित परीक्षा एक घंटी के रूप में वितरण पैदा करती है। वितरण परीक्षा डिज़ाइन का एक प्रतिकृति है, नहीं कि विद्यार्थियों के बारे में खोज।
सर्कुलर लूप को पाएं
हैमिंग की विश्लेषण एक त्रिकोणीय सर्कुलर डिफिनिशन प्रदान करता है:
1. एक उपकरण और कैलिब्रेशन प्रक्रिया डिज़ाइन करें।
2. निर्माण को 'इस उपकरण द्वारा मापा' के रूप में परिभाषित करें।
3. घोषित करें कि निर्माण का निर्माण किया गया है, जो कैलिब्रेशन प्रक्रिया में डिज़ाइन किया गया था।
जब माप एक लक्ष्य बन जाता है
हैमिंग की व्याख्या, गुडहार्ट ने नाम दिया था: जब आप माप को एक लक्ष्य के रूप में उपयोग करते हैं, तो यह एक वैध माप नहीं रह जाती है। लक्ष्यीकरण का काम माप को भ्रष्ट करता है।
mekanizma: पहले लक्ष्यीकरण के पहले, माप लक्ष्य के साथ मूल्य के साथ सहसंबद्ध था। बाद में, रैशन एक्टोर्स माप को सीधे लक्ष्य करने के लिए अनुकूलित करते थे। सहसंबंध टूट गया क्योंकि माप को सबसे आसान तरीका अक्सर मूल्य से विच्छेदित करना था।
हैमिंग के मामले:
- वियतनाम का शव संख्या: सैन्य प्रगति के माप के रूप में उपयोग किया गया। सैनिकों ने शव संख्या को अनुपातकारी वस्तुओं से बढ़ाया। माप बढ़ गया; सैन्य प्रगति नहीं।
- जीडीपी वृद्धि: सामाजिक कल्याण के माप के रूप में उपयोग किया गया। जीडीपी वृद्धि नकारात्मक मूल्य वाली चीजें बनाने से हो सकती है (प्रदूषण सफाई, सेना का निर्माण, जेल निर्माण)। माप कल्याण के साथ विच्छेदित हो गया।
- परीक्षा स्कोर: सीखने के माप के रूप में उपयोग किया गया। स्कूल टेस्ट के लिए पढ़ाया। स्कोर बढ़ गए; विषय के मूल्य को समझने में वृद्धि नहीं।
हैमिंग का समाधान: (1) मेट्रिक को नियमित रूप से बदलें, इससे पहले कि लोग इसे पूरी तरह से अनुकूलित कर लें; (2) एक साथ कई मापदंडों का उपयोग करें - एक साथ सभी को अनुकूलित करना मुश्किल होता है; (3) कभी भी किसी महत्वपूर्ण निर्णय के लिए एकल माप पर निर्भर न करें।
भ्रष्टाचार मैकेनिज्म की पहचान करें
एक सॉफ्टवेयर संगठन विकासकर्ता की उत्पादकता को सप्ताहानुसार लाइनों को कोड (LOC) लिखने के द्वारा मापता है। प्रारंभ में, LOC उत्पादकता से संबंधित होता है - सक्रिय विकासकर्ता निष्क्रियों की तुलना में अधिक कोड लिखते हैं।
डाइनेमिक रेंज समस्या
हैमिंग एक सूक्ष्म मापण समस्या उठाते हैं: रेटिंग स्केल के डाइनेमिक रेंज होते हैं, और अधिकांश लोग इसे उपयोग नहीं करते हैं।
उदाहरण के लिए: एक 1-10 स्केल जहां 5 औसत होता है। अधिकांश रेटर 4, 5 और 6 का उपयोग करते हैं, कभी 1 या 9 को नेविगेट नहीं करते हैं। उनके रेटिंग का प्रभावी रेंज 3 (4 से 6) है, हालांकि स्केल 10 प्रदान करता है।
परिणाम: एक रेटिंगकर्ता जो पूर्ण सीमा का उपयोग करता है, उसे औसत रेटिंग पर 3 गुणा प्रभाव होता है जो कि संकुचित सीमा का उपयोग करते हैं। यदि आप किसी चीज को नापसंद करते हैं और उसे 2 (पूर्ण सीमा) रेट करते हैं, जबकि अन्य रेटिंगकर्ता उन्हें 6 (संकुचित सीमा) देते हैं, तो औसत 4 होता है - आपकी नापसंदगी उनकी पसंद से भी अधिक वजन देती है, हालांकि दोनों को रेटिंग सिस्टम के डिज़ाइन में समान आवाज मिलती है।
हैमिंग की जानकारी सिद्धांत का संबंध: एक वितरण की एंट्रॉपी (औसत चौंकाने वाली) एक समान वितरण होती है जब वितरण समान होता है। एक रेटिंग स्केल जहां सभी ग्रेड समान रूप से उपयोग किए जाते हैं, वे अधिकतम जानकारी संचारित करते हैं। एक स्केल जहां अधिकांश रेटिंग 5 के चारों ओर केंद्रित होते हैं, वे बहुत कम सूचना देते हैं - रेटिंगों में लगभग कोई जानकारी नहीं होती है।
उसका व्यावहारिक सलाह: आप जो भी स्केल दिए गए हैं, उसकी पूरी गतिज सीमा का उपयोग करें। यदि आपको 1 से 10 का स्केल दिया गया है, तो इसे 1 से 6 के रूप में नहीं मानें। ऐसा करने से आपके प्रभाव को कम करता है और आपकी रेटिंगों की जानकारी सामग्री को कम करता है।
जानकारी और गतिज सीमा
दो प्रोफेसर 0-100 के स्केल पर रेटिंग देते हैं। प्रोफेसर ए केवल 70-90 के दायरे का उपयोग करते हैं (20 पॉइंट में संकुचित करते हैं)। प्रोफेसर बी पूरे दायरे 0-100 का उपयोग करते हैं (100 पॉइंट)। माना जाता है कि प्रत्येक प्रोफेसर का ग्रेड वितरण उनके द्वारा उपयोग किए गए दायरे के भीतर समान रूप से होता है।