जाणूया ‘डेटा’ची भाषा

डॉ. मानसी फडके
Wednesday, 6 January 2021

सार्वजनिक धोरणनिर्मितीपासून वैयक्तिक निर्णयांपर्यंत अनेक गोष्टींत संख्यांना अपार महत्त्व आले आहे. या संख्यांचे अंतरंग आणि बाह्यरंग उलगडून दाखविणारे साप्ताहिक सदर.

दुसरं महायुद्ध सुरू असताना अमेरिकेतील ‘स्टॅटिस्टिकल रिसर्च ग्रुप’ (एसआरजी)कडे खूपच ‘हटके’ प्रश्न यायचे. अमेरिकेची विमाने जर्मनीमधून यायची तेव्हा विमानांच्या वेगवेगळ्या भागांवर गोळ्या लागल्याच्या खुणा असत. प्रश्न असा होता, की लष्कराला विमानांवर चिलखत (आर्मर) बसवायचे होते. पण चिलखत चढवले, की विमाने जड होऊन त्यांची गती कमी व्हायची. लष्कराला वाटले, ज्या भागांवर गोळ्यांच्या खुणा आहेत, त्याच भागांवर चिलखत बसवलेले बरे. जर्मनीहून परतलेल्या विमानांचा ‘डेटा’ लष्कराने गोळा केला. ‘डेटा’प्रमाणे विमानांच्या पंखांवर सर्वात जास्त हल्ला दिसत होता. त्या मागोमाग ‘फ्युएल टॅंक’ आणि ‘फ्युएल सिस्टिम’वर निशाण होते. इंजिनवर सगळ्यात कमी निशाण होते.आता पंखांवर किती वजनाचे चिलखत बसवावे एवढेच विचारायला लष्कराचे अधिकारी ‘एसआरजी’ कडे गेले. ‘एसआरजी’च्या संख्याशास्त्रज्ञांनी धक्कादायक उत्तर दिले. ‘पंखांना चिलखत लावूच नका. चिलखत इंजिनला लावा!’ डोळसपणे पहिले, तर लक्षात येते की पंखांवर गोळ्या लागलेली विमाने परत आली होती. पण इंजिनवर गोळ्या लागल्यावर विमाने बहुतकरून परत येऊच शकली नव्हती! ज्या विमानांचा नमुना घेऊन ‘डेटा’ निर्माण केला होता, ती सगळी विमाने परत आली होती. पडलेली विमाने नमुन्यात नव्हतीच. ‘डेटा’ तयार करतांना नमुना चुकला, की काढलेले निष्कर्ष हमखास चुकणार. तर ‘डेटा’ तयार करण्याचे शास्त्र आहे. प्रत्येक डेटासेटचे वेगळे व्यक्तिमत्व नि भाषा असते. कधी ‘डेटा’ अबोल असतो आणि काही वेळेला खूप बोलका. कधी ‘डेटा’ची इतकी बडबड असते, की त्याला ‘नॉइझी’ म्हटले जाते. ‘डेटा’ला बोलतं करण्यासाठी अनेक विद्वान त्यावर सांख्यिकी अत्याचार करतात. त्यावर ‘रिग्रेशन’ किंवा ‘स्मूथिंग’सारखी तंत्र वापरतात. पण अशाने नेहेमी फायदा होतोच असं नाही. ‘डेटा’ला बोलतं करण्यापेक्षा आपण त्याची भाषा शिकणे जास्त फायद्याचे. त्यादृष्टीने या सदरात ताज्या घडामोडींच्या संदर्भातील संख्या आणि त्यांची प्रस्तुतता न्याहाळणार आहोत. ‘डेटा’वर अत्याचार न करता त्यातून माहिती उलगडण्याचा हा प्रयत्न असेल. 

जगभरातील इतर बातम्या वाचण्यासाठी येथे क्लिक करा

बिर्याणीत भाज्यांचे, भाताचे, मसाल्याचे थर असतात; तसेच आकड्यांमध्येदेखील. एक उदाहरण पाहूया. एप्रिल ते जून २०२०च्या या तिमाहीत भारताच्या जीडीपीचा वाढ दर हा उणे २३.९ होता. याचा अर्थ असा, की एप्रिल ते जून २०१९च्या तुलनेत जीडीपी २३.९ टक्‍क्‍यांनी कमी झाला. दुसऱ्या तिमाहीत `जीडीपी’ फक्त ७.५ टक्‍क्‍यांनी आकुंचन पावला आहे. प्रश्न असा असतो, की `जीडीपी३’ मधील ७ . ५ % ची घट ही कुठल्या पायावर मोजायची? ‘जीडीपी’चा वाढदर मोजताना नेहेमी गेल्या वर्षीच्या त्याच तिमाहीतील ‘जीडीपी’बरोबर तुलना केली जाते. हा एक दृष्टिकोन झाला. बिर्याणीतील सोपा साधा भाताचा थर म्हणा ना! दुसऱ्या तिमाहीतील आकडेवारी पहिल्या तिमाहीपेक्षा किती सुधारित आहे,असंही पाहता येतं. त्यावरूनही राहणीमानातील सुधारणांचा वेध घेता येतो. हा झाला भाज्यांचा थर. आणखी पुढे जायचे तर गेल्या  वर्षांच्या तुलनेत या वर्षीच्या दुसऱ्या तिमाहीत कितपत सुधारणा आहे याचा अभ्यासही वेगळा थर उलगडवतो. आता आकड्यांची बिर्याणी मसालेदार होऊ लागते! ‘जीडीपी’चे विश्‍लेषण करण्यासाठी  इतर अंकांचाही आधार घेतला जातो. ‘जीडीपी’बरोबरच ग्राहक किंमत निर्देशांक, सेन्सेक्‍स, खरिपातील पेरणी, खाजगी क्षेत्रातील गुंतवणूक, रोजगार, उद्योगांना दिलेले कर्ज, विनिमय दर या संकेतांकांमधील हालचाली बघितल्यास अंकांची बिर्याणी रुचकर होते! सरकारचे अनेक विभाग आकडे गोळा करतात. ‘डेटा’चे विश्‍लेषण करण्याआधी त्या विभागाची भूमिका, त्यांनी वापरलेल्या व्याख्या, पद्धती समजून घेणे महत्त्वाचे. हा ‘डेटा’ कळत- नकळत चुकीचा भरला गेल्यास त्यावर आधारित योजनांचा परिणाम अपेक्षित नसतो. एकूणच संख्यांच्या या दुनियेतही खूप काही घडत असतं. ते समजून घेण्या-देण्याचा हा प्रयत्न.

ताज्या बातम्यांसाठी डाऊनलोड करा ई-सकाळचे ऍप 


स्पष्ट, नेमक्या आणि विश्वासार्ह बातम्या वाचण्यासाठी 'सकाळ'चे मोबाईल अॅप डाऊनलोड करा
Web Title: dr manasi phadke write article data language