कॉम्प्युटर व्हिजनची कमाल 

डॉ. आशिष तेंडुलकर 
Thursday, 24 September 2020

प्रभावशाली संगणक दृष्टीचा वापर अनेक क्षेत्रामध्ये केला जातो. विविध वस्तू ओळखण्यासाठी, वास्तूमधील त्रुटी शोधण्यासाठी, संगणकाला पटावरील खेळामध्ये प्रावीण्य मिळविण्यासाठी आणि इतर अनेक क्षेत्रामध्ये केला जातो.

मागील काही लेखांमध्ये आपण ‘एआय’चे अंतरंग अभ्यासले. यातील बहुतांशी बाबी तांत्रिक स्वरूपाच्या होत्या. उर्वरित बाबी आपण भविष्यातील लेखांसाठी राखून ठेऊया. या आणि यापुढील काही लेखांमध्ये आपण संगणक दृष्टी अर्थातच कॉम्प्युटर व्हिजन या तंत्राबाबत चर्चा करूया. 

‘संगणक दृष्टी’ हे तंत्रज्ञान विकसित करण्यामध्ये ‘इमेजनेट’ या स्पर्धेने खूपच हातभार लावला आहे. ही स्पर्धा त्याच नावाच्या चित्रसंचावर आधारित आहे. इमेजनेट हा चित्रसंच एकत्रित करण्याची प्रक्रिया २००६ पासून प्रिन्सटन विद्यापीठामध्ये विख्यात ‘एआय’ संशोधक फेई-फेई ली यांच्या पुढाकाराने झाली. या चित्रसंचामध्ये एकंदरीत १ कोटी ४० लाख चित्रे वर्गवारीसह उपलब्ध आहेत. यातील दहा लाख चित्रांमध्ये प्रत्यक्ष वस्तूभोवती रेखांकन केले आहे, ज्यावरून चित्रामधील वस्तूचे नेमके स्थान समजून घेता येते. या चित्रसंचामध्ये एकंदरीत २०,००० वर्गातील चित्रे आहेत. २०१२मधील इमेजनेट स्पर्धेमध्ये सर्वप्रथम संगणक दृष्टी प्रणालीचा त्रुटी दर होता तब्बल १५ टक्के आणि ही प्रणाली होती अॅलेक्स नेट. ही प्रणाली डीप नेटवर्क तंत्रावर आधारित होती. या स्वरूपाच्या प्रणाली पुढील ४ वर्षांमध्ये इतक्या विकसित झाल्या की २०१८ च्या इमेजनेत स्पर्धेतील सर्वप्रथम प्रणालीचा त्रुटी दर हा अवघा ३ टक्के होता आणि याचा चित्रसंचावर मनुष्याचा त्रुटीदर आहे ५ टक्के, म्हणजेच संगणक दृष्टी इमेजनेट चित्रसंचावर मानवापेक्षाही प्रभावित कार्य करत असल्याचे आपल्या लक्षात येते. 

ताज्या बातम्यांसाठी डाऊनलोड करा ई-सकाळचे ऍप

अशा या प्रभावशाली संगणक दृष्टीचा वापर अनेक क्षेत्रामध्ये केला जातो. विविध वस्तू ओळखण्यासाठी, वास्तूमधील त्रुटी शोधण्यासाठी, संगणकाला पटावरील खेळामध्ये प्रावीण्य मिळविण्यासाठी आणि इतर अनेक क्षेत्रामध्ये केला जातो. या तंत्राधारित अनेक भ्रमणध्वनी आज्ञावली (मोबाईल अॅप्स) उपलब्ध आहेत. उदा. गुगल लेन्स ज्याच्या साहाय्याने आपण विविध वस्तू (प्राणी, वनस्पती, खाद्यपदार्थ) ओळखू शकतो, चित्रावरून त्या गोष्टीला महाजालामध्ये शोधू शकतो. याच तंत्राचा वापर जपानमध्ये काकड्यांच्या वर्गीकरणासाठी केला जातो. सर्व काकड्या एका सरकत्या पट्ट्यावर ठेऊन त्यांच्या छायाचित्रावरून काकडीचे तिच्या दर्जावरून वर्गीकरण केले जाते. या तंत्राचा प्रभावी वापर आपण विविध शेतमालाच्या वर्गवारीसाठी केला जाऊ शकतो. उदा. आंबा, टोमॅटो, नारळ, द्राक्षे आदीच्या आंब्याच्या छायाचित्रावरून हापूस, पायरी, तोतापुरी अशी वर्गवारी करता येईल, शिवाय आंबा आतून कसा असेल याचीही अटकळ बांधता येऊ शकेल. नारळाच्या बाबतीत बोलायचे, तर नारळाच्या छायाचित्रावरून आतमध्ये असलेल्या फळाच्या नेमक्या आकाराबद्दल अटकळ बांधता येणे शक्य आहे. याव्यतिरिक्त वनस्पतीच्या छायाचित्रावरून रोगांचे निदान करण्याच्या प्रणालीही उपलब्ध आहेत. या तंत्रज्ञानाचा वापर शेतातील अळ्यांचा प्रादुर्भाव शोधण्यासाठी केला गेला आहे. 

पुण्याच्या बातम्या वाचण्यासाठी येथे ► क्लिक करा

पुढील काही लेखामध्ये आपण विविध उपाययोजनांची सखोल माहिती घेऊया! 


स्पष्ट, नेमक्या आणि विश्वासार्ह बातम्या वाचण्यासाठी 'सकाळ'चे मोबाईल अॅप डाऊनलोड करा
Web Title: Dr. Ashish tendulkar writes article about computer vision

Tags
टॉपिकस
Topic Tags: