भविष्य नोकऱ्यांचे : मानवनिर्मित भाषेमधील माहितीची उकल

डॉ. आशिष तेंडुलकर
Thursday, 9 April 2020

आत्तापर्यंत लेखमालेमध्ये आपण कृत्रिम बुद्धिमत्तेमधील विविध पायऱ्यांची ओळख करून घेतली. मागील लेखामध्ये ही सर्व कौशल्ये कशी वापरायची हे आपण कोरोना विषाणूच्या संबंधाने अभ्यासले. आत्तापर्यंत आपण संख्यारुपी माहितीचा कसा वापर करायचा हे पाहिले. आपण आज कृत्रिम बुद्धिमत्तेचा वापर करून विविध भाषांतील माहितीचे आकलन कसे करतात, त्याबद्दल बोलूया. 

आत्तापर्यंत लेखमालेमध्ये आपण कृत्रिम बुद्धिमत्तेमधील विविध पायऱ्यांची ओळख करून घेतली. मागील लेखामध्ये ही सर्व कौशल्ये कशी वापरायची हे आपण कोरोना विषाणूच्या संबंधाने अभ्यासले. आत्तापर्यंत आपण संख्यारुपी माहितीचा कसा वापर करायचा हे पाहिले. आपण आज कृत्रिम बुद्धिमत्तेचा वापर करून विविध भाषांतील माहितीचे आकलन कसे करतात, त्याबद्दल बोलूया. 

जगातील उपलब्ध माहिती साठ्यांपैकी खूप साठा लिखित स्वरूपात उपलब्ध आहे. तो आपण लिहिलेल्या वेगवेगळ्या माध्यमातून तयार होतो. भ्रमणध्वनीवरील लघुसंदेश (एसएमएस), व्हॉटस्ॲप संदेश, लेख, बातम्या, पुस्तके आणि अशा अनेक प्रकारे तयार होतो. या साठ्यामधून माहिती मनुष्यबळाकरवी शोधून काढणे. हे फारच जिकरीचे  काम असते.  उदाहरणार्थ, ‘सकाळ’मधील बातम्यांतून आपल्याला ‘कोविड-१९’च्या रुग्णांची माहिती एकत्र करायची असल्यास कोविड संदर्भातील सर्व बातम्या वाचून त्यातून हवी ती माहिती शोधण्याशिवाय पर्याय नाही. आता हेच काम कृत्रिम बुद्धिमत्तेच्या माध्यमातून कसे करता येईल, ते पाहूया.

प्रथमतः आपणास प्रत्येक बातमीचे दोन भागात वर्गीकरण करावे लागेल - ‘कोविड-१९’ संदर्भातील बातमी आणि इतर बातमी. हेच वर्गीकरण अजून सूक्ष्म पातळीवर करता येईल. जसे की, कोविड-१९ ग्रस्त रुग्ण माहिती असलेल्या बातम्या आणि इतर बातम्या. एकदा बातमीचे वर्गीकरण केल्यावर आपल्याला माहिती वेचणी या तंत्राच्या साहाय्याने अपेक्षित माहिती अचूकपणे वेचून काढता येते. यामध्ये दोन पायऱ्या आहेत : (१) बातम्यांचे वर्गीकरण आणि  (२) माहिती वेचणी. हा प्रश्‍न आपण कृत्रिम बुद्धिमत्तेच्या पर्यवेक्षी वर्गीकरण तंत्राने सोडवू शकतो. आपण यापूर्वीच्या लेखामध्ये या तंत्राबद्दल वाचले आहे.

थोडक्यात, अशा प्रकारची वर्गीकरण प्रणाली विकसित करण्यासाठी आपल्याला तालीम संच तयार करावा लागेल. या संचामध्ये दोन प्रकारातील बातम्या असतील : कोविड-१९ संदर्भातील आणि इतर. तालीम संचामध्ये जेवढी जास्त उदाहरणे तेवढी वर्गीकरण प्रणालीची अचूकता अधिक वाढते. ही उदाहरणे आपल्याला मनुष्यबळाकरवी ओळखून घ्यावी लागतात. पण हे फक्त एकावेळी करायचे  काम असते. एकदा या तालीम संचाद्वारे आपण वर्गीकरण प्रणाली विकसित केली की ती आपल्याला वारंवार वापरता येते. मग काय दररोजच्या बातम्या या प्रणालीकडे सोपवून त्यांचे इच्छित वर्गीकरण करून घेता येते.   

पुढील लेखात आपण माहिती वेचणी तंत्राबद्दल अधिक माहिती करून घेऊया आणि हे तंत्र कोविड-१९ ग्रस्त रुग्णांची माहिती गोळा करण्यासाठी कशी मदत करते ते सविस्तरपणे पाहूया.


स्पष्ट, नेमक्या आणि विश्वासार्ह बातम्या वाचण्यासाठी 'सकाळ'चे मोबाईल अॅप डाऊनलोड करा
Web Title: article ashish tendulkar on Information solutions in man-made languages