भविष्य नोकऱ्यांचे : माहिती वेचणी तंत्र

डॉ. आशिष तेंडुलकर
Thursday, 30 April 2020

एकदा व्यक्ती, वस्तू, जागा, संस्था, वेळ-काळ यांची वेचणी करून झाल्यावर आपल्याला त्यांच्यातील संबंध समजून घ्यावा लागतो. आपल्याला ते ज्ञान उपजत असते. संबंध वेचणीच्या पायरीमध्ये आपण संगणकाद्वारे  वाक्यातील विविध भागातील संबंधांचे आकलन करण्याचा प्रयत्न करतो.  उदा. ‘काल पुण्यात ४ रुग्ण कोरोनामुक्त झाले,’  या वाक्यामध्ये व्यक्ती, वस्तू, जागा, संस्था, वेळ-काळ वेचणी साधारणत: अशी दिसते -

माहिती वेचणी तंत्रविषयीच्या पहिल्या भागात आपण त्यातील पायऱ्यांची मांडणी केली होती. यात मुख्यत्वे: तीन पायऱ्या आहेत: 

(१) व्यक्ती, वस्तू, जागा,  संस्था, वेळ-काळ यांची वेचणी (Entity extraction)
(२) पहिल्या पायरीमध्ये शोधलेल्या भागांमधील संबंध वेचणी (Relationship extraction)
(३) वेचलेल्या भागांची आणि संबंधांची ज्ञात माहिती बरोबर जोडणी  (Record linkage). मागील दोन लेखात आपण व्यक्ती, वस्तू, जागा, संस्था, वेळ-काळ यांची वेचणी याविषयी लिहिले आहे. या लेखात आपण संबंध वेचणीचा उहापोह करूया.

एकदा व्यक्ती, वस्तू, जागा, संस्था, वेळ-काळ यांची वेचणी करून झाल्यावर आपल्याला त्यांच्यातील संबंध समजून घ्यावा लागतो. आपल्याला ते ज्ञान उपजत असते. संबंध वेचणीच्या पायरीमध्ये आपण संगणकाद्वारे  वाक्यातील विविध भागातील संबंधांचे आकलन करण्याचा प्रयत्न करतो.  उदा. ‘काल पुण्यात ४ रुग्ण कोरोनामुक्त झाले,’  या वाक्यामध्ये व्यक्ती, वस्तू, जागा, संस्था, वेळ-काळ वेचणी साधारणत: अशी दिसते -

आता हेच शब्दसंबंध संगणकाद्वारे कसे वेचावेत बघूया. येथे प्रामुख्याने दोन तंत्रांचा वापर केला जातो (१) सांख्यिकी आधारित (२) ठराविक नियमाधारित जे संबंध साच्यावर अवलंबून असतात. प्रथम आपण सांख्यिकी आधारित वर्गीकरण तंत्राचा वापर कसा केला जातो, ते पाहूया. 

(१) प्रत्येक संबंध हा एक वर्ग मानून आपल्याला त्यासाठी तालीम संच तयार करावा लागतो. या संचामध्ये प्रत्येक उदाहरण म्हणजे एक वाक्य आणि त्यातील संबंध. म्हणजेच वाक्यात एकापेक्षा जास्त संबंध असल्यास तेवढी उदाहरणे तयार होतात - एक वाक्य, एक संबंध, एक उदाहरण! 
(२) या तालीम संचाचा उपयोग करून पर्यवेक्षी साधन शिक्षण तंत्राद्वारे आपण संगणकाला या वर्गीकरणाची तालीम देतो.  तालीम पूर्ण झाल्यावर आपल्याला संबंध वेचणी करणारी संकनक प्रणाली उपलब्ध होते.  त्याचा वापर करून आपण अनेक वाक्यातील असे संबंध शोधून काढता येतात. 

या व्यतिरिक्त आपल्याला या कामासाठी संबंध साच्यांचाही वापर करता येतो. हे संबंध साचे व्यक्ती, वस्तू, जागा, संस्था, वेळ-काळ यांची वेचणी करणाऱ्या वाक्य साच्यांसारखे असतात. त्यांच्याप्रमाणेच हे साचे मनुष्यबळाचा वापर करून तयार करावे लागतात. त्याचप्रमाणे वाक्यासाच्यांचे सर्व गुण-दोष संबंध साच्यांमध्ये आढळून येतात. या संचाद्वारे संबंध वेचणी करणाऱ्या अनेक संगणक प्रणाली कार्यरत आहेत. पुढील लेखामध्ये आपण माहिती वेचणीच्या शेवटच्या पायरीविषयी बोलूया.

वाक्य      पुण्यामध्ये     काल     ४    रुग्ण     कोरोनामुक्त     झाले
माहिती प्रकार     स्थळ     काळ     रुग्ण संख्या     व्यक्ती     रोग     इतर

पुढील वाक्यात संबंध आढळून येतात
संबंध                       शब्द जोड्या 
स्थळ-काळ               (पुणे, काल)
स्थळ-रुग्ण संख्या     (पुणे, ४)
रुग्ण-स्थिती             (रुग्ण, रोगमुक्त) 


स्पष्ट, नेमक्या आणि विश्वासार्ह बातम्या वाचण्यासाठी 'सकाळ'चे मोबाईल अॅप डाऊनलोड करा
Web Title: Article Aashish Tendulkar on future job