Information marketing techniques 
एज्युकेशन जॉब्स

भविष्य नोकऱ्यांचे : माहिती वेचणी तंत्र

डॉ. आशिष तेंडुलकर

माहिती वेचणी तंत्रविषयीच्या पहिल्या भागात आपण त्यातील पायऱ्यांची मांडणी केली होती. यात मुख्यत्वे: तीन पायऱ्या आहेत: 

(१) व्यक्ती, वस्तू, जागा,  संस्था, वेळ-काळ यांची वेचणी (Entity extraction)
(२) पहिल्या पायरीमध्ये शोधलेल्या भागांमधील संबंध वेचणी (Relationship extraction)
(३) वेचलेल्या भागांची आणि संबंधांची ज्ञात माहिती बरोबर जोडणी  (Record linkage). मागील दोन लेखात आपण व्यक्ती, वस्तू, जागा, संस्था, वेळ-काळ यांची वेचणी याविषयी लिहिले आहे. या लेखात आपण संबंध वेचणीचा उहापोह करूया.

एकदा व्यक्ती, वस्तू, जागा, संस्था, वेळ-काळ यांची वेचणी करून झाल्यावर आपल्याला त्यांच्यातील संबंध समजून घ्यावा लागतो. आपल्याला ते ज्ञान उपजत असते. संबंध वेचणीच्या पायरीमध्ये आपण संगणकाद्वारे  वाक्यातील विविध भागातील संबंधांचे आकलन करण्याचा प्रयत्न करतो.  उदा. ‘काल पुण्यात ४ रुग्ण कोरोनामुक्त झाले,’  या वाक्यामध्ये व्यक्ती, वस्तू, जागा, संस्था, वेळ-काळ वेचणी साधारणत: अशी दिसते -

आता हेच शब्दसंबंध संगणकाद्वारे कसे वेचावेत बघूया. येथे प्रामुख्याने दोन तंत्रांचा वापर केला जातो (१) सांख्यिकी आधारित (२) ठराविक नियमाधारित जे संबंध साच्यावर अवलंबून असतात. प्रथम आपण सांख्यिकी आधारित वर्गीकरण तंत्राचा वापर कसा केला जातो, ते पाहूया. 

(१) प्रत्येक संबंध हा एक वर्ग मानून आपल्याला त्यासाठी तालीम संच तयार करावा लागतो. या संचामध्ये प्रत्येक उदाहरण म्हणजे एक वाक्य आणि त्यातील संबंध. म्हणजेच वाक्यात एकापेक्षा जास्त संबंध असल्यास तेवढी उदाहरणे तयार होतात - एक वाक्य, एक संबंध, एक उदाहरण! 
(२) या तालीम संचाचा उपयोग करून पर्यवेक्षी साधन शिक्षण तंत्राद्वारे आपण संगणकाला या वर्गीकरणाची तालीम देतो.  तालीम पूर्ण झाल्यावर आपल्याला संबंध वेचणी करणारी संकनक प्रणाली उपलब्ध होते.  त्याचा वापर करून आपण अनेक वाक्यातील असे संबंध शोधून काढता येतात. 

या व्यतिरिक्त आपल्याला या कामासाठी संबंध साच्यांचाही वापर करता येतो. हे संबंध साचे व्यक्ती, वस्तू, जागा, संस्था, वेळ-काळ यांची वेचणी करणाऱ्या वाक्य साच्यांसारखे असतात. त्यांच्याप्रमाणेच हे साचे मनुष्यबळाचा वापर करून तयार करावे लागतात. त्याचप्रमाणे वाक्यासाच्यांचे सर्व गुण-दोष संबंध साच्यांमध्ये आढळून येतात. या संचाद्वारे संबंध वेचणी करणाऱ्या अनेक संगणक प्रणाली कार्यरत आहेत. पुढील लेखामध्ये आपण माहिती वेचणीच्या शेवटच्या पायरीविषयी बोलूया.

वाक्य      पुण्यामध्ये     काल     ४    रुग्ण     कोरोनामुक्त     झाले
माहिती प्रकार     स्थळ     काळ     रुग्ण संख्या     व्यक्ती     रोग     इतर

पुढील वाक्यात संबंध आढळून येतात
संबंध                       शब्द जोड्या 
स्थळ-काळ               (पुणे, काल)
स्थळ-रुग्ण संख्या     (पुणे, ४)
रुग्ण-स्थिती             (रुग्ण, रोगमुक्त) 

सकाळ+ चे सदस्य व्हा

ब्रेक घ्या, डोकं चालवा, कोडे सोडवा!

शॉपिंगसाठी 'सकाळ प्राईम डील्स'च्या भन्नाट ऑफर्स पाहण्यासाठी क्लिक करा.

Read latest Marathi news, Watch Live Streaming on Esakal and Maharashtra News. Breaking news from India, Pune, Mumbai. Get the Politics, Entertainment, Sports, Lifestyle, Jobs, and Education updates. And Live taja batmya on Esakal Mobile App. Download the Esakal Marathi news Channel app for Android and IOS.

T Raja Singh Resignation : ‘’आजच्याच दिवशी बरोबर ११ वर्षांपूर्वी मी...’’ ; भाजपने राजीनामा मंजूर करताच टी.राजा भावनिक!

Pune: सूपमध्ये झुरळ सापडले; पण तक्रारीकडे हॉटेल व्यवस्थापनाचे दुर्लक्ष, नंतर महिलेनं...; पुण्यातील खळबळजनक घटना

IND vs ENG 3rd Test: KL Rahul ने झेल सोडला! शुभमन गिल अम्पायरसोबत भांडला; Umpire ने मागे ढकलले अन् म्हणाले, जा...

Hinjewadi Electric Supply : हिंजवडीतील वीजपुरवठा ७२ तासांनी पूर्वपदावर; नागरिकांकडून सुटकेचा निःश्वास

World Record Internet Speed: इंटरनेट स्पीडचा वर्ल्ड रेकॉर्ड! 10,000 पेक्षा जास्त 4K सिनेमे एका क्षणात झाले डाउनलोड, कुठे घडला हा चमत्कार?

SCROLL FOR NEXT