Information marketing techniques
Information marketing techniques 
एज्युकेशन जॉब्स

भविष्य नोकऱ्यांचे : माहिती वेचणी तंत्र

डॉ. आशिष तेंडुलकर

माहिती वेचणी तंत्रविषयीच्या पहिल्या भागात आपण त्यातील पायऱ्यांची मांडणी केली होती. यात मुख्यत्वे: तीन पायऱ्या आहेत: 

(१) व्यक्ती, वस्तू, जागा,  संस्था, वेळ-काळ यांची वेचणी (Entity extraction)
(२) पहिल्या पायरीमध्ये शोधलेल्या भागांमधील संबंध वेचणी (Relationship extraction)
(३) वेचलेल्या भागांची आणि संबंधांची ज्ञात माहिती बरोबर जोडणी  (Record linkage). मागील दोन लेखात आपण व्यक्ती, वस्तू, जागा, संस्था, वेळ-काळ यांची वेचणी याविषयी लिहिले आहे. या लेखात आपण संबंध वेचणीचा उहापोह करूया.

एकदा व्यक्ती, वस्तू, जागा, संस्था, वेळ-काळ यांची वेचणी करून झाल्यावर आपल्याला त्यांच्यातील संबंध समजून घ्यावा लागतो. आपल्याला ते ज्ञान उपजत असते. संबंध वेचणीच्या पायरीमध्ये आपण संगणकाद्वारे  वाक्यातील विविध भागातील संबंधांचे आकलन करण्याचा प्रयत्न करतो.  उदा. ‘काल पुण्यात ४ रुग्ण कोरोनामुक्त झाले,’  या वाक्यामध्ये व्यक्ती, वस्तू, जागा, संस्था, वेळ-काळ वेचणी साधारणत: अशी दिसते -

आता हेच शब्दसंबंध संगणकाद्वारे कसे वेचावेत बघूया. येथे प्रामुख्याने दोन तंत्रांचा वापर केला जातो (१) सांख्यिकी आधारित (२) ठराविक नियमाधारित जे संबंध साच्यावर अवलंबून असतात. प्रथम आपण सांख्यिकी आधारित वर्गीकरण तंत्राचा वापर कसा केला जातो, ते पाहूया. 

(१) प्रत्येक संबंध हा एक वर्ग मानून आपल्याला त्यासाठी तालीम संच तयार करावा लागतो. या संचामध्ये प्रत्येक उदाहरण म्हणजे एक वाक्य आणि त्यातील संबंध. म्हणजेच वाक्यात एकापेक्षा जास्त संबंध असल्यास तेवढी उदाहरणे तयार होतात - एक वाक्य, एक संबंध, एक उदाहरण! 
(२) या तालीम संचाचा उपयोग करून पर्यवेक्षी साधन शिक्षण तंत्राद्वारे आपण संगणकाला या वर्गीकरणाची तालीम देतो.  तालीम पूर्ण झाल्यावर आपल्याला संबंध वेचणी करणारी संकनक प्रणाली उपलब्ध होते.  त्याचा वापर करून आपण अनेक वाक्यातील असे संबंध शोधून काढता येतात. 

या व्यतिरिक्त आपल्याला या कामासाठी संबंध साच्यांचाही वापर करता येतो. हे संबंध साचे व्यक्ती, वस्तू, जागा, संस्था, वेळ-काळ यांची वेचणी करणाऱ्या वाक्य साच्यांसारखे असतात. त्यांच्याप्रमाणेच हे साचे मनुष्यबळाचा वापर करून तयार करावे लागतात. त्याचप्रमाणे वाक्यासाच्यांचे सर्व गुण-दोष संबंध साच्यांमध्ये आढळून येतात. या संचाद्वारे संबंध वेचणी करणाऱ्या अनेक संगणक प्रणाली कार्यरत आहेत. पुढील लेखामध्ये आपण माहिती वेचणीच्या शेवटच्या पायरीविषयी बोलूया.

वाक्य      पुण्यामध्ये     काल     ४    रुग्ण     कोरोनामुक्त     झाले
माहिती प्रकार     स्थळ     काळ     रुग्ण संख्या     व्यक्ती     रोग     इतर

पुढील वाक्यात संबंध आढळून येतात
संबंध                       शब्द जोड्या 
स्थळ-काळ               (पुणे, काल)
स्थळ-रुग्ण संख्या     (पुणे, ४)
रुग्ण-स्थिती             (रुग्ण, रोगमुक्त) 

Read latest Marathi news, Watch Live Streaming on Esakal and Maharashtra News. Breaking news from India, Pune, Mumbai. Get the Politics, Entertainment, Sports, Lifestyle, Jobs, and Education updates. And Live taja batmya on Esakal Mobile App. Download the Esakal Marathi news Channel app for Android and IOS.

Weather Updates: मे महिन्यातही सूर्य आग ओकणार! पावसासंदर्भातही मोठी अपडेट; IMD ने काय सांगितलं?

Shyam Rangeela: मेरे प्यारे देशवासियो... मोदींची मिमिक्री करत प्रसिद्ध झालेल्या कॉमेडियनचे वाराणसीतून पंतप्रधानांना आव्हान

Prajwal Revanna : 'प्रज्वल' प्रकरणामुळे प्रचाराची दिशाच बदलली; काँग्रेस आक्रमक, JDS ऐवजी भाजप नेते रडारवर

Parveen Shaikh: इस्रायल-हमास युद्धावर पोस्ट केल्याने प्रिन्सिपलवर नोकरी गमावण्याची वेळ

Latest Marathi News Live Update : १५ जूनपर्यंत मालमत्ता कर भरल्यास मिळणार १०% सूट

SCROLL FOR NEXT