काठमाडौं । पछिल्लो समयमा एआई टुलका कारण बारम्बार सुनिरहेकाे वाक्यांश हो, मसिन लर्निङ (एमएल) । किनकी मसिन लर्निङका मोडेलहरू प्रयोग गरेर एआईले मान्छेले जस्तै लेख्ने गर्छ । एआईको उदयसँगै नेचुरल ल्याङ्ग्वेज प्रोसेसिङ (एनएलपी) पनि निकै चर्चामा रहेको अर्को वाक्यांश हो ।
हुन त मसिन लर्निङ र नेचुरल ल्याङ्ग्वेज प्रोसेसिङ पर्यायवाची हुन् भन्नु सामान्य हो । तर यिनीहरू एक अर्कासँग सम्बन्धित भएपनि भिन्नताहरू अवश्य छन् । तिनै भिन्नता र यिनीहरूले एआई टुलमा कसरीसँगै काम गर्छन् भनेर आज हामी यो लेखमा चर्चा गर्ने छौं:
मसिन लर्निङ के हो ?
एआईको एउटा क्षेत्र हो, मसिन लर्निङ । विशेष गरेर एल्गोरिदम र म्याथम्याटिकल मोडेलको विकास गर्नमा यसको प्रयोग हुन्छ । त्यस्ता मोडेलले डेटा विश्लेषण गरेर आफ्नो विकास आफैं गर्न सक्छन् । डेभलपरको निर्देशन बेगर ती मोडेलहरूले प्याटर्न सिक्न, अनुमान लगाउन वा निर्णयहरू गर्न डेटा स्ट्रिम (उच्च गतिमा डेटा ट्रान्सफर गर्ने)को प्रयोग गर्न सक्छन् ।
त्यस्तै कुनै पनि मानवीय सहायता बिना मसिनहरूलाई समस्या समाधान गर्न सक्षम बनाउँछन् । मसिन लर्निङको उदाहरण सेल्फ ड्राइभिङ भेहिकलमा प्रयोग गरिएको कम्प्युटर भिजन र डिफेक्ट डिटेक्सन सिस्टम हुन् ।
नेचुरल ल्याङ्ग्वेज प्रोसेसिङ के हो ?
यो एउटा एआईको विषय हो । विशेष गरेर ‘टेक्स्ट’ र ‘स्पिच’को विश्लेषण तथा संश्लेषण गर्दा यसको प्रयोग गरिन्छ । यसका लागि एनएलपीले कम्प्युटरलाई मानव भाषा बुझाउन विभिन्न विधि प्रयोग गर्ने गर्छ । सोही कारण भोइस एसिस्टेन्ट, मसिन ट्रान्सलेसन, टेक्स्ट समराइजेसन, सेन्टिमेन्ट एनालिसिस लगायतका ठाउँमा एनएलपीको प्रयोग हुन्छ ।
एआई तथा कम्प्युटर सिस्टमलाई अहिलेको जति युजर-फ्रेन्ड्ली बनाउनमा एनएलपीको ठूलो भूमिका छ । यसको उदाहरण एलेक्सा, सिरी, गुगल एसिस्टेन्ट हुन् ।
एमएल भर्सेस एनएलपी
अहिलेसम्म हामीले थाहा पायौं कि, मसिन लर्निङ (एमएल) र नेचुरल ल्याङ्ग्वेज प्रोसेसिङ (एनएलपी) एआईसँग सम्बन्धित विषय हुन् । दुवैले मसिनलाई निर्णय लिन मोडेल र एल्गोरिदमहरू प्रयोग गरेर सहयोग गर्छन् । तर यिनीहरूले विश्लेषण गर्ने डेटाको प्रकार भने फरक हुन्छ ।
मसिन लर्निङले कम्प्युटरलाई बिना प्रोग्रामिङ डेटाहरूबाट सिक्न विभिन्न विधि प्रयोग गर्छ । विभिन्न प्रकारका डेटा विश्लेषण गर्न र तिनबाट सिक्न मसिन लर्निङ एल्गोरिदम प्रयोग हुन्छ ।
यता नेचुरल ल्याङ्ग्वेज प्रोसेसिङलाई मसिन लर्निङ भित्रकै एउटा क्षेत्र मानिन्छ । कम्प्युटरलाई मानव भाषा बुझाउनमा यो अलि बढी केन्द्रित छ ।
एनएलपी एल्गोरिदम भने ‘टेक्स्ट’ मात्र विश्लेषण गर्न र त्यसबाट सिक्न प्रयोग हुन्छ । साधारण च्याटबट जस्ता एनएलपीले काम गर्न सामान्य नियम प्रयोग गर्छन् । तर धेरै जसो एनएलपीले भाषा बुझ्न मसिन लर्निङ प्रयोग गर्छन् ।
यद्यपि डिप लर्निङ, न्यूरल नेटवर्क, ट्रान्सफर्मर्स, वर्ड इम्बेडिङ, डिसिजन ट्रिज लगायत थुप्रै विधि मसिन लर्निङ अन्तर्गत पर्छन् ।
त्यस्तै मसिन लर्निङको न्यानुचरल ल्याङ्ग्वेज प्रोसेसिङमा लार्ज ल्याङ्ग्वेज मोडेल (एलएलएम) अझै धेरै एडभान्स भर्सन हो । यसको राम्रो उदाहरण च्याटजीपीटी थ्री हो । नेचुरल ल्याङ्ग्वेज प्रोसेसिङ, मसिन लर्निङका मोडेलहरू हुन् ।
मसिन लर्निङले टेक्स्ट प्याटर्न बुझ्न विभिन्न प्रकारका नेचुरल ल्याङ्ग्वेज प्रोसेसिङ विधि प्रयोग गर्ने गर्छ । एलएलएमलाई टेक्स्ट तथा कोडको ठूलो डेटासेटमा तालिम दिइन्छ । सोहीकारण भाषा अनुवाद गर्ने, कविता/कोड/गीत/इमेल जस्ता विभिन्न लेखाइका प्रकार तयार पार्ने, सूचना दिने जस्ता काम गर्न सक्छ ।
मसिन लर्निङको उपयोगिता
मसिन लर्निङको उपयोगिताबारे हामीले माथि पनि चर्चा गरिसकेका छौं । तर अलि विस्तृतमा यसको उपयोगिताबारे दिइएको छ:
-कम्प्युटर भिजन
-इमेज रिकग्नाइजेसन
-बायोइन्फोर्मेटिक्स
-मेडिकल डायग्नोसिस
-प्रोडक्ट रिकम्मेन्डेसन
-प्रेडिक्टिभ एनालिसिस
-मार्केट सेग्मेन्टेसन, कल्सटेरिन एन्ड एनालिसिस आदि ।
नेचुरल ल्याङ्ग्वेज प्रोसेसिङका उपयोगिता
तुलनात्मक रुपमा नेचुरल ल्याङ्ग्वेज प्रोसेसिङका उपयोगिता विशेष र थोरै छ । तर धेरै एनएलपीमा भाषा बुझ्नका लागि मसिन प्रयोग गरिन्छ । त्यसो हुँदा यसका उपोगिताको क्षेत्र पनि बढ्छ । जुन निम्नानुसार छन्:
-टेक्स्ट समराइजेसन
-ल्याङ्ग्वेज ट्रान्सलेसन
-टेक्स्ट कम्प्यारिजन
-सेन्टेन्स कम्प्लिसन
-स्मार्ट एसिस्टेन्ट
-इमेल फिल्टरिङ एन्ड स्पाम डिटेक्सन
-सेन्टेन्स एनालिसिस एन्ड टेक्स्ट क्लासिफिकेसन आदि ।
समग्रमा मसिन लर्निङ र नेचुरल ल्याङ्ग्वेज प्रोसेसिङमा थुप्रै समानता छन् । दुवैले डेटाबाट सिक्न एल्गोरिदमहरू प्रयोग गर्छन् । यिनीहरूबीचको मुख्य भिन्नता प्रोसेसिङ गर्ने डेटाको प्रकार हो ।
अहिलेका अधिकांश मसिन लर्निङ टुलहरूले जेनेरेटिभ मोडेलहरू प्रयोग गर्ने गरेका छन् । ती टुलहरूले मान्छेहरूको इनपुट बिना नै काम गर्न सक्छन् । त्यसो हुनाले यी दुवै एउटै हुन् भन्ने लाग्न सक्छ, तर यी फरक छन् ।