काठमाडौं । निकै लामो समयसम्म निश्चित क्रियटरहरूलाई मात्र उपलब्ध गराइएको भिडिओ जेनेरेसन टुल सोरा आम सर्वसाधारणका लागि हालैमात्र सशुल्क उपलब्ध भएको छ । प्रयोगकर्ताले मासिक रूपमा २० र २०० डलर (३ देखि २७ हजार हजार रुपैयाँ) तिरेर यस टुललाई चलाउन सक्छन् ।
गत वर्ष यो टुल सार्वजनिक हुँदा धेरैले चलचित्रकर्मीहरूलाई ठूलो असर पार्ने चर्चा थियो । तर जसै यो टुल सार्वजनिक भयो, तत्कालै टुलले त्यस्तो असर नपार्ने देखिएको छ । अहिले टुलबारे सामाजिक सञ्जालहरूमा विभिन्न प्रतिक्रिया आउन थालेका छन् । बिर्सिनुहुन्न कि यो टुलको प्रयोग गरेर क्रियटरहरूले म्युजिक भिडिओ र लघुचलचित्र समेत बनाइसकेका छन् ।
राम्रो प्रम्ट (लिखित निर्देशन) दिएर बनाएका भिडिओहरूमा सामान्य मान्छे झुक्किन सक्छन् । तर भिडिओग्राफी/फिल्म मेकिङ जस्ता समान क्षेत्रमा काम गर्दै आएका व्यक्तिहरूलाई भने टुलले तयार पार्ने भिडिओले अहिले नै झुक्याउन सक्ने अवस्था बनिसकेको छैन ।
सोराले काम कसरी गर्छ ?
सोरा टेक्स्ट टू भिडियो एआई मोडेल हो । यसले टेक्स्ट प्रम्प्ट, फोटो, भिडिओ क्लिपका आधारमा नयाँ भिडिओ बनाउन सक्छ । अहिलेको अवस्थामा सोराले १०८० पिक्सेल रेजोलुसनका ६० सेकेन्डसम्मका भिडिओ बनाउन सक्छ । यसले पनि ड्याल-ई, जीपीटी जस्ता जेनरेटिभ मोडेलहरू जसरी काम गर्छ ।
केका आधारमा सोराले त्यस्तो भिडिओ बनाउँछ?
क्षणभरमा नै सोरालाई भिडिओ बनाउन सक्ने बनाउन ठूलो डेटामा तालिम दिइएको छ । यसका लागि ओपनएआईले सार्वजनिक रूपमा उपलब्ध मिडिया र डेटा प्रयोग गरेको जनाइएको छ । भन्नुको अर्थ सोराले बनाउने भिडिओको स्रोत कतै न कतै यसअघि नै बनेका हुन्छन् ।
कस्तो छ टुल ?
युट्युबर मार्क्स किथ ब्राउनली उर्फ एमकेबीएचडीले यस टुलको रिभ्यू गर्दै हालै युट्युबमा भिडिओ हालेका छन् । जहाँ उनले टुलले दिएको परिणाम डरलाग्दो र प्रेरणादायी दुवै भएको बताएका छन् । यस क्रममा टुललाई फोटोझैँ वास्तविक, कार्टुन, स्थिर चित्रलगायतका विभिन्न प्रकारको भिडिओ बनाउन लगाएको उनले उल्लेख गरेका छन् ।
उनी के कुरामा विश्वास गर्छन् भने यो शक्तिशाली उपकरण हो । जसलाई अब लाखौं मानिसहरूले प्रयोग गर्ने निश्चित छन् । तर टुल सबै अवस्था राम्रो नभएको उनको निष्कर्ष छ ।
उनका अनुसार टुलबाट ३६० पिक्सेलका भिडिओ बनाउन तुलनात्मक रूपमा कम समय लाग्छ । उनले आफ्नो अनुभवमा यस रेजोलुसनको भिडिओ बनाउन २० सेकेन्डभन्दा कम समय लाग्ने बताएका छन् ।
तर १०८० पिक्सेल रेजोलुसनको बनाउन भने एक मिनेट बढी लाग्छ । त्यसमाथि सबैका लागि टुल उपलब्ध गराउँदा अझ बढी समय लाग्नेमा उनी शङ्का गर्छन् । हालै मात्र च्याटजीपीटी र सोरा धेरै क्षेत्रमा डाउन भएको रिपोर्ट आएका थिए । यसले गर्दा पनि उनको शङ्का सत्य हुनेमा ठाउँ बाँकी नै रहेको छ ।
टुलले भिडिओ बनाउन समय लगाउनुमा प्रयोगकर्ताको कम्प्युटर वा इन्टनरनेटको गतिले खासै फरक पार्दैन । किनकि प्रम्प्ट दिइसकेको बाँकी सबै काम ओपनएआईको सर्भरमा हुने गर्छ । तर एकै पटकमा सयौं प्रयोगकर्ताले टुल चलाउँछन् । यसले गर्दा टुलले समय लिन्छ । तर भिडिओ तयार भए पछि भने डाउनलोड गर्न सकिन्छ ।
टुलको लेआउट
सोरा चलाउन कम्पनीले छुट्टै डोमेन sora.com दिएको छ । जसको इन्टरफेस च्याटजीपीटीको जस्तै सामान्य र सरल छ । टुलको तल्लो भागमा प्रम्प्ट लेख्ने ठाउँ छ । बायाँतर्फ भने एक्सप्लोर र लाइब्रेरी लगायतका विकल्प छन् ।
त्यहीँ नै एक्सप्लोर सेक्सन भित्र 'फिचर्ड' को विकल्प छ । जहाँ अरू प्रयोगकर्ताहरूले हालै बनाएका भिडिओ देखिन्छ । जसलाई प्रयोगकर्ताले बुकमार्क समेत गर्न सक्छन् । त्यसैगरी ती भिडिओ बनाउन उनीहरूले केकस्ता प्रम्प्ट प्रयोग गरे भनेर समेत हेर्न सकिन्छ ।
त्यस्तै प्रयोगकर्ताहरूले आफूले बनाएको भिडिओहरूलाई विभिन्न प्रोजेक्ट वा थिम अनुसार 'फोल्डर' बनाएर व्यवस्थित समेत गर्ने विकल्प पनि बायाँ भागमा नै पाउन सकिन्छ । अझ अरूको काममा परिवर्तन गरेर आफ्नो बनाउन 'रिमिक्स' फिचर पनि यसै भागमा दिइएको छ ।
टुलमा 'स्टोरीबोर्ड' नामक एउटा फिचर पनि छ । हेर्दामा यो अनलाइन भिडिओ एडिटिङ टुल जस्तै देखिन्छ । काम पनि उस्तै गर्छ । यसबाट फरक फरक प्रम्प्टबाट एउटा लामो भिडिओ बनाउन सकिन्छ । जसै ती भिडिओ तयार हुन्छ, त्यसपछि स्टोरीबोर्डले ती सबैलाई एकैसाथ मिलाएर लामो भिडिओ बनाइदिन्छ ।
टुलको कमजोरी
यसअघि आएका डेमो भिडिओहरूमा पनि तपाईंले ख्याल गर्नु भएको हुन सक्छ, टुलले बनाएका फोटो/भिडिओहरू वास्तविक जस्ता देखिँदैनन् । अहिले पनि यो समस्या टुलमा छ ।
कृत्रिम तरिकाले निर्माण गरिएका भिडिओहरूमा कतै न कतै समस्या भेटिन्छ । उदाहरणका लागि, टुलले तयार पारेका भिडिओमा देखिने वस्तुहरूको चाल र व्यवहार अनौठो लाग्छ । ती वस्तुहरू वास्तविक जस्तै देखिन चाल र व्यवहार मिल्नु आवश्यक छ ।
त्यस्तै कतिपय वस्तुहरू टुलमा अचानक गायब हुन्छन् त फेरि अचानक देखिन्छन् । खुट्टाहरूको चालमा पनि उस्तै समस्या छ । ध्यानपूर्वक हेर्दा अगाडि र पछाडिको खुट्टा बारम्बार साटिरहने देखिन्छ ।
यी सबैको अर्थ टुलले तयार पारेका वस्तुहरू विज्ञान सम्बद्ध छैनन् । कुनै वस्तुहरूको गति र चाल सामान्यतया यथार्थपरक नभएको मानव आँखाले सजिलैसँग थाहा पाइहाल्छ । टुलले पानीका छालहरू, आगोको लप्काहरू केहीमा विज्ञान सम्बद्ध यथार्थपरक भिडिओ बनाए पनि समस्या भने उही आइहाल्छ ।
टुलले फोटोको आधारमा पनि भिडिओ बनाउन सक्छ । विभिन्न चर्चित मिमहरूको भिडिओ बनाइएको फोटो सामाजिक सञ्जालमा पाउन सकिन्छ । तर तिनमा पनि उस्तै समस्या छ । अर्थात् ती पनि हेर्दा सही लाग्दैनन् ।
टुलले फोटोबाट भिडिओ बनाए पनि फोटोको सब्जेक्टको क्रियाकलाप बुझ्दैन । फोटोको सन्दर्भ एउटा हुन्छ भने भिडिओ अर्कै बन्छ । युट्युबर एमकेबीएचडीले यी बारे प्रशस्तै उदाहरण दिएका छन् ।
टुलको राम्रो पक्ष
फोटोलाई जीवन्त बनाउनु, केही लेखेकै आधारमा क्षणभरमा भिडिओ बनाउनु पक्कै पनि टुलका राम्रा पक्ष हुन् । तर यथार्थपरक र विज्ञान सम्बद्ध नभएको कुरा छाड्ने हो भने टुलको केही राम्रा पक्ष छन् ।
युट्युबर एमकेबीएचडीका अनुसार टुलले एब्स्ट्र्याक्ट (अमूर्त) डिजाइनका भिडिओ राम्रो बनाउन सक्छ । यसमा विभिन्न बनावट, रङ, ग्रेडियन्ट आदिबाट बन्ने भिडिओ पर्छन् । किनकि अमूर्त भनेपछि नियम नमिले पनि हुन्छ । टुलबाट बनाउन सकिने त्यस्ता भिडिओ स्क्रिन सेभर वा अन्य कुनै काममा प्रयोग गर्न सकिन्छ ।
त्यस्तै टेक्स्ट हुने खालका भिडिओ पनि यस टुलले राम्रै बनाउँछ । भन्नुको अर्थ भिडिओमा टेक्स्ट मात्र हुन्छ । सुरुमा केही गडबड भए पनि टुलले यस प्रकारको राम्रो भिडिओ बनाउने उनले बताएका छन् । यसैगरी स्टप मोसन र कार्टुन शैलीका भिडिओ पनि राम्रो बनाउँछ । यस खालका भिडिओ पनि यथार्थपरक हुनु आवश्यक छैन ।
टुलको सीमितता र सुरक्षा
समयसमयमा एआई टुलहरू विवादित हुँदै आएका छन् । यसको गतिलो उदाहरण गुगलको जेमिनाई हो । यही विवादका कारण अहिलेसम्म जेमिनाईको नि:शुल्क भर्सनमा मान्छेको फोटो बनाउन सकिँदैन । यसबाट बँच्न ओपनएआईले सोरामा केही सीमितता र सुरक्षा मापदण्डहरू राखेको छ ।
टुलबाट अतियथार्थपरक केही पनि बनाउन सकिँदैन । स्रोतका रूपमा तपाईंले वास्तविक व्यक्तिको अनुहार प्रयोग दिनु भए अस्वीकार गर्छ । यसैगरी कुनै पनि खतरनाक वा हानिकारक भिडिओ बनाउन पनि यसले अस्वीकार गर्छ ।
त्यस्तै टुलबाट बनाइएका प्रत्येक भिडिओमा वाटरमार्क पनि राखिएको छ । तर पैसा तिरे वाटमार्कलाई हटाउन सकिन्छ । अनि टुलमा कपिराइट कन्टेन्टहरू पनि प्रयोग गर्न मिल्दैन ।
त्यस्तै भिडिओ बनाउन उपलब्ध गराइका फोटो/भिडिओमा १८ वर्षभन्दा कम उमेरका बालबालिका हुनुहुन्न । यति कुरामा तपाईंले सहमति जनाएपछि मात्र भिडिओ बनाउन सक्नुहुन्छ । तर टुलको मुख्यत: सीमितता भनेको यसले बनाउने भिडिओको लम्बाइ हो ।
टुलले चलचित्रकर्मीलाई प्रभाव पार्छ ?
अहिलेकै अवस्थामा यस टुलले चलचित्रकर्मीहरूलाई प्रभाव पार्ने अवस्था छैन । यसको कारण टुलको सीमितता हो । तर केही वर्षको अन्तरालमा टुलको क्षमतामा जुन प्रगति भएको छ, त्यसले भने सोच्नु पर्ने बनाउन सक्छ । हाललाई बरु यो गतिलो सहायक टुल हुन सक्छ ।