च्याट जीपीटी निर्माता कम्पनी ओपन एआईले आफ्नो प्रिमियर टेक्स्ट-टु-भिडिओ जेनेरेटर टुल सार्वजनिक गरेको छ । बिहीबार कम्पनीले लिखित निर्देशनकै भरमा सबैलाई आश्चर्यचकित पार्ने किसिमको भिडिओ तयार बनाइदिने एआई मोडेल सोरा ल्याएको हो ।
सबैले प्रयोग गर्नेगरी सार्वजनिक गर्नु अघि हाललाई सोरा केही अनुसन्धानकर्ता र क्रियटरहरूमा सीमित गरिएको छ । जसले फिल्म उद्योग र हाम्रो समग्र डिपफेक समस्यामा आँधीबेहरी ल्याउन सक्ने ठानिएको छ ।
"सोरा विभिन्न पात्र तथा चरित्रसहित जटिल किसिमका सिन, विशेष प्रकारका मोसन र सब्जेक्ट र ब्याकग्राउन्डको यथार्थ परक विस्तृत विवरण तयार पार्न सक्षम छ," ओपन एआईले आफ्नो ब्लगपोस्टमा भनेको छ ।
"यो मोडेलले प्रोम्प्टमा प्रयोगकर्ताले के कुरा अनुरोध गरेको छ भन्ने मात्र नभएर ती चिजहरू भौतिक संसारमा कसरी अस्तित्वमा छन् भन्ने विषय समेत राम्रोसँग बुझ्न सक्छ ।" ओपन एआईले सोरा कहिलेसम्म आम सर्वसाधारणका लागि उपलब्ध हुन्छ भन्ने जानकारी भने खुलाएको छैन ।
एआई भिडिओ सिर्जनाको क्षेत्रमा सोरा ओपन एआईको पहिलो परियोजना हो । कम्पनीले आएआईमा आधारित टेक्स्ट-टु-इमेज जेनेरेटरको रूपमा भने च्याट जीपीटी र ड्याल-ई यस अघि नै ल्याइसकेको छ ।
एनभिदियाका वरिष्ठ अनुसन्धानकर्ता डा जिम फ्यानका अनुसार सोरा सिर्जनात्मक कम र डेटा ड्रिभन (डेटाबाट सञ्चलित भौतिक विज्ञानमा आधारित इन्जिन जस्तो बढी लाग्छ ।
सोराले केवल तस्विर सिर्जना गर्ने मात्र नभई कुनै वातावरणमा रहेको वस्तुको भौतिकशास्त्र समेत यकिन गर्न सक्छ र सोही हिसाबकिताबमा रहेर भिडिओ निकाल्छ । सोरामार्फत भिडिओ तयार पार्न प्रयोगकर्ताले प्रोम्प्टमा केही वाक्य टाइप गरे पुग्छ, जुन धेरैजसो एआई-इमेज जेनेरेटर अर्थात् तस्विर तयार पार्ने एआई टुलहरू अपनाइने विधि जस्तै हो ।
Prompt: “Animated scene features a close-up of a short fluffy monster kneeling beside a melting red candle. the art style is 3d and realistic, with a focus on lighting and texture. the mood of the painting is one of wonder and curiosity, as the monster gazes at the flame with… pic.twitter.com/aLMgJPI0y6
यसमा तपाईंले आश्चर्यजनक परिणाम प्राप्त गर्न केवल फोटोरियालिस्टिक अथवा एनिमेटेड मध्ये कुनै एक शैली रोज्न सक्नुहुन्छ । सोरा एउटा डिफ्युजन मोडेल हो ।
जसको अर्थ यसले ब्लरी अस्थिपञ्जरले भरिएको भिडिओबाट सुरु गरेर विस्तारै तल देखाइएको जस्तो पालिस गरिएको भर्सन देख्न सक्नु हुन्छ ।
मिडजर्नी र स्टेबल डिफ्युजन तस्विर तथा भिडिओ जेनेरेटर पनि डिफ्युजन मोडेल नै हुन् । यद्यपि ओपन एआईको सोरा निकै तीभन्दा निकै उत्कृष्ट छ ।
सोराले तयार पार्ने भिडिओ लामा, थप गतिशील र अन्य प्रतिस्पर्धीभन्दा राम्रा छन् । झट्ट हेर्दा सोराले वास्तविक भिडिओ नै सिर्जना गरेको जस्तो लाग्छ ।
जब कि अन्य प्रतिस्पर्धी कम्पनीका मोडेल भने एआई तस्विरकै गति वा चालमा सीमित भएजस्तो देखिन्छन् । सोरा मार्फत ओपन एआईले एआईको अर्को क्षेत्र भिडिओ जेनेरेटरमा प्रतिस्पर्धीलाई लाजै लाग्ने गरी पुनः माथ दिएको छ ।
Prompt: “Several giant wooly mammoths approach treading through a snowy meadow, their long wooly fur lightly blows in the wind as they walk, snow covered trees and dramatic snow capped mountains in the distance, mid afternoon light with wispy clouds and a sun high in the distance… pic.twitter.com/Um5CWI18nS
सोराले तयार पारेका भिडिओ हेर्ने हो भने निःसन्देह गज्जबकै छन् । वास्तविक फिल्म क्रु अथवा एनिमेटरलाई यी भिडिओ बनाउन घण्टौं लाग्न सक्छ ।
एडिटोरियल र डिजाइनको क्षेत्रमा च्याट जीपीटी र एआई-इमेज जेनेरेटरले गरे जस्तै सोराले पनि सम्भवतः चलचित्र उद्योगलाई नै धक्का दिने देखिन्छ । यो प्रविधि भिडिओ क्रियटरहरूको रोजगारी सुरक्षाका हिसाबले उल्लेखनीय र अझ भनौं डरलाग्दो देखिन्छ ।
सोरामा कारण र असर बुझ्न नसक्ने लगायतका समस्या सम्बोधन गरी थप चुस्त बनाउन अझै केही काम गर्न बाँकी रहेको ओपन एआईले जनाएको छ ।
खासगरी डिपफेक तयार पारी दुर्व्यवहार गर्ने कार्यमा हालैका महिनामा जसरी एआई प्रविधि दुरुपयोग भइरहेको छ, त्यस हिसाबले सुरक्षा पनि एउटा मुख्य सरोकारको विषय हो । कम्पनीले भ्रामक प्रकारका सामग्री पहिचान गर्ने र जोखिमपूर्ण टेक्स्ट प्रोम्प्ट अस्वीकार गर्ने टुल समेत बनाउने ओपन एआईले जनाएको छ ।