close

एआई तालिमका लागि पुस्तक चोरीको आरोप: मेटा, गुगल, ओपनएआई एन्थ्रोपिक कानुनी घेरामा

टेकपाना टेकपाना

माघ १४, २०८२ १०:५२

एआई तालिमका लागि पुस्तक चोरीको आरोप: मेटा, गुगल, ओपनएआई एन्थ्रोपिक कानुनी घेरामा

काठमाडौँ । सन् २०२४ को सुरुतिर, आर्टिफिसियल इन्टेलिजेन्स स्टार्टअप एन्थ्रोपिक (Anthropic) का कार्यकारीहरूले एक महत्वाकाङ्क्षी र गोप्य राख्न खोजिएको परियोजनालाई तीव्रता दिए । गत हप्ता कानुनी फाइलिङहरूमा खुलासा भएको एउटा आन्तरिक योजना दस्तावेजमा भनिएको छ, “प्रोजेक्ट पानामा संसारका सबै पुस्तकहरूलाई नष्ट गर्ने गरी स्क्यान गर्ने हाम्रो प्रयास हो ।" दस्तावेजमा थप भनिएको छ, "हामी यो चाहँदैनौँ कि हामीले यसमा काम गरिरहेका छौँ भन्ने कुरा बाहिर आओस् ।"

फाइलिङहरूका अनुसार, करिब एक वर्षभित्र कम्पनीले लाखौँ पुस्तकहरू खरिद गर्न र तिनका मेरुदण्ड (spines) काटेर पानाहरू स्क्यान गर्न करोडौँ डलर खर्च गर्‍यो । ती स्क्यान गरिएका पानाहरूलाई क्लाउड (Claude) जस्ता लोकप्रिय च्याटबट पछाडिका एआई मोडेलमा थप ज्ञान भर्न प्रयोग गरियो ।

प्रोजेक्ट पानामाका यी विवरणहरू पहिले बाहिर आएका थिएनन् । यी तथ्यहरू पुस्तक लेखकहरूले एन्थ्रोपिक विरुद्ध दायर गरेको प्रतिलिपि अधिकार मुद्दाका ४,००० भन्दा बढी पानाका कागजातहरूबाट बाहिर आएका हुन् । लगानीकर्ताहरूले एन्थ्रोपिकको मूल्य १८३ अर्ब डलर मूल्याङ्कन गरेका छन् । कम्पनीले गत अगस्टमा यो मुद्दा सुल्झाउन १.५ अर्ब डलर तिर्न सहमति जनाएको थियो, तर गत हप्ता अमेरिकाका एक जिल्ला न्यायाधीशले यस मामिलाका कागजातहरू सार्वजनिक गर्ने निर्णय गरेपछि एन्थ्रोपिकको पुस्तकहरू प्राप्त गर्ने तीव्र चाहना पूर्ण रूपमा खुलासा भयो ।

नयाँ कागजात र एआई कम्पनीहरू विरुद्धका अन्य प्रतिलिपि अधिकार मुद्दाहरूले एन्थ्रोपिक, मेटा, गुगल र ओपनएआई जस्ता प्रविधि कम्पनीहरूले आफ्नो सफ्टवेयरलाई 'तालिम' दिन विशाल डेटाको भण्डार प्राप्त गर्न कति सम्मको प्रयास गरिरहेका छन् भन्ने देखाउँछन् । यी कम्पनीहरूले पुस्तकहरूलाई एक महत्त्वपूर्ण पुरस्कारको रूपमा लिएका थिए । 

सन् २०२३ को एक दस्तावेजमा एन्थ्रोपिकका एक सह-संस्थापकले तर्क गरेका थिए कि एआई मोडेलहरूलाई पुस्तकहरूबाट तालिम दिँदा उनीहरूले कम गुणस्तरको इन्टरनेट सामग्रीको सट्टा राम्रोसँग लेख्न सिक्न सक्छन् । मेटा भित्रको सन् २०२४ को एक इमेलले पनि पुस्तकहरूको डिजिटल भण्डारमा पहुँच पाउनु आफ्ना एआई प्रतिद्वन्द्वीहरूसँग प्रतिस्पर्धा गर्न अत्यावश्यक रहेको कुरा उल्लेख गरेको थियो ।

तर अदालतको रेकर्डले भने प्रकाशक र लेखकहरूबाट प्रत्यक्ष अनुमति लिनु यसका लागि व्यावहारिक नहुने यी कम्पनीहरूले ठानेको प्रष्ट हुन्छ । बरु, उनीहरूले लेखकहरूको जानकारी बिना नै ठुलो मात्रामा पुस्तकहरू प्राप्त गर्ने तरिकाहरू फेला पारे, जसमा पाइरेटेड (चोरी गरिएका) प्रतिलिपिहरू डाउनलोड गर्ने कार्य पनि समावेश छ ।

मेटाका कर्मचारीहरूले आन्तरिक मेसेजमा अनुमति बिना लाखौँ पुस्तकहरू डाउनलोड गर्दा प्रतिलिपि अधिकार कानुन उल्लङ्घन हुने चिन्ता व्यक्त गरेका थिए । सन् २०२३ को एक ईमेल अनुसार, यो अभ्यासलाई एमजी (मार्क जुकरबर्ग) सम्म पुर्‍याएपछि अनुमोदन गरिएको थियो । मेटाले यस विषयमा टिप्पणी गर्न अस्वीकार गरेको द वाशिङ्गटन पोस्टमा उल्लेख छ ।

एन्थ्रोपिकको एक कानुनी फाइलिङमा खुलाइए अनुसार, सह-संस्थापक बेन मानले सन् २०२१ मा लिबजेन (LibGen) भनिने प्रतिलिपि अधिकार उल्लङ्घन गरिएका सामग्रीहरू पाइने स्याडो लाइब्रेरीबाट ११ दिन लगाएर थुप्रै पुस्तकहरू डाउनलोड गरेका थिए । एक वर्ष पछि उनले पाइरेट लाइब्रेरी मिरर नामक साइटको प्रशंसा गर्दै कर्मचारीहरूलाई ‘ठिक्क समयमा!!!’ भन्ने सन्देश पठाएका थिए । यद्यपि, एन्थ्रोपिकले दाबी गरेको छ कि उसले यी चोरी गरिएका डेटा प्रयोग गरेर आय आर्जन हुने कुनै पनि व्यावसायिक मोडेललाई तालिम दिएको छैन ।

एआई उद्योगका पूर्व कार्यकारी एड न्युटन-रेक्स भन्छन् कि यी कम्पनीहरूले सर्जकहरूलाई अझै ठुलो ऋण तिर्न बाँकी छ । हाल गुगल, माइक्रोसफ्ट र ओपनएआईले पनि यस्तै प्रकारका प्रतिलिपि अधिकार मुद्दाहरूको सामना गरिरहेका छन् । धेरै जसो मुद्दाहरू अझै चलिरहेका छन्, तर केही न्यायाधीशहरूले एआई तालिमका लागि पुस्तकहरूको प्रयोगलाई फेयर युज (fair use) अन्तर्गत कानुनी मान्न सकिने प्रारम्भिक फैसला सुनाएका छन् । न्यायाधीश विलियम अलसपका अनुसार एआईले सामग्रीलाई परिवर्तनकारी रूपमा प्रशोधन गर्ने भएकाले यो कानुनी हुन सक्छ ।

तर पुस्तकहरू कसरी प्राप्त गरियो भन्ने कुराले कम्पनीहरूलाई अप्ठ्यारोमा पार्न सक्छ । एन्थ्रोपिकले मुद्दा सुल्झाउन १.५ अर्ब डलर तिर्नुको एउटा कारण उनीहरूले पाइरेटेड पुस्तकहरू डाउनलोड गरेको विषय पनि थियो । यस सेटलमेन्टबाट लेखकहरूले प्रति पुस्तक करिब ३,००० डलर दाबी गर्न सक्ने अनुमान गरिएको छ ।

खरिद, कटान, स्क्यान र रिसाइक्लिङ

प्रोजेक्ट पानामा सञ्चालन गर्न एन्थ्रोपिकले गुगलका पूर्व कार्यकारी टम टर्भीलाई नियुक्त गर्‍यो । कम्पनीले सुरुमा न्युयोर्कको प्रसिद्ध पुस्तक पसल द स्ट्र्यान्ड वा सार्वजनिक पुस्तकालयहरूबाट पुस्तक खरिद गर्ने सोच बनाएको थियो । अन्ततः उसले बेटर वर्ल्ड बुक्स र वर्ल्ड अफ बुक्स जस्ता पुराना पुस्तक बिक्रेताहरूबाट लाखौंको सङ्ख्यामा पुस्तक किन्यो ।

कागजातहरूका अनुसार, एउटा भेन्डरले ६ महिनाको अवधिमा ५ लाखदेखि २० लाख पुस्तकहरू स्क्यान गर्ने तयारी गरेको थियो । यो प्रक्रियामा हाइड्रोलिक पावर भएको काट्ने मेसिनले पुस्तकहरू काट्ने, उच्च गतिको स्क्यानरमा स्क्यान गर्ने र अन्त्यमा ती पुस्तकहरूलाई रिसाइक्लिङका लागि पठाउने गरिन्थ्यो ।

मेटामा पनि यस्तै होडबाजी थियो । कर्मचारीहरूले कर्पोरेट ल्यापटपबाट पाइरेटेड फाइलहरू डाउनलोड (टोरेन्टिङ) गर्नु जोखिमपूर्ण भएको र यसलाई ट्रेस हुन नदिन अमेजनका सर्भरहरू प्रयोग गरिएको कुरा आन्तरिक च्याटहरूमा स्वीकारेका थिए । ओपनएआईले पनि लिबजेन डाउनलोड गरेको स्वीकार गरे पनि च्याटजीपीटी सार्वजनिक गर्नुअघि ती फाइलहरू हटाइएको बताएको छ ।

कोर्नेल टेकका प्राध्यापक जेम्स ग्रिमेलम्यान भन्छन् कि एआई कम्पनीहरू तीव्र प्रतिस्पर्धाका कारण प्रतिलिपि अधिकार सामग्री प्रयोग गर्ने लतमा परे । उनका अनुसार, पछि एन्थ्रोपिकले चोरीका फाइलहरू डाउनलोड गर्नुको सट्टा भौतिक पुस्तकहरू किनेर स्क्यान गर्ने निर्णय गर्नु कानुनी रूपमा ‘स्मार्ट’ कदम थियो ।

पछिल्लो अध्यावधिक: माघ १४, २०८२ ११:१२