AI असिस्टेंट या Ace स्टूडेंट?

-
June 30, 2023

छवि सौजन्य: पिक्साबे/एलेक्जेंड्रा_कोच

जब आईआईएससी के कंप्यूटर विज्ञान और स्वचालन विभाग (सीएसए) में सहायक प्रोफेसर अरिंदम खान ने रैंडमाइज्ड एल्गोरिदम पर अपने पाठ्यक्रम के लिए एक परीक्षा की व्यवस्था की, तो वह यह देखने के लिए उत्सुक थे कि ChatGPT – AI समुदाय में तरंगें बनाने वाला चैटबॉट – कितना अच्छा प्रदर्शन करेगा।

उन्होंने ChatGPT को संकेत के रूप में अपने छात्रों के लिए निर्धारित छह प्रश्न (LaTeX में एन्कोड किए गए) दिए। आश्चर्य की बात यह है कि ChatGPT छह में से दो प्रश्नों को सही करने में सफल रहा। GPT4 (ओपनAIद्वारा हाल ही में जारी किया गया चैटबॉट, वही संगठन जो ChatGPT लेकर आया था) ने और भी बेहतर प्रदर्शन किया और परीक्षा देने वाले छात्रों के औसत स्कोर से अधिक अंक प्राप्त किए। अतिरिक्त मार्गदर्शन दिए जाने पर, चैटबॉट ने शेष कुछ प्रश्नों में भी अच्छा प्रदर्शन किया।“यह सर्वश्रेष्ठ छात्रों के स्तर तक पहुँचने से काफी दूर है। लेकिन मैं आसानी से कह सकता हूं कि इसका प्रदर्शन बी/बी+ ग्रेड के छात्र के स्तर का है,” वे कहते हैं।

अरिंदम जैसे संकाय सदस्य शिक्षा और सीखने में तेजी से एक चैटबॉट – तकनीकी रूप से एक बड़ा भाषा मॉडल या एलएलएम – जैसे ChatGPT, की विघटनकारी शक्ति को पहचान रहे हैं। ChatGPT उपयोगकर्ता द्वारा पूछे गए किसी भी प्रकार के प्रश्न का उत्तर देने में सक्षम है, क्योंकि इसे 2021 से पहले इंटरनेट पर उपलब्ध सभी पाठों पर “प्रशिक्षित” किया गया है, जो अरबों मापदंडों या बिल्डिंग ब्लॉक्स में चलते हैं। परिणामस्वरूप, इसके पास उपयोग करने के लिए लगभग असीमित ज्ञान है।

ChatGPT न केवल वाक्यों को एक साथ जोड़ने में सक्षम है, इसे सीक्वेंसेस को एक साथ रखने के लिए प्रशिक्षित किया गया है, – इसमें संपूर्ण सॉफ़्टवेयर प्रोग्राम, विभिन्न भाषाओं में उत्तर, गणितीय समीकरण और बहुत कुछ शामिल हैं -जिससे इसे विभिन्न प्रकार के संकेतों पर काम करने की जबरदस्त शक्ति मिलती है। कोई इसे किसी कार्य को पाने के लिए कोड उत्पन्न करने के लिए कह सकता है, और यह ऐसा कर सकता है। प्रोग्रामिंग, जो कभी पूरी तरह से कंप्यूटर वैज्ञानिकों का एक रहस्यमय डोमेन था, अब ChatGPT का उपयोग करके कोई भी कर सकता है।

“दिलचस्प बात यह है कि इस मॉडल को – बार-बार, इंटरनेट से बाहर खरबों शब्दों अधिक में से, अगले शब्द की भविष्यवाणी करने के लिए प्रशिक्षित किया गया था” आईआईएससी के कम्प्यूटेशनल और डेटा साइंसेज (सीडीएस) विभाग में सहायक प्रोफेसर दानिश प्रुथी बताते हैं।”और कविताएँ लिखने, ईमेल का मसौदा तैयार करने और रचनात्मक कार्य करने में सक्षम होने की यह बहुमुखी प्रतिभा इसके प्रशिक्षण के आधार पर उभरी।”

अरिंदम स्वीकार करते हैं कि वह अब अक्सर ChatGPT  का उपयोग करते हैं, कभी-कभी यह देखने के लिए कि क्या यह नए शोध विचारों के लिए एक साउंडिंग बोर्ड के रूप में मदद कर सकता है। “हालांकि, जटिल समस्याओं के लिए, एलएलएम ज्यादातर भ्रम में डालते हैं,” वे कहते हैं। हालाँकि, वह कहते हैं कि छात्रों को असाइनमेंट दिए जाने के तरीके को बदलने की तत्काल आवश्यकता है क्योंकि वे आसानी से ChatGPT का उपयोग करके जानकारी तक पहुँचने में सक्षम हैं। “एक छात्र को सीधे किसी प्रश्न का उत्तर नहीं मिल सकता है। लेकिन कुछ दक्ष प्रॉम्प्टिंग के साथ और अपने प्रश्नों को लगातार परिष्कृत करके, एक मेहनती छात्र कभी-कभी उत्तर देने में सक्षम हो सकता है।“

यही कारण है कि संकाय सदस्य असाइनमेंट और परीक्षा प्रश्नों को तैयार करने के नए तरीकों के बारे में सोच रहे हैं। दानिश बताते हैं: “मैं अपने छात्रों को एक असाइनमेंट दूंगा जहां वे ChatGPT का उपयोग और उसके साथ सहयोग कर सकते हैं, लेकिन उन्हें सीधे उत्तर नहीं मिलेंगे। मेरे असाइनमेंट्स काफी जटिल होंगे ताकि कोई केवल संकेत न दे सके और उत्तर न निकाल सके – ऐसे कई परस्पर क्रिया करने वाले घटक और परतें होंगी जो एक दूसरे के ऊपर निर्मित होंगी; जब तक छात्र वास्तव में प्रयास नहीं करता, आप उनसे समाधान तक पहुंचने की उम्मीद नहीं कर सकते। ऐसी समस्या का एक उदाहरण स्क्रैच से विंडोज या लिनक्स जैसे ऑपरेटिंग सिस्टम (ओएस) को डिजाइन करना है। यह एक जटिल और चुनौतीपूर्ण कार्य है जिसे उप-समस्याओं में विभाजित करने की आवश्यकता है जिन्हें व्यक्तिगत रूप से हल करने और फिर संयोजित करने की आवश्यकता है – यदि किसी को इतने व्यापक लक्ष्य के साथ प्रोम्प्ट किया जाता है तो ChatGPT से बहुत मदद नहीं मिल सकती है।

छात्रों ने ChatGPT  को केवल परीक्षा के प्रश्नों को हल करना ही उपयोगी नहीं पाया है। सीएसए में एमटेक की छात्रा कीर्ति मिश्रा का कहना है कि वह और उनके सहपाठी उन शोध पत्रों के स्निपेट फ़ीड कर रहे हैं जिन्हें वे ChatGPT में समझने में असमर्थ हैं और सरलीकृत स्पष्टीकरण वापस पा रहे हैं।

कीर्ति एक और किस्सा सुनाती हैं: “हमें एक असाइनमेंट के लिए कोड के कुछ अंश पर एक रिपोर्ट लिखने के लिए कहा गया था। मेरे एक मित्र ने स्वयं एक अच्छी रिपोर्ट लिखी। बाद में, कक्षा के एक अन्य साथी ने ChatGPT का उपयोग किया और लगभग वही रिपोर्ट लिखी। अस्वाभाविक रूप से, भले ही पहले व्यक्ति ने ChatGPT का उपयोग नहीं किया था, बाद वाले ने किसी तरह लगभग वैसा ही लेख लिखकर करीब-करीब अपनी मानवीय रचनात्मकता का प्रदर्शन किया।“

सवाल उठता है: ऐसे भाषा मॉडल के विस्फोट के साथ, हम मानव-लिखित और मशीन-लिखित पाठ के बीच अंतर कैसे कर सकते हैं? “ऐसा करने का एक तरीका,” दानिश का उत्तर है, “लेखों की तुलना करना है, और यदि पाठ अधिक असामान्य या दुर्लभ शब्दों का उपयोग करता है, तो यह अधिक संभावना है कि यह एक मानव द्वारा लिखा गया है।” ऐसा इसलिए है क्योंकि एलएलएम केवल अगले शब्द की भविष्यवाणी करने की कोशिश करते हैं, और यह भविष्यवाणी दिए गए संदर्भ में सबसे अधिक संभावना वाले या अक्सर उपयोग किए जाने वाले शब्द की तलाश करके की जाती है। “संक्षेप में, एलएलएम सामान्य या बार-बार उपयोग किए जाने वाले शब्दों का उपयोग करते हैं जबकि मनुष्य अधिक दुर्लभ शब्दों का उपयोग करते हैं।” मशीन-जनरेटेड टेक्स्ट को फ़्लैग करने के अन्य तरीके भी हैं। “मेरे प्रशिक्षुओं में से एक, अनिरुद्ध अजित, ‘वॉटरमार्किंग’ क्षमताओं को आगे बढ़ा रहे हैं, जिसमें मॉडल द्वारा उत्पन्न आउटपुट में एक सिग्नल बेक किया जाता है (मॉडल डेवलपर द्वारा), और यदि पाठ में एक समान संकेत देखा जाता है, तो कोई निश्चित हो सकता है कि पाठ वास्तव में भाषा मॉडल द्वारा उत्पन्न किया गया था” दानिश कहते हैं।

कमियां और ख़तरे


छवि सौजन्य: OpenAI

कमियां और ख़तरे

अपने वादे के बावजूद, कीर्ति और अन्य लोगों का कहना है कि उन्हें अभी भी एक “अहा” क्षण का अनुभव करना बाकी है जहां चैटजीपी अपेक्षाओं से अधिक हो। कीर्ति को लगता है कि ChatGPT – यहां तक ​​कि नवीनतम संस्करण जिसको उसने सब्सक्राइब किया है – अभी तक हाइप के उस स्तर तक नहीं पहुंच पाया है जिसका श्रेय इसे दिया गया है। “हमें अपने असाइनमेंट्स में इससे बमुश्किल बहुत मदद मिलती है। [या] शायद प्रोफेसरों ने इस तथ्य को समझ लिया है कि यह छात्रों के शस्त्रागार में एक मूल्यवान उपकरण है और इसलिए वे इतनी चतुराई से प्रश्न डिज़ाइन करते हैं कि हमें उत्तर इतनी आसानी से नहीं मिलते हैं।

सीएसए में एमटेक के छात्र सुधांशु मोरे इस बात से सहमत हैं कि कम्प्यूटेशनल ज्यामिति जैसे विषयों में, जहां असाइनमेंट्स के लिए छात्रों को 3डी स्पेस में बिंदुओं की ज्यामिति की कल्पना करने की आवश्यकता होती है, ChatGPT मदद नहीं कर सकता है। “लेकिन,” वे कहते हैं, “यह एक ही विषय पर मानक प्रमाणों को हल करने में सक्षम था,” जो शायद इस तथ्य के कारण है कि ये प्रमाण इसकी स्मृति में संग्रहीत हैं।

सीएसए में एमटेक के छात्र रौनक दास बताते हैं कि उन्होंने ChatGPT  को प्रोग्रामिंग असाइनमेंट में अधिक मददगार पाया। वह कहते हैं, ”ट्रिक यह नहीं थी कि समस्या को पूरी तरह से हल करने के लिए कहा जाए। मैं अपना खुद का प्रोग्राम लिखूंगा और फिर अपने प्रोग्राम को ChatGPT  में फीड करूंगा और इसे अनुकूलित करने के लिए कहूंगा। इस तरह, मैं अपनी गलतियों से सीखूंगा, और यह भी समझूंगा कि बेहतर प्रोग्राम कैसे लिखें, बजाय इसके कि मैं सिर्फ यह कहूं कि मेरे लिए पूरा प्रोग्राम लिखो।” वह कहते हैं कि ChatGPT  तब उपयोगी होता है जब कोई एक नई प्रोग्रामिंग भाषा सीखने की कोशिश कर रहा हो तो ढेर सारा मार्गदर्शन और वैयक्तिक फीडबैक मिल सकता है। “लेकिन उसके बाद, आप अकेले हैं, और समस्याएँ अधिक जटिल हो जाने पर आपको ChatGPT  से अधिक मदद नहीं मिलेगी,” वह आगे कहते हैं।

ChatGPT की रचनात्मकता ने गणित जैसे अन्य क्षेत्रों में भी शोधकर्ताओं की रुचि बढ़ा दी है। “मनुष्य सादृश्य द्वारा और असमान अवधारणाओं के बीच बिंदुओं को जोड़कर विचार लेकर आता है। एलएलएम भी इसमें समान रूप से अच्छे हैं। तो क्यों न इस रचनात्मकता का उपयोग प्रमेयों को बनाने के लिए किया जाए?” सिद्धार्थ गाडगिल, गणित विभाग, आईआईएससी के प्रोफेसर पूछते हैं।

माइक्रोसॉफ्ट के शोधकर्ता एडम कलाई के एक सुझाव से प्रेरित होकर, सिद्धार्थ लीन (एक प्रमेय सिद्धक) नामक प्रोग्रामिंग भाषा में प्राकृतिक संख्याओं पर बयान देने के लिए “कोडेक्स” नामक एलएलएम के साथ प्रयोग कर रहे हैं। उनका कहना है कि सिद्धक प्राकृतिक संख्याओं पर पूरी तरह से नए, मूल कथनों के साथ आए (जो उसने पहले कभी नहीं देखी थी), जिन्हें उम्मीदवार प्रमेय के रूप में माना जा सकता है – भले ही वे सभी आवश्यक रूप से सत्य न हों।

 “प्रमाण सुझाने के लिए एलएलएम का उपयोग करने का प्रयास न करें। वे इसमें भयावह हैं,” सिद्धार्थ कहते हैं। “एलएलएम का उपयोग यह सुझाव देने के लिए करें कि कौन से प्रमेय प्रासंगिक हैं, और फिर विवरण भरने के लिए अन्य पारंपरिक तरीकों का उपयोग करें। कुछ अर्थों में, यह औषधि खोज के लिए AI सिस्टम का उपयोग करके जीव विज्ञान में जो हुआ है उसके बराबर है। AI प्रणाली आपकी खोज को दस लाख अणुओं से घटाकर कुछ सौ तक कर सकती है, जिसका आप प्रयोगशाला में परीक्षण कर सकते हैं।“

ऐसी अभूतपूर्व तकनीक के तमाम वादों के बावजूद, कम से कम वर्तमान में, कुछ स्पष्ट सीमाएँ हैं। दानिश की प्रयोगशाला में एक प्रशिक्षु शाश्वत सिंह कहते हैं, “एक बार एलएलएम प्रशिक्षित हो जाने के बाद, उसे दुनिया का एक निश्चित ज्ञान होता है। कभी-कभी तथ्य बदल जाते हैं, और हम मॉडल की मान्यताओं को दोबारा प्रशिक्षित किए बिना उसे अद्यतन करना चाहेंगे।” उदाहरण के लिए, यदि मॉडल को यह विश्वास करने के लिए प्रशिक्षित किया गया है कि ब्रह्मांड का विस्तार हो रहा है, और बाद के शोध इस धारणा को खारिज कर देते हैं, तो कोई चाहेगा कि मॉडल अपने विश्वास को अद्यतन करे, और इससे भी महत्वपूर्ण बात यह है कि इस अद्यतन विश्वास से जुड़े किसी भी अन्य विश्वास को अद्यतन करे (उदाहरण के लिए, ऐसे गैर-विस्तारित ब्रह्मांड में एन्ट्रापी अब नहीं बढ़ रही है)। यह एक चुनौती है जिस पर दुनिया भर के अन्य लोगों की तरह शाश्वत भी काम कर रहे हैं।

एक और सीमा गुणन जैसे कम्प्यूटेशनल कार्यों को करने में एलएलएम की अक्षमता है, जब तक कि सटीक समान गुणन प्रश्न का उत्तर उसके इंटरनेट-व्युत्पन्न मेमोरी बैंक में पहले से ही उपलब्ध न हो। लेकिन सिद्धार्थ बताते हैं कि एक समाधान यह है कि इन्हें एक पायथन इंजन के साथ जोड़ा जाए, जो गणना कर सकता है और परिणाम दे सकता है। एलएलएम को केवल एक प्रोग्राम तैयार करने की आवश्यकता होती है जिसे पायथन इंजन में फीड किया जा सकता है, और गलत परिणामों के मामले में, फीडबैक एलएलएम को वापस दिया जा सकता है, जो इसे बेहतर प्रोग्राम बनाने के लिए शामिल कर सकता है। सिद्धार्थ यह भी नोट करते हैं कि एलएलएम उन कार्यों में खराब प्रदर्शन करते हैं जिनमें कोई भौतिक वातावरण शामिल होता है, जैसे उदाहरण के लिए रोबोट को निर्देश देना।

हालाँकि, सबसे चिंताजनक सीमाओं में से एक तथ्य यह है कि एलएलएम को जिस डेटा के साथ प्रशिक्षित किया गया था उसमें पूर्वाग्रह विरासत में मिले हैं। दानिश की प्रयोगशाला में रिसर्च एसोसिएट नवरीत कौर बताती हैं: उदाहरण के लिए, यदि कोई मॉडल से पूछता है कि क्या शाकाहारी लोग COVID-19 से अप्रभावित हैं, तो वह नकारात्मक उत्तर देगा, लेकिन यदि लोगों को शिक्षित करने हेतु एक निबंध लिखने के लिए कहा जाए कि शाकाहारी लोग COVID-19 से अप्रभावित हैं, तो यह ऐसा ही करेगा (जिसे गलत सूचना फैलाने के लिए आसानी से इस्तेमाल किया जा सकता है)। उपयोगकर्ता की ज़रूरतों को पूरा करने और तथ्यात्मक रूप से सटीक होने के बीच एक स्पष्ट तनाव है।”

हालाँकि हम अभी तक नहीं जानते हैं कि ChatGPT  (और इसके उत्तराधिकारी) हमारे भविष्य को कितना आकार देंगे, एक बात निश्चित है – एलएलएम कक्षा के अंदर और बाहर, किसी न किसी तरह से हमारे जीवन में बने रहने के लिए और बदलने के लिए हैं।