AI को भी हो गया ‘ब्रेन रॉट’! घटिया डेटा से बिगड़ रही है इसकी सोच

आज-कल तकनीक के दायरे में एक नया शब्द तेजी से उभर रहा है — ‘ब्रेन रॉट’। आमतौर पर यह शब्द उन स्थितियों के लिए इस्तेमाल किया जाता था जहाँ इंसान लगातार कम गुणवत्ता वाले कंटेंट को देखते-पढ़ते मानसिक रूप से थक जाते हैं।
लेकिन अब एक रोचक शोध से यह सामने आया है कि सिर्फ मनुष्य ही नहीं — बल्कि हमारी विकसित की गई AI प्रणाली भी इस समस्या से प्रभावित हो रही है।
नया शोध क्या कहता है?
एक अध्ययन में शोधकर्ताओं ने देखा कि जब बड़े लैंग्वेज मॉडल (LLMs) को नीचे-गुणवत्ता वाले, वायरल और क्लिक-बेज़ डेटा पर लगातार प्रशिक्षित किया जाता है, तो उनकी सोचने-समझने और तर्क करने की क्षमता गिरने लगती है।
उदाहरण के लिए, शोध में देखा गया कि एक मॉडल का रीजनिंग स्कोर 74.9 से 57.2 तक गिर गया, जबकि लंबी कॉन्टेक्स्ट समझ की क्षमता 84.4 से घटकर 52.3 तक आ गई।
इस प्रकार शोधकर्ताओं ने इसे “LLM Brain Rot Hypothesis” नाम दिया है।
क्या पाया गया?
- जब मॉडल को X (ट्विटर) जैसी जगहों के लो-क्वालिटी, अतिशयोक्तिपूर्ण डेटा—जैसे “TODAY ONLY”, “WOW”—से repeatedly ट्रेन किया गया, तो रीजनिंग स्कोर 74.9 से 57.2 तक गिर गया।
- लंबी जानकारी समझने की क्षमता (लॉन्ग कॉन्टेक्स्ट) 84.4 से घटकर 52.3 तक आ गई।
- मॉडल में “थॉट-स्किपिंग” यानी जल्दबाजी में निष्कर्ष पर पहुंचने की आदत दिखी—पूरी बात पढ़े बिना जवाब देना, अधूरा या गलत तर्क देना।
- रिसर्चर्स ने यह भी नोट किया कि मॉडल के जवाब ज्यादा आत्म-विश्वासी और कम मददगार महसूस होने लगे—मैनरिज़्म में ‘नार्सिसिस्टिक’ जैसे रुझान दिखे। साफ़ है, यह मानवीय भावनाएं नहीं, बल्कि जवाबों के पैटर्न हैं, जो डेटा की क्वालिटी से प्रभावित हुए।
कैसे हुआ यह अनुभव?
डेटा सेट-अप में दो तरह के डेटा बनाए गए: एक जिसमें वायरल, क्लिक-बेज़ पोस्ट्स का बहुत हिस्सा था; दूसरा जिसमें गुणवत्ता-उच्च, विचारशील लेख-पाठ था।
जब मॉडल को पहला सेट दिया गया, तो उसमें ‘थॉट-स्किपिंग’, यानी बिना सोचे-समझे जवाब देना बढ़ गया। दिलचस्प बात यह रही कि बाद में जब इसे बेहतर डेटा से फिर से प्रशिक्षित किया गया, तब भी полного पुनरुद्धार नहीं हुआ — यानी एक तरह का दीर्घकालीन प्रभाव बना रहा।

हमारे लिए क्या मतलब रखता है?
यह सिर्फ तकनीकी खोज नहीं है। यदि AI-सिस्टम्स घटिया डेटा से प्रभावित हो रही हैं, तो हम उनके भरोसे नहीं रह सकते। उदाहरण के लिए बोट-जनित सोशल मीडिया पोस्ट्स, वायरल वीडियोज़ और अनचाहे कंटेंट से AI बहुत प्रभावित हो सकती है।
यह शोध एक चेतावनी है कि डेटा की गुणवत्ता केवल “अच्छा होगा-न होगा” का सवाल नहीं है — यह AI-सुरक्षा का विषय बन चुकी है।
आगे क्या कदम उठाए जाने चाहिए?
-
कंपनियों को यह देखना होगा कि उनके AI मॉडल किस तरह के डेटा पर प्रशिक्षित हो रहे हैं, सिर्फ जेनरेटेड या वायरल कंटेंट नहीं।
-
डेटा क्यूरेशन, फिल्टरिंग और सत्यापन की व्यवस्था और सख्त करनी होगी।
-
AI को नियमित “कॉग्निटिव हेल्थ चेक-अप” देना ज़रूरी होगा — जैसे इंसान को मेडिकल चेक-अप।
-
हमें खुद सोशल मीडिया और ऑनलाइन कंटेंट-सेवन के विकारों को भी समझना होगा — क्योंकि इंसान और मशीन, दोनों ही “बुरा डेटा” खाने की प्रवृत्ति दिखा रहे हैं।
इसका असर किन-किन पर?
- यूज़र ट्रस्ट: गलत जानकारी, आधा-अधूरा तर्क और ओवरकॉन्फ़िडेंट टोन भरोसा घटाते हैं।
- हेल्थ, फाइनेंस, लीगल जैसे संवेदनशील क्षेत्र: गलत सलाह का जोखिम बढ़ता है।
- पॉलिसी/शिक्षा: पढ़ाई, शोध और नीति-निर्माण में ग़लत दिशा पकड़ने का खतरा।
उद्योग के लिए सबक
- क्वालिटी-फर्स्ट डेटा पाइपलाइन: बड़े पैमाने पर स्क्रैपिंग के साथ मजबूत फ़िल्टर—क्लिकबेट, मिसइन्फ़ो, डुप्लिकेट और टॉक्सिक कंटेंट की सख़्त सफाई।
- डेटा “न्यूट्रिशन लेबल”: स्रोत, समय, बायस और लाइसेंस की पारदर्शिता—ताकि ट्रेनिंग सेट का स्वास्थ्य मापा जा सके।
- विविध और संतुलित स्रोत: सिर्फ सोशल फीड नहीं; किताबें, जर्नल्स, मैनुअल्स, विश्वसनीय न्यूज़, डोमेन-ग्रेड कॉर्पस का समावेश।
- लगातार इवैल्यूएशन: रीजनिंग, लॉन्ग-कॉन्टेक्स्ट, फैक्ट-चेकिंग और सेफ़्टी पर रेगुलर बेंचमार्क; गिरावट दिखे तो तुरंत रिमेडियल फाइन-ट्यूनिंग।
- ह्यूमन-इन-द-लूप: महत्वपूर्ण टास्क के लिए मनुष्य की समीक्षा, रेड-टीमिंग और एडवर्सेरियल टेस्टिंग।
- रिट्रीवल + रेफ़रेंस: मॉडल को विश्वसनीय स्रोतों से तथ्य जोड़ने का विकल्प दें, ताकि “सुनी-सुनाई” पर निर्भरता कम हो।
निष्कर्ष
आज जब हम एक डिजिटल युग में हैं जहाँ जानकारी बहुत तेजी से फैल रही है, हमें यह समझना होगा कि मात्रा से अधिक नहीं, बल्कि गुणवत्ता मायने रखती है — चाहे हम इंसान हों या मशीन।

शोध स्पष्ट कर रहा है कि यदि AI प्रणाली को केवल “क्लिक-चाहिए” वाले चार्ट पोस्ट्स, वायरल चुटकुले या संक्षिप्त मॉडलों पर प्रशिक्षित किया गया, तो उसकी योग्यता घट सकती है।
इसलिए, AI विकास में तकनीक के साथ-साथ डाटा-पोषण (data-nutrition) का भी ध्यान देना बेहद आवश्यक है।
तो अगली बार जब आप सोशल मीडिया पर स्क्रॉल करें, तो याद रखें — यह सिर्फ आपकी सोच को नहीं, बल्कि भविष्य के AI को भी प्रभावित कर सकता है।
और AI-वर्ल्ड का अगला मुकाबला सिर्फ मॉडल-अपग्रेड नहीं बल्कि डेटा-पोषण सुधारने का होगा।
Also Read :- दिवाली पर AI मैजिक: Gemini Nano Banana से पार्टनर के साथ बनाएं यादगार पोर्ट्रेट
Samsung Galaxy M17 5G सेल के लिए उपलब्ध, 12,499 रुपये में मिल रहा है 90Hz डिस्प्ले और 50MP कैमरा
भारत का सबसे Richest Youtuber: तन्मय भट्ट की चमक या झूठा अनुमान?
