سائنسی کاغذات کا انحصار اس بات پر ہے کہ آیا قارئین اپنی معلومات پر بھروسہ کرتے ہیں۔ یہی وجہ ہے کہ یہ چونکا دینے والی بات ہے کہ کارنیل اور یو سی ایل اے سے منسلک محققین کی ایک نئی تحقیق میں چار بڑے تحقیقی ڈیٹا بیس میں میزبان سائنسی مقالوں میں 146,900 AI سے تیار کردہ جعلی حوالہ جات ملے۔
جیمنی اور چیٹ جی پی ٹی جیسے بڑے پیمانے پر زبان کے ماڈلز کی ایک بڑی حد یہ ہے کہ اگرچہ وہ قابل فہم لگتے ہیں، لیکن وہ غلط معلومات پیدا کرتے ہیں۔ ایک ایسا رجحان جسے ہیلوسینیشن کہا جاتا ہے۔. اگر کوئی محقق اقتباسات کی جانچ پڑتال کے بغیر ایک چیٹ بوٹ کا استعمال کرتا ہے، تو ماڈل مکمل طور پر من گھڑت حوالہ جات تیار کر سکتا ہے۔
سائنسی مقالے اکثر لوگوں کی نظروں سے پوشیدہ رہتے ہیں، لیکن ان کی رپورٹ کردہ تحقیق کا ہماری زندگیوں پر گہرا اثر پڑتا ہے۔ انٹرنیٹ سے لے کر لیتھیم آئن بیٹریوں تک سب کچھ تحقیقی مقالوں سے شروع ہوا۔
لیکن جب سائنس دان اے آئی کے فریب کا حوالہ دیتے ہوئے کاغذات جمع کراتے ہیں تو ان کی تحقیق کے معیار پر اعتماد مجروح ہو سکتا ہے۔
خام سائنس
تحقیقی ٹیم نے 2.5 ملین سائنسی مقالوں سے 111 ملین حوالوں کا تجزیہ کیا۔ انہیں عنوان میں ایک حوالہ ملا جو ٹیم کسی بھی اشاعت سے میل نہیں کھا سکتی تھی۔ اگرچہ ان میں سے کچھ معاملات میں املا کی غلطیاں تھیں، لیکن ٹیم کو فریب نظر بھی ملا۔
چونکہ غیر ایماندار محققین چیٹ بوٹس کے ظاہر ہونے سے بہت پہلے نقلی حوالہ جات بنا رہے تھے، اس لیے ٹیم نے 2023 سے پہلے شائع ہونے والے مطالعات میں بھی بے مثال حوالہ جات کی شرح کو دیکھا، جب چیٹ بوٹس ابھی تک وسیع نہیں تھے۔
"ہم نے بڑے پیمانے پر LLM اپنانے کے بعد غیر موجود حوالہ جات میں ڈرامائی اضافہ پایا،” مصنفین نے مقالے میں لکھا۔
تحقیقی ٹیم نے یہ بھی پایا کہ غلط فہمیاں چند کاغذات میں مرکوز نہیں تھیں بلکہ بہت سے کاغذات میں پھیلی ہوئی تھیں۔ اس سے پتہ چلتا ہے کہ مسئلہ وسیع ہے، بہت سے محققین AI سے تیار کردہ حوالہ جات کی مکمل تصدیق کیے بغیر ان پر انحصار کرتے ہیں۔
انتباہی علامات
ویکیٹا اسٹیٹ یونیورسٹی میں بزنس پروفیسر اوشا ہیلی نے CNET کو ایک ای میل میں بتایا کہ وہ جعلی حوالوں کے پھیلاؤ کو ایک سنگین انتباہ کے طور پر دیکھتی ہیں۔
ہیلی نے کہا کہ "جعلی یا AI سے تیار کردہ حوالہ جات تعلیمی ریکارڈ پر اعتماد کو کمزور کرتے ہیں جو ہم مرتبہ کے جائزے اور مجموعی علم کی بنیاد فراہم کرتا ہے۔” "پریشان کن بات یہ ہے کہ اب یہ شکوک و شبہات اکیڈمی کے اندر سے اور یہاں تک کہ پہلے کے اسکالرز سے بھی آرہے ہیں۔”
وہ چار ڈیٹا بیس جہاں محققین کو جعلی حوالوں کا پتہ چلا وہ arXiv، bioRxiv، SSRN، اور PubMed Central تھے۔ سائنسی ذخیرے کے نام سے مشہور یہ تنظیمیں تحقیق کی دنیا میں اہم کردار ادا کرتی ہیں۔
سائنسی جرائد میں مقالے شائع ہونے سے پہلے، مصنفین اکثر انہیں سائنسی ذخیروں میں اپ لوڈ کرتے ہیں تاکہ ان کی مرئیت میں اضافہ ہو اور عالمی سائنسی برادری کے لیے انہیں فوری طور پر قابل رسائی بنایا جا سکے۔ AI hallucination citations پر ایک نیا مقالہ فی الحال arXiv پر ہوسٹ کیا گیا ہے۔
حال ہی میں arXiv نے جھوٹے حوالوں کے بہاؤ کو روکنے کے لیے اقدامات کیے ہیں۔ گروپ نے منگل کو اعلان کیا کہ وہ ایسے مصنفین پر پابندی عائد کر دے گا جو فریب کاری والے کوٹیشنز یا AI مواد کے نشانات کے ساتھ کام جمع کرتے ہیں جن کی احتیاط سے تصدیق نہیں کی گئی ہے۔
"سائنس کو کمزور کیا جا رہا ہے۔ اے آئی کی بہت سی چیزیں دراصل غلط ہیں یا ان کا کوئی مطلب نہیں ہے۔ یہ صرف شور ہے،” arXiv کے سائنسی ڈائریکٹر سٹین سیگرڈسن نے فروری میں CNET کے کیٹلین چیڈراوئی کو بتایا۔ "یہ تلاش کرنا مشکل بناتا ہے کہ واقعی کیا ہو رہا ہے اور لوگوں کو گمراہ کر سکتا ہے۔”