کیوں چیٹ جی پی ٹی ایک صفحہ دوسرے سے زیادہ حوالہ دیتا ہے (1.4 ملین فوری مطالعہ)

ہم سب ChatGPT جوابات میں چھوٹے نمبر والے نیلے لنکس سے واقف ہو گئے ہیں۔ یہ اقتباس بیرونی معلومات کے ساتھ ChatGPT کے جواب کی حمایت کرتا ہے۔

تاہم، جبکہ ChatGPT ایک سوال کا جواب دینے کے لیے درجنوں صفحات کو کرال کرتا ہے، تحقیق سے پتہ چلتا ہے کہ ان میں سے صرف 50% کا حوالہ دیا گیا ہے۔

ایک صفحہ کو کریڈٹ کیوں ملتا ہے، لیکن دوسرا صفحہ جس کی AI نے واضح طور پر تلاش کی تھی اسے کچھ نہیں ملتا؟

اے آئی کے ماہر ڈین پیٹرووک کی تحقیق کے مطابق، جب ChatGPT نتائج تلاش کرتا ہے، تو ہر نتیجہ صفحہ کے عنوان، ایک مختصر ٹکڑا یا خلاصہ، یو آر ایل اور ایک شناختی نمبر کے ساتھ واپس آتا ہے۔

خام تلاش کے نتائج کو بیان کرنے والا متن (ہر متعلقہ ویب صفحہ کا عنوان، تفصیل، URL، اور ID) نارنجی رنگ کے خانے میں نمایاں کیا جاتا ہے۔خام تلاش کے نتائج کو بیان کرنے والا متن (ہر متعلقہ ویب صفحہ کا عنوان، تفصیل، URL، اور ID) نارنجی رنگ کے خانے میں نمایاں کیا جاتا ہے۔

ChatGPT اس ڈیٹا کو یہ فیصلہ کرنے کے لیے استعمال کرتا ہے کہ کون سے صفحات کھولنے کے قابل ہیں اور آخر کار جواب میں حوالہ دیتے ہیں۔

اس کا مطلب ہے کہ گیٹ کیپنگ پرت ہے۔ پہلے چیٹ جی پی ٹی صفحہ کے اصل مواد کو کھولتا اور پڑھتا ہے۔ عنوان، ٹکڑا، اور URL آپ کے ابتدائی فیصلے پر بہت زیادہ اثر انداز ہوں گے۔

تو ہم جاننا چاہتے تھے: واقعی اس فیصلے پر کیا اثر پڑتا ہے؟ کیا صفحہ تلاش کے اعداد و شمار اور صارف کے سوالات کے درمیان زیادہ سے زیادہ معنوی مماثلت حوالہ جات کے امکانات کو بڑھاتی ہے؟ کون سے علاقے سب سے اہم ہیں؟ کیا انسانی پڑھنے کے قابل URLs مبہم URLs سے بہتر کارکردگی کا مظاہرہ کرتے ہیں؟

یہ جاننے کے لیے، ہم نے Ahrefs ڈیٹا سائنسدان Xibeijia Guan کی مدد سے فروری 2025 (ڈیسک ٹاپ) سے 1.4 ملین ChatGPT 5.2 پرامپٹس کا تجزیہ کیا۔

لیکن اس سے پہلے کہ آپ نتائج دیکھیں، آپ کو یہ سمجھنے کی ضرورت ہے کہ ChatGPT دراصل اپنے ذرائع کیسے جمع کرتا ہے۔ اس کی وجہ یہ ہے کہ تمام یو آر ایل اسی طرح سسٹم میں داخل نہیں ہوتے ہیں۔

تمام ذرائع برابر نہیں بنائے گئے ہیں: ref_type درجہ بندی

جب ChatGPT نتائج تلاش کرتا ہے، تو یہ داخلی فیلڈز استعمال کرتا ہے جسے کہا جاتا ہے: ref_type-بنیادی طور پر سرچ چینل کے لیے ایک لیبل جس سے URL گزرا ہے۔

ہمیں پانچ زمرے ملے: سرچ، نیوز، ریڈڈیٹ، یوٹیوب، اور اکیڈمکس۔

ان کے درمیان اقتباس کی شرحیں بہت ناہموار ہیں۔

ref_type کوٹیشن٪ کل ڈیٹا پوائنٹس
تلاش کریں 88.46% 25,563,589
خبریں 12.01% 3,940,537
reddit 1.93% 16,182,976
یوٹیوب 0.51% 953,693
اکیڈمی 0.40% 185,337

عام "تلاش” انڈیکس حجم اور حوالہ کی شرح دونوں میں حاوی ہے، ChatGPT میں حوالہ کردہ 88% URLs براہ راست تلاش سے آتے ہیں۔

ChatGPT میں حوالہ دینے کے لیے، آپ کو ان کے سرچ سلیکشن پول میں ہونا چاہیے۔ اس کا مطلب ہے کہ آپ کے مواد کو درجہ بندی کرنے کی ضرورت ہے۔

یہ نئی معلومات نہیں ہے۔ اب تک، زیادہ تر لوگ پہلے ہی جان چکے ہیں کہ درجہ بندی ایک اہم کردار ادا کرتی ہے، لیکن اس کا بیک اپ لینے کے لیے مزید ڈیٹا کا ہونا اچھا ہے۔

دوسری طرف، خاص علاقے جیسے YouTube (جیسے youtube.com) اور اکیڈمیا (جیسے arXiv.org) بڑے ہیں لیکن اصل حوالہ جات کے طور پر شاذ و نادر ہی سطح پر ہوتے ہیں۔

سائیڈ نوٹ۔

"تلاش” ref_type Reddit اور YouTube کے نتائج بھی شامل ہیں۔ کوئی بھی Reddit یا YouTube کے صفحات جو آپ معیاری ویب تلاش کے ذریعے لوٹتے ہیں وہ یہاں ظاہر ہوں گے۔

"Reddit” اور "YouTube” کو الگ کریں ref_types شاید نمائندگی کرتا ہے۔ اضافی ایک وقف API انضمام کے ذریعے نکالے گئے نتائج، ویب تلاشوں سے پہلے سے واپس کیے گئے نتائج کے علاوہ۔

اس لیے اس چینل کا حجم اتنا زیادہ ہے۔ ChatGPT اپنے تلاش کے نتائج کو Reddit اور YouTube کے مواد کی الگ الگ فیڈز کے ساتھ فراہم کر رہا ہے۔

باقی تجزیہ کی تشریح کے لیے یہ بہت ضروری ہے۔

اوسطاً، ChatGPT کو فی پرامپٹ 16.57 حوالہ دینے والے URLs اور 16.58 غیر حوالہ دینے والے URLs تک ملتے ہیں۔

تاہم، چونکہ ریڈڈیٹ کا 67.8% غیر حوالہ شدہ پول ہے، اس لیے "حوالہ شدہ بمقابلہ غیر حوالہ” کا ایک جامع موازنہ دراصل تلاش کے نتائج کا Reddit API آؤٹ پٹ سے موازنہ کر رہا ہے۔ یہ سیب سے سیب نہیں ہے۔

لہذا، اس پورے مطالعہ میں ہم نے اپنے تجزیوں کو اس طرح الگ کیا: ref_type جتنا ممکن ہو تحریف سے بچیں۔

غیر نقل شدہ URLs میں سے، 67.8% Reddit سے ہیں۔

ڈیٹا سیٹ میں یہ شاید سب سے حیران کن نتیجہ ہے۔

Reddit کا اپنا ایک وقف ہے۔ ref_type چیٹ جی پی ٹی کے سرچ سسٹم کے ڈیٹاسیٹ میں 16 ملین سے زیادہ ڈیٹا پوائنٹس ہیں۔

تاہم، حوالہ کی شرح صرف 1.93٪ ہے۔

دریں اثنا، تمام غیر نقل شدہ URLs میں سے 67.8% Reddit سے آئے ہیں۔

دوسرے لفظوں میں، ChatGPT عنوانات کو سمجھنے، اتفاق رائے کی پیمائش کرنے اور سیاق و سباق کی تعمیر کے لیے Reddit کو بڑے پیمانے پر استعمال کرتا ہے، لیکن شاذ و نادر ہی Reddit کو کریڈٹ دیتا ہے۔

بھیڑ سے سیکھیں اور پھر دوسرے اداروں کا حوالہ دیں۔

غیر حوالہ شدہ صفحات میں 3 گنا زیادہ تلاش کا ڈیٹا ہوتا ہے، لیکن اتنا ہی نہیں…

جیسا کہ مختصراً بیان کیا گیا ہے، جب ChatGPT تلاش کے نتائج کو بازیافت کرتا ہے، تو ہر نتیجہ فیلڈز کا ایک سیٹ لوٹاتا ہے، بشمول عنوان، URL، اور بعض اوقات اسنیپٹس، جو ChatGPT تلاش کے ڈیٹا میں محفوظ کردہ صفحہ کے مواد کے مختصر اقتباسات ہیں۔

ہمیں توقع تھی کہ حوالہ جات کی شرح میں اضافہ ہوگا کیونکہ ان میں سے زیادہ فیلڈز آباد ہیں۔

پہلی نظر میں، مجموعی اعداد و شمار ایک مختلف کہانی سنانے لگے۔ بے حوالہ صفحہ دراصل ہے۔ مزید ChatGPT سرچ ڈیٹا میں درج کردہ فیلڈز سے زیادہ آبادی والے فیلڈز ہیں۔

غیر نقل شدہ URL ہے: ٹکڑے حوالہ کردہ یو آر ایل کے 4.36 فیصد کے مقابلے اس میں 14.81% وقت لگا۔ اشاعت کی تاریخ (92.72% بمقابلہ 35.98%)۔

ہم نے اسے تقریباً ایک تلاش کے طور پر چلایا، لیکن مجھے خوشی ہے کہ ہم نے ایسا نہیں کیا۔

جب ہم نے اس کی چھان بین کی، تو ہم نے پایا کہ یہ تضاد تقریباً مکمل طور پر ایک ساختی نمونہ ہے جو Reddit اور ChatGPT سرچ پائپ لائن کے میکانزم سے چلایا جاتا ہے۔

غیر نقل شدہ پول بہت زیادہ Reddit (67.8%) ہے، اور API کے ذریعے درآمد کردہ Reddit مواد قدرتی طور پر پہنچایا جاتا ہے۔ pub_date میٹا ڈیٹا میں 92.72% اعداد و شمار ایک Reddit آرٹفیکٹ ہے اور یہ اس بات کا اشارہ نہیں ہے کہ ChatGPT عام طور پر ویب صفحات کی جانچ کیسے کرتا ہے۔

ٹکڑوں کے درمیان وقفہ کاری کو مختلف طریقے سے بیان کیا گیا ہے۔ ChatGPT کے تلاش کے عمل میں David McSweeney کی تحقیق سے پتہ چلتا ہے کہ جب ماڈل کسی URL کا حوالہ دینے کا فیصلہ کرتا ہے، تو یہ اصل میں اسنیپٹ فیلڈ (مختصر مواد کو نکالنا) چھوڑ دیتا ہے اور اس کے بجائے پورا صفحہ کھولتا ہے۔

لہذا یہ کوئی مسئلہ نہیں ہے کہ ChatGPT بغیر ٹکڑوں کے صفحات کو ترجیح دیتا ہے۔ حوالہ کردہ صفحات کی کم ٹکڑوں کی شرح ممکنہ طور پر پائپ لائن کے کام کرنے کے طریقہ کار کی ضمنی پیداوار ہے۔

جب ڈیٹا کو صرف "تلاش” سے الگ کیا جاتا ہے۔ ref_typeاگر آپ Reddit، خبریں، یوٹیوب وغیرہ کو ہٹاتے ہیں تو تصویر زیادہ واضح ہوجاتی ہے۔

ref_type تلاش کریں۔ اس کے ٹکڑے ہیں۔ پب_تاریخ ہے۔ کل URLs
حوالہ دیا گیا۔ 2.52% 33.79% 22,612,529
حوالہ نہیں دیا 0.09% 49.00% 2,951,060

اسنیپٹ ڈیٹا قابل استعمال سگنل نہیں ہے کیونکہ یہ سرچ فیلڈ میں کسی بھی گروپ میں بطور ڈیفالٹ موجود نہیں ہے۔ اور جب کہ اشاعت کی تاریخ کی شرحیں قریب ہیں، غیر حوالہ شدہ تلاش کے صفحات اب بھی قدرے زیادہ ہیں۔ مزید پورٹیبل ہونے کا امکان ہے۔ pub_date (49%) حوالہ (33.79%) سے زیادہ تھا۔

جن اختلافات کو ہم نے ابتدائی طور پر حوالہ دیا اور غیر حوالہ شدہ یو آر ایل کے درمیان محسوس کیا وہ ڈیٹا آرگنائزیشن اور بازیافت کے طریقہ کار کے ذریعے مسخ شدہ دکھائی دیتے ہیں۔ کوئی بھی سگنل (اگر کوئی ہے) شور کے نیچے دب گیا ہے۔

ایماندارانہ سبق: اس اعداد و شمار کا حوالہ دیتے وقت آپ اس بارے میں مضبوط نتیجہ نہیں نکال سکتے کہ آیا ٹکڑوں یا اشاعت کی تاریخ کے فیلڈز ایک معنی خیز کردار ادا کرتے ہیں۔

یہ بتانے کے قابل ہے کہ یہ مسئلہ دیگر حوالہ جات کے مطالعے پر بھی لاگو ہونے کا امکان ہے۔ ایسے مطالعات جو "حوالہ شدہ اور غیر حوالہ شدہ” URLs کا موازنہ کرتے ہیں اس کی وضاحت کیے بغیر کہ وہ URLs کہاں سے آتے ہیں حقیقی نمونوں کے لیے ڈیٹا میں غلط فہمیوں کا خطرہ چلاتے ہیں۔

برانڈ ریڈار پر اپنے اقتباس کا فرق تلاش کریں۔

اس مطالعہ کے اعداد و شمار کہتے ہیں: کیا چیٹ جی پی ٹی ویلیو۔ برانڈ ریڈار آپ کو مطلع کرتا ہے۔ کہاں آپ کم پڑ رہے ہیں۔

برانڈ ریڈار کھولیں، اپنے برانڈ اور حریفوں کو ترتیب دیں، اور براہ راست Citation Pages کی رپورٹ پر جائیں۔

اس کے بعد حریفوں کا حوالہ دیا جاتا ہے اور آپ ان جوابات کو فلٹر کرتے ہیں جن کا حوالہ نہیں دیا جاتا ہے۔

اسکرین شاٹ اسکرین شاٹ

یہ فرق تجزیہ تخلیق، تازہ کاری، یا دوبارہ ترتیب دینے کے لیے مواد کی ایک مخصوص فہرست فراہم کرتا ہے۔

عنوان کا فین آؤٹ استفسار سے معنوی طور پر تعلق ہونا چاہیے۔

یہ معلوم کرنے کے لیے کہ "قابل حوالہ” کیا ہے، ChatGPT اس بات کا تعین کرتا ہے کہ آیا مضمون اور استفسار ایک پروسیس کے ذریعے مطابقت کا تخمینہ لگا کر متعلق ہے جسے "سمینٹک اسکورنگ” کہا جاتا ہے۔

ChatGPT ایک بند ماخذ ماڈل ہے، لہذا اس میں کوئی مرئیت نہیں ہے۔ درست طریقے سے کس طرح مطابقت کا تعین اندرونی طور پر کیا جاتا ہے۔

لہذا، اس مطالعہ میں، ہم نے مقدار کا تعین کیا اور اس کا خاکہ پیش کیا کہ ChatGPT اوپن سورس ماڈل سے تیار کردہ ایمبیڈنگز سے کمپیوٹنگ کی گئی کوزائن مماثلت کا استعمال کرتے ہوئے کیسے کام کرتا ہے۔

ChatGPT اپنے "فین آؤٹ سوالات” کے ساتھ یو آر ایل سے میل کھاتا ہے، جو ذیلی سوالات ہیں جو یہ مخصوص حقائق تلاش کرنے کے لیے اندرونی طور پر (صارف کے بیج پرامپٹ سے) پیدا کرتا ہے۔

ڈیٹا اس بات کی تصدیق کرتا ہے کہ فین آؤٹ سوالات سے عنوان کی مطابقت حوالہ جات میں ایک اہم عنصر ہے۔

  • فوری اور اقتباس URL عنوان: 0.602
  • فوری اور غیر نقل شدہ URL عنوانات: 0.484
  • Fanout استفسار اور حوالہ کردہ URL عنوان (زیادہ سے زیادہ میچ*): 0.656

سائیڈ نوٹ۔

ان فین آؤٹ سوالات میں سے ہر ایک کے لیے، ہم مضمون کے عنوان کے ساتھ کوزائن مماثلت کا حساب لگاتے ہیں۔ "زیادہ سے زیادہ میچ” سکور ان میں سب سے زیادہ مماثلت کی نشاندہی کرتا ہے۔ مثال کے طور پر، اگر اسکور 0.45، 0.71، اور 0.38 ہیں، تو زیادہ سے زیادہ میچ 0.71 ہے۔ یہ تمام تشریحات پر اوسط کا حساب لگانے کے بجائے بہترین ترتیب والے ذیلی سوالات کو پکڑتا ہے، جو سگنل کو کمزور کر دیتا ہے۔

باکس پلاٹ کہانی کو واضح طور پر بتاتے ہیں۔ بھر میں ref_typesحوالہ کردہ URLs مسلسل عنوان اور اصل پرامپٹ کے درمیان اعلیٰ مماثلت دکھاتے ہیں۔

Boxplot ظاہر کرتا ہے کہ حوالہ شدہ صفحات میں عنوان اور اصل ChatGPT پرامپٹ کے درمیان غیر حوالہ شدہ صفحات کی نسبت زیادہ کوزائن مماثلت ہے۔Boxplot ظاہر کرتا ہے کہ حوالہ شدہ صفحات میں عنوان اور اصل ChatGPT پرامپٹ کے درمیان غیر حوالہ شدہ صفحات کی نسبت زیادہ کوزائن مماثلت ہے۔

اصل پرامپٹ کی بجائے فین آؤٹ استفسار کے مقابلے میں خلا اور بھی وسیع ہو جاتا ہے۔ اس سے اس بات کو تقویت ملتی ہے کہ ChatGPT کے اندرونی ذیلی سوالات سے متعلق مواد تخلیق کرنا دراصل انتخاب کو آگے بڑھاتا ہے۔

Boxplot حوالہ اور غیر حوالہ شدہ صفحات کے عنوان اور فین آؤٹ سوالات کے درمیان کوزائن مماثلت دکھا رہا ہے۔ حوالہ کردہ صفحات زیادہ مماثلت کی نشاندہی کرتے ہیں۔Boxplot حوالہ اور غیر حوالہ شدہ صفحات کے عنوان اور فین آؤٹ سوالات کے درمیان کوزائن مماثلت دکھا رہا ہے۔ حوالہ کردہ صفحات زیادہ مماثلت کی نشاندہی کرتے ہیں۔

تلاشوں کو الگ کرتے وقت ref_type خاص طور پر، پیٹرن واضح ہو جاتے ہیں. حوالہ کردہ صفحات زیادہ متعلقہ ہیں، اور غیر حوالہ شدہ تقسیم نمایاں طور پر کم ہو گئی ہے۔

حوالہ شدہ اور غیر حوالہ شدہ تلاش کے نتائج کے لیے عنوان اور اصل پرامپٹ کے درمیان کوزائن مماثلت کا موازنہ کرنے والا باکس پلاٹ۔حوالہ شدہ اور غیر حوالہ شدہ تلاش کے نتائج کے لیے عنوان اور اصل پرامپٹ کے درمیان کوزائن مماثلت کا موازنہ کرنے والا باکس پلاٹ۔

مزید برآں، قدرتی زبان کے URL سلگس پر مشتمل تلاش کے نتائج میں شامل ہیں: حوالہ کی شرح 89.78%دوسری صورت میں، یہ 81.11 فیصد پایا گیا تھا.

بالآخر، اگر آپ کا URL اور ٹائٹل AI کے اندرونی فین آؤٹ استفسار سے مماثل نہیں ہیں، تو آپ کے حوالہ کیے جانے کا امکان کم ہے۔

برانڈ ریڈار کا استعمال کرتے ہوئے فین آؤٹ سوالات کو بہتر بنائیں

آپ برانڈ ریڈار میں براہ راست فین آؤٹ سوالات کا مطالعہ کر سکتے ہیں۔ اگر آپ AI ریسپانس رپورٹ پر جاتے ہیں اور پرامپٹ کو منتخب کرتے ہیں، تو آپ حوالہ کردہ یو آر ایل کے ساتھ ChatGPT کے ذریعے تیار کردہ فین آؤٹ سوال دیکھ سکتے ہیں۔

احرف سے اسکرین شاٹ احرف سے اسکرین شاٹ

یہ ذیلی سوالات کا اصل مجموعہ ہے جس کا جواب آپ کے مواد کو دینا چاہیے۔

وہاں سے، یہ دیکھنے کے لیے ہمارے AI مواد کے معاون کا استعمال کریں کہ آپ کا صفحہ اس فین آؤٹ استفسار کے موضوع کو کس حد تک کور کرتا ہے۔ یہ آپ کے مواد اور SERP یا AI کا جواب جس موضوع کا احاطہ کرنے کی کوشش کر رہا ہے کے درمیان کوزائن کی مماثلت کی پیمائش کرتا ہے اور آپ کے لکھتے وقت رنگین جھلکیاں فراہم کرتا ہے تاکہ آپ کوئی بھی باقی خالی جگہیں ظاہر کریں۔

Content Optimizer کا اسکرین شاٹ مواد کے اسکور اور موضوع کی تجاویز کے ساتھ ترمیم شدہ اور نمایاں کردہ متن دکھا رہا ہے۔Content Optimizer کا اسکرین شاٹ مواد کے اسکور اور موضوع کی تجاویز کے ساتھ ترمیم شدہ اور نمایاں کردہ متن دکھا رہا ہے۔

اگر کسی مدمقابل کے صفحے کا حوالہ آپ کے بجائے تلاش کے استفسار کے لیے دیا جاتا ہے، تو یہ اس کی وجہ جاننے کے تیز ترین طریقوں میں سے ایک ہے۔

اوسط حوالہ دیا گیا صفحہ 500 دن پرانا ہے (اور اب بھی منتخب کیا جا رہا ہے)۔

یہ عام علم ہے کہ AI کے ذریعہ نئے مواد کا زیادہ حوالہ دیا جاتا ہے۔ درحقیقت، 17 ملین حوالوں پر ہماری اپنی تحقیق اس کی حمایت کرتی ہے۔ ChatGPT نے پایا کہ اس نے Google کے نامیاتی تلاش کے نتائج سے 458 دن پہلے نئے URLs کا حوالہ دیا ہے۔ یہ ان تمام پلیٹ فارمز کی سب سے مضبوط رجعت پسند ترجیح ہے جن کا ہم نے تجربہ کیا ہے۔

یہ مطالعہ اس کہانی سے متصادم نہیں ہے، لیکن اس میں اضافی اہمیت کا اضافہ ہوتا ہے۔

مثال کے طور پر، اگر آپ سرچ انڈیکس پر نظر ڈالتے ہیں، تو حوالہ کردہ صفحات عمر کے گروپوں کی ایک وسیع رینج پر محیط ہیں۔ درمیانی عمر تقریباً 500 دن (~1.3 سال) ہے، کچھ حوالہ جات والے صفحات 2,700 دن (~7.4 سال) سے زیادہ ہیں۔

اوسط عمر درحقیقت اوپر منسلک ابتدائی تازگی کے مطالعے سے بہت کم ہے (جولائی میں 958 دن بمقابلہ اس ڈیٹاسیٹ میں 500 دن)۔ اس سے پتہ چلتا ہے کہ ChatGPT اپنی اقتباس کی ترجیحات میں بہت کم عمر رکھتا ہے۔

اس نے کہا، ہم نے یہ بھی پایا کہ غیر حوالہ شدہ صفحات بہت زیادہ چھوٹے تھے۔

باکس پلاٹ سے پتہ چلتا ہے کہ ChatGPT کے ذریعہ حوالہ کردہ تلاش کے نتائج 500 دن کی اوسط عمر کے ساتھ، غیر حوالہ شدہ نتائج سے کافی پرانے ہیں۔باکس پلاٹ سے پتہ چلتا ہے کہ ChatGPT کے ذریعہ حوالہ کردہ تلاش کے نتائج 500 دن کی اوسط عمر کے ساتھ، غیر حوالہ شدہ نتائج سے کافی پرانے ہیں۔

لہٰذا، ایک ہی پرامپٹ کے سرچ سیٹ کے اندر، یہ پرانے، زیادہ قائم شدہ صفحات ہیں جن کا حوالہ دیا جاتا ہے، اور یہ سب سے حالیہ مواد ہے جو ضائع ہو جاتا ہے۔

دوسرے لفظوں میں، ChatGPT نئے مواد کی حمایت کرتا ہے، لیکن نسبتاً "پرانے” مواد کا زیادہ کثرت سے حوالہ دیتا ہے۔ یہ متضاد لگ سکتا ہے، لیکن ایک ہی وقت میں دو چیزیں درست ہو سکتی ہیں۔

AI حوالہ جات کی وسیع آبادی میں، ChatGPT گوگل کے نتائج کے مقابلے میں اور یہاں تک کہ پچھلے سال سے اس کی اپنی اقتباسات کی ترجیحات کے مقابلے میں زیادہ تازہ ترین ہے۔

تاہم، دیے گئے سرچ سیٹ کے اندر صرف تازگی برقرار رکھی جاتی ہے۔ کافی نہیں. مطابقت ایک اہم کام ہے۔

نئے صفحات جو فین آؤٹ استفسار سے اچھی طرح میل کھاتے ہیں ان کا حوالہ دیا گیا ہے۔ نیا صفحہ ہے۔ ایسا نہیں اس کا پتہ چل جاتا ہے لیکن نظر انداز کر دیا جاتا ہے۔

یہ بھی بتانے کے قابل ہے کہ تمام تلاشوں میں غیر حوالہ شدہ صفحات (~3M) کا ایک تالاب ہے۔ ref_type یہ حوالہ کردہ گروپ (~23M) سے بہت چھوٹا ہے، جو اس بات کو محدود کرتا ہے کہ ہم عمر کے فرق کو کتنے اعتماد سے بیان کر سکتے ہیں۔

‘خبر’ وہ جگہ ہے جہاں تازگی سب سے اہم ہے۔

اس زمرے میں، حوالہ کردہ اور غیر حوالہ شدہ صفحات کے لیے عنوان کے متعلقہ اسکور تقریباً ایک جیسے ہیں۔

باکس پلاٹ عنوان اور حوالہ شدہ (نیلے) اور غیر نقل شدہ (سرخ) نیوز آرٹیکلز کے لیے اصل پرامپٹ کے درمیان کوزائن مماثلت دکھاتا ہے۔باکس پلاٹ عنوان اور حوالہ شدہ (نیلے) اور غیر نقل شدہ (سرخ) نیوز آرٹیکلز کے لیے اصل پرامپٹ کے درمیان کوزائن مماثلت دکھاتا ہے۔

AI صرف مطابقت کی بنیاد پر فیصلہ نہیں کر سکتا، اس لیے یہ صفحہ زندگی کا استعمال کرتا ہے، جو کہ بنیادی طور پر وقتی فیصلہ کا معیار ہے۔ حوالہ کردہ خبروں کے صفحات چھوٹے ہیں۔

باکس پلاٹ: باکس پلاٹ:

خبروں کے استفسارات کے لیے، چھوٹے صفحات کا واضح فائدہ ہوتا ہے، یہاں تک کہ جب حوالہ اور غیر حوالہ شدہ صفحات کے درمیان مطابقت کے اسکور ایک جیسے ہوں۔

فائر ہوز کا استعمال کرتے ہوئے جدید ترین خبروں کا مواد بنائیں

اگر آپ خبریں یا وقت کے لحاظ سے حساس مواد شائع کرتے ہیں، تو تجدید غیر گفت و شنید ہے۔

Ahrefs Firehose کا استعمال کرتے ہوئے مخصوص مضامین پر تازہ ترین خبریں حاصل کرنے والے پہلے فرد بنیں، ایک ریئل ٹائم ویب مانیٹرنگ API جو ایک بڑے کرالر انفراسٹرکچر سے سٹریمنگ ڈیٹا فیڈ فراہم کرتا ہے۔

مثال کے طور پر، اگر آپ SaaS جرنلزم میں کام کرتے ہیں، تو آپ Google کے آفیشل بلاگ جیسے صفحات پر مواد کی تبدیلیوں کو ٹریک کر سکتے ہیں، تاکہ آپ گوگل کے نئے اپ ڈیٹس کے شائع ہوتے ہی ان کا احاطہ کرنے والے پہلے لوگوں میں شامل ہو جائیں۔

اسکرین شاٹ اسکرین شاٹ

پھر AI رسپانس رپورٹس میں برانڈ ریڈار کی ذکر کی تاریخ کا استعمال کریں تاکہ یہ معلوم ہو سکے کہ آیا شائع ہونے کے بعد ChatGPT کی مرئیت میں اضافہ ہوتا ہے۔

Ahrefs AI ریسپانسیو ڈیش بورڈ وقت کے ساتھ ساتھ حریف کا تذکرہ دکھاتا ہے، گرافس کے ساتھ Ahrefs، Moz، SE رینکنگ، اور ویب پر اسی طرح کا پتہ چلتا ہے۔Ahrefs AI ریسپانسیو ڈیش بورڈ وقت کے ساتھ ساتھ حریف کا تذکرہ دکھاتا ہے، گرافس کے ساتھ Ahrefs، Moz، SE رینکنگ، اور ویب پر اسی طرح کا پتہ چلتا ہے۔

اس کا کیا مطلب ہے "حوالہ جات”

1.4 ملین پرامپٹس ایک بہت واضح تصویر پینٹ کرتے ہیں۔ ChatGPT ایک جارحانہ ایڈیٹر ہے۔ یہ عام تلاش کی اشاریہ سازی کی حمایت کرتا ہے، ذرائع کو منتخب کرنے اور حوالہ دینے کے لیے معنوی مماثلتوں کا استعمال کرتا ہے، اور Reddit کو ایک نصابی کتاب کی طرح برتا جاتا ہے جسے آپ یہ تسلیم کرنے میں شرمندہ ہوں گے کہ آپ نے پڑھا ہے۔

لیکن اعداد و شمار نے ہمیں تجزیاتی احتیاط کے بارے میں ایک سبق بھی سکھایا۔

"حوالہ شدہ” اور "غیر حوالہ شدہ” URLs کے درمیان مجموعی موازنہ گمراہ کن ہو سکتا ہے اگر غیر حوالہ شدہ پول پر اس کے اپنے تلاش کے طریقہ کار کے ساتھ واحد ذریعہ قسم کا غلبہ ہو۔

پہلے جو کچھ تضاد کی طرح لگتا تھا — غیر اصلاحی صفحات کو زیادہ حوالہ جات مل رہے ہیں — ڈیٹا سیٹ کی تعمیر میں ایک مسئلہ بن گیا۔

اگر ہم نے قرنطینہ نہ کیا ہوتا تو ہم ان میں سے ایک کام بہت غلط کرتے۔ ref_type.

بالآخر، جن صفحات کا حوالہ دیا جاتا ہے وہ وہ ہیں جن کا عنوان اور مواد ان سوالات سے ملتا ہے جو ChatGPT پردے کے پیچھے پوچھ رہے ہیں، اور وہ صحیح سرچ چینلز کے ذریعے سامنے آتے ہیں۔

Scroll to Top