انتھروپک کا کہنا ہے کہ اس کا تازہ ترین ماڈل ‘افسانہ’ ہے لیکن اس میں سخت حفاظتی اقدامات ہیں۔


گزشتہ اپریل میں، انتھروپک نے اپنا "میتھوس” ماڈل دنیا کے سامنے پیش کیا۔ Mythos Preview کہتے ہیں: یہ ایک طاقتور ماڈل ہے جو ہر قسم کے سافٹ وئیر میں حفاظتی خامیوں کو تلاش کر سکتا ہے۔ غلط ہاتھوں میں، بدنیتی پر مبنی اداکار ان پروگراموں، خدمات اور سائٹس میں کمزوریوں کو تلاش کرنے کے لیے اس ماڈل کا فائدہ اٹھا سکتے ہیں جن پر ہم میں سے اکثر اپنی جدید ڈیجیٹل زندگیوں کے لیے انحصار کرتے ہیں۔ درحقیقت، Mythos تاریخ میں ہیکنگ کا سب سے بڑا موقع کھول سکتا ہے۔ یہ واقعی بہت اچھا لگتا ہے۔

اس طرح، انتھروپک نے Mythos پر بریک لگا دی۔ انھوں نے دعویٰ کیا کہ وہ آخر کار اس ماڈل کو عوام کے لیے جاری کریں گے، لیکن پہلے انھیں اسے قابل اعتماد ٹیسٹرز کے محدود پول کے ساتھ آزمانا ہوگا، جسے انھوں نے "پروجیکٹ گلاس وِنگ” کہا ہے۔ سب سے پہلے، اس کا مطلب امریکہ اور دیگر حکومتوں کے لیے ماڈل کھولنا تھا۔ آپ اور میرے جیسے لوگ ابھی تک Mythos استعمال نہیں کر سکتے، لیکن Anthropic کرتا ہے۔ ہے ہم ایک نیا ماڈل لانچ کر رہے ہیں جو سائبر سیکیورٹی کے خطرات کے بغیر Mythos کی بہت سی خصوصیات کا وعدہ کرتا ہے۔

Anthropic’s Fable 5 اور Mythos 5 کیا ہیں؟

منگل کو، Anthropic نے اپنے نئے ماڈل، Claude Fable 5 کا اعلان کیا۔ یہ ماڈل ایک "افسانہ ماڈل” ہے جو "عام استعمال کے لیے محفوظ ہے۔” کمپنی کا کہنا ہے کہ Fable 5 بہتر ہے اور جاری کردہ دیگر ماڈلز سے بہتر کارکردگی کا مظاہرہ کرتا ہے۔ Anthropic کا دعویٰ ہے کہ Fable 5 نے زیادہ تر بینچ مارکس پر اعلیٰ اسکور حاصل کیے، بشمول سافٹ ویئر انجینئرنگ، علمی کام، وژن کا کام، اور تحقیق۔ کمپنی کا کہنا ہے کہ "کام جتنا لمبا اور پیچیدہ ہوگا، Fable 5 کو دوسرے ماڈلز پر اتنا ہی زیادہ فائدہ ہوگا۔” Mythos 5 بھی ہے، جو کہ کچھ پابندیوں کے بغیر Fable 5 جیسا لگتا ہے لیکن عام لوگوں کے لیے دستیاب نہیں ہے۔

Anthropic کی بینچ مارکنگ سے پتہ چلتا ہے کہ Fable 5 اور Mythos 5 دونوں Mythos Preview، Opus 4.8، OpenAI کے GPT-5.5، اور Google کے Gemini 3.1 Pro کو ایجنٹ کوڈنگ، نالج آپریشنز، مقامی استدلال، ٹول کا استعمال، قانون، بین الکلیاتی استدلال اور صحت، ٹول بیوروجی، سائنس کے شعبوں میں بہتر کارکردگی کا مظاہرہ کرتے ہیں۔ Mythos Preview کمپیوٹیشنل اور ملٹی ڈسپلنری استدلال (ٹول کا استعمال) میں جیتتا ہے، لیکن دوسرے تمام ماڈلز کو مکمل طور پر پیچھے چھوڑ دیتا ہے۔


کریڈٹ: انتھروپک

Anthropic کا کہنا ہے کہ Fable 5 نے ٹیم کو ایک کوڈنگ پروجیکٹ مکمل کرنے کی اجازت دی جسے صرف ایک دن میں مکمل ہونے میں دو ماہ سے زیادہ کا وقت لگے گا۔ آپ صرف ایک اسکرین شاٹ کے ساتھ اپنی ویب ایپ کے سورس کوڈ کو دوبارہ بنا سکتے ہیں۔ جیت سکتے ہیں پوکیمون فائر ریڈ اگرچہ یہ "کم سے کم وژن صرف استعمال” کا استعمال کرتا ہے، دوسرے کلاڈ ماڈلز نے بالکل بھی کھیلنے کے لئے جدوجہد کی۔ یہ کھیلنے کے قابل تھا۔ سپائر کو مار ڈالو میں Opus 4.8 کے مقابلے میں تین گنا زیادہ بار فائنل ایکٹ تک پہنچا۔ Mythos 5 منشیات کے ڈیزائن میں بہتر اعدادوشمار، سالماتی حیاتیات کے مسائل کے لیے نئے مفروضے، اور جینومکس میں نئی ​​تحقیق پیدا کرنے کی صلاحیت کے ساتھ تحقیقی صلاحیتوں پر استوار ہے۔

Anthropic Fable 5 کو کیسے محفوظ رکھتا ہے؟

یہ بڑا سوال ہے۔ اگر افسانہ 5 فرضی ہے، تو ہم کیسے یقینی بنا سکتے ہیں کہ اسے عام لوگوں کے لیے جاری کرنا محفوظ ہے؟ کیا ایک بدنیتی پر مبنی اداکار Fable 5 کی صلاحیتوں کو سیکورٹی کے خطرات کو دریافت کرنے اور انہیں ظاہر کرنے پر مجبور کرنے کے لیے استعمال نہیں کر سکتا تھا؟

Anthropic کا کہنا ہے کہ یہ پتہ چلا ہے. Fable 5 بہت سے طریقوں سے افسانوی ہو سکتا ہے، لیکن کمپنی کا کہنا ہے کہ اس کے پروجیکٹ Glasswing ٹیسٹنگ نے عوامی ریلیز کے لیے صحیح حفاظتی اقدامات کے ساتھ ایک ماڈل تیار کیا ہے۔ افسانہ 5 "کلاسیفائرز” یا انتہائی حساس عنوانات تلاش کرتا ہے جن کا جواب نہیں دیا جانا چاہئے۔ اس کا مطلب یہ ہے کہ جب Fable 5 کو ایک درخواست ملتی ہے کہ اس کے خیال میں سائبرسیکیوریٹی، بیالوجی، کیمسٹری، یا ڈسٹلیشن سے کوئی تعلق ہے، تو یہ خود اس سوال کا جواب نہیں دے گا۔ اس کے بجائے، یہ انتھروپک کے "اگلے بہترین” ماڈل، Opus 4.8 کو سوالات بھیجتا ہے۔ ماڈلز کو درست جوابات فراہم کرنے کے لیے کافی طاقتور ہونا چاہیے، لیکن نقصان دہ صارفین کو وہ ٹولز نہیں دینا چاہیے جن کی انہیں دوسرے صارفین کا استحصال کرنے کی ضرورت ہے۔

اب تک آپ کا کیا خیال ہے؟

اینتھروپک کا کہنا ہے کہ اس کے نئے گارڈریل محتاط، قدامت پسند اور ممکنہ طور پر زیادہ کِل ہیں۔ Fable 5 میں ایک بے نظیر درخواست کے لیے غلطی سے حفاظتی الارم بجنا ممکن ہے، لیکن یہ تقریباً 5% وقت میں ہونے کا تخمینہ ہے۔ لہذا انتھروپک کا کہنا ہے کہ Fable 5 تقریبا 95٪ وقت کی درخواست کو خود ہینڈل کر سکتا ہے۔ کمپنی نے یہ بھی دریافت کیا کہ، اس کے بگ باؤنٹی پروگرام کے بعد، کوئی بھی سفید ہیکر 1,000 گھنٹے کی جانچ کے بعد یونیورسل جیل بریک (یا حفاظتی پروٹوکول کو نظرانداز کرنے کا استحصال) نہیں پا سکتا ہے۔ اگرچہ ایک تنظیم نے جیل بریک کو تلاش کرنے میں پیشرفت کی ہے، اینتھروپک کو یقین ہے کہ اس کے پروٹوکول کمپنی کے کرنے سے پہلے ہیکرز کے لیے جیل بریک کو دریافت کرنا ناقابل عمل بنا دیتے ہیں۔

حیاتیات اور کیمسٹری کا پوچھنا کیوں چھوڑ دیا؟ Anthropic کا کہنا ہے کہ Mythos جین تھراپی کی تحقیق اور ترقی میں مدد کرنے میں بہت اچھا ہے، جو سائنسدانوں کے لیے ایک اعزاز ہو سکتا ہے لیکن غلط ہاتھوں میں بہت بڑا خطرہ ہے۔ اینتھروپک یہ بھی تسلیم کرتا ہے کہ ایسے اداکار بھی ہیں جو کلاڈ ماڈل کی صلاحیتوں کو "تنقید” کرنا چاہتے ہیں اور اپنے ماڈلز کو وہ کرنا چاہتے ہیں جو وہ چاہتے ہیں۔ لہذا، ان درخواستوں کو کم کارکردگی والے ماڈل میں بوٹ کیا جاتا ہے۔

Anthropic Fable 5 اور Mythos 5 کے لیے اپنی ڈیٹا برقرار رکھنے کی پالیسیوں کو بھی تبدیل کر رہا ہے۔ اس ماڈل کے ساتھ، کمپنی آپ کے ڈیٹا کو 30 دنوں کے لیے اپنے پاس رکھتی ہے، تعلیمی مقاصد کے لیے نہیں بلکہ مستقبل کے سائبر حملوں اور جیل بریک سے بچانے کے لیے۔ Fable 5 اور Mythos 5 کی قیمت ایک جیسی ہے۔ $10 فی ملین ڈالر ان پٹ ٹوکنز اور $50 فی ملین ڈالر آؤٹ پٹ ٹوکن۔ Anthropic کا کہنا ہے کہ یہ Mythos Preview کی نصف سے بھی کم قیمت ہے۔

اوپر تک سکرول کریں۔