ChatGPT کی تازہ ترین اپ ڈیٹ AI سے تیار کردہ تصاویر کو دریافت کرنا پہلے سے کہیں زیادہ مشکل بنا دیتی ہے۔


AI سے تیار کردہ تصاویر کو دریافت کرنا مشکل ہوتا جا رہا ہے۔ بلاشبہ، باقاعدگی سے بتاتے ہیں، لیکن ہر نئے AI امیج ماڈل کے ساتھ ان کو کم کیا جا رہا ہے۔ مثال کے طور پر، ہم AI سے تیار کردہ ہاتھوں پر بھروسہ کر سکتے ہیں، بشمول جب ان کی بہت زیادہ یا بہت کم انسانی انگلیاں ہوں۔ ضروری نہیں کہ ان دنوں ایسا ہو۔

AI امیج ماڈلز کی ایک خاص کمزوری ٹیکسٹ جنریشن تھی۔ تصویر بذات خود قابل فہم لگ سکتی ہے، لیکن الفاظ کو قریب سے دیکھنے سے اکثر دوسری صورت میں پتہ چلتا ہے۔ واقعی صحیح کچھ درست ہو سکتے ہیں، دوسرے بہت ملتے جلتے ہو سکتے ہیں، لیکن بہت سے معاملات میں آپ کو بہت سی تضادات نظر آئیں گی۔ بہت سارے دہرائے گئے حروف ہیں، ایسے حروف جو حقیقت میں حروف نہیں ہیں، ایسے حروف جو آپس میں گھل مل جاتے ہیں اور چاروں طرف لکھتے ہیں، وغیرہ۔ ان میں سے بہت سے نرالا مجھے یاد دلاتے ہیں کہ Star Wars کی زبان کیسی دکھتی ہے، کم از کم جب AI امریکی انگریزی کو نقل کرنے کی کوشش کر رہا ہو۔

OpenAI کی امیجز 2.0 انتہائی حقیقت پسندانہ AI تصاویر بنا سکتی ہے۔

تاہم، جدید AI ماڈلز ٹیکسٹ جنریشن کے ساتھ بہت بہتر ہو رہے ہیں۔ درحقیقت، OpenAI کا تازہ ترین ChatGPT ماڈل، امیجز 2.0، انتہائی حقیقت پسندانہ متن پیش کر سکتا ہے۔ بہت سے ہم میں سے بہت سے (یا کوئی بھی ہم اسے ڈھونڈ سکیں گے۔ OpenAI کے مطابق امیجز 2.0 سوچنے کی صلاحیتوں کے ساتھ کمپنی کا پہلا امیج ماڈل ہے۔ اس کا مطلب یہ ہے کہ ماڈل درخواست کے ہر قدم کا تجزیہ کرنے میں وقت لے سکتا ہے، جو اسے مزید تفصیلی اور درست تصاویر بنانے کی اجازت دیتا ہے، ساتھ ہی ایک پرامپٹ سے آٹھ تک تصاویر بنانے کی صلاحیت (صرف ادا شدہ سبسکرائبرز کے لیے دستیاب ہے)۔ مفت صارفین اب بھی امیجز 2.0 پرکس سے فائدہ اٹھا سکتے ہیں، جیسے کہ معلومات کے لیے ویب پر تلاش کرنے کے طریقے اور آپ کے کام کو دوبارہ دیکھنا۔ کمپنی کا کہنا ہے کہ "نتائج ایسے محسوس ہوتے ہیں جیسے وہ AI کے ذریعہ تیار کیے گئے تھے اور زیادہ ایسے محسوس ہوتے ہیں جیسے وہ جان بوجھ کر ڈیزائن کیے گئے تھے۔” اس کا بنیادی مطلب یہ ہے کہ ChatGPT کا استعمال کرتے ہوئے بنائی گئی تصاویر کو دریافت کرنا زیادہ مشکل ہوگا۔

کمپنی اس تازہ ترین ماڈل میں بہت پراعتماد نظر آتی ہے۔ اس میں تصویری حقیقت پسندانہ تصاویر کے ساتھ ساتھ کمپیوٹر UIs کے اسکرین شاٹس، میگزین کے کولاجز، چاول کے ڈھیر (کہ بنانے کے لیے بہت کچھ ہے)، میگزین کے صفحات، ہاتھ سے لکھے ہوئے مضامین۔ اس کا مطلب ہے کہ یہ ہاتھ سے لکھا ہوا ہے، کاغذ پر کافی کے داغ تک۔ آپ OpenAI کی سرکاری اعلان کی پوسٹ میں ان مثالوں کو اسکرول کر سکتے ہیں تاکہ یہ معلوم ہو سکے کہ یہ کتنی ناقابل یقین حد تک حقیقت پسندانہ ہیں۔ پوسٹ میں دیگر مثالیں شامل ہیں جیسے کہ انتہائی حقیقت پسندانہ تصاویر، گرافک ناول کے صفحات، فلم کے پوسٹرز، اور مختلف پہلوؤں کے تناسب میں تصاویر، آئی فون پر ایک پینورامک منظر تک۔

اب تک آپ کا کیا خیال ہے؟

یہ تمام پیشرفتیں اتنی ہی متاثر کن ہیں جتنی کہ یہ تکلیف دہ ہیں، لیکن میرے لیے یہ متن میں بہتری ہے جو اسے واقعی ایک اور سطح پر لے جاتی ہے۔ بہت سے ماڈل ایسی تصاویر بنانے میں کافی ماہر ہو گئے ہیں جو صارفین کو یہ سوچنے پر مجبور کرتے ہیں کہ وہ حقیقی ہیں، لیکن ہمیں ابھی تک ان مثالوں کے لیے متن اور تحریر میں تفصیل کی سطح نہیں دیکھنی ہے۔ میں نے ChatGPT سے ایک اطالوی ریستوراں مینو بنانے کو کہا جس میں پانچ ڈنر کورسز اور دو میٹھے شامل ہوں۔ کچھ ڈشز کو AI کی صوابدید پر چھوڑ دیا گیا تھا۔ جہاں تک میں جانتا ہوں، میں بغیر کسی غلطی کے، رات کے کھانے اور میٹھے کی اشیاء سمیت حقیقت پسندانہ کچھ بنانے میں کامیاب رہا۔ پھر میں نے ان سے ایک اخباری شے تیار کرنے کو کہا جس میں یہ اعلان کیا جائے کہ ریڈ سوکس اور یانکیز شہر بدل رہے ہیں۔ اور ہم نے اسے بغیر کسی واضح غلطی کے دوبارہ کیا۔


کریڈٹ: لائف ہیکر

میں یہ نہیں کہہ رہا ہوں کہ یہ تصاویر ایسی ہیں۔ واٹر ٹائٹ: ان کے پاس اب بھی ایک AI "چمک” ہے جسے ایک تربیت یافتہ آنکھ یا قریبی مبصر دیکھ سکتا ہے۔ OpenAI کے مطابق، امیج 2.0 کچھ پیچیدہ کاموں کے ساتھ جدوجہد کرتا ہے، جیسے کہ پہیلیاں، نیز پوشیدہ یا عجیب و غریب جگہوں میں پائی جانے والی تفصیلات، جیسے کہ الٹی ہوئی سطحیں۔ لیکن اس سے کوئی فرق نہیں پڑتا ہے اگر اس ماڈل کی تیار کردہ تصاویر اتنی متاثر کن ہیں کہ زیادہ تر لوگوں کو بیوقوف بنا سکیں جو اسکرول کرتے ہیں۔ چاہے یہ انفوگرافکس، تصاویر، نقشے، کارٹون، مووی پوسٹرز وغیرہ ہوں، لوگ اس ٹول کو استعمال کریں گے، اور آپ اپنی زندگی میں بہت زیادہ AI تصاویر دیکھیں گے۔

Scroll to Top