Gemini ‘Omni’ کسی بھی ان پٹ سے میڈیا بناتا ہے، ویڈیو سے شروع ہوتا ہے۔


آج گوگل I/O 2026 میں AI سے متعلق اعلانات کی بھرمار ہے، لیکن شاید سب سے زیادہ متاثر کن ایک نیا ملٹی موڈ ماڈل ہے جسے Gemini Omni کہتے ہیں۔ یہ ابتدائی طور پر ایک ویڈیو جنریٹر کے طور پر شروع کرے گا، لیکن آخر میں ان پٹ اور آؤٹ پٹ دونوں اطراف میں تصاویر اور آڈیو کو بھی ضم کرنے کے قابل ہو جائے گا۔

خیال یہ ہے کہ آپ مختلف آڈیو، تصاویر اور ویڈیوز کو اپنی مرضی کے مطابق پرامپٹ کے ذریعے مکمل طور پر نئے کلپس میں ریمکس کر سکتے ہیں۔ فی الحال آپ جیمنی میں صرف ٹیکسٹ پرامپٹس اور امیجز سے ہی ویڈیوز بنا سکتے ہیں، اس لیے آپ کو کچھ نیا بناتے وقت آڈیو کلپس اور موجودہ ویڈیوز کو یکجا کرنے کی اضافی صلاحیت ملتی ہے۔ اس کا مطلب یہ ہے کہ متعدد ان پٹ ذرائع کے ساتھ، آؤٹ پٹ گوگل کے وعدے حقیقت پسندی اور درستگی کے لحاظ سے پہلے سے کہیں بہتر ہے۔

جب تصویر اور آڈیو تخلیق جاری ہے، ویڈیو پروڈکشن کی خصوصیات سب سے پہلے جیمنی اومنی فلیش نامی ماڈل کے ساتھ آتی ہیں۔ گوگل کی جانب سے فراہم کردہ ایک مثال یہ ہے کہ آپ اپنے فون کی گیلری میں موجود تصاویر سے کچھ اسٹائلز منتخب کریں اور پھر انہیں موجودہ ویڈیو پر لاگو کریں۔ لہذا اگر آپ چاہیں تو، آپ حقیقی دنیا کی ویڈیو کو Pixar اینیمیشن کی طرح بنا سکتے ہیں۔

Omni آپ کو ویڈیو، تصاویر اور آڈیو کو نئے کلپس میں یکجا کرنے دیتا ہے۔
کریڈٹ: گوگل

گوگل کا کہنا ہے کہ آپ "گفتگو” کے ذریعے ویڈیوز میں ترمیم بھی کر سکتے ہیں۔ یہ بات چیت کے پہلو ہر اس شخص کے لیے پہلے سے ہی واقف ہوں گے جو ویڈیوز بنانے کے لیے Gemini کا استعمال کرتا ہے۔ بس بیان کریں کہ آپ کیا دیکھنا چاہتے ہیں اور اومنی اس کا خیال رکھے گا۔ آپ ویڈیو میں مخصوص مواد کو تبدیل کرنے کے لیے فالو اپ پرامپٹس استعمال کر سکتے ہیں، جیسے کہ اشیاء یا رنگ، یا ان مناظر کو براہ راست دوبارہ شوٹ کرنے کے لیے جہاں حرکت میں تبدیلی آتی ہے۔

آپ ویڈیو کا زاویہ یا ماحول بھی تبدیل کر سکتے ہیں، بیڈ روم سے ساحل سمندر کے منظر میں جا کر۔ گوگل کا کہنا ہے کہ آپ اپنے ویڈیو کو متعدد بار تراش سکتے ہیں اور پھر بھی اصل کلپ پر واپس جا سکتے ہیں۔

جیمنی کی دنیا کا علم

گوگل کا کہنا ہے کہ جیمنی اومنی ویڈیوز کو زیادہ سے زیادہ حقیقت پسندانہ اور مستقل مزاج بنانے کے لیے "جیمنی کی تاریخ، سائنس اور ثقافتی سیاق و سباق کے علم کے ساتھ طبیعیات کی بدیہی سمجھ” کا استعمال کرتا ہے۔ لیکن آپ کو خود دیکھنا پڑے گا کہ آیا یہ سب کام کرتا ہے جیسا کہ گوگل کہتا ہے۔

اومنی کو اب کشش ثقل، حرکی توانائی، اور سیال حرکیات جیسی قوتوں کی بہتر تفہیم ہوگی، اس لیے اس کے AI میں عجیب و غریب پن کم ہوگا۔ گوگل کا کہنا ہے کہ جیمنی اومنی نہ صرف عمارت کے مناظر بلکہ آگے کیا ہونا چاہیے اس کا بھی اندازہ لگاتا ہے۔

اب تک آپ کا کیا خیال ہے؟

AI ویڈیوز اکثر ٹوٹ سکتے ہیں کیونکہ وہ فزکس کے قوانین پر عمل کرنے کے بجائے اپنے تربیتی ڈیٹا میں ویڈیوز کی وسیع صف میں پیٹرن کی پیروی کرنے کی کوشش کرتے ہیں۔ اگر کوئی شخص آف کیمرہ غائب ہو جاتا ہے، تو ضروری نہیں کہ جب کیمرہ پیچھے ہو جائے تو وہ شخص وہاں موجود ہو۔ گوگل کا دعویٰ ہے کہ جیمنی اومنی اس طرح کے کم مسائل دکھائے گا۔

جیمنی اومنی

Omni استعمال کرنے کے لیے، آپ کو Google AI سبسکرپشن کے لیے سائن اپ کرنا ہوگا۔
کریڈٹ: گوگل

ڈیپ فیکس سے بچانے کے لیے، گوگل ویڈیو بنانے پر کچھ پابندیاں لگاتا ہے۔ ابھی کے لیے، آپ آؤٹ پٹ بنانے کے لیے صرف اپنی آواز اور اپنے آپ پر مبنی ڈیجیٹل اوتار استعمال کر سکتے ہیں۔ تمام ویڈیوز میں گوگل کا غیر مرئی SynthID واٹر مارک بھی ہوتا ہے، جو اس بات کی نشاندہی کرتا ہے کہ مواد AI سے تیار کیا گیا تھا۔

Gemini Omni Flash اب Gemini ایپ اور Google Flow میں Google AI Plus، Pro، اور Ultra سبسکرائبرز کے لیے دستیاب ہے۔ یہ اس ہفتے کے آخر میں YouTube Shorts اور YouTube Create ایپس میں بھی مفت دستیاب ہوگا۔

لکھنے کے وقت، استعمال کی حدود کا کوئی ذکر نہیں ہے۔ فی الحال، گوگل اے آئی پلس پلان ($7.99 فی مہینہ) کے صارفین Veo 3.1 Lite ماڈل کا استعمال کرتے ہوئے فی دن دو ویڈیوز بنا سکتے ہیں۔ یہ دیکھنا باقی ہے کہ گوگل جیمنی اومنی جنریشن کے ساتھ کتنا فراخدلی دکھائے گا۔ ایسا لگتا ہے کہ وہ AI پروسیسنگ پاور کی ایک قابل ذکر مقدار لیتے ہیں۔

Scroll to Top