یہ اینی میشن سٹارٹ اپ کھلی کہانیاں سنانا آسان بنانا چاہتا ہے۔

تخلیقی AI متحرک تصاویر کی موجودہ لہر اکثر جادو کی طرح محسوس ہوتی ہے جو صرف ایک بار کام کرتا ہے۔ جب آپ پرامپٹ ٹائپ کرتے ہیں تو ایک ویڈیو نمودار ہوتی ہے، اور اگر آپ کو نتائج پسند نہیں آتے ہیں (آپ کے پاؤں بالکل عجیب ہوسکتے ہیں، جو ممکنہ طور پر AI جنریشن کے ساتھ ایک عام مسئلہ ہے)، آپ کا واحد حقیقی آپشن یہ ہے کہ آپ ایک مختلف پرامپٹ کو آزمائیں۔ یہ "بلیک باکس” نقطہ نظر بالکل وہی ہے جو نیا 3D اینیمیشن اسٹارٹ اپ کارٹ وہیل کو ختم کرنے کی کوشش کر رہا ہے۔

اے آئی اٹلس

کمپنی کی بنیاد اینڈریو کار اور جوناتھن جارویس نے رکھی تھی، جو OpenAI اور Google میں جڑیں رکھنے والے دو سابق فوجی ہیں۔ کمپنی ایک ایسے مستقبل کی تعمیر کے لیے کام کر رہی ہے جہاں AI تخلیقی روح کو فنکاروں پر چھوڑتے ہوئے اینیمیشن کی تکنیکی مشقت کو سنبھالتا ہے۔

میں نے Carr اور Jarvis کے ساتھ کمپنی کی بنیاد رکھنے، AI کے ساتھ ‘ذائقہ’ کی وضاحت کرنے اور 2026 میں اینیمیشن کے تکنیکی اور تخلیقی چیلنجز کے بارے میں بات کی۔

کیا کارٹ وہیل کو الگ کرتا ہے۔

بانیوں کے مطابق اس فیلڈ میں سب سے بڑی رکاوٹ 3D موشن ڈیٹا کی نمایاں کمی ہے جو کہ آن لائن دستیاب ٹیکسٹ اور تصاویر کے لامتناہی سمندر کے مقابلے میں ہے جس پر AI ماڈلز کو تربیت دی جاتی ہے۔

"اگر آپ تمام بڑی ٹیکنالوجی کمپنیوں کو دیکھیں تو ان کے پاس ہے۔ [and] "ان نمونوں کو تلاش کرنا بہت آسان ہے کیونکہ بہت ساری ویڈیوز ہیں،” جارویس نے کہا۔ "ہم جانتے تھے کہ یہ مشکل ہونے والا ہے، لیکن یہ پتہ چلا کہ اس ڈیٹا کو حاصل کرنا شاید ہماری سوچ سے 10 سے 100 گنا زیادہ مشکل تھا۔”

مزید پڑھیں: گیمنگ میں جنریٹو AI ابھرتا ہے، لیکن اسے گیمرز اور ڈویلپرز کے ردعمل کا سامنا کرنا پڑتا ہے۔

جب کہ دیگر ٹیک جنات نے حتمی پکسل بنانے پر توجہ مرکوز کی، کارٹ وہیل نے کئی سال اس نقشہ سازی میں گزارے کہ انسان اصل میں کیسے حرکت کرتے ہیں۔ ان کے ماڈلز کارکردگی کی باریکیوں کو سمجھنے کے لیے بنائے گئے ہیں، جس سے وہ اپنے گھر کے پچھواڑے میں ناچتے ہوئے کسی کی ایک سادہ 2D ویڈیو کو درست، حقیقت پسندانہ 3D کنکال میں تبدیل کر سکتے ہیں۔

فلیٹ امیجز سے 3D اثاثوں میں منتقلی اینیمیٹرز کو وہ کنٹرول فراہم کرتی ہے جو وہ AI دور میں کھو چکے ہیں۔

Cartwheel کا استعمال کرتے ہوئے انسانی تحریک کو 3D اینیمیشن میں تبدیل کریں۔

کارٹ وہیل نے نقشہ سازی کے مشکل کام میں برسوں گزارے ہیں کہ انسان اصل میں کس طرح حرکت کرتا ہے۔

کارٹ وہیل

AI "یکسانیت” سے بچیں

کارٹ وہیل کے ایگزیکٹوز نے کہا کہ وہ AI کی "یکسانیت” کو کنٹرول کی کمی کے ضمنی پیداوار کے طور پر دیکھتے ہیں۔ اگر ہر کوئی اپنی ویڈیوز بنانے کے لیے ایک ہی جنریٹر کا استعمال کرتا ہے، تو نتائج بہت ملتے جلتے نظر آ سکتے ہیں۔

"ہمارے سسٹم کا آؤٹ پٹ لوگوں کے لیے ترمیم کرنے کے لیے ڈیزائن کیا گیا ہے۔ اسے لوگوں کے لیے چھونے اور جوڑ توڑ کرنے کے لیے ڈیزائن کیا گیا ہے، اور ہم نہیں چاہتے کہ کوئی کوئی چیز ڈالے اور پھر اسے مکمل اینیمیشن میں ملا دے۔ یہ بات نہیں ہے۔ یہ بورنگ ہے۔ اسے کون دیکھے گا؟” کار نے کہا.

انہوں نے کہا، "حقیقت یہ ہے کہ لوگوں کے لیے اس تک رسائی حاصل کرنا اور اس میں ترمیم کرنا بہت آسان ہے۔ "آپ اسے ایک مختلف کردار پر ڈالتے ہیں، اسے مختلف ماحول میں ڈالتے ہیں، اس کی ظاہری شکل کو تبدیل کرتے ہیں، کارکردگی کو آگے بڑھاتے ہیں، کارکردگی کو کھینچتے ہیں، اس معنی میں۔ [sameness] "یہ ایک نان ایشو بن گیا ہے۔”

Carr اور Jarvis نے کہا کہ حل ایک "کنٹرول لیئر” فراہم کرنا ہے جہاں AI آؤٹ پٹ صرف ایک نقطہ آغاز ہے۔ فلیٹ ویڈیو کے بجائے 3D ڈیٹا تیار کر کے، تخلیق کار لائٹنگ کو تبدیل کر سکتے ہیں، کیمرہ کو حرکت دے سکتے ہیں، یا AI کے ابتدائی کام کرنے کے بعد کسی کردار کے پوز کو ایڈجسٹ کر سکتے ہیں، ٹیکنالوجی کو آرٹسٹ کے متبادل کے بجائے ایک جدید ترین پاور ٹول بنا دیتا ہے۔

کارٹ وہیل اینیمیشن پلیٹ فارم کا یوزر انٹرفیس اسکرین شاٹ

بانی اینڈریو کار نے کہا کہ ان کے بنیادی سائنسی مفروضوں میں سے ایک یہ ہے کہ حرکت اور حرکت ڈیٹا کی بنیادی اقسام ہیں۔

کارٹ وہیل

AI کے ذریعہ تخلیق کردہ اینیمیشن کا مستقبل

حرکت پذیری کو تیز تر بنانے اور داخلے میں رکاوٹ کو کم کرنے کے علاوہ، کمپنی ان تصورات کو دیکھ رہی ہے جسے اسے "کھلی کہانی سنانے” یا "اوپن ورلڈ بلڈنگ” کہتے ہیں۔ جدید گیمنگ اور سوشل میڈیا میں مواد کی مانگ اس پیمانے پر پہنچ گئی ہے جہاں دستی اینیمیشن برقرار نہیں رہ سکتی۔

کارٹ وہیل ایسے کرداروں کا تصور کرتا ہے جو نہ صرف چند ایکشنز کے ساتھ پروگرام کیے گئے ہوں، بلکہ ایسے کردار جو موشن ماڈلز کے ذریعے چلائے جاتے ہیں جو ریئل ٹائم میں رد عمل ظاہر کر سکتے ہیں اور پرفارم کر سکتے ہیں۔ ہر فریم کو کوریوگراف کرنے کے بجائے، ڈیجیٹل اداکاروں کے ساتھ "ریہرسل” کرنا زیادہ اہم ہے جو منظر کے ارادے کو سمجھتے ہیں۔

بانیوں نے کہا کہ بالآخر، مقصد 2D وژن اور 3D پر عمل درآمد کے درمیان فرق کو ختم کرنا ہے۔

کار نے کہا، "ایک اہم مفروضہ جس کی ہمیں امید ہے کہ اگلے تین سالوں میں کارٹ وہیل پر پورا اترے گا وہ یہ ہے کہ ہر کوئی 3D میں کام کرے گا، چاہے اسے 2D میں بنایا گیا ہو، چاہے حتمی آؤٹ پٹ 2D ویڈیو ہی کیوں نہ ہو،” کار نے کہا۔

Carr اور Jarvis نے کہا کہ وہ امید کرتے ہیں کہ "پکسل کے نیچے کی پرت” پر توجہ مرکوز کرنے سے، حرکت پذیری زیادہ خودکار ہو جائے گی جبکہ مزید ذاتی نوعیت کی بھی ہو جائے گی۔ مشینیں بائیو مکینکس اور فائل کی برآمدات کو سنبھالتی ہیں، لیکن انسان کہانی کے ذائقہ، وقت اور گوشت کے بارے میں حتمی بات کو برقرار رکھتے ہیں۔

اوپر تک سکرول کریں۔