OpenAI کی مالیاتی رفتار بنیادی ڈھانچے کے اخراجات پر بہت زیادہ منحصر ہے، ایک حقیقت جس نے نئی کسٹم OpenAI Jalapeño چپ کی ترقی کو آگے بڑھایا۔ براڈ کام کے تعاون سے تیار کردہ ایپلیکیشن مخصوص انٹیگریٹڈ سرکٹس (ASICs) تیسرے فریق کے ہارڈ ویئر سے وابستہ اہم سرمائے کے اخراجات کو کم کرنے کی براہ راست کوشش کی نمائندگی کرتے ہیں۔
Nvidia کے پاس اس وقت اپنے اعلیٰ درجے کے پروسیسرز پر منافع کا مارجن تقریباً 75% ہے، لیکن OpenAI سخت مارجن پر کام کرتا ہے، اپنے بھاری آپریٹنگ اخراجات کے حساب سے پیدا ہونے والے ہر ڈالر کے لیے تقریباً 33 سینٹ کا منافع برقرار رکھتا ہے۔ بڑے پیمانے پر زبان کے ماڈلز کو چلانے کا مالی بوجھ اہم ہے۔
پچھلے سال، چیٹ جی پی ٹی سرورز کو ریسپانسیو رکھنے پر اوپن اے آئی کو $8.4 بلین کی لاگت آئی۔ پلیٹ فارم کے اب 900 ملین ہفتہ وار صارفین تک پہنچنے کے ساتھ، آپریٹنگ اخراجات اس سال تقریباً 14 بلین ڈالر تک پہنچنے کی توقع ہے۔ اگلے آٹھ سالوں میں، OpenAI نے کمپیوٹنگ پاور میں تقریباً 1.4 ٹریلین ڈالر کی سرمایہ کاری کی، جو کہ اس کمپنی کے لیے ایک بہت بڑی سرمایہ کاری ہے جو فی الحال 25 بلین ڈالر سالانہ آمدنی پیدا کرتی ہے۔
ایل ایل ایم انفرنس کے لیے ہارڈ ویئر ڈیزائن
کمپنی کے پہلے "انٹیلی جنس پروسیسر” کو ڈب کیا گیا، OpenAI Jalapeño چپ خاص طور پر بڑے لینگویج ماڈل (LLM) کے لیے عام مقصد کے AI کام کے بوجھ کے بجائے بنائی گئی ہے۔ OpenAI نے ایک مخصوص ماڈل روڈ میپ اور سروس ڈیلیوری سسٹم کی بنیاد پر بنیادی آرکیٹیکچرل ڈیزائن فراہم کیا، جبکہ Broadcom نے سلیکون انجینئرنگ اور ہائی پرفارمنس نیٹ ورکنگ انضمام کا انتظام کیا۔
TSMC تائیوان میں فزیکل مینوفیکچرنگ کے لیے ذمہ دار ہے، جبکہ Celestica بورڈ اور ریک سسٹم کی تعمیر کے لیے ذمہ دار ہے۔ OpenAI کے مطابق، ابتدائی لیب کے نمونے پہلے سے ہی فرنٹیئر ورک بوجھ چلا رہے ہیں، بشمول غیر ریلیز شدہ GPT-5.3-Codex-Spark ماڈل، ہدف کی پیداوار کی فریکوئنسیوں اور طاقتوں پر۔
اوپن اے آئی کے ہارڈ ویئر پروگرام ڈائریکٹر رچرڈ ہو نے نوٹ کیا کہ یہ فن تعمیر ڈیٹا کی نقل و حرکت کو کم کرتا ہے، جس کے استعمال کو نظریاتی چوٹی کی کارکردگی کے قریب پہنچاتا ہے۔ میراثی AI کام کے بوجھ میں کام کرنے والے عام مقصد کے سرعت کاروں کے برعکس، یہ فن تعمیر خاص طور پر کمپیوٹ، میموری، اور نیٹ ورکنگ کے وسائل کو متوازن کرتا ہے تاکہ انٹرایکٹو LLM سروسز میں موجود ڈیٹا کی نقل و حرکت کی رکاوٹوں کو دور کیا جا سکے۔
اس کو بڑے پیمانے پر حاصل کرنے کے لیے، پلیٹ فارم براڈکام کے ٹوماہاک نیٹ ورکنگ سلکان کو براہ راست ڈیزائن میں ضم کرتا ہے، جس سے کسٹم پروسیسرز کو بڑے کلسٹر ڈیٹا سینٹر کے ماحول میں بات چیت کرنے کی اجازت ملتی ہے۔
عمودی طور پر مربوط فلائی وہیل
اپنی مرضی کے مطابق سلیکون پر جانے سے، OpenAI ایک سادہ سافٹ ویئر کی تہہ سے عمودی طور پر مربوط انفراسٹرکچر کمپنی میں منتقل ہوتا ہے۔. یہ مکمل اسٹیک حکمت عملی پوری پائپ لائن پر پھیلی ہوئی ہے: چپ آرکیٹیکچر، سافٹ ویئر کرنل، میموری سسٹم، نیٹ ورک شیڈولنگ، اور آخری ایپلیکیشن لیئر۔. ایپل کے ملکیتی ہارڈویئر کے ساتھ iOS کے سخت جوڑے کی طرح، OpenAI اب اپنے عین اندرونی ماڈل روڈ میپ کے ارد گرد اپنے بنیادی ڈھانچے کو بہتر بنا سکتا ہے۔.
یہ انضمام ایک مسلسل آپریٹنگ فلائی وہیل فراہم کرتا ہے۔. بنیادی ڈھانچے کی بہتر کارکردگی ٹریننگ اور سروس ماڈل دونوں کے اخراجات کو کم کرتی ہے۔. مزید سستی خدمات کی پیشکش بہتر، زیادہ ذمہ دار مصنوعات فراہم کرتی ہے، صارف کی ٹریفک کو بڑھاتی ہے اور آمدنی کو اگلی نسل کے کسٹم انفراسٹرکچر میں دوبارہ سرمایہ کاری کے لیے فراہم کرتا ہے۔.
دیر سے آنے والے فائدہ پر قابو پانا
اپنا سلکان متعارف کروا کر، OpenAI ایک ایسے ماحول میں داخل ہوتا ہے جہاں اس کے بڑے حریفوں نے ملکیتی ہارڈویئر تیار کرنے میں تقریباً ایک دہائی گزاری ہے۔ گوگل نے 2015 میں ٹینسر پروسیسر یونٹس (TPUs) کی تعیناتی شروع کی اور اب Nvidia سپلائی چین سے باہر دنیا کی AI کمپیوٹنگ کی ایک چوتھائی صلاحیت کو کنٹرول کرتا ہے۔
ایمیزون نے ایک ملین سے زیادہ کسٹم چپس بھیجی ہیں، اور میٹا اور مائیکروسافٹ اپنے بنیادی ڈھانچے کو بڑھانا جاری رکھے ہوئے ہیں۔
OpenAI کے صدر اور شریک بانی گریگ بروک مین نے کہا، "Jalapeño کمپیوٹنگ کو مزید امیر بنانے کے لیے ہماری طویل مدتی، مکمل اسٹیک بنیادی ڈھانچے کی حکمت عملی کا حصہ ہے۔” "خود زیادہ اسٹیک کو ڈیزائن کرکے، ہم زیادہ انٹیلی جنس کو زیادہ موثر طریقے سے فراہم کر سکتے ہیں۔”
اس شیڈول کے فرق کو ختم کرنے کے لیے، OpenAI نے ترقی کے مرحلے کو تیز کیا۔ OpenAI Jalapeño چپ خالی سلیٹ ڈیزائن سے لے کر ٹیپ آؤٹ مینوفیکچرنگ تک گئی، صرف نو مہینوں میں جسمانی پیداوار سے پہلے کا آخری مرحلہ۔ انجینئرنگ ٹیم نے یہ شیڈول اوپن اے آئی کے ملکیتی لینگویج ماڈلز کو خودکار اور ہارڈ ویئر ڈیزائن کے عمل کے حصوں کو بہتر بنانے کے لیے حاصل کیا۔
یہ ایک انوکھا فیڈ بیک لوپ بناتا ہے جہاں صارف کو پیش کردہ ماڈل کو مستقبل کے تکرار کو چلانے کے لیے فزیکل انفراسٹرکچر بنانے کے لیے فعال طور پر فائدہ اٹھایا جاتا ہے۔ ڈیٹا سینٹرز میں ہارڈ ویئر کی ابتدائی تعیناتی 2026 کے آخر میں شروع ہونے کی امید ہے۔
براڈ کام کے سی ای او ہاک ٹین نے تصدیق کی کہ یہ لانچ بنیادی ڈھانچے کے شراکت داروں کے ساتھ توسیع کرے گا، بشمول مائیکروسافٹ، گیگا واٹ پیمانے پر ڈیٹا سینٹر کے استحکام کی تیاری کے لیے۔
(تصویر = اوپن اے آئی)
یہ بھی دیکھیں: Omio سفری مصنوعات کی ترقی کے پیمانے کے لیے OpenAI ماڈل استعمال کرتا ہے۔
صنعت کے رہنماؤں سے AI اور بڑے ڈیٹا کے بارے میں مزید جاننا چاہتے ہیں؟ ایمسٹرڈیم، کیلیفورنیا اور لندن میں ہونے والے AI اور بگ ڈیٹا ایکسپو کو دیکھیں۔ جامع ایونٹ TechEx کا حصہ ہے اور دیگر اہم ٹیکنالوجی ایونٹس کے ساتھ منعقد کیا جاتا ہے۔ مزید معلومات کے لیے یہاں کلک کریں۔
AI News آپ کے لیے TechForge Media لایا ہے۔ دیگر آنے والے انٹرپرائز ٹیکنالوجی ایونٹس اور ویبینرز کو یہاں دریافت کریں۔