NVIDIA اور Google انفراسٹرکچر کے ساتھ AI انفرنس کے اخراجات کو کم کریں۔

گوگل کلاؤڈ نیکسٹ کانفرنس میں، گوگل اور NVIDIA نے ایک ہارڈویئر روڈ میپ کا خاکہ پیش کیا جو بڑے پیمانے پر AI تخمینہ کے اخراجات کو حل کرنے کے لیے ڈیزائن کیا گیا تھا۔

دونوں کمپنیوں نے NVIDIA Vera Rubin NVL72 ریک اسکیل سسٹمز پر چلنے والی اپنی نئی A5X ننگی دھاتی مثالوں کی تفصیل دی۔ ہارڈ ویئر اور سافٹ ویئر کے مشترکہ ڈیزائن کے ذریعے، اس فن تعمیر کا مقصد فی میگا واٹ 10 گنا زیادہ ٹوکن تھرو پٹ حاصل کرنا ہے جبکہ پچھلی نسلوں کے مقابلے میں فی ٹوکن انفرنس لاگت کو 10x تک کم کرنا ہے۔

پروسیسنگ میں تاخیر سے بچنے کے لیے ہزاروں پروسیسرز کو جوڑنے کے لیے بہت زیادہ بینڈوتھ کی ضرورت ہوتی ہے۔ A5X مثالیں NVIDIA ConnectX-9 SuperNIC کو Google Virgo نیٹ ورکنگ ٹکنالوجی کے ساتھ جوڑ کر ان ہارڈویئر چیلنجوں کو حل کرتی ہیں۔

یہ کنفیگریشن سنگل سائٹ کلسٹر کے اندر 80,000 NVIDIA Rubin GPUs اور ایک ملٹی سائٹ تعیناتی میں 960,000 GPUs تک پیمانہ ہے۔ اس پیمانے پر کام کرنے کے لیے کام کے بوجھ کے نفیس انتظام کی ضرورت ہوتی ہے کیونکہ تقریباً ایک ملین متوازی پروسیسرز کے ڈیٹا کو روٹنگ کے لیے درست مطابقت پذیری کی ضرورت ہوتی ہے تاکہ بیکار کمپیوٹ وقت سے بچا جا سکے۔

گوگل کلاؤڈ میں اے آئی اور کمپیوٹ انفراسٹرکچر کے وی پی اور جی ایم مارک لوہمیئر نے کہا: "گوگل کلاؤڈ پر، ہمیں یقین ہے کہ اے آئی کی اگلی دہائی ہمارے صارفین کی اپنے انتہائی مطلوبہ کام کے بوجھ کو صحیح معنوں میں مربوط، AI سے بہتر بنائے گئے انفراسٹرکچر اسٹیک پر چلانے کی صلاحیت سے تشکیل پائے گی۔

"Google کلاؤڈ کے توسیع پذیر انفراسٹرکچر اور منظم AI سروسز کو NVIDIA کے صنعت کے معروف پلیٹ فارمز، سسٹمز، اور سافٹ ویئر کے ساتھ ملا کر، ہم اپنے صارفین کو تربیت دینے، اسکیل کرنے اور سب کچھ فراہم کرنے کے لیے لچک فراہم کرتے ہوئے کارکردگی، لاگت اور پائیداری کو بہتر بنا رہے ہیں۔

خودمختار ڈیٹا گورننس اور کلاؤڈ سیکیورٹی کے تقاضے

خام پروسیسنگ کی صلاحیتوں کے علاوہ، ڈیٹا گورننس انٹرپرائز کی تعیناتیوں کے لیے ایک بڑا مسئلہ بنی ہوئی ہے۔ فنانس اور ہیلتھ کیئر جیسے انتہائی ریگولیٹڈ سیکٹرز میں، مشین لرننگ کے اقدامات اکثر ڈیٹا کی خودمختاری کے تقاضوں اور ملکیتی معلومات کے سامنے آنے کے خطرے کی وجہ سے تاخیر کا شکار ہوتے ہیں۔

تعمیل کے ان تقاضوں کو پورا کرنے کے لیے، NVIDIA Blackwell اور Blackwell Ultra GPUs پر چلنے والے Google Gemini ماڈلز Google Distributed Cloud پر پیش نظارہ میں منتقل ہو رہے ہیں۔ تعیناتی کا یہ طریقہ تنظیموں کو اپنے انتہائی حساس ڈیٹا اسٹورز کے ساتھ مکمل طور پر کنٹرول شدہ ماحول میں فرنٹیئر ماڈل کو برقرار رکھنے کی اجازت دیتا ہے۔

یہ فن تعمیر NVIDIA خفیہ کمپیوٹنگ کو مربوط کرتا ہے۔ یہ ہارڈ ویئر کی سطح کا سیکیورٹی پروٹوکول یقینی بناتا ہے کہ تربیتی ماڈل ایک محفوظ ماحول میں کام کرتے ہیں جہاں پرامپٹس اور فائن ٹیوننگ ڈیٹا کو انکرپٹ کیا جاتا ہے۔ انکرپشن غیر مجاز فریقوں کو، بشمول کلاؤڈ انفراسٹرکچر آپریٹرز کو خود، بنیادی ڈیٹا کو دیکھنے یا تبدیل کرنے سے روکتی ہے۔

کثیر کرایہ دار عوامی کلاؤڈ ماحول کے لیے، NVIDIA RTX PRO 6000 Blackwell GPUs کے ساتھ خفیہ G4 VMs کا پیش نظارہ انہی کرپٹوگرافک تحفظات کو متعارف کراتا ہے، جو ریگولیٹڈ صنعتوں کو ڈیٹا رازداری کے معیارات کی خلاف ورزی کیے بغیر اعلیٰ کارکردگی والے ہارڈویئر تک رسائی فراہم کرتا ہے۔ یہ ریلیز NVIDIA Blackwell GPUs کے لیے پہلے کلاؤڈ بیسڈ خفیہ کمپیوٹنگ پروڈکٹ کی نمائندگی کرتی ہے۔

ایجنٹ AI ٹریننگ کا آپریشنل اوور ہیڈ

ملٹی لیول ایجنٹ سسٹمز کی تعمیر کے لیے بڑے لینگویج ماڈلز کو پیچیدہ ایپلیکیشن پروگرامنگ انٹرفیس سے جوڑنے، مسلسل ویکٹر ڈیٹا بیس کی ہم آہنگی کو برقرار رکھنے، اور عمل کے دوران الگورتھمک فریب کاری کو فعال طور پر کم کرنے کی ضرورت ہوتی ہے۔

انجینئرنگ کی ان بھاری ضروریات کو آسان بنانے کے لیے، NVIDIA Nemotron 3 Super اب Gemini Enterprise Agent پلیٹ فارم پر دستیاب ہے۔ یہ پلیٹ فارم ڈویلپرز کو خاص طور پر ایجنٹ کے کاموں کے لیے ڈیزائن کردہ انفرنس اور ملٹی موڈل ماڈلز کو اپنی مرضی کے مطابق بنانے اور تعینات کرنے کے لیے ٹولز فراہم کرتا ہے۔ گوگل کلاؤڈ پر وسیع تر NVIDIA پلیٹ فارم کو متعدد ماڈلز کے لیے بہتر بنایا گیا ہے، بشمول گوگل کے جیمنی اور جیما فیملیز، جو ڈویلپرز کو ایسے سسٹم بنانے کے لیے ٹولز فراہم کرتے ہیں جو وجہ، منصوبہ بندی اور عمل کرتے ہیں۔

ان ماڈلز کو پیمانے پر تربیت دینے سے اہم آپریشنل اوور ہیڈ لاگو ہوتا ہے، خاص طور پر جب طویل کمک سیکھنے کے چکروں کے دوران کلسٹر اسکیلنگ اور ہارڈویئر کی ناکامیوں کا انتظام کرنا۔

Google Cloud اور NVIDIA نے Gemini Enterprise Agent پلیٹ فارم پر منظم تربیتی کلسٹرز متعارف کرائے ہیں، جس میں NVIDIA NeMo RL کے ساتھ بنایا گیا ایک منظم کمک سیکھنے والا API شامل ہے۔ یہ نظام کلسٹر سائزنگ، غلطیوں کی بازیابی، اور کام پر عمل درآمد کو خودکار بناتا ہے، جس سے ڈیٹا سائنس ٹیموں کو نچلی سطح کے انفراسٹرکچر مینجمنٹ کے بجائے ماڈل کے معیار پر توجہ مرکوز کرنے کی اجازت ملتی ہے۔

CrowdStrike فعال طور پر NVIDIA NeMo کھلی لائبریریوں کا فائدہ اٹھاتا ہے، بشمول NeMo Data Designer اور NeMo Megatron Bridge، ڈومین کے لیے مخصوص سائبر سیکیورٹی ایپلی کیشنز کے لیے مصنوعی ڈیٹا اور فائن ٹیونڈ ماڈل تیار کرنے کے لیے۔ ان ماڈلز کو بلیک ویل GPUs کا استعمال کرتے ہوئے ایک منظم ٹریننگ کلسٹر پر چلانے سے خطرے کی خودکار شناخت اور ردعمل کی صلاحیتوں میں تیزی آتی ہے۔

میراثی فن تعمیر کا انضمام اور جسمانی تخروپن

مشین لرننگ کو بھاری صنعت اور مینوفیکچرنگ میں ضم کرنا انجینئرنگ چیلنج کی ایک اور سطح پیش کرتا ہے۔ ڈیجیٹل ماڈلز کو اصل فیکٹری فلور سے مربوط کرنے کے لیے درست فزیکل سمولیشنز، بڑے پیمانے پر کمپیوٹنگ پاور، اور لیگیسی ڈیٹا فارمیٹس میں معیاری کاری کی ضرورت ہوتی ہے۔ NVIDIA کا AI انفراسٹرکچر اور فزیکل AI لائبریریاں اب گوگل کلاؤڈ پر دستیاب ہیں، جو تنظیموں کو حقیقی دنیا کے مینوفیکچرنگ ورک فلو کی تقلید اور خودکار کرنے کی بنیاد فراہم کرتی ہیں۔

معروف صنعتی سافٹ ویئر فراہم کنندگان جیسے Cadence اور Siemens نے NVIDIA انفراسٹرکچر کے ساتھ Google Cloud پر اپنے تیز رفتار حل دستیاب کرائے ہیں۔ یہ ٹولز بھاری سامان، ایرو اسپیس پلیٹ فارمز، اور خود مختار گاڑیوں کی انجینئرنگ اور مینوفیکچرنگ میں معاونت کرتے ہیں۔

مینوفیکچرنگ کمپنیاں اکثر پروڈکٹ لائف سائیکل مینجمنٹ سسٹم چلاتی ہیں جو دہائیوں پرانے ہیں، جس سے جیومیٹرک اور فزیکل ڈیٹا کا ترجمہ مشکل ہو جاتا ہے۔ گوگل کلاؤڈ مارکیٹ پلیس کے ذریعے NVIDIA Omniverse لائبریری اور اوپن سورس NVIDIA Isaac Sim فریم ورک کا فائدہ اٹھاتے ہوئے، ڈویلپرز جسمانی طور پر درست ڈیجیٹل جڑواں بچے بنانے اور جسمانی تعیناتی سے پہلے روبوٹکس سمولیشن پائپ لائنوں کو تربیت دینے کے لیے ترجمہ کے ان چیلنجوں میں سے کچھ کو نظرانداز کر سکتے ہیں۔

NVIDIA NIM مائیکرو سروسز، جیسے Cosmos Reason 2 ماڈل کو Google Vertex AI اور Google Kubernetes Engine پر تعینات کرنا وژن پر مبنی ایجنٹوں اور روبوٹس کو اپنے جسمانی ماحول کی تشریح اور نیویگیٹ کرنے کے قابل بناتا ہے۔ یہ پلیٹ فارم ڈویلپرز کو کمپیوٹر کی مدد سے ڈیزائن سے براہ راست صنعتی ڈیجیٹل جڑواں بچوں تک آگے بڑھنے میں مدد کرتے ہیں۔

تیز رفتار کمپیوٹنگ ماحولیاتی نظام پر اثر

ہارڈ ویئر کی ان وضاحتوں کو قابل مقدار مالیاتی منافع میں ترجمہ کرنے کے لیے، آپ کو یہ جانچنے کی ضرورت ہے کہ ابتدائی اختیار کرنے والے بنیادی ڈھانچے کو کس طرح استعمال کرتے ہیں۔

وسیع پورٹ فولیو میں مکمل NVL72 ریک سے جزوی G4 VMs تک پیمانے کے اختیارات شامل ہیں جو GPUs کا صرف 1/8 فراہم کرتے ہیں۔ یہ صارفین کو ماہر کے مخلوط اندازے اور ڈیٹا پروسیسنگ کے کام کے بوجھ کے لیے درست طریقے سے سرعت کی صلاحیتوں کی فراہمی کی اجازت دیتا ہے۔

Thinking Machines Lab تربیت کو تیز کرنے کے لیے A4X Max VM پر ٹنکر API کو بڑھاتا ہے۔ OpenAI گوگل کلاؤڈ پر NVIDIA GB300 اور GB200 NVL72 سسٹمز پر بڑے پیمانے پر تخمینہ کا استعمال کرتا ہے تاکہ کام کے بوجھ کو سنبھالا جا سکے، بشمول ChatGPT کام۔

Snap نے اپنی ڈیٹا پائپ لائن کو Google Cloud پر GPU-accelerated Spark میں تبدیل کر دیا تاکہ بڑے پیمانے پر A/B ٹیسٹنگ سے وابستہ اہم اخراجات کو کم کیا جا سکے۔ فارماسیوٹیکل سیکٹر میں، Schrödinger NVIDIA تیز رفتار کمپیوٹنگ کو Google Cloud پر استعمال کرتا ہے تاکہ منشیات کی دریافت کے سمیولیشنز کو کمپریس کیا جا سکے جس میں پہلے ہفتوں میں گھنٹے لگتے تھے۔

ان ٹولز کو پھیلانے والے ڈویلپر ماحولیاتی نظام میں تیزی سے توسیع ہوئی ہے۔ صرف ایک سال میں، 90,000 سے زیادہ ڈویلپر مشترکہ NVIDIA اور Google Cloud ڈویلپر کمیونٹی میں شامل ہو چکے ہیں۔

CodeRabbit اور Factory جیسے اسٹارٹ اپ کوڈ کے جائزے چلانے اور خود مختار سافٹ ویئر ڈویلپمنٹ ایجنٹوں کو چلانے کے لیے Google Cloud پر NVIDIA Nemotron پر مبنی ماڈلز کا اطلاق کرتے ہیں۔ Aible، Mantis AI، Photoroom، اور Baseten انٹرپرائز ڈیٹا، ویڈیو انٹیلی جنس، اور جنریٹیو امیجنگ سلوشنز بنانے کے لیے فل اسٹیک پلیٹ فارم استعمال کرتے ہیں۔

NVIDIA اور Google Cloud کا مقصد ایک کمپیوٹنگ فاؤنڈیشن فراہم کرنا ہے جو تجرباتی ایجنٹوں اور نقلی کو پروڈکشن سسٹم میں آگے بڑھانے کے لیے ڈیزائن کیا گیا ہے جو گاڑیوں کی حفاظت کرتے ہیں اور حقیقی دنیا میں فیکٹریوں کو بہتر بناتے ہیں۔

حوالہ: AI کمزوریوں کو دریافت کرکے کارپوریٹ سیکیورٹی کے اخراجات کو کم کریں۔

NVIDIA اور Google انفراسٹرکچر کے ساتھ AI انفرنس کے اخراجات کو کم کریں۔ 1

صنعت کے رہنماؤں سے AI اور بڑے ڈیٹا کے بارے میں مزید جاننا چاہتے ہیں؟ ایمسٹرڈیم، کیلیفورنیا اور لندن میں اے آئی اور بگ ڈیٹا ایکسپو دیکھیں۔ یہ جامع ایونٹ TechEx کا حصہ ہے اور اس کا انعقاد سائبرسیکیوریٹی اور کلاؤڈ ایکسپو سمیت دیگر اہم ٹیکنالوجی ایونٹس کے ساتھ کیا جاتا ہے۔ مزید معلومات کے لیے یہاں کلک کریں۔

AI News آپ کے لیے TechForge Media لایا گیا ہے۔ دیگر آنے والے انٹرپرائز ٹیکنالوجی ایونٹس اور ویبینرز کو یہاں دریافت کریں۔

اوپر تک سکرول کریں۔