مجھے اب بھی وہی لمحہ یاد ہے جب میں جانتا تھا کہ جب AI امیج بنانے کی بات آئی تو کچھ بدل گیا تھا۔
میں نے اشارہ درج کیا، تخلیق پر کلک کیا، اور اپنے MacBook پرو پر بنتی تصویر کو دیکھا۔ آپ کو یہ بتانے کے لیے کوئی چرخی نہیں ہے کہ آپ کریڈٹ پر کم ہیں۔ میں نے جو کچھ پوچھا اس کا کوئی نرم، سینیٹری ورژن نہیں ہے۔ کونے پر کوئی واٹر مارک نہیں ہے۔ میرے کمپیوٹر پر فولڈرز میں موجود تصاویر مکمل طور پر میری ہیں۔
میں اسے ایک سال سے بند کر رہا ہوں۔ یہ ایک غلطی تھی۔
5 زبردست اوپن سورس ایپس جن کے لیے آپ کو کچھ بھی ادا کرنے کی ضرورت نہیں ہے۔
5 مفت ایپس جو اصل میں ادا شدہ ایپس کی جگہ لے لیتی ہیں۔
"سہولت” کی حقیقی قیمت
میں کچھ عرصے سے خاموشی سے کلاؤڈ AI امیجنگ ٹولز پر اپنا انحصار ختم کر رہا ہوں۔ کچھ مہینے پہلے، میں نے اس بارے میں لکھا تھا کہ کس طرح کریتا کے مفت AI ڈفیوژن پلگ ان نے ایڈوب فائر فلائی کو میرے مقاصد کے لیے تقریباً بے کار بنا دیا۔ میں ایک مصنف ہوں، ڈیزائنر نہیں ہوں۔ میں آرٹیکل امیجز، فوری تصوراتی تصویروں اور بعض اوقات پلیس ہولڈرز کے لیے AI امیج ٹول استعمال کرتا ہوں۔ Fireflies واقعی اچھی ہیں. لیکن ایک مفت متبادل تلاش کرنے کے بعد جو میری اصل ضروریات کے مطابق ہو، مجھے اپنے آپ سے پوچھنا پڑا کہ میں واقعی میں کس چیز کی ادائیگی کر رہا ہوں۔
ایماندارانہ جواب زیادہ تر سہولت ہے۔
اسی سوال نے مجھے مستحکم بازی اور مقامی طور پر اشارے کا ایک گروپ چلانے کا باعث بنا۔ اگر آپ اپنے امیج ورک فلو پر مکمل کنٹرول حاصل کرنے کے لیے پہلے سے ہی کچھ بہتری لانا چاہتے ہیں، تو آپ اب بھی کلاؤڈ بیسڈ تخلیق پر کیوں انحصار کر رہے تھے؟ مڈجرنی رکنیت کی دیوار کے پیچھے اور ڈسکارڈ کے اندر رہتا ہے۔ ڈسکارڈ نے ہمیشہ تخلیقی ٹولز کے لیے ایک عجیب گھر کی طرح محسوس کیا ہے۔ DALL-E ChatGPT Plus کے ساتھ بنڈل ہے۔ اس کا مطلب ہے کہ آپ پورے پیکیج کی ادائیگی کرتے ہیں قطع نظر اس سے کہ آپ امیج جنریٹر استعمال کرتے ہیں یا نہیں۔ زیادہ تر پلیٹ فارمز کے مفت درجے یا تو آؤٹ پٹ کو واٹر مارک کرتے ہیں یا حقیقی ورک فلو بنانے کے لیے نسلوں کو بہت زیادہ جارحانہ انداز میں محدود کرتے ہیں۔
میں سوچتا رہا کہ کوئی بہتر طریقہ ہونا چاہیے۔ میں فرض کرتا رہا کہ یہ میرے لیے دستیاب نہیں ہے۔
میک کا افسانہ جس نے مجھے ایک سال خرچ کیا۔
آپ کے خیال میں ایپل سلیکون ڈیڈ اینڈ کیوں نہیں ہے۔
جب بھی مقامی AI امیج کی تخلیق سامنے آئی، میں نے چند سطریں پڑھی، CUDA یا Nvidia کے تذکرے میں ٹائپ کیا، اور خاموشی سے ٹیب بند کر دیا۔ ایسا لگتا ہے کہ پورا ایکو سسٹم ونڈوز سسٹم کے ارد گرد مخصوص گرافکس کارڈز کے ساتھ بنایا گیا ہے۔ میرے پاس M4 پرو چپ اور 24GB مربوط میموری کے ساتھ ایک MacBook Pro ہے، جو طاقتور کارکردگی پیش کرتا ہے لیکن NVIDIA ہارڈ ویئر نہیں ہے۔ CUDA تعاون یافتہ نہیں ہے۔ میں نے سوچا کہ اس کا مطلب ہے کہ مجھے مقامی AI امیج تخلیق کرنے والی گفتگو سے مکمل طور پر بلاک کر دیا گیا تھا۔
اس مفروضے میں ایک سال لگا۔
ایپل سلیکون مستحکم بازی کو نافذ کرتا ہے۔ CUDA کے بجائے، یہ ایپل کے اپنے GPU ایکسلریشن فریم ورک، میٹل پرفارمنس شیڈرز کا استعمال کرتا ہے، جس کو ComfyUI کی طرف سے اچھی طرح سے سپورٹ کیا جاتا ہے، جس ٹول کو میں نے استعمال کرنا ختم کیا۔ تجربہ ہائی اینڈ ونڈوز GPU مشین پر چلنے سے مختلف ہوگا۔ یہ تخلیق کرنے میں سست ہے اور سیٹ اپ ونڈوز ٹیوٹوریلز جیسا کچھ بھی نہیں لگتا ہے جو آپ کو زیادہ تر وقت آن لائن مل سکتا ہے۔ لیکن "سست” کا مطلب "ناقابل استعمال” نہیں ہے۔ 24GB مربوط میموری کے ساتھ، M4 Pro ایسے وقت میں تصاویر تیار کرتا ہے جو آپ کے ورک فلو میں آرام سے فٹ بیٹھتا ہے۔ 24 جی بی انٹیگریٹڈ میموری کا مطلب ہے کہ آپ میموری کی رکاوٹوں کا شکار نہیں ہوں گے جو نچلے درجے کے کمپیوٹروں کو متاثر کرتے ہیں۔
کاش کوئی مجھے جلد بتاتا۔ Apple Silicon کی رکاوٹیں خام خصوصیات کے بارے میں کم اور ماحولیاتی نظام کے فرق کے بارے میں زیادہ ہیں۔ آپ کی مشین اسے سنبھال سکتی ہے۔
کیوں ComfyUI میک صارفین کے لیے صحیح انتخاب ہے۔
AUTOMATIC1111 کے ساتھ مسائل کا سامنا کرنا پڑا
اگر آپ کو مقامی اسٹیبل ڈفیوژن ٹول ملتا ہے، تو آپ کے پاس کچھ اختیارات ہیں۔ AUTOMATIC1111 کو کئی سالوں سے سب سے زیادہ تجویز کیا گیا ہے اور اس کے آس پاس ایک بہت بڑی کمیونٹی ہے۔ میں نے پہلے اسے آزمایا۔ ازگر کے تازہ ترین ورژن کے ساتھ ایک جدید میک پر، میں نے انحصار کے تنازعات، تعمیراتی غلطیوں، اور ورژن کی مماثلتوں کے ساتھ آخر تک جدوجہد کی جس کو حل کرنے میں گھنٹوں لگے۔ میں نے آخر کار اسے ترک کر دیا۔
ComfyUI مختلف ہے۔ یہ زیادہ فعال طور پر برقرار ہے، بغیر کسی شکایت کے ازگر کے نئے ورژن ہینڈل کرتا ہے، اور Apple Silicon پر زیادہ تر بینچ مارکس میں AUTOMATIC1111 سے زیادہ صاف اور تیز چلتا ہے۔ انٹرفیس نوڈ پر مبنی ہے اور پہلے تو مکڑی دار لگتا ہے، لیکن کلکس ناقابل یقین حد تک تیز ہیں۔ اگر آپ آج میک پر شروعات کر رہے ہیں، تو ComfyUI ایک ٹھوس انتخاب ہے۔
میک پر ComfyUI کو کیسے ترتیب دیا جائے۔
تنصیب کا جائزہ: ٹرمینل، ہومبریو، اور پائ ٹارچ
سیٹ اپ میں ہومبریو کے ذریعے Git اور Python کو انسٹال کرنا شامل ہے (اگر آپ نے پہلے سے ایسا نہیں کیا ہے)، ریپوزٹری کو کلون کرنا، Apple Silicon کے لیے PyTorch انسٹال کرنا، اور انحصار انسٹال چلانا، یہ سب کچھ ٹرمینل سے ہے۔ یہ ایک کلک ایپ نہیں ہے، اس لیے میں دوسری صورت میں دکھاوا نہیں کروں گا۔ تاہم، اگر آپ میک کے لیے مخصوص ہدایات پر عمل کرتے ہیں تو یہ عمل آسان ہے، اور ComfyUI کی دستاویزات واضح طور پر Apple Silicon کا احاطہ کرتی ہیں۔ پہلی نسل کو شروع سے حاصل کرنے میں مجھے ایک گھنٹے سے بھی کم وقت لگا، اس وقت کا زیادہ تر وقت ماڈل فائلوں کے ڈاؤن لوڈ ہونے کا انتظار کر رہا تھا۔ اگرچہ ComfyUI اب ایک اسٹینڈ میک ڈیسک ٹاپ ایپ پیش کرتا ہے، میں نے دستی ٹرمینل انسٹالیشن کا انتخاب کیا تاکہ میں ماحولیاتی اپ ڈیٹس پر مکمل کنٹرول رکھ سکوں۔
آپ کو Stable Diffusion ماڈل کی بھی ضرورت ہوگی، جو کہ 4 سے 7 GB تک کی ایک بڑی فائل ہے جسے الگ سے ڈاؤن لوڈ کرکے فولڈر میں رکھا جاسکتا ہے۔ مختلف جمالیات اور مقاصد کے مطابق سینکڑوں ماڈلز ہیں۔ ایک اچھی طرح سے سوچا ہوا فوٹو ریئلسٹک ماڈل آرٹیکل امیجز کے لیے ایک اچھا نقطہ آغاز ہے۔
ایک بار چلنے کے بعد، ورک فلو بادل میں موجود کسی بھی چیز سے بالکل مختلف محسوس ہوتا ہے۔
پرامپٹ درج کریں۔ بنائیں پر کلک کریں۔ ایک تصویر ظاہر ہوگی۔ آپ اسے دوبارہ کریں۔ اور پھر۔ کونے میں کاؤنٹر ٹک نہیں رہا ہے۔ کوئی ماہانہ بیان نہیں ہے جو اس بات کی عکاسی کرے کہ آپ اس ہفتے کتنے تخلیقی تھے۔ صرف بجلی کی قیمت ہے۔
جس چیز نے مجھے حیرت میں ڈالا وہ یہ تھا کہ یہ کتنی جلدی اور غیر محسوس طریقے سے بدل گیا۔ اسے کچھ سیشنوں میں مقامی طور پر بنانا ایک مختلف ٹول استعمال کرنے جیسا محسوس ہوا۔ رکاوٹوں کی عدم موجودگی اب بونس کی طرح محسوس نہیں ہوتی بلکہ یہ نیا معمول بن گیا ہے۔ توقعات میں تبدیلی وہ جگہ ہے جہاں یہ واقعی آپ کو متوجہ کرتی ہے۔ ایک ایسا مقام جہاں آپ واپس جانے کے بارے میں سوچ بھی نہیں سکتے۔
ارتکاب کرنے سے پہلے ایماندارانہ سمجھوتہ کریں۔
ماڈلز اور اشارے کے لیے سیکھنے کا وکر
یہ رگڑ کے بغیر سیٹ اپ نہیں ہے، لہذا میں اچھے اور نقصانات کے بارے میں ایماندار ہونا چاہتا ہوں۔
خاص طور پر Apple Silicon پر، ہم NVIDIA-آپٹمائزڈ اسٹیک سے باہر کام کر رہے ہیں جسے زیادہ تر Stable Diffusion سبق مانتے ہیں۔ تخلیق کی رفتار سرشار GPUs والے ونڈوز سسٹمز کے مقابلے میں نمایاں طور پر سست ہے۔ اگر آپ خالص رفتار چاہتے ہیں، تو جدید ترین NVIDIA GPU والا ونڈوز سسٹم اب بھی بہترین ہے۔
ڈاؤن لوڈ کردہ ماڈل ہر چیز کو شکل دیتا ہے۔ ابتدائی چند نتائج اس وقت تک مایوس کن ہو سکتے ہیں جب تک کہ آپ کو کوئی ایسا ماڈل اور فوری نقطہ نظر نہ ملے جو کلک کرتا ہو۔ آپ کی بہترین شرط یہ ہے کہ ایک اچھی طرح سے جائزہ لیا گیا بیس ماڈل منتخب کریں اور وہاں سے ترتیبات کو ایڈجسٹ کریں۔
اور تنصیب کے لیے صبر اور ٹرمینل کے قریب کچھ سکون درکار ہوتا ہے۔ اگر آپ نے پہلے کبھی کمانڈ لائن ٹولز کا استعمال نہیں کیا ہے تو، آپ کے خیال سے زیادہ وقت مختص کریں جس کی آپ کو ضرورت ہوگی۔
مقامی طور پر اسٹیبل ڈفیوژن کو چلانا ترتیب دینے کے قابل ہے۔
موجودہ AI ٹولز میں مایوس کن رجحان ہے۔ سب کچھ سبسکرپشن ہے اور تخلیقی صلاحیتوں کو میٹرڈ یوٹیلیٹی کی طرح سمجھا جاتا ہے۔ یہ ماڈل ٹولز بنانے والی کمپنیوں کے لیے موزوں ہے۔ یہ ان لوگوں کے لیے بہت اچھا نہیں ہے جو اسے استعمال کرتے ہیں۔
لیکن پیچھے مڑ کر، میں نے محسوس کیا کہ جس چیز کی مجھے درحقیقت ضرورت تھی وہ اس ماڈل کے باہر مکمل طور پر دستیاب تھی۔ کریتا کے AI پلگ ان نے اس کے ایک حصے کا خیال رکھا۔ ComfyUI کے ذریعے مقامی طور پر Stable Diffusion چلانا آپ کے لیے دوسری چیزوں کا خیال رکھتا ہے۔ نہ ہی ایڈوب کی پیشکش کی طرح پالش ہے۔ دونوں مفت، سینسر شدہ اور مکمل طور پر میرے ہیں۔
اگر آپ کبھی ایسے مواد کے فلٹرز سے مایوس ہوئے ہیں جو جائز اشارے، آپ کے مفت درجے پر واٹر مارکس، یا سبسکرپشنز کے سست جمع ہونے کو مسترد کرتے ہیں جو آپ شاذ و نادر ہی استعمال کرتے ہیں، مقامی تصویر کی تخلیق سیٹ اپ رگڑ کے قابل ہے۔ خاص طور پر اگر آپ پہلے سے ہی Apple Silicon استعمال کر رہے ہیں اور فرض کیا ہے کہ دروازہ آپ کے لیے بند تھا جیسا کہ میں نے کیا تھا۔
ایسا نہیں تھا۔ مجھے اصل میں اسے آزمانا پڑا۔