الانتشار المستقر: البرامج التعليمية والموارد والأدوات

نشرت: 2022-09-08
جدول المحتويات
  • الموارد والمعلومات
    • ما هي الصور التي تم استخدامها لتدريب نموذج الانتشار المستقر؟
    • أين تجد أمثلة ومطالبات Stable Diffusion؟
    • هل يوجد خادم Discord رسمي؟
  • أدوات وبرامج
    • كيفية تشغيل Stable Diffusion على نظامي التشغيل Windows / Linux؟
    • كيف يتم تشغيل Stable Diffusion على جهاز Mac؟
    • ما هو حجم نموذج الانتشار المستقر؟
  • البرامج التعليمية والأدلة
    • منشئ موجه الانتشار المستقر
    • دليل المبتدئين النهائي
    • سجلات Akashic
    • موجه الغش
    • أنماط الفن والوسائط
    • الأنماط المرئية والفنان

في 22 أغسطس ، أعلن مؤسس Stability.ai عماد مصطفى عن إطلاق Stable Diffusion. يتمتع هذا النموذج الفني التوليدي بالذكاء الاصطناعي بقدرات فائقة على أمثال DALL · E 2 وهو متاح أيضًا كمشروع مفتوح المصدر. في تلك الأسابيع منذ صدوره ، تخلى الناس عن مساعيهم ومشاريعهم لإعطاء Stable Diffusion اهتمامهم الكامل.

لقد كنت متحمسًا بالفعل عندما أعلنت شركة OpenAI عن DALL · E 2 ، وكنت أيضًا محظوظًا بما يكفي للحصول على وصول مبكر. ولكن بعد اللعب مع Stable Diffusion خلال اليومين الماضيين ، يمكنني القول أن DALL · E 2 لا يقترب مما يجلبه Stable Diffusion إلى الطاولة.

وحقيقة أنه مفتوح المصدر يجعل الوصول إليه أكثر سهولة. في غضون أسبوعين فقط ، أرشفة مواقع مثل ليكسيكا أكثر من 10 ملايين صورة تم إنشاؤها بواسطة الذكاء الاصطناعي. أتوقع أيضًا أن يقوم المطورون بخطوات ثابتة لدمج Stable Diffusion مع أدوات تصميم الرسوم الأكثر شيوعًا ، مثل Figma و Sketch وغيرها. القدرة على إنشاء فن عالي الجودة أثناء التنقل لم يسبق لها مثيل.

قرية كيرالا ، تركيز حاد ، لقطة واسعة ، تتجه إلى ArtStation ، تحفة فنية ، بقلم جريج روتكوفسكي ، بقلم روس تران ، بواسطة فنغوا زونج ، أوكتان ، عرض ناعم ، زيت على قماش ، ملون ، سينمائي ، فن مفهوم بيئي
"قرية كيرالا ، تركيز حاد ، لقطة واسعة ، رائجة على محطة فنية ، تحفة فنية ، بقلم غريغ روتكوفسكي ، روس تران ، فنغهوا زونغ ، أوكتان ، تجسيد ناعم ، زيت على قماش ، ملون ، سينمائي ، مفهوم فني بيئي"

الغرض من هذه المقالة هو سرد جميع البرامج التعليمية والموارد والأدوات الشيقة وذات الصلة لمساعدتك على التعجيل بسرعة باستخدام Stable Diffusion. أعتقد أننا سنشهد خلال الأشهر القادمة تدفقًا هائلاً للمشاريع المتخصصة في استخراج أقصى إمكانات من الانتشار المستقر. سأبذل قصارى جهدي لتحديث هذه المقالة وفقًا لذلك.

  • البرامج التعليمية - يركز هذا القسم بشكل كبير على موضوعات مثل "كيفية استخدام الانتشار المستقر؟" .
  • الموارد - يركز هذا القسم على استعلامات مثل "ما هو الانتشار المستقر؟".
  • الأدوات - يعتمد هذا القسم على الأدوات التي تتيح لك استخدام Stable Diffusion.

لذلك بدون مزيد من اللغط - لنبدأ بالأساسيات.


الموارد والمعلومات

أحد الأسئلة الأولى التي يطرحها العديد من الأشخاص حول Stable Diffusion هو الترخيص الذي يتم نشر هذا النموذج بموجبه وما إذا كان الفن الذي تم إنشاؤه مجانيًا للاستخدام في المشاريع الشخصية والتجارية.

الترخيص الذي تستخدمه Stable Diffusion هو CreativeML Open RAIL-M ، ويمكن قراءته بالكامل في Hugging Face. باختصار ، "تراخيص منظمة العفو الدولية المسؤولة المفتوحة (Open RAIL) هي تراخيص مصممة للسماح بالوصول المجاني والمفتوح وإعادة الاستخدام والتوزيع النهائي لمشتقات عناصر الذكاء الاصطناعي طالما أن قيود الاستخدام السلوكي تنطبق دائمًا (بما في ذلك الأعمال المشتقة). .

يتوفر شرح أكثر تفصيلاً لهذا الترخيص على صفحة BigScience هذه.

ما هي الصور التي تم استخدامها لتدريب نموذج الانتشار المستقر؟

نمذجة الذكاء الاصطناعي هي وسيلة لإنشاء وتدريب خوارزميات التعلم الآلي لغرض محدد. في هذه الحالة ، الغرض من إنشاء صور من مطالبات المستخدم.

إذا كنت مهتمًا بالصور التي استخدمها Stable Diffusion ، فقد أجرى Andy Baio و Simon Willison تحليلًا شاملاً لأكثر من 12 مليون صورة (من إجمالي 2.3 مليار) تم استخدامها لتدريب نموذج Stable Diffusion.

فيما يلي بعض النقاط الرئيسية:

  • كانت مجموعات البيانات التي تم استخدامها لتدريب Stable Diffusion هي تلك التي جمعتها LAION.
  • من بين 12 مليون صورة تم أخذ عينات منها ، جاء 47٪ من الحجم الإجمالي للعينة من 100 مجال ، مع إنتاج Pinterest 8.5٪ من مجموعة البيانات بأكملها. تضمنت أهم المصادر الأخرى WordPress.com و Blogspot و Flickr و DeviantArt و Wikimedia.
  • لا يقيد الانتشار المستقر استخدام الفن من أسماء الأشخاص (سواء أكانوا مشاهير أم غير ذلك).

سيكون من المثير للاهتمام أن نرى كيف يتطور النموذج وما إذا كانت الشركات ستكون على استعداد للمساهمة بوسائل الإعلام الخاصة بها للمساعدة في نمو الانتشار المستقر.

أين تجد أمثلة ومطالبات Stable Diffusion؟

إحدى الطرق التي يختلف فيها Stable Diffusion عن أمثال DALL · E هي تحقيق أقصى استفادة من Stable Diffusion ؛ عليك أن تتعلم عن المعدلات الخاصة به. أحد المعدلات ، على وجه الخصوص ، يسمى البذرة . عندما تقوم بإنشاء صورة باستخدام Stable Diffusion ، فسيتم تعيين بذرة لتلك الصورة ، والتي يمكن فهمها أيضًا على أنها التكوين العام لتلك الصورة. لذلك ، إذا استمتعت بصورة معينة وترغب في تكرار أسلوبها (أو على الأقل أقرب ما يمكن) ، يمكنك استخدام البذور.

معجم

أفضل منصة للعثور على الأمثلة والمطالبات المستخدمة لإنشاء تلك الصور هي Lexica ، والتي تعمل على أرشفة أكثر من 10 ملايين عينة من الأعمال الفنية. يتضمن كل عمل فني موجهه الكامل ورقم البداية ، والذي يمكنك إعادة استخدامه بنفسك.

هل يوجد خادم Discord رسمي؟

نعم!

يمكنك الوصول إليه من خلال زيارة [https://discord.gg/stablediffusion] ؛ من المهم ملاحظة أن الخادم لم يعد يدعم إنشاء الصور من الخادم نفسه. كانت هذه الميزة متاحة كجزء من برنامج بيتا. إذا كنت ترغب في استخدام Stable Diffusion من خادم Discord - يمكنك البحث في مشاريع مثل Yet Another SD Discord Bot ، أو زيارة خادم Discord لتجربته.


أدوات وبرامج

إذا كنت قد رأيت الفن الذي تم إنشاؤه باستخدام Stable Diffusion أو أسرتك ، فقد تتساءل عما إذا كان يمكنك تجربته بنفسك. والإجابة هي نعم ، وهناك طرق متعددة لتجربة Stable Diffusion مجانًا ، بما في ذلك القيام بذلك من المتصفح أو جهازك.

الطريقة الرسمية للقيام بذلك هي استخدام منصة DreamStudio.

مثال DreamStudio

يمكن لأي شخص التسجيل مجانًا ، وتحصل الحسابات الجديدة على 200 رمز مجاني مجاني. هذه الرموز كافية لـ 200 جيل طالما أنك لا تزيد من التعقيد ولا تغير الارتفاع والعرض بعد الإعداد الافتراضي 512 × 512. ولكن إذا قمت بزيادة التعقيد ، فمن المحتمل أن تنفد الرموز الخاصة بك بسرعة.

كيفية تشغيل Stable Diffusion على نظامي التشغيل Windows / Linux؟

حاليًا ، الحل الأكثر شيوعًا لتشغيل Stable Diffusion محليًا هو مستقر Stable Diffusion Web UI repo المتاح على GitHub. استنادًا إلى Gradio GUI ، يكون هذا أقرب ما يكون إلى واجهة DreamStudio ، ويمكنك التلويح وداعًا لأي قيود.

ما هي متطلبات الكمبيوتر للانتشار المستقر؟

- 4 جيجا بايت (يفضل المزيد) VRAM GPU (الدعم الرسمي لـ Nvidia فقط!)
- مستخدمو AMD تحقق هنا

تذكر أنه لاستخدام Web UI repo ؛ ستحتاج إلى تنزيل النموذج بنفسك من Hugging Face. تأكد من قراءة دليل التثبيت بالكامل (Windows) لإعداده بشكل صحيح. بالنسبة لنظام التشغيل Linux ، راجع هذا الدليل. ويمكنك أيضًا الحصول عليه وتشغيله على Google Colab - دليل هنا.

هل توجد أي بدائل لتشغيل SD على نظامي التشغيل Windows أو Linux؟

تكتسب واجهة المستخدم المستقرة Diffusion UI شعبية (تثبيت بنقرة واحدة لنظامي التشغيل Windows و Linux).

كيف يتم تشغيل Stable Diffusion على جهاز Mac؟

أصدر Charlie Holtz CHARL-E ، وهو أداة تثبيت بنقرة واحدة لمستخدمي Mac (M1 & M2).

انتشار مستقر على جهاز Mac الخاص بك بنقرة واحدة باستخدام CHARL-E

المميزات:

  • قم بتنزيل جميع الأوزان المطلوبة تلقائيًا.
  • يمكنك تعيين رقم أولي وأخذ عينات DDIM.
  • يتم حفظ الصور التي تم إنشاؤها في معرض.

هناك أيضًا Diffusion Bee للنظر فيه كبديل.

ما هو حجم نموذج الانتشار المستقر؟

كما ذكرت أعلاه ، يجب عليك تنزيل نموذج Stable Diffusion ، ويمكن العثور على الرابط هنا. ستحتاج إلى إنشاء حساب على Hugging Face ، وبعد ذلك ، قبول شروط ترخيص النموذج قبل أن تتمكن من عرض ملفاته وتنزيلها.

ملفات نموذج انتشار مستقرة على وجه المعانقة

أحد الأسئلة التي يطرحها الناس هو ، "كيف يصل حجم النموذج إلى 4 غيغابايت فقط على الرغم من أنه مصنوع من أكثر من 2 مليار صورة؟" .

وأفضل إجابة على هذا السؤال تأتي من مستخدم Hacker News جوليندورا ⟶

هذا هو الجزء المثير للاهتمام: جميع الصور التي تم إنشاؤها مستمدة من نموذج أقل من 4 جيجابايت (الأوزان المدربة للشبكة العصبية).

وبطريقة ما ، يتم تخزين مئات المليارات من الصور الممكنة في النموذج (كل متجه في مساحة كامنة متعددة الأبعاد) وتحويلها إلى وحدات بكسل عند الطلب (مدفوعة بنموذج اللغة الذي يعرف كيفية تحويل الكلمات إلى متجه في هذا الفضاء )

نظرًا لأنه حتمي (بالنظر إلى نفس معلمات الطلب بالضبط ، بما في ذلك البذور العشوائية ، ستحصل على نفس الصورة بالضبط) إنه شكل من أشكال الضغط (أو على الأقل فك تشفير) أيضًا: يمكنني إرسال المعلمات لمليون صورة التي قد تكون قادرًا على إعادة إنشائه من جانبك ، تمامًا كملف نصي صغير نسبيًا.


البرامج التعليمية والأدلة

القسم التالي مخصص بالكامل للبرامج التعليمية والأدلة لمساعدتك على استخراج أكبر قدر من العصير من مطالبات Stable Diffusion. كما قلت ، سأبذل قصارى جهدي لتحديث هذا مع توفر المزيد من الأدلة وفهم النموذج بشكل أفضل.

منشئ موجه الانتشار المستقر

توجد أدلة نمط إضافية أدناه ، ولكن فيما يتعلق ببناء المطالبات بشكل مرئي - من المحتمل أن تكون أداة "مانيا" هي الأفضل على الإطلاق.

يمكنك البدء بإضافة وصف للصورة التي تحاول إنشاءها ، وبعد ذلك يمكنك التمرير لأسفل لبدء إضافة التفاصيل وتقليد أنماط الفنانين المختلفين. هناك المئات من الخيارات للاختيار من بينها ، ولكل منها معاينة مرئية.

بمجرد الانتهاء من بناء السلسلة الخاصة بك ، يمكنك نسخها ثم لصقها في أي أداة تستخدمها لإنشاء صور Stable Diffusion.

دليل المبتدئين النهائي

نشر Arman Chaudhry عرضًا تقديميًا مضغوطًا في محرر مستندات Google حول أساسيات SD.

يغطي هذا الدليل جميع المُعدِّلات التي يدعمها SD ولكنه يوصي أيضًا بأفضل الممارسات لإعدادات العرض / الارتفاع والأخطاء الشائعة التي يجب تجنبها.

سجلات Akashic

إذا كنت تبحث عن الغوص العميق (أو تحتاج إلى مراجع للبحث) - يحتوي مستودع SD Akashic Records على قدر مذهل من الموارد التي يمكنك دراستها.

ستجد كل شيء من استخدام الكلمات الرئيسية ، إلى التحسين الفوري ، إلى أدلة الأنماط. هناك أيضًا إشارات إلى العديد من الأدوات ، بخلاف تلك المذكورة بالفعل في هذه المقالة.

موجه الغش

إذا كنت تبحث عن مصدر إلهام لتطبيق أنماط وتأثيرات مخصصة على مطالباتك ، فراجع منشور المدونة هذا من Moritz. يغطي الإضافات السريعة لمفاهيم مثل الفن ثنائي الأبعاد وثلاثي الأبعاد والتفاصيل والإضاءة والألوان والبيئات.

أنماط الفن والوسائط

تحقق من ملف محرر مستندات Google هذا للحصول على ما يصل إلى 100+ من الأنماط والوسائط المختلفة لاستخدامها في إنشاء صور SD الخاصة بك. يستند المستند إلى موجه واحد ، وقد تم إنشاء الموجه المذكور بمئات من الأنماط المختلفة بحيث يمكنك تكرار نفس النمط في مطالباتك.

الأنماط المرئية والفنان

تحقق من ملف modifiers.json هذا على GitHub للحصول على أنماط إضافية وتوصيات فنية. يوجد أكثر من 200 مُعدِّل مختلف يمكنك تطبيقه على مطالباتك.