Kararlı Yayılma: Öğreticiler, Kaynaklar ve Araçlar

Yayınlanan: 2022-09-08
İçindekiler
  • Kaynaklar ve Bilgi
    • Kararlı Difüzyon modelini eğitmek için hangi görüntüler kullanıldı?
    • Kararlı Yayılma örnekleri ve istemleri nerede bulunur?
    • Resmi bir Discord sunucusu var mı?
  • Araçlar ve Yazılım
    • Windows/Linux'ta Kararlı Yayılma nasıl çalıştırılır?
    • Mac'te Kararlı Difüzyon nasıl çalıştırılır?
    • Kararlı Difüzyon modeli ne kadar büyük?
  • Öğreticiler ve Kılavuzlar
    • Kararlı Difüzyon İstemi Oluşturucu
    • Nihai Başlangıç ​​Kılavuzu
    • Akaşik Kayıtlar
    • Hızlı Hile Sayfası
    • Sanat Stilleri ve Ortamları
    • Görsel ve Sanatçı Stilleri

22 Ağustos'ta Stability.ai'nin kurucusu Emad Mostaque, Stable Diffusion'ın piyasaya sürüldüğünü duyurdu. Bu AI üretken sanat modeli, DALL·E 2'nin benzerlerinden daha üstün yeteneklere sahiptir ve ayrıca açık kaynaklı bir proje olarak da mevcuttur. Piyasaya sürülmesinden bu yana geçen haftalarda, insanlar tüm dikkatlerini Kararlı Yayılım'a vermek için çabalarını ve projelerini bıraktılar.

OpenAI, DALL·E 2'yi duyurduğunda zaten oldukça heyecanlanmıştım ve ayrıca erken erişim elde edecek kadar şanslıydım. Ancak son birkaç gündür Stable Diffusion ile oyalandığım için, DALL·E 2'nin Stable Diffusion'ın masaya getirdiğinin yanına bile yaklaşamadığını söyleyebilirim.

Ve açık kaynak olması da onu çok daha erişilebilir kılıyor. Sadece iki hafta içinde, Lexica gibi siteler 10 milyondan fazla AI tarafından oluşturulmuş görüntüyü arşivledi. Ayrıca geliştiricilerin Stable Difusion'ı Figma, Sketch ve diğerleri gibi en popüler grafik tasarım araçlarıyla entegre etmek için istikrarlı adımlar atmasını da bekliyorum. Hareket halindeyken yüksek kaliteli sanat üretme yeteneği emsalsizdir.

kerala köyü, keskin odak, geniş çekim, ArtStation'da trend, başyapıt, Greg Rutkowski, Ross Tran, Fenghua Zhong, oktan, yumuşak render, tuval üzerine yağlıboya, renkli, sinematik, çevresel konsept sanatı
“Kerala köyü, keskin odak, geniş çekim, artstation trendi, başyapıt, greg rutkowski, ross tran, fenghua zhong, oktan, yumuşak render, tuval üzerine yağlı boya, renkli, sinematik, çevresel konsept sanatı”

Bu makalenin amacı, Stable Difüzyon ile hızlı bir şekilde hızlanmanıza yardımcı olacak tüm ilginç ve ilgili öğreticileri, kaynakları ve araçları listelemektir. Önümüzdeki aylarda, Kararlı Yayılımdan en fazla potansiyeli çıkarma konusunda uzmanlaşmış büyük bir proje akışı göreceğimize inanıyorum. Bu makaleyi buna göre güncel tutmak için elimden geleni yapacağım.

  • Öğreticiler – bu bölüm ağırlıklı olarak “Stabil Difüzyon Nasıl Kullanılır?” gibi konulara odaklanmıştır. .
  • Kaynaklar – bu bölüm “Kararlı Yayılma Nedir?” gibi sorgulara odaklanmıştır.
  • Araçlar – bu bölüm, Kararlı Yayılımı kullanmanıza izin veren araçlara dayanmaktadır.

Yani daha fazla uzatmadan – hadi temel bilgilerle başlayalım.


Kaynaklar ve Bilgi

Pek çok kişinin Stabil Difüzyon hakkında sahip olduğu ilk sorulardan biri, bu modelin yayınlandığı lisans ve üretilen sanatın kişisel ve ticari projeler için ücretsiz olup olmadığıdır.

Stable Diffusion'ın kullandığı lisans CreativeML Open RAIL-M'dir ve Hugging Face'de tamamı okunabilir. Kısacası, "Açık Sorumlu AI Lisansları (Open RAIL), davranışsal kullanım kısıtlamaları her zaman geçerli olduğu sürece (türev çalışmalar dahil) AI eserlerinin türevlerinin ücretsiz ve açık erişimine, yeniden kullanımına ve aşağı akış dağıtımına izin verecek şekilde tasarlanmış lisanslardır." .

Bu lisans için daha ayrıntılı bir açıklama bu BigScience sayfasında mevcuttur.

Kararlı Difüzyon modelini eğitmek için hangi görüntüler kullanıldı?

Yapay zeka modelleme, belirli bir amaç için Makine Öğrenimi algoritmaları oluşturma ve eğitme aracıdır. Bu durumda, kullanıcı istemlerinden görüntü oluşturma amacı.

Stabil Diffusion'ın hangi görüntüleri kullandığını merak ediyorsanız, Andy Baio ve Simon Willison, Stable Diffusion modelini eğitmek için kullanılan 12 milyondan fazla görüntünün (toplam 2,3 milyardan) kapsamlı bir analizini yaptı.

İşte bazı önemli çıkarımlar:

  • Kararlı Difüzyonu eğitmek için kullanılan veri kümeleri LAION tarafından bir araya getirildi.
  • Örnekledikleri 12 milyon görselden toplam örnek boyutunun %47'si 100 alandan geldi ve Pinterest tüm veri setinin %8,5'ini oluşturdu. Diğer en iyi kaynaklar arasında WordPress.com, Blogspot, Flickr, DeviantArt ve Wikimedia vardı.
  • Kararlı Yayılma, insanların isimlerinden (ünlüler veya başka türlü) sanat üretmenin kullanımını kısıtlamaz.

Modelin nasıl geliştiğini ve şirketlerin İstikrarlı Yayılımın büyümesine yardımcı olmak için medyalarına katkıda bulunmaya istekli olup olmayacağını görmek ilginç olacak.

Kararlı Yayılma örnekleri ve istemleri nerede bulunur?

Stabil Difüzyonun DALL·E'nin benzerlerinden farklı olmasının yollarından biri, Stabil Difüzyondan en iyi şekilde yararlanmaktır; onun değiştiricileri hakkında bilgi edinmelisiniz. Özellikle bir değiştiriciye tohum denir. Kararlı Yayılım ile bir görüntü oluşturduğunuzda, bu görüntüye, aynı görüntünün genel bileşimi olarak da anlaşılabilecek bir tohum atanacaktır. Bu nedenle, belirli bir görüntüden keyif aldıysanız ve stilini (veya en azından mümkün olduğunca yakın) kopyalamak istiyorsanız, tohumları kullanabilirsiniz.

sözlük

Örnekleri ve bu görüntüleri oluşturmak için kullanılan komutları bulmak için en iyi platform, 10 milyondan fazla örnek sanat eserini arşivleyen Lexica'dır. Her sanat eseri, tam istemini ve kendinizi yeniden kullanabileceğiniz tohum numarasını içerir.

Resmi bir Discord sunucusu var mı?

Evet!

[https://discord.gg/stablediffusion] adresini ziyaret ederek erişebilirsiniz; sunucunun artık sunucunun kendisinden görüntü oluşturmayı desteklemediğini unutmamak önemlidir. Bu özellik, beta programının bir parçası olarak mevcuttu. Bir Discord sunucusundan Stable Diffusion kullanmak istiyorsanız, Yet Another SD Discord Bot gibi projelere bakabilir veya denemek için Discord sunucularını ziyaret edebilirsiniz.


Araçlar ve Yazılım

Stable Difüzyon ile yaratılan sanatı gördüyseniz veya büyülendiyseniz, bunu kendiniz deneyip deneyemeyeceğinizi merak ediyor olabilirsiniz. Ve cevap evet ve bunu tarayıcıdan veya makinenizden yapmak da dahil olmak üzere Stable Difüzyon'u ücretsiz denemenin birçok yolu var.

Bunu yapmanın resmi yolu DreamStudio platformunu kullanmaktır.

DreamStudio örneği

Herkes ücretsiz olarak kaydolabilir ve yeni hesaplar ücretsiz 200 ücretsiz jeton alır. Bu belirteçler, karmaşıklığı artırmadığınız ve yüksekliği ve genişliği 512×512 varsayılan ayarını geçmediğiniz sürece 200 nesil için yeterlidir. Ancak karmaşıklığı artırırsanız, muhtemelen jetonlarınız hızla tükenir.

Windows/Linux'ta Kararlı Yayılma nasıl çalıştırılır?

Şu anda, Stable Diffusion'ı yerel olarak çalıştırmak için en popüler çözüm, GitHub'da bulunan Stable Diffusion Web UI deposudur. Gradio GUI'ye dayanarak, bu DreamStudio arayüzüne en yakın olanıdır ve herhangi bir sınırlamaya elveda diyebilirsiniz.

Kararlı Difüzyon için PC gereksinimleri nelerdir?

4GB (daha fazlası tercih edilir) VRAM GPU (Yalnızca Nvidia için resmi destek!)
AMD kullanıcıları burayı kontrol eder

Web UI deposunu kullanmak için şunu unutmayın; modeli Hugging Face'den kendiniz indirmeniz gerekecek. Doğru şekilde kurmak için Kurulum kılavuzunu (Windows) tamamen okuduğunuzdan emin olun. Linux için bu kılavuzu kontrol edin. Ayrıca onu Google Colab'da çalıştırabilir ve çalıştırabilirsiniz - burada kılavuz.

Windows veya Linux'ta SD çalıştırmanın herhangi bir alternatifi var mı?

Stable Difüzyon UI popülerlik kazanıyor (Windows ve Linux için 1 tıklamayla kurulum).

Mac'te Kararlı Difüzyon nasıl çalıştırılır?

Charlie Holtz, Mac (M1 ve M2) kullanıcıları için tek tıkla yükleyici olan CHARL-E'yi piyasaya sürdü.

CHARL-E ile 1 tıklamayla Mac'inizde Kararlı Difüzyon

Özellikler:

  • Gerekli tüm ağırlıkları otomatik olarak indirin.
  • Bir tohum numarası ve DDIM örneklemesi ayarlayabilirsiniz.
  • Oluşturulan görüntüler bir galeriye kaydedilir.

Alternatif olarak düşünülmesi gereken Difüzyon Arı da var.

Kararlı Difüzyon modeli ne kadar büyük?

Yukarıda bahsettiğim gibi Stabil Difüzyon modelini indirmeniz gerekiyor ve linke buradan ulaşabilirsiniz. Hugging Face'de bir hesap oluşturmanız ve ardından, dosyalarını görüntüleyip indirmeden önce modelin lisans koşullarını kabul etmeniz gerekecektir.

sarılma yüzünde kararlı difüzyon modeli dosyaları

İnsanların aklındaki sorulardan biri, "2 milyardan fazla görüntüden yapılmış olmasına rağmen model nasıl sadece 4 GB boyutunda?" .

Ve bu soruya en iyi cevap bir Hacker News kullanıcısı juliendorra'dan geliyor ⟶

İlginç olan kısım da bu: oluşturulan tüm görüntüler 4 gb'den daha küçük bir modelden (sinir ağının eğitilmiş ağırlıkları) türetilmiştir.

Yani bir şekilde, yüz milyarlarca olası görüntünün tümü modelde depolanır (her biri çok boyutlu gizli uzayda bir vektördür) ve isteğe bağlı olarak piksellere dönüştürülür (kelimeleri bu uzayda bir vektöre nasıl dönüştüreceğini bilen dil modeli tarafından yönlendirilir). )

Belirleyici olduğu için (tam olarak aynı istek parametreleri göz önüne alındığında, rastgele tohum dahil, tam olarak aynı görüntüyü alırsınız) bu da bir sıkıştırma biçimidir (veya en azından kodlama kod çözme): Size 1 milyon görüntü için parametreleri gönderebilirim nispeten küçük bir metin dosyası olarak kendi tarafınızda yeniden oluşturabilirsiniz.


Öğreticiler ve Kılavuzlar

Aşağıdaki bölüm tamamen Stabil Difüzyon komutlarınızdan en fazla suyu almanıza yardımcı olacak öğreticilere ve kılavuzlara ayrılmıştır. Dediğim gibi, daha fazla kılavuz kullanıma sunuldukça ve model hakkında daha iyi bir anlayış kazandıkça bunu güncel tutmak için elimden geleni yapacağım.

Kararlı Difüzyon İstemi Oluşturucu

Aşağıda ek stil kılavuzları var, ancak görsel olarak bilgi istemleri oluşturma konusunda, muhtemelen en iyi araç, prostoMANIA aracıdır.

Oluşturmaya çalıştığınız görüntünün açıklamasını ekleyerek başlayabilir ve ardından ayrıntıları eklemeye ve çeşitli sanatçıların stillerini taklit etmeye başlamak için aşağı kaydırabilirsiniz. Her biri görsel bir önizlemeye sahip yüzlerce seçenek arasından seçim yapabilirsiniz.

Dizinizi oluşturmayı bitirdikten sonra, onu kopyalayabilir ve ardından Kararlı Yayılma görüntüleri oluşturmak için kullandığınız araca yapıştırabilirsiniz.

Nihai Başlangıç ​​Kılavuzu

Arman Chaudhry, SD'nin temelleri hakkında kompakt bir Google Dokümanlar sunumu yayınladı.

Bu kılavuz, SD'nin desteklediği tüm değiştiricileri kapsar, ancak aynı zamanda genişlik/yükseklik ayarları için en iyi uygulamaları ve kaçınılması gereken yaygın hataları önerir.

Akaşik Kayıtlar

Derin bir dalış yapmak istiyorsanız (veya araştırma için referanslara ihtiyacınız varsa) - SD Akaşik Kayıtlar deposu, çalışmanız için şaşırtıcı miktarda kaynağa sahiptir.

Anahtar kelime kullanımından hızlı optimizasyona ve stil kılavuzlarına kadar her şeyi bulacaksınız. Bu makalede daha önce bahsedilenlerin dışında birkaç araçtan da bahsedilmiştir.

Hızlı Hile Sayfası

İstemlerinize özel stiller ve efektler uygulamak için ilham arıyorsanız, Moritz'in bu blog gönderisine göz atın. 2D ve 3D sanat, ayrıntılar, aydınlatma, renkler ve ortamlar gibi kavramlar için hızlı eklemeleri kapsar.

Sanat Stilleri ve Ortamları

SD görüntü oluşturmanız için kullanılacak 100'den fazla farklı stil ve ortam için bu Google Dokümanlar dosyasına göz atın. Belge tek bir bilgi istemine dayalıdır ve söz konusu bilgi istemi yüzlerce farklı stilde oluşturulmuştur, böylece aynı stili bilgi istemlerinizde çoğaltabilirsiniz.

Görsel ve Sanatçı Stilleri

Ek stiller ve sanatçı önerileri için GitHub'daki bu değiştiriciler.json dosyasına göz atın. İstemlerinize uygulayabileceğiniz 200'den fazla farklı değiştirici var.