← Wróć do bloga
Techniques

Zrozumienie skali CFG w Stable Diffusion

Autor: PromptShot AI25 kwietnia 20262 min czytania332 words

Wprowadzenie do skali CFG w Stable Diffusion

Stable Diffusion jest popularnym modelem AI do generowania obrazów na podstawie wypowiedzi. Jednym z kluczowych parametrów kontrolujących wynik tego modelu jest skala CFG (bezklasifikaatorowa orientacja). W tym artykule zapoznamy się z światem skali CFG i zbadamy, jak ją wykorzystać, aby osiągnąć pożądany poziom jakości i stylu obrazu.

Co to jest skala CFG?

Skala CFG to parametr w modelu Stable Diffusion, który kontroluje siłę kierowania dostarczanej przez bezklasifikaatorową orientację. Bezklasifikaatorowa orientacja to mechanizm, który pozwala modelowi wziąć pod uwagę wyniki sieci klasyfikatora w dodatkie do wejściowej wypowiedzi. To pomaga modelowi generować bardziej spójne i adekwatne do kontekstu obrazy.

Jak skala CFG wpływa na jakość obrazu?

Parametr skali CFG ma istotny wpływ na jakość obrazu produkowanego przez model Stable Diffusion. Gdy skala CFG jest ustawiona na niską wartość, model generuje obrazy o bardziej abstrakcyjnym i surrealnym charakterze. Obraz może brakować szczegółów i może mieć cechy marzeń lub impresjonistyczny charakter. Z drugiej strony, gdy skala CFG jest ustawiona na wysoką wartość, model generuje obrazy o bardziej realistycznym i szczegółowym charakterze. Jednak może to kosztować część abstrakcyjnych i twórczych elementów obrazy.

Doświadczenie z skalą CFG

Zobaczmy przykład, jak dostosować skalę CFG, aby osiągnąć różne jakości obrazów. Możemy użyć następującej wypowiedzi w modelu Stable Diffusion:
 obraz kotu siedzącego na oknie, skala CFG = 7.0 
To wygeneruje obraz kotu siedzącego na oknie z realistycznym i szczegółowym charakterem. Teraz, zobaczmy, jak dostosować skalę CFG do niższej wartości:
 obraz kotu siedzącego na oknie, skala CFG = 3.0 
To wygeneruje obraz kotu siedzącego na oknie z bardziej abstrakcyjnym i surrealnym charakterem. Możemy również doświadczyć z różnymi wartościami skali CFG, aby osiągnąć określony styl lub efekt. Na przykład możemy użyć wysokiej wartości skali CFG, aby wygenerować realistyczny obraz kotu siedzącego na oknie z dużą ilością szczegółów, lub możemy użyć niskiej wartości skali CFG, aby wygenerować abstrakcyjny i marzeniowy obraz kotu siedzącego na oknie.

Użycie PromptShot AI do generowania wypowiedzi

W tym miejscu, można by dodać więcej treści, zależnie od Twoich potrzeb.

Try PromptShot AI free →

Upload any image and get a ready-to-use AI prompt in seconds. No signup required.

Generate a prompt now