Данный инструмент представляет собой модель стабильных диффузионных вариаций изображений, которая была точно настроена для приема нескольких вкраплений изображений CLIP в качестве входных данных, что позволяет пользователям объединять вкрапления изображений из нескольких изображений для смешивания их концепций и добавления текстовых концепций для большей вариативности. На выходе получается изображение размером 640×640, и его можно запускать локально или на облаке Lambda GPU Cloud.
Открытый исходный код