Опубликовано

Встречайте: “Программирование с помощью искусственного интеллекта”

Программирование с помощью искусственного интеллекта

Книга посвящена практике использования инструментов искусственного интеллекта  для всех этапов создания кода: от разработки требований и планирования до проектирования, написания, отладки и тестирования. Предложена методология модульного программирования, которая эффективно сочетается с подходом генерации кода с применением ИИ. Рассмотрены  основные возможности и сценарии использования инструментов ИИ для разработки, оценены плюсы и минусы популярных систем. Показаны перспективы применения универсальных языковых моделей (LLM), таких как ChatGPT, Gemini, Claude и других, для решения задач программирования. Также рассмотрено применение широкого спектра специализированных систем (GitHub Copilot, Tabnine, Cursor, Amazon CodeWhisperer). Освещены вопросы инженерии промптов, автоматизации рутинных задач, таких как создание регулярных выражений, применения низкокодового и бескодового программирования и др.

Для широкого круга разработчиков

 

Примеры кода можно скачать тут: https://github.com/ttaulli/AI-Assisted-Programming-Book

Получите практические советы, как использовать инструменты искусственного интеллекта для всех этапов создания кода: от разработки требований и планирования до проектирования, написания, отладки и тестирования.  Начинающие и опытные разработчики узнают, как применять широкий спектр инструментов ИИ— от универсальных языковых моделей (ChatGPT, Gemini, Claude) до специализированных систем (GitHub Copilot, Tabnine, Cursor, Amazon CodeWhisperer).

Вы также познакомитесь с узкоспециализированными генеративными ИИ-инструментами для таких задач, как, например, преобразование текста в изображение.

Автор предлагает методологию модульного программирования, которая эффективно сочетается с подходом генерации кода с помощью ИИ. Также описаны лучшие способы использования универсальных языковых моделей для изучения языков программирования, объяснения кода или его преобразования с одного языка на другой.

В этой книге:

  • Основные возможности ИИ-инструментов для разработки
  • Плюсы, минусы и сценарии использования популярных систем, включая GitHub Copilot
  • Применение универсальных языковых моделей (LLM), таких как ChatGPT, Gemini, Claude и других, для решения задач программирования
  • Использование ИИ-инструментов в жизненном цикле разработки ПО: от разработки требований до тестирования
  • Инженерия промптов для разработки
  • Автоматизация рутинных задач, таких как создание регулярных выражений, с помощью ИИ
  • Низкокодовые и бескодовые инструменты на основе ИИ
Tom Taulli

Том Таулли занимается разработкой программного обеспечения с 1980-х годов. Еще в колледже основал свою первую компанию, которая сосредоточилась на разработке систем электронного обучения. Ведет авторские колонки для популярных онлайн-изданий, таких как BusinessWeek.com, TechWeb.com и Bloomberg.com. Автор статей об искусственном интеллекте для Forbes.com и является консультантом различных компаний в этой сфере. Ведет  веб-сайт Taulli.com.

Книгу “Программирование с помощью искусственного интеллекта” можно купить в нашем интенет-магазине.

Высокая оценка книги
«Программирование с помощью искусственного интеллекта». 9

Вступительное слово. 11

Предисловие. 13

О чем эта книга. 14

В чем отличие этой книги. 15

Для кого эта книга. 16

Условные обозначения, используемые в книге. 16

Примеры использования кода. 16

Онлайн-обучение O’Reilly. 17

Как с нами связаться. 17

Благодарности. 18

Глава 1. Новый мир для разработчиков. 19

Эволюция и революция. 20

Генеративный искусственный интеллект. 23

Преимущества. 24

Минимизация поиска. 24

Ваш консультант. 26

Интеграция с IDE.. 27

Рефлексия вашей кодовой базы.. 28

Целостность кода. 29

Генератор документации на платформе искусственного интеллекта. 30

Модернизация. 30

Недостатки. 34

Галлюцинации. 34

Интеллектуальная собственность. 35

Конфиденциальность. 36

Безопасность. 36

Данные для обучения. 37

Предвзятость. 38

Новый путь для разработчиков. 38

Карьера. 39

Разработчик 10x?. 40

Профессиональные навыки разработчика. 40

Заключение. 41

Глава 2. Как работает технология программирования с использованием искусственного интеллекта  43

Основные функции. 43

Подбор кода и завершение с учетом контекста в сопоставлении с интеллектуальным завершением кода  44

Компиляторы по сравнению с инструментами программирования на основе искусственного интеллекта  45

Уровни возможностей. 47

Генеративный искусственный интеллект и большие языковые модели (LLM) 49

Эволюция. 49

Модель трансформера. 51

OpenAI Playground. 54

Токены.. 55

Использование платформы.. 56

Оценка больших языковых моделей. 60

Типы больших языковых моделей. 63

Выбор ИИ-инструментов программирования. 66

Заключение. 67

Глава 3. Оперативное проектирование. 69

Наука и искусство. 70

Проблемы.. 70

Промпт. 71

Контекст. 72

Инструкции. 72

Суммаризация. 73

Классификация текста. 74

Рекомендации. 75

Локализация. 75

Ввод содержимого. 77

Формат. 77

Передовой опыт. 79

Будьте конкретны.. 79

Сокращения и технические термины.. 80

Техники обучения с примерами и без. 80

Ключевые слова. 81

Методика промптов по цепочке размышлений (CoT) 82

Наводящие вопросы.. 83

Промпт на примеры и аналогии. 83

Снижение галлюцинаций. 84

Безопасность и конфиденциальность. 85

Автономные агенты искусственного интеллекта. 86

Заключение. 89

Глава 4. Github Copilot 91

GitHub Copilot 91

Цены и версии. 92

Пример использования: программирование аппаратных средств. 93

Пример использования: Shopify. 94

Пример использования: Accenture. 96

Безопасность. 96

Приступая к работе. 97

Среда Codespaces и Visual Studio Code. 98

Рекомендации. 99

Комментарии. 102

Чат. 102

Внутренний чат. 107

Открытые вкладки. 108

Интерфейс командной строки. 109

Партнерская программа Copilot 110

Заключение. 111

Глава 5. Остальные инструменты программирования на основе
искусственного интеллекта. 113

CodeWhisperer от Amazon. 113

Duet AI от Google для разработчиков. 115

Tabnine. 117

Replit 118

CodeGPT.. 121

Cody  122

CodeWP. 124

Warp  125

Bito AI. 127

Cursor 128

Code Llama. 130

Остальные модели с открытым исходным кодом.. 131

StableCode. 131

AlphaCode. 132

PolyCoder 132

CodeT5. 132

Компании, производящие корпоративное программное обеспечение. 133

Заключение. 134

Глава 6. ChatGPT и другие большие языковые модели общего назначения. 135

ChatGPT.. 135

GPT-4. 136

Навигация по ChatGPT.. 137

Мобильное приложение. 140

Пользовательские запросы.. 141

Просмотр с помощью Bing. 141

Утомительные задачи. 145

Регулярные выражения. 146

Стартовый код. 147

GitHub README.. 148

Кросс-браузерная совместимость. 149

Команды Bash. 150

GitHub Actions. 150

Плагины.. 151

Плагин Codecademy. 152

Плагин AskYourDatabase. 153

Плагин Recombinant AI. 154

GPTs  154

Gemini 156

Приложения. 158

Программирование в Gemini 159

Claude. 161

Заключение. 163

Глава 7. Идеи, планирование и требования. 165

Мозговой штурм.. 165

Исследование рынка. 167

Тенденции развития рынка. 170

Общий адресный рынок. 171

Конкуренция. 172

Требования. 174

Документ с требованиями к продукту. 175

Спецификация требований к программному обеспечению.. 176

Интервью.. 177

Белая доска. 178

Стиль. 180

Подходы к планированию проекта. 181

Разработка через тестирование. 183

Разработка веб-дизайна. 185

Заключение. 188

Глава 8. Программирование. 189

Что в реальности?. 189

Мотивы, помогающие принять решение. 191

Обучение. 191

Комментарии. 193

Модульное программирование. 194

Начало работы над проектом.. 195

Автозаполнение. 196

Рефакторинг. 198

Ninja Code. 198

Метод извлечения. 199

Разделение условий. 200

Переименование. 200

Мертвый код. 201

Функции. 202

Объектно-ориентированное программирование. 204

Фреймворки и библиотеки. 205

Данные. 206

Разработка фронтенда. 208

Каскадные таблицы стилей CSS. 209

Создание графики. 210

Инструменты на основе искусственного интеллекта. 211

API-интерфейсы.. 213

Заключение. 214

Глава 9. Отладка, тестирование и развертывание. 215

Отладка. 215

Документация. 216

Код-ревью.. 218

Модульные тесты.. 219

Запросы на извлечение. 222

Развертывание. 224

Обратная связь с пользователями. 225

Запуск. 227

Заключение. 228

Глава 10. Выводы.. 229

Интенсивный процесс обучения. 229

Основные преимущества. 229

Но есть и недостатки. 230

Оперативное проектирование —  это не только искусство, но и наука. 231

За гранью программирования. 232

Искусственный интеллект не заменит вас на работе. 232

Заключение. 233

Предметный указатель. 234

Об авторе. 238

Об изображении на обложке. 239

Опубликовано

Вышло 4-е издание книги: “Мобильные роботы с искусственным интеллектом на базе Arduino”

Мобильные роботы с искусственным интеллектом на базе Arduino, 4-е издание

Руководство для начинающих конструкторов написано в форме практических проектов по построению мобильных роботов, для реализации которых выбрана популярная платформа Arduino и единая базовая двухколесная конструкция. Сложность проектов возрастает от простой, управляемой с пульта «машинки» до роботов с элементами искусственного интеллекта. Рассказано, как управлять моторами, осуществлять сборку механики и электроники, программировать основные функции и управлять роботом. Роботы смогут обходить препятствия, выбираться из лабиринтов, обнаруживать и распознавать дорожные знаки.

В четвертом издании по сравнению с третьим, выходившем под названием «Мобильные  роботы на базе Arduino», предложены современные идеи для модернизации роботов. Рассмотрено использование связки Arduino и ESP32-CAM, позволяющей «видеть» окружающий мир с помощью цифровой камеры и управлять роботами через веб-интерфейс. Показано, как робот обнаруживает и распознает дорожные знаки с помощью машинного обучения на базе технологии искусственного интеллекта Edge Impulse.

Электронный архив на сайте издательства содержит листинги, библиотеки и программы для Arduino, ESP32 и SPBot.

Для читателей, интересующихся электроникой и робототехникой

Практические проекты для начинающих и продвинутых конструкторов

Лучший практический гид по созданию умных роботов! От основ пайки до нейросетей на Edge Impulse. В архиве — все программы и 3D-модели.

Структура книги:

  • Часть I: Основы робототехники (датчики, пайка, программирование).
  • Часть II: Сборка базового робота (Arduino, mCore, SPBot).
  • Часть III: Автономные роботы (гироскопы, ИК-датчики, сервоприводы).
  • Часть IV: ИИ для роботов (ESP32-CAM, Edge Impulse).

Для кого актуально 4-е издание?

  • Для тех, кто хочет выйти за рамки базовой робототехникии освоить ИИ.
  • Для преподавателей, которым нужны современные проектыдля курсов.
  • Для инженеров, экспериментирующих с TinyML и компьютерным зрением.

Книгу “Stable Diffusion XL. Генерируем картинки нейросетью на своем компьютере” можно купить в нашем интенет-магазине.

Опубликовано

Новинка: “Stable Diffusion. 22 урока для начинающих”

Stable Diffusion. 22 урока для начинающих

В книге представлено 22 проиллюстрированных урока по работе с нейросетью Stable Diffusion в интерфейсах AUTOMATIC1111 и Forge. Для лучшего усвоения материала разработаны сопровождающие книгу видеоуроки и сделан полный разбор всех моделей и препроцессоров ControlNet, доступный на электронном ресурсе Figma.  Рассмотрены расширения ADetailer, Civitai Helper, State, A-person-mask-generator, Dynamic Prompts, Prompt All-in-One, SD-WebUI-AR-Plus, Photopea, FreeU, Reactor и ControlNet. Описаны основные функции и настройки, приведены примеры применения для генерации изображений. Рассказано, как управлять стилем и композицией через промты, настроить модели и препроцессоры ControlNet, автоматизировать генерации серий изображений с помощью расширений и скриптов, создавать реалистичные лица и другие изображения,  использовать продвинутые трюки по ретуши и постобработке,  интегрировать WebUI AUTOMATIC1111 и Forge в рабочие проекты.

Электронное приложение на сайте издательства содержит дополнительные материалы: цветные изображения и видеоуроки.

Для начинающих дизайнеров

Научись использовать нейросеть для генерации изображений в дизайне, графике и фото

Просто, наглядно и с примерами — книга научит создавать изображения с помощью нейросети на телефоне, в «облаке» и на ПК.

  • Установка и запуск: как развернуть Stable Diffusion локально и в Google Colab.
  • Интерфейсы: работа с AUTOMATIC1111 и Forge — двумя популярными вариантами веб-интерфейса.
  • Расширения и инструменты: ADetailer, Dynamic Prompts, Prompt-all-in-one, sd-webui-ar-plus, Photopea, Reactor и ControlNet — как использовать их для тонкой настройки изображений.

Результат: вы получите прочную основу для работы с генеративной графикой, визуальными эффектами и нейросетевыми креативными процессами.

Вы узнаете, как

  • работать в WebUI интерфейсах AUTOMATIC1111 и Forge;
  • управлять стилем и композицией через промты;
  • настроить модели и препроцессоры ControlNet;
  • автоматизировать генерации серий изображений с помощью расширений и скриптов;
  • создавать реалистичные лица с помощью расширений ADetailer и A-person-mask-generator;
  • делать продвинутые трюки по ретуши и постобработке в Photopea в интерфейсе Forge;
  • интегрировать WebUI AUTOMATIC1111 и Forge в рабочие проекты.

Книгу “Stable Diffusion. 22 урока для начинающих” можно купить в нашем интенет-магазине.

Предисловие…………………………………………………………………………………………….. 8

Структура книги…………………………………………………………………………………………………………………………… 9

Некоторые обозначения и условности…………………………………………………………………………………….. 10

ВВЕДЕНИЕ. Что такое нейросети и как они генерируют изображения?… 11

Часть I. Нейросети. Генерация изображений в смартфоне, облаке и на ПК          15

УРОК 1. Нейросети для генерации со смартфона…………………………………… 17

Шедеврум……………………………………………………………………………………………………………………………………. 17

GenZArt……………………………………………………………………………………………………………………………………….. 19

PixAI……………………………………………………………………………………………………………………………………………. 19

Dream by WOMBO……………………………………………………………………………………………………………………… 20

Starryai………………………………………………………………………………………………………………………………………… 21

УРОК 2. Нейросети в облаке………………………………………………………………….. 24

Stable Diffusion Web…………………………………………………………………………………………………………………… 24

Kandinsky 3.0……………………………………………………………………………………………………………………………… 27

DALL-E 3…………………………………………………………………………………………………………………………………….. 30

Lexica, Playground Ai и Leonardo.Ai………………………………………………………………………………………….. 30

Artbreeder…………………………………………………………………………………………………………………………………….. 32

Midjourney………………………………………………………………………………………………………………………………….. 40

УРОК 3. Нейросети для установки локально на ПК: Stable Diffusion……… 42

Часть II. Установка Stable Diffusion локально
и на Google Colab…………………………………………………………………………. 49

УРОК 4. Интерфейсы Stable Diffusion и системные требования к ним…….. 51

Интерфейсы Stable Diffusion……………………………………………………………………………………………………… 52

AUTOMATIC1111………………………………………………………………………………………………………………. 52

Forge…………………………………………………………………………………………………………………………………….. 53

ComfyUI……………………………………………………………………………………………………………………………… 54

InvokeAI……………………………………………………………………………………………………………………………… 56

Fooocus………………………………………………………………………………………………………………………………… 57

Системные требования……………………………………………………………………………………………………………… 58

Тесты производительности……………………………………………………………………………………………………….. 61

УРОК 5. Локальная установка………………………………………………………………. 66

Установка AUTOMATIC1111…………………………………………………………………………………………………… 66

Установка Python 3.10.6……………………………………………………………………………………………………. 67

Установка редактора для работы с кодом………………………………………………………………………. 69

Установка Git……………………………………………………………………………………………………………………… 70

Установка интерфейса AUTOMATIC1111………………………………………………………………………. 73

Загрузка модели и запуск нейросети……………………………………………………………………………….. 77

Полезные функции и аргументы запуска…………………………………………………………………………. 80

Установка интерфейса Forge…………………………………………………………………………………………………….. 84

Установка менеджера пакетов Stability Matrix……………………………………………………………………….. 88

УРОК 6. Установка на Google Colab………………………………………………………. 97

Блокнот Google Colab………………………………………………………………………………………………………………… 97

Улучшенные генерации…………………………………………………………………………………………………………… 104

Часть III. Обзор возможностей AUTOMATIC1111
и генерация первых картинок……………………………………………….. 111

УРОК 7. Генерация изображения по промту и изображению……………….. 113

Вкладка txt2img: генерация изображения по промту. Клубничный торт………………………….. 113

Интерфейс вкладки txt2img……………………………………………………………………………………………… 113

Первая генерация……………………………………………………………………………………………………………… 114

Настройки Hires. fix…………………………………………………………………………………………………………. 117

Увеличение изображения………………………………………………………………………………………………… 119

Вкладка img2img: генерация изображения по промту и изображению.
Гоночная машина……………………………………………………………………………………………………………………. 122

Настройки вкладки img2img……………………………………………………………………………………………. 122

Правильный состав любого промта……………………………………………………………………………….. 123

Генерация изображения………………………………………………………………………………………………….. 124

УРОК 8. Вкладка Extras……………………………………………………………………….. 127

Увеличение изображения: параметр Upscale………………………………………………………………………… 127

Восстанавливаем лица: параметры GFPGAN и CodeFormer……………………………………………….. 129

Оптимизация маленькой памяти: параметр Split oversized images………………………………………. 129

Автоматическое кадрирование изображения: параметр Auto focal point crop………………….. 131

Кадрирование до указанного размера: параметр Auto-sized crop……………………………………… 132

Отражение изображения в одну из сторон: параметр Create flipped copies……………………….. 132

Автоматическое создание текстовых описаний изображения: параметр Caption……………. 133

УРОК 9. Вкладки PNG info, Checkpoint merger, Train, Settings и Extensions 135

Вкладка PNG info: извлечение промта из сгенерированного ранее изображения…………….. 135

Вкладка Checkpoint merger: слияние разных моделей нейросети………………………………………. 136

Вкладка Train: тренировка маленьких моделей……………………………………………………………………. 138

Создание текстовой инверсии…………………………………………………………………………………………. 138

Создание гиперсети…………………………………………………………………………………………………………. 140

Вкладка Settings: настраиваем нейросеть под себя……………………………………………………………… 140

Вкладка Extensions: обзор способов установки расширений……………………………………………… 142

Часть IV. Генерация изображений по промту:
вкладка txt2img……………………………………………………………………………. 147

УРОК 10. Поколения и виды моделей, лицензии их использования…….. 149

Поколения моделей нейросети……………………………………………………………………………………………….. 149

Виды моделей…………………………………………………………………………………………………………………………… 153

Устанавливаем современную модель……………………………………………………………………………………. 156

Сайты для загрузки моделей…………………………………………………………………………………………………… 163

Лицензии использования моделей………………………………………………………………………………………….. 166

Компания Stability AI……………………………………………………………………………………………………….. 166

Компания Fusionbrain.ai…………………………………………………………………………………………………… 168

Компания «Яндекс» (Шедеврум)…………………………………………………………………………………….. 168

Компания OpenAI (DALL-E)……………………………………………………………………………………………. 168

Нейросеть Artbreeder……………………………………………………………………………………………………….. 169

Нейросеть Midjourney……………………………………………………………………………………………………… 169

Нейросеть Leonardo.Ai…………………………………………………………………………………………………….. 170

Нейросеть Playground AI…………………………………………………………………………………………………. 170

Нейросеть Lexica……………………………………………………………………………………………………………… 170

Нейросеть Dream by Wombo…………………………………………………………………………………………… 170

Нейросеть Starryai……………………………………………………………………………………………………………. 170

Нейросети GenZart и PixAI……………………………………………………………………………………………… 171

УРОК 11. Генерируем фотореалистичный город и устанавливаем
первое расширение………………………………………………………………………………. 172

Генерируем фотореалистичный город………………………………………………………………………………….. 172

Устанавливаем расширение Civitai Helper……………………………………………………………………………. 180

Вкладка Civitai Helper……………………………………………………………………………………………………… 182

Вкладка Civitai Helper Browser………………………………………………………………………………………… 188

УРОК 12. Примеры использования нейросети……………………………………… 190

Генерация персонажей из аниме и компьютерных игр………………………………………………………… 190

Генерация персонажа в стиле аниме……………………………………………………………………………… 190

Генерация персонажа в стиле компьютерных игр………………………………………………………… 194

Генерация логотипов, одежды, архитектуры и графики для 2D-игр…………………………………… 196

Генерация логотипа компании……………………………………………………………………………………….. 196

Генерация одежды для мужчины……………………………………………………………………………………. 200

Генерация архитектуры………………………………………………………………………………………………….. 203

Генерация графики для 2D-игр……………………………………………………………………………………….. 205

УРОК 13. Сравнение методов генерации по разным настройкам…………. 211

Выбираем Sampling method: анализ на примере портретной генерации…………………………… 211

Улучшаем качество изображения: настройки Schedule type, Hires. fix,
Denoising strength, Upscaler………………………………………………………………………………………………………. 212

Настройка Schedule type…………………………………………………………………………………………………. 212

Настройки Hires. fix и Denoising strength………………………………………………………………………… 214

Виды Upscaler и их зависимость от количества шагов Hires………………………………………… 215

УРОК 14. Секреты создания качественных изображений с людьми…….. 218

Дорабатываем лицо и руки: ADetailer и Refiner в действии…………………………………………………. 218

ADetailer…………………………………………………………………………………………………………………………….. 218

Refiner……………………………………………………………………………………………………………………………….. 224

Улучшаем изображение: параметр CFG Scale……………………………………………………………………… 226

УРОК 15. Ускорение написания промта………………………………………………. 228

Установка расширения Dynamic Prompts……………………………………………………………………………… 228

Установка расширения Prompt-all-in-one………………………………………………………………………………. 236

Генерация золотого кольца с бриллиантом………………………………………………………………………….. 242

Создание контента для соцсетей: генерируем 90 изображений цветов одной темы…………. 242

УРОК 16. Скрипты и расширения для ускорения работы…………………….. 245

Встроенные скрипты……………………………………………………………………………………………………………….. 245

Скрипт Prompt matrix: создание одного изображения в разных стилях
(генерируем загородный дом)…………………………………………………………………………………………. 245

Скрипт X/Y/Z plot: создание нескольких сеток изображений
с различными параметрами……………………………………………………………………………………………. 247

Скрипт Prompts from file or textbox: создание списка заданий для нейросети…………… 249

Загружаемые расширения для ускорения работы……………………………………………………………….. 251

Расширения для настройки быстрой смены соотношения сторон изображения……….. 251

Sd-webui-ar-plus……………………………………………………………………………………………………….. 251

Aspect Ratio Resolutions selector-xhox……………………………………………………………………. 254

Расширение State: сохраняем настройки предыдущей генерации……………………………… 255

Style Selector for SDXL 1.0: настройка стилей……………………………………………………………………….. 256

Часть V. Генерация изображения по промту и изображению: вкладка img2img…………………………………………………………………………………………………………….. 259

УРОК 17. Общие настройки вкладки img2img
и автоматическая генерация промта…………………………………………………….. 261

Общие настройки вкладки img2img……………………………………………………………………………………….. 261

Параметр Seed Extra: вариации изображения………………………………………………………………………. 265

Параметр Interrogate: автоматическая генерация текста по изображению……………………….. 266

УРОК 18. Режимы работы на вкладке img2img…………………………………….. 267

Вкладка img2img: генерируем интерьер………………………………………………………………………………… 267

Режим Sketch вкладки img2img: меняем цвета отдельных частей интерьера…………………….. 271

Режим Inpaint вкладки img2img: генерация новых объектов интерьера без изменения всего изображения      276

Расширение Canvas Zoom………………………………………………………………………………………………………. 276

Режим Inpaint sketch вкладки img2img…………………………………………………………………………………… 279

Режим Inpaint upload вкладки img2img: добавление деталей по маске……………………………… 282

Упражнение: режимы Sketch и Inpaint…………………………………………………………………………………… 284

Задача……………………………………………………………………………………………………………………………….. 284

Решение…………………………………………………………………………………………………………………………….. 284

Настройка Soft inpainting: улучшение качества режима Inpaint………………………………………… 287

УРОК 19. Расширения для создания быстрых эффектов,
ретуши изображений и дизайна……………………………………………………………. 292

Расширение A Person Mask Generator: быстрая замена одежды и частей тела человека…. 292

Photopea: бесплатная альтернатива Photoshop для нейросетей…………………………………………. 295

Устанавливаем для интернет-браузера расширение Adblock…………………………………….. 295

Устанавливаем расширение Photopea…………………………………………………………………………… 295

Интерфейс Photopea: панель инструментов, слои и маски, кисти инструментов………. 297

Расширение PBRemTools: замена (вырезка) фона изображения…………………………………………. 300

Расширение FreeU: существенное повышение качества генераций……………………………………. 303

Расширение Color Correction и методы обработки StableSR: цветокоррекция изображения на вкладке Extras              305

Расширение Canvas Editor: быстро создаем визитку……………………………………………………………. 307

Расширение ReActor: создаем арты со своим лицом……………………………………………………………. 309

Установка расширения ReActor……………………………………………………………………………………… 309

Способ применения расширения ReActor и обзор его настроек………………………………….. 311

УРОК 20. Оптимизация интерфейса и скрипты вкладки img2img………… 314

Расширение SD Webui Tabs: оптимизируем интерфейс нейросети……………………………………… 314

Скрипты вкладки img2img………………………………………………………………………………………………………. 315

Скрипт img2img alternative test……………………………………………………………………………………….. 315

Скрипт Loopback……………………………………………………………………………………………………………… 320

Скрипты Outpainting mk2 и Poor man’s outpainting: расширение изображения…………. 321

Скрипт Outpainting mk2………………………………………………………………………………………….. 321

Скрипт Poor man’s outpainting………………………………………………………………………………… 323

Скрипты SD upscale, Ultimate SD upscale: масштабирование (увеличение) изображения 324

Скрипт SD upscale…………………………………………………………………………………………………… 324

Скрипт Ultimate SD upscale…………………………………………………………………………………….. 324

Скрипт controlnet m2m…………………………………………………………………………………………………….. 327

Часть VI. Нейросеть внутри нейросети:
расширение ControlNet…………………………………………………………… 329

УРОК 21. Установка расширения ControlNet и загрузка моделей………… 331

Установка расширения ControlNet…………………………………………………………………………………………. 331

Загрузка моделей расширения ControlNet…………………………………………………………………………….. 331

Разница между моделями ControlNet в интерфейсах нейросетей……………………………………….. 340

УРОК 22. Настройки расширения ControlNet и создание
нового изображения на основе контуров другого изображения……………. 343

Настройки расширения ControlNet………………………………………………………………………………………… 343

Multi-ControlNet……………………………………………………………………………………………………………………….. 345

Работаем с расширением ControlNet: модель Canny……………………………………………………………. 345

ПРИЛОЖЕНИЕ. Описание файлового архива, сопровождающего книгу 351

 

Опубликовано

Бестселлер: “Stable Diffusion XL. Генерируем картинки нейросетью на своем компьютере”

Stable Diffusion XL. Генерируем картинки нейросетью на своем компьютере

Книга посвящена генерации изображений на домашнем компьютере с использованием нейросети Stable Diffusion XL. Подробно описана архитектура Stable Diffusion XL, шаг за шагом показан процесс установки и настройки программного обеспечения нейросети на домашнем компьютере, даны инструкции по выбору подходящих для задач пользователя моделей, рефайнеров, LoRA и стилей. Приведены подробные инструкции по улучшению качества получаемых изображений с использованием reForge, правильному составлению промптов, раскрыты дополнительные возможности WebUI reForge. Описаны принципы работы с механизмами улучшения генеративных картинок: семплерами и шедулерами. Показаны тонкости работы с открытыми моделями FLUX.1 и SwarmUI. Даны детальные инструкции по генерации изображений в разных стилях, включая аниме и фотореалистичные портреты, описаны скрытые возможности Stable Diffusion XL.

Для широкого круга читателей

Электронный архив с цветными иллюстрациями к книге можно скачать по ссылке https://zip.bhv.ru/9785977520638.zip, а также со страницы книги на сайте bhv.ru.

Хотите генерировать уникальные изображения с ИИ — без подписок и ограничений?
Эта книга научит вас в полной мере использовать Stable Diffusion XL на своём ПК: от установки до продвинутых техник. Вы сможете создавать:

  • Реалистичные портреты
  • Фантастические пейзажи
  • Яркие аниме-иллюстрации …и многое другое, полностью контролируя каждый этап.

Stable Diffusion XL — это “цифровая кисть” нового поколения.
Введите текст — и нейросеть превратит ваши идеи в изображения. Но чтобы раскрыть её потенциал, нужны знания. Эта книга — ваш проводник в мир генеративной графики.

Что внутри?

✔ Пошаговая установка Stable Diffusion XL на домашний компьютер
✔ Выбор моделей, рефайнеров, LoRA и стилей под ваши задачи
✔ reForge, FLUX.1, SwarmUI — инструменты для улучшения качества картинок
✔ Семплеры и шедулеры — как они влияют на результат
✔ Секреты промптов — учимся формулировать запросы точно
✔ Аниме-стиль, скрытые настройки и другие творческие возможности

Итог: вы не просто научитесь «нажимать кнопки» — вы освоите Stable Diffusion XL как профессионал, с полной свободой творчества.

Книгу “Stable Diffusion XL. Генерируем картинки нейросетью на своем компьютере” можно купить в нашем интенет-магазине.

Предисловие…………………………………………………………………………………………….. 7

Благодарности……………………………………………………………………………………………………………………………… 8

Глава 1. Введение в Stable Diffusion XL…………………………………………………….. 9

Приступаем…………………………………………………………………………………………………………………………………… 9

Stable Diffusion XL в облаке……………………………………………………………………………………………………… 10

Локальные дистрибутивы Stable Diffusion………………………………………………………………………………. 10

Какие вообще бывают сборки?…………………………………………………………………………………………. 12

Первый запуск……………………………………………………………………………………………………………………………. 12

Как составить запрос………………………………………………………………………………………………………………… 20

Продвинутые возможности……………………………………………………………………………………………………….. 21

Недостатки Fooocus…………………………………………………………………………………………………………………… 23

Достоинства……………………………………………………………………………………………………………………………….. 24

Как дела с законностью?…………………………………………………………………………………………………………… 25

Глава 2. Выбираем модели, рефайнеры, лоры и стили……………………………. 26

Различия между пресетами……………………………………………………………………………………………………….. 26

Базовые модели………………………………………………………………………………………………………………………….. 27

Универсальные модели, пригодные для реализма…………………………………………………………………. 30

Специализированные модели: аниме………………………………………………………………………………………. 36

Модели-рефайнеры……………………………………………………………………………………………………………………. 37

Стили…………………………………………………………………………………………………………………………………………… 38

Лоры……………………………………………………………………………………………………………………………………………. 43

Глава 3. ReForge: улучшаем картинки, генерируемые Stable Diffusion…… 47

Stable Diffusion WebUI и его производные………………………………………………………………………………. 47

Краткая предыстория………………………………………………………………………………………………………………… 48

Установка и начало работы……………………………………………………………………………………………………… 49

Пути к моделям…………………………………………………………………………………………………………………… 50

Обновление существующей сборки………………………………………………………………………………….. 51

Сохранение настроек………………………………………………………………………………………………………… 58

Дополнительные настройки……………………………………………………………………………………………… 58

Работа со стилями……………………………………………………………………………………………………………………… 59

Hires.fix: генерируем картинки высокого разрешения……………………………………………………………. 61

Где брать модели……………………………………………………………………………………………………………….. 64

Что рекомендуют на Reddit, и почему не стоит слепо доверять рекомендациям…………. 64

Для иллюстраций, аниме и изображений в стиле штриховой графики…………………………. 65

Для псевдореалистичных изображений и графики в стиле 2.5D и 3D…………………………… 66

Для фотореалистичных изображений……………………………………………………………………………… 66

Глава 4. FLUX.1 и SwarmUI. Генерируем картинки
новой открытой моделью……………………………………………………………………….. 69

Что за Flux?…………………………………………………………………………………………………………………………………. 69

Возможности Flux………………………………………………………………………………………………………………………. 70

Comfy и SwarmUI………………………………………………………………………………………………………………………. 73

Установка и начало работы……………………………………………………………………………………………………… 74

Шпаргалка: ограничения модели FLUX.1 (dev)………………………………………………………………. 76

Дополнительные настройки……………………………………………………………………………………………………… 76

Рука-лицо……………………………………………………………………………………………………………………………………. 78

Конфиги и пресеты…………………………………………………………………………………………………………………….. 82

Ждем Stable Diffusion 3 или не ждем?………………………………………………………………………………………. 83

Выводы……………………………………………………………………………………………………………………………………….. 85

Глава 5. Фишки Flux.1. Добиваемся лучших картинок
от генеративной модели…………………………………………………………………………. 86

Поддержка Flux в WebUI Forge…………………………………………………………………………………………………. 86

NF4, FP16, FP8, Q8, GGUF: в чем разница?………………………………………………………………………………. 87

Шпаргалка: какие файлы качать……………………………………………………………………………………………… 88

Запускаем Flux на старых видеокартах………………………………………………………………………………….. 90

Текстовые декодеры и квантизация моделей………………………………………………………………………….. 91

Модели и текстовые декодеры………………………………………………………………………………………….. 91

Квантование текстовых декодеров T5XXL……………………………………………………………………… 91

Квантование диффузионных моделей……………………………………………………………………………… 92

Решетка на плавных градиентах……………………………………………………………………………………………… 93

Генерируем картинки в разрешении 2К…………………………………………………………………………………… 94

Негативные ключевые слова…………………………………………………………………………………………………….. 95

Способ 1: Flux Guidance Scale…………………………………………………………………………………………… 96

Способ 2: Dynamic Thresholding……………………………………………………………………………………….. 96

Способ 3: Perp-Neg……………………………………………………………………………………………………………… 97

Раскрываем креативность модели……………………………………………………………………………………………. 97

Выводы……………………………………………………………………………………………………………………………………… 101

Глава 6. Семплеры и шедулеры. Разбираем два важных механизма улучшения генеративных картинок………………………………………………………………………………………………. 102

Семплер и шедулер: что это такое…………………………………………………………………………………………. 102

Семплеры………………………………………………………………………………………………………………………………….. 105

Устаревшие семплеры……………………………………………………………………………………………………… 105

Обычные дифференциальные уравнения: семплеры класса ODE……………………………….. 105

Семплеры класса ancestral………………………………………………………………………………………………. 107

DPM, DPM++ и их производные……………………………………………………………………………………… 107

SDE: щепотка случайности…………………………………………………………………………………………….. 109

Специализированные семплеры…………………………………………………………………………………….. 111

Лучшее — враг хорошего?……………………………………………………………………………………………… 111

Шедулеры…………………………………………………………………………………………………………………………………. 116

Uniform: отправная точка……………………………………………………………………………………………….. 116

Karras…………………………………………………………………………………………………………………………………. 117

Экспоненциальный шедулер…………………………………………………………………………………………… 117

Align Your Steps…………………………………………………………………………………………………………………. 118

Beta                                                                                                                                                                 118

Шпаргалка……………………………………………………………………………………………………………………………….. 120

Глава 7. Карта мира генеративного ИИ. Выбираем модель и интерфейс, разбираемся с терминами…………………………………………………………………………………………………………….. 122

Что нужно, чтобы начать создавать картинки?……………………………………………………………………. 122

Видеокарта……………………………………………………………………………………………………………………….. 122

Софт…………………………………………………………………………………………………………………………………… 123

Что из этого выбрать?……………………………………………………………………………………………………………… 124

Модели и архитектуры……………………………………………………………………………………………………………. 125

Базовые и дополнительные модели……………………………………………………………………………………….. 127

Из каких частей состоит базовая модель………………………………………………………………………. 128

Обученные модели и ремиксы………………………………………………………………………………………… 129

Где брать базовые модели………………………………………………………………………………………………. 129

Глава 8. Расширяем возможности WebUI reForge, чтобы повысить комфорт и качество            131

WebUI reForge dev……………………………………………………………………………………………………………………. 131

Начало работы: раскладываем расширения по полочкам…………………………………………………. 132

Расширения-улучшения………………………………………………………………………………………………………….. 134

Быстрый выбор соотношения сторон…………………………………………………………………………….. 134

Сохранение конфигурации……………………………………………………………………………………………… 134

Очередь задач…………………………………………………………………………………………………………………… 135

Превью моделей……………………………………………………………………………………………………………….. 136

Теги Danbooru для аниме-моделей…………………………………………………………………………………. 137

Динамические запросы……………………………………………………………………………………………………. 138

Детализация рук и лиц…………………………………………………………………………………………………………….. 139

Улучшайзеры…………………………………………………………………………………………………………………………… 142

Механизм внутреннего внимания…………………………………………………………………………………… 142

Бесплатный ланч……………………………………………………………………………………………………………… 143

Выводы……………………………………………………………………………………………………………………………………… 144

Глава 9. Нарушаем правила и расширяем границы возможного при генерации картинок         145

Борьба с выгоранием………………………………………………………………………………………………………………. 145

Низкие значения CFG: высокая креативность, но низкий контраст…………………………….. 146

Высокие значения CFG: точное следование запросу и детализация, сопровождаемые «выгоранием»    149

DynamicThresholding (CFG-Fix)……………………………………………………………………………… 149

RescaleCFG………………………………………………………………………………………………………………. 149

AutomaticCFG………………………………………………………………………………………………………….. 151

Warp Drive: ускорение генерации………………………………………………………………………….. 153

APG’s now your CFG………………………………………………………………………………………………… 154

Skimmed CFG…………………………………………………………………………………………………………… 156

Высокое разрешение в один проход………………………………………………………………………………………. 157

А теперь — все в одном…………………………………………………………………………………………………………… 163

Все расширения в одном файле……………………………………………………………………………………………… 166

Глава 10. Как правильно просить Stable Diffusion нарисовать картинку. 167

Кого будем спрашивать?………………………………………………………………………………………………………… 168

Оператор BREAK…………………………………………………………………………………………………………………….. 171

Негативные ключевые слова………………………………………………………………………………………………….. 174

Весовые коэффициенты…………………………………………………………………………………………………………… 175

Котапельсин или апельсокот?………………………………………………………………………………………………… 176

Текстовые инверсии…………………………………………………………………………………………………………………. 178

Composable Diffusion………………………………………………………………………………………………………………. 179

Шпаргалка по составлению запросов…………………………………………………………………………………… 180

Глава 11. Разбираемся с моделями для создания картинок в стиле аниме 181

Чего не будет в этой главе………………………………………………………………………………………………………. 181

Аниме: базовые модели и ремиксы………………………………………………………………………………………… 182

Pony…………………………………………………………………………………………………………………………………… 182

Illustrious……………………………………………………………………………………………………………………………. 182

Animagine………………………………………………………………………………………………………………………….. 183

Pony Diffusion: во что превратилась модель для генерации пушистых зверушек…………….. 183

Score_9, score_8_up и прочие неприятности…………………………………………………………………………. 184

Illustrious: «неэтичная» альтернатива от корейских разработчиков………………………………….. 186

Animagine XL 4.0……………………………………………………………………………………………………………………… 188

Запрягаем в одну телегу коня и трепетную лань: фотореалистичное аниме…………………….. 189

Слегка реалистичное аниме и 3DCG……………………………………………………………………………………… 191

А фотореалистичные модели Illustrious бывают?…………………………………………………………………. 192

А фотореалистичные модели Animagine?……………………………………………………………………………… 192

Ближайшее будущее……………………………………………………………………………………………………………….. 194

Pony…………………………………………………………………………………………………………………………………… 194

Animagine………………………………………………………………………………………………………………………….. 195

Illustrious……………………………………………………………………………………………………………………………. 195

NoobAI………………………………………………………………………………………………………………………………. 195

Выводы……………………………………………………………………………………………………………………………………… 196

Глава 12. Как создаются модели для рисования откровенных сцен……… 197

Обученные модели и ремиксы………………………………………………………………………………………………… 197

Цензура и борьба с ней: ранние этапы………………………………………………………………………………….. 198

Фотореалистичные модели глубокого обучения………………………………………………………………….. 199

Ближайшее будущее……………………………………………………………………………………………………………….. 203

Flux.dev……………………………………………………………………………………………………………………………… 203

SD 3.5…………………………………………………………………………………………………………………………………. 203

Lumina 2……………………………………………………………………………………………………………………………. 203

AuraFlow……………………………………………………………………………………………………………………………. 203

SDXL………………………………………………………………………………………………………………………………….. 204

Выводы……………………………………………………………………………………………………………………………………… 204

Предметный указатель…………………………………………………………………………. 205