Резюме
- Генерация изображений GPT-4o позволяет создавать безупречные фотографии.
- Результаты колоризации впечатляют, но это всего лишь изображения, а не настоящие колоризации.
- Реальная раскраска сохраняет историю, тогда как раскраска, созданная искусственным интеллектом, не оправдывает ожиданий.
DALL-E был заменен новым движком генерации изображений под GPT-4o, и, черт возьми, это большой скачок. Кажется, что мало что может сделать эта новая технология генерации изображений, но как насчет добавления цвета к старым черно-белым фотографиям?
Эта идея пришла мне в голову, когда я просматривал некоторые исторические фотографии и их тщательно раскрашенные версии, поэтому я решил проверить, насколько хорошо это передовое программное обеспечение для генерации изображений может справиться с этой задачей.
Генерация изображений GPT-4o может творить чудеса
Переход от DALL-E к новой модели генерации изображений GPT-4o имеет важное значение. У DALL-E был этот предательский стиль, который портил все, даже когда вы стремились к фотореализму, но эта новая модель может создавать фотографии, которые практически безупречны. Рассмотрим эту «фотографию» Альберта Эйнштейна, работающего на MacBook.
Если присмотреться, то можно заметить некоторые недостатки, но я думаю, что если не считать анахронизма, который я добавил, чтобы дать понять, что это не настоящая фотография, она выдержит проверку на распознавание у многих людей.
Что меня также бесконечно впечатлило, так это то, как система генерации изображений интегрировалась с самим ChatGPT. Поскольку ChatGPT может видеть и понимать изображения, вы можете использовать их для руководства процессом генерации. Например, здесь я предоставляю образец изображения и прошу бота показать мне, как выглядел бы капитан Пикард из Star Trek с маллетом.
Обратите внимание, что он достаточно умен, чтобы не создавать его с рыбой, но помимо этого программное знание мира формирует подсказку (которую мы не видим), и результаты ошеломляют. Забудьте о переднем плане; посмотрите, насколько точно были имитированы фон и композиция оригинального изображения.
Итак, могу ли я вставить черно-белую фотографию и попросить выдать мне ее цветную версию?
Результаты запросов на раскрашивание впечатляют
Я решил посетить сайт Библиотеки Конгресса и взять несколько изображений из раздела «Бесплатно для использования», чтобы протестировать. Я выбрал изображение и попросил ChatGPT создать цветное фото.
Закрыто
В результате мы получаем нечто, выглядящее довольно прилично. Хотя, это также ушло и очистило изображение, что не совсем то, что я хочу. Поэтому мне часто приходится делать повторный запрос, чтобы попытаться сохранить исходные недостатки изображения и просто добавить к нему цвета. Я добавил несколько фотографий в этот микс таким образом, и в целом результаты довольно убедительны, но только на первый взгляд.
Но посмотрите внимательно!
За исключением случаев, когда вы внимательно смотрите, а иногда даже не смотрите который При более внимательном рассмотрении становится очевидно, что это не раскрашенная оригинальная фотография, а совершенно новое изображение, созданное так, чтобы походить на оригинальную фотографию.
Очевидно, учитывая, как работает эта технология, это не слишком удивительно, но если только фотография не является фотографией знаменитого человека, вроде Линкольна или Эйнштейна, генератор изображений не может сохранить лицо исходного человека. Иногда это срабатывает нормально, но я готов поспорить, что кто-то, кто действительно знает человека, о котором идет речь, сразу заметит, что что-то не так.
Например, я попросил его раскрасить мою фотографию, и я не знаю, кто этот парень!
Закрыто
Реальная раскраска сохраняет исходное фото
Людям, которые занимаются настоящей работой по колоризации, сегодня гораздо проще справляться с этой задачей благодаря цифровым инструментам, но это все еще кропотливый процесс, основанный на их историческом опыте и исследованиях того, какие цвета, скорее всего, будут правильными для определенного времени и места.
Если положить раскрашенную фотографию рядом с оригиналом, фотографии будут выглядеть идентичными, за исключением цвета и других ретушей. История одновременно сохраняется и оживает. Прямо сейчас, несмотря на то, насколько впечатляющим является GPT-4o как генератор изображений, он пока не может этого сделать.
Не подходит для важных фотографий.
Играть с колоризацией, особенно для фотографий с узнаваемыми историческими личностями, довольно весело. Однако дело в том, что это не настоящая колоризация.
Так что если у вас есть фотографии, которые нужно раскрасить, особенно семейные фотографии, то я бы пока не советовал пробовать использовать этот метод. Однако есть онлайн-сервисы ИИ, которые были созданы специально для этой работы, и мне было любопытно посмотреть, справятся ли они с этим лучше. Большинство из них позволят вам раскрасить несколько изображений бесплатно, и вот как выглядела моя фотография после обработки колоризатором Deep AI. Оригинал справа.
Закрыто
Это отлично справилось с сохранением оригинальной фотографии, но, честно говоря, цвета выглядят не очень, и пропущено несколько пятен. Я также попробовал Palette, который действительно отлично справился, и это то, что я бы использовал, если бы у меня были семейные фотографии, которые мне нужно было бы привести в порядок.
Я очень доволен этим, но мне все еще не терпится увидеть, на что способны такие мощные и свободные таланты будущих моделей, как генератор изображений GPT-4o, на которые не способны эти специализированные колоризаторы.