📖 Цифровая магия — 2
Я раздобыл более качественную иллюстрацию в Вики (Карл Булла, «Управленческая элита Российской Империи (1802-1917). Лики России». С-Петербург, 2008).
И тут результаты работы ИИ уже другие (см. прошлый пост на эту тему).
На исходной фотографии уже больше деталей, нейросети приходится меньше додумывать, поэтому разница между кадрами уже не такая шокирующая. Тем не менее, при обработке такого источника гораздо лучше проработана ограда, полукруглое окно здания слева сделано более детально: видно, что две верхние створки там открываются. Также проявился извозчик на санях перед входом. Добавилась погода: видно, что идёт снег. Нейросеть также попыталась нарисовать лепнину над окнами второго этажа.
Вместе с тем, нейросеть тщательно восстановила муар в левой части снимка, который получился при сканировании изображения на бумаге. А вот что практически ни одна модель не умеет делать, так это работать с текстом. Gigapixel тут не исключение. На здании между третим и четвёртым этажом размещена вывеска, вероятнее всего «Госдарственный контроль». На исходном изображении можно даже разобрать несколько букв. А на восстановленном снимке — графическая мешанина, потому что модель не знает, как выглядят буквы. Тут ещё есть, над чем поработать.
Ну, и самое печальное: скорость работы. На моём далеко не самом медленном Macbook Pro Intel Core i9 + Radeon Pro 5600M 8 ГБ картинка обрабатывалась сильно больше часа. Такое решение явно не для работы, а так, для экспериментов. Конечно, на новейших машинах это всё будет быстрее, но всё равно, думаю, речь будет идти самое быстрое — о минутах. Или нужно использовать облачные решения, там за счёт использования производительных кластеров обработка будет быстрее.
А вообще, тема очень интересная, прогресс тут очень быстрый. Если кому интересно более подробно копнуть, есть отличная статья «500 мегапикселей на старую камеру» от Nature Photo Team.