10 Landmark Projects Across 50+ Years — Convergence Patterns, Anti-Convergence Mechanisms, and Positioning of Gen-Emerge
10 ключевых проектов за 50+ лет — паттерны конвергенции, механизмы противодействия и позиционирование Gen-Emerge
From the extensive field of generative art, projects were selected according to five criteria of relevance to gen-emerge: (1) autonomy — serial generation without manual triggering of each iteration; (2) feedback — a mechanism for evaluation/selection influencing subsequent generations; (3) continuous evolution — temporal operation with accumulated history; (4) diversity problem — explicit or implicit encounter with convergence; (5) scale — the project produced results beyond a prototype stage.
From approximately 30 identified projects and experiments, 10 were selected as most significant, organized across three eras: pre-deep-learning (before 2014), the GAN era (2014–2021), and the LLM + diffusion era (2021–present).
AARON is recognized as the first long-lived autonomous art system. Developed by artist Harold Cohen as a C/Lisp expert system over 43 years, it generated drawings and paintings autonomously using codified knowledge of composition, perspective, and anatomy. Decisions on composition, color, and placement were made through internal rules with stochastic elements; output was produced through physical plotters and custom painting machines.
The system underwent approximately 60 iterations over its lifetime: from abstract lines (1970s) through figures and spaces (1980s) to autonomous color selection (1990s) and abstract painting (2000s). Each iteration was a result of manual codebase updates by Cohen.
AARON converged to Cohen's own style — described as "an expert system that just automated the stylistic quirks specific to his own practice." Even with stochastic elements, the output space was bounded by rules encoded by a single individual. By 2009, Cohen experienced a creative crisis and returned to manual painting over AARON's outputs, recognizing that "creativity lay in neither the programmer alone nor in the program alone, but in the dialog between program and programmer."
A pioneering project in the evolution of visual forms through genetic algorithms. Genetic Images (1991) was the first published work on evolving 2D images from mathematical formula trees. Galápagos (1997) was an interactive installation at ICC Tokyo where visitors evolved 3D creatures by standing before screens. The genotype comprised a tree of mathematical functions (sin, cos, noise, etc.); the phenotype was an image computed from the tree for each pixel.
A distributed system for evolving fractal flame animations, operating continuously for 27 years. Over 450,000 computers simultaneously render "sheep"; users vote for favorites; popular specimens mate and mutate. The fitness function is weighted by viewing time.
After 11 weeks of data analysis, Draves concluded that the system functions "more as an amplifier of its human collaborators' creativity rather than as a traditional genetic algorithm that optimizes a fitness function." Mass voting creates a median-taste bias. Diversity is maintained through manual submissions by "shepherds" — approximately 5–20 active participants who inject novel genetic material into the flock.
An online platform for collaborative interactive evolution of images using CPPN-NEAT (Compositional Pattern Producing Networks evolved by NeuroEvolution of Augmenting Topologies). The key innovation was "branching" — any user could continue evolving any other user's image.
Stanley demonstrated on Picbreeder that "pursuing an objective limits evolution" — images found through free branching could not be rediscovered when made explicit targets of the same algorithm. A skull was found by branching from an alien face, branched from a butterfly, branched from a blob. This became the empirical foundation for Novelty Search and the Quality-Diversity algorithm family.
The Creative Adversarial Network is a GAN modification where the generator receives two contradictory signals: (1) "does this look like art?" (minimize deviation from art distribution) and (2) "which style is this?" (maximize style ambiguity). A discriminator trained on 80K WikiArt images spanning five centuries provides both signals.
The theoretical foundation is Berlyne's arousal potential theory (1970s): maximal aesthetic pleasure at moderate novelty — familiar enough to be recognized as art, novel enough to surprise. In blind tests, humans could not distinguish AICAN outputs from works by contemporary artists at leading art fairs.
A program-"artist" aiming to be accepted as an autonomous creative agent. The focus is not on quality optimization but on demonstrating three properties: skill, appreciation, and imagination. Before each portrait, The Painting Fool reads newspapers, determines the day's emotional tone, and selects style and palette accordingly — with the capacity to refuse to paint if the news is too depressing.
Conceived as an "autonomous artificial artist" — a sovereign creative spirit generating original art through multi-party computation, making it impossible for any single participant to reconstruct the full model. Governance operates through a DAO with tokens.
A platform for collaborative generative art — spiritual successor to Picbreeder built on StyleGAN/BigGAN. With 14M+ users and 300M+ generated images, it employs "gene sliders" (semantic axes in latent space) and "breeding" (weighted interpolation between latent vectors). Full lineage tracking is maintained for each image.
The most proximate public analog to gen-emerge. A Decentralized Autonomous Artist operating continuously since October 2021 (~4.5 years). The system generates ~70K images per week; a taste model selects 350 for DAO voting; one canonical work per week is minted as an NFT and auctioned on SuperRare (first work: ~$325,000).
| Dimension | Botto | Gen-Emerge |
|---|---|---|
| Human participants | 5,000+ DAO voters | 1 human curator |
| Generation volume | ~70K/week | 1–4/cycle |
| Selection mechanism | Taste model trained on votes | 8 feedback channels |
| Diversity strategy | Volume (statistical) | Architecture (multi-model, QD) |
| Prompt generation | Random combinations | Context-aware (Snapshot → Ontology) |
Botto evolves aesthetically through "creative periods" (Genesis, Fragmentation, etc.). The taste model, trained on votes, creates a feedback loop: popular works breed similar works → convergence to median DAO taste. Solutions include periodic creative period transitions, addition of new models (through BIP — Botto Improvement Proposals), and theme voting via LLM.
Application of Quality-Diversity algorithms (MAP-Elites) to the latent space of generative models (GAN, Stable Diffusion). A MAP-Elites archive (20×20 grid) stores latent vectors; CLIP evaluates fitness; diversity metrics are either manual (CLIP-attributes) or learned (QDHF — contrastive learning on human similarity judgments via DreamSim).
Key finding: CLIP embedding distance correlates poorly with perceived diversity — calibration on human judgments is required. QDHF-learned diversity metrics outperform manual axes because they reflect what humans consider "different," not what is metrically distant in CLIP space.
| Project | Period | Generation | Feedback | Diversity Mechanism | Convergence Problem |
|---|---|---|---|---|---|
| AARON | 1973–2016 | Rule-based (Lisp) | Author manually | Manual rule updates | Author style lock-in |
| Karl Sims | 1991–1997 | Genetic algo | Interactive (human) | User diversity | Fatigue + beauty bias |
| Electric Sheep | 1999–present | Fractal Flame | Crowd voting (450K) | Shepherd submissions | Median taste |
| Picbreeder | 2007–2021 | CPPN-NEAT | Interactive + branch | Branching lineages | Community decay |
| CAN/AICAN | 2017 | Modified GAN | Adversarial | Style ambiguity loss | Mode collapse |
| Painting Fool | 2001–present | Multi-technique | Self-evaluation | Capability expansion | Author bias |
| Abraham/Eden | 2017–present | CLIP+VQGAN → SD | DAO governance | Decentralized data | Model bias |
| Botto | 2021–present | SD + taste model | DAO voting (5K+) | Volume + periods | Taste model convergence |
| LSI+QDHF | 2020–2024 | SD + MAP-Elites | CLIP + human cal. | QD archive | Archive saturation |
| Artbreeder | 2018–present | StyleGAN/BigGAN | User sliders | Community branching | GAN aesthetic ceiling |
| Project | Models | Memory | Human Role | Anti-Convergence |
|---|---|---|---|---|
| AARON | 1 (rule system) | Code = memory | Author-programmer | Manual code changes |
| Electric Sheep | 1 (Flame algo) | Flock genome | Voter + shepherds | External injection |
| Picbreeder | 1 (CPPN-NEAT) | Lineage tree | Selector + brancher | Branching + NEAT |
| CAN | 1 (GAN) | None | None (fully auto) | Adversarial style loss |
| Botto | Multiple | Taste model | DAO voting | Periods + new models |
| LSI+QDHF | 1 (SD) + MAP-Elites | Archive grid | Preference calibration | QD archive + emitters |
| Artbreeder | Multiple GANs | Lineage + community | Slider/breeder | Mass user diversity |
All 10 projects exhibit convergence. Sources differ, but five recurring patterns have been identified:
From the 10 projects, six mechanisms with confirmed effectiveness have been identified:
| # | Mechanism | Source Projects | Gen-Emerge Implementation |
|---|---|---|---|
| 1 | External injection | Electric Sheep (shepherds), Botto (creative periods) | T4d — curriculum from external data |
| 2 | Branching / stepping stones | Picbreeder, Artbreeder | B11 — stepping stones archive |
| 3 | Adversarial style pressure | CAN/AICAN | T4e/T4f, ε architecture |
| 4 | QD archive | LSI+QDHF | B6 — QD-score + coverage |
| 5 | Multi-model diversity | Botto, Artbreeder | η (ensemble), θ (HACN clusters) |
| 6 | Human-calibrated metrics | QDHF, Artbreeder genes | T2e — QDHF-calibrated descriptors |
Four problems remain unsolved across all reviewed projects:
Based on this systematic review, gen-emerge is identified as the first system that simultaneously:
The nearest analog is Botto, which resolves diversity through volume (70K/week) and crowd (5K+ voters). Gen-emerge must solve the same problem through architecture (multi-model, adversarial, QD) at 1–4 images/cycle with a single human. This constitutes a more challenging engineering problem, but a potentially more elegant solution.
Из обширного поля генеративного искусства проекты отбирались по пяти критериям релевантности для gen-emerge: (1) автономность — серийная генерация без ручного запуска каждой итерации; (2) обратная связь — наличие механизма оценки/отбора, влияющего на последующие поколения; (3) непрерывная эволюция — работа во времени с накоплением истории; (4) проблема разнообразия — явное или неявное столкновение с конвергенцией; (5) масштаб — проект не остался прототипом, имеются результаты и данные.
Из приблизительно 30 выявленных проектов и экспериментов были отобраны 10 наиболее значимых, организованных по трём эрам: доглубинного обучения (до 2014), эра GAN (2014–2021) и эра LLM + diffusion (2021–настоящее время).
AARON признаётся первой долгоживущей автономной арт-системой в мире. Разработанная художником Гарольдом Коэном как экспертная система на C/Lisp на протяжении 43 лет, она автономно генерировала рисунки и картины с использованием кодифицированных знаний о композиции, перспективе и анатомии. Решения о композиции, цвете и расположении принимались на основе внутренних правил со стохастическими элементами; вывод осуществлялся через физические плоттеры и специальные рисовальные машины.
Система прошла через приблизительно 60 итераций за свою жизнь: от абстрактных линий (1970-е) через фигуры и пространства (1980-е) к автономному выбору цвета (1990-е) и абстрактной живописи (2000-е). Каждая итерация была результатом ручного обновления кодовой базы Коэном.
AARON конвергировал к собственному стилю Коэна — система описывается как «экспертная система, автоматизировавшая стилистические особенности практики самого автора». Даже со стохастическими элементами пространство выходов было ограничено правилами, закодированными одним человеком. К 2009 году Коэн пережил творческий кризис и вернулся к ручной живописи поверх выходов AARON, осознав: «творчество заключалось не в программисте и не в программе по отдельности, а в диалоге между программой и программистом».
Пионерский проект по эволюции визуальных форм посредством генетических алгоритмов. Genetic Images (1991) — первая публикация об эволюции 2D-изображений из деревьев математических формул. Galápagos (1997) — интерактивная инсталляция в ICC Tokyo, где посетители эволюционировали 3D-существ.
Распределённая система эволюции фрактальных анимаций, непрерывно работающая 27 лет. Свыше 450 000 компьютеров одновременно рендерят «овец»; пользователи голосуют за лучших; популярные особи спариваются и мутируют.
По результатам анализа 11 недель данных Дрейвс заключил, что система функционирует «скорее как усилитель творчества человеческих соавторов, нежели как традиционный генетический алгоритм, оптимизирующий фитнес-функцию». Массовое голосование создаёт аттрактор медианного вкуса. Разнообразие поддерживается через ручные инъекции «пастухами» (shepherds) — примерно 5–20 активными участниками, внедряющими новый генетический материал.
Онлайн-платформа коллаборативной интерактивной эволюции изображений с использованием CPPN-NEAT. Ключевая инновация — «ветвление» (branching): любой пользователь мог продолжить эволюцию любого чужого изображения.
Стэнли продемонстрировал на Picbreeder, что «преследование цели ограничивает эволюцию» — изображения, найденные через свободное ветвление, не могли быть переоткрыты при использовании того же алгоритма с этими изображениями в качестве явных целей. Это стало эмпирическим основанием для алгоритма Novelty Search и всего семейства QD-алгоритмов.
Креативная состязательная сеть — модификация GAN, в которой генератор получает два противоречивых сигнала: (1) «выглядит ли это как искусство?» (минимизация отклонения от распределения искусства) и (2) «к какому стилю это относится?» (максимизация стилевой неопределённости). Дискриминатор обучен на 80 000 изображений WikiArt, охватывающих пять веков.
Теоретическое основание — теория потенциала возбуждения Берлайна (1970-е): максимальное эстетическое удовольствие при умеренной новизне. В слепых тестах люди не могли отличить выходы AICAN от работ современных художников на ведущих ярмарках.
Программа-«художник», стремящаяся быть принятой как самостоятельный креативный агент. Фокус — не на оптимизации качества, а на демонстрации трёх свойств: мастерства, оценки и воображения. Перед каждым портретом система читает газеты, определяет эмоциональный тон дня и выбирает стиль и палитру — с возможностью отказаться рисовать, если новости слишком мрачны.
Задуман как «автономный искусственный художник» — sovereign creative spirit, генерирующий оригинальное искусство через многосторонние вычисления (multi-party computation), делающие невозможным восстановление полной модели любым одним участником.
Платформа коллаборативного генеративного искусства на базе StyleGAN/BigGAN. 14M+ пользователей, 300M+ сгенерированных изображений. Используются «ген-слайдеры» (семантические оси в латентном пространстве) и «скрещивание» (взвешенная интерполяция между латентными векторами). Для каждого изображения ведётся полная генеалогия.
Наиболее близкий публичный аналог gen-emerge. Децентрализованный автономный художник, непрерывно работающий с октября 2021 (~4.5 года). Система генерирует ~70 000 изображений в неделю; вкусовая модель отбирает 350 для голосования DAO; одна каноническая работа в неделю минтится как NFT и продаётся на SuperRare (первая работа: ~$325 000).
| Измерение | Botto | Gen-Emerge |
|---|---|---|
| Участники-люди | 5 000+ голосующих DAO | 1 человек-куратор |
| Объём генерации | ~70 000/неделю | 1–4/цикл |
| Механизм отбора | Вкусовая модель на голосах | 8 каналов обратной связи |
| Стратегия разнообразия | Объём (статистическая) | Архитектура (мультимодельная, QD) |
| Генерация промптов | Случайные комбинации | Контекстно-зависимая (Snapshot → Ontology) |
Botto эволюционирует эстетически через «творческие периоды» (Genesis, Fragmentation и т.д.). Вкусовая модель, обученная на голосах, создаёт петлю обратной связи: популярные работы порождают похожие → конвергенция к медианному вкусу DAO. Решения включают периодическую смену творческих периодов, добавление новых моделей (через BIP) и голосование за темы через LLM.
Применение алгоритмов Quality-Diversity (MAP-Elites) к латентному пространству генеративных моделей (GAN, Stable Diffusion). Архив MAP-Elites (сетка 20×20) хранит латентные вектора; CLIP оценивает качество; метрики разнообразия — либо ручные (CLIP-атрибуты), либо обученные (QDHF — контрастивное обучение на человеческих суждениях о сходстве через DreamSim).
Ключевой результат: расстояние в CLIP-эмбеддинговом пространстве плохо коррелирует с воспринимаемым разнообразием — необходима калибровка по человеческим суждениям. Обученные QDHF метрики разнообразия превосходят ручные оси, поскольку отражают то, что люди считают «различным».
| Проект | Период | Генерация | Обратная связь | Механизм разнообразия | Проблема конвергенции |
|---|---|---|---|---|---|
| AARON | 1973–2016 | На правилах (Lisp) | Автор вручную | Ручное обновление правил | Фиксация на стиле автора |
| Карл Симс | 1991–1997 | Генетический алг. | Интерактивная (человек) | Разнообразие пользователей | Утомление + bias красоты |
| Electric Sheep | 1999–н.в. | Fractal Flame | Голосование толпы (450K) | Инъекции пастухов | Медианный вкус |
| Picbreeder | 2007–2021 | CPPN-NEAT | Интерактивная + ветвление | Ветвящиеся линии | Угасание сообщества |
| CAN/AICAN | 2017 | Модиф. GAN | Состязательная | Стилевая неопределённость | Mode collapse |
| Painting Fool | 2001–н.в. | Мульти-техника | Самооценка | Расширение возможностей | Bias автора |
| Abraham/Eden | 2017–н.в. | CLIP+VQGAN → SD | Управление DAO | Децентрализованные данные | Bias модели |
| Botto | 2021–н.в. | SD + вкусовая модель | Голосование DAO (5K+) | Объём + периоды | Конвергенция вкусовой модели |
| LSI+QDHF | 2020–2024 | SD + MAP-Elites | CLIP + чел. калибровка | QD-архив | Насыщение архива |
| Artbreeder | 2018–н.в. | StyleGAN/BigGAN | Слайдеры пользователя | Коммунитарное ветвление | Потолок GAN-эстетики |
Все 10 проектов демонстрируют конвергенцию. Источники различаются, однако было идентифицировано пять повторяющихся паттернов:
| # | Механизм | Проекты-источники | Реализация в gen-emerge |
|---|---|---|---|
| 1 | Внешняя инъекция | Electric Sheep (пастухи), Botto (творческие периоды) | T4d — учебный план из внешних данных |
| 2 | Ветвление / stepping stones | Picbreeder, Artbreeder | B11 — архив stepping stones |
| 3 | Adversarial давление стиля | CAN/AICAN | T4e/T4f, архитектура ε |
| 4 | QD-архив | LSI+QDHF | B6 — QD-score + покрытие |
| 5 | Мультимодельное разнообразие | Botto, Artbreeder | η (ансамбль), θ (HACN-кластеры) |
| 6 | Калиброванные метрики | QDHF, Artbreeder | T2e — QDHF-калиброванные дескрипторы |
Четыре проблемы остаются нерешёнными во всех рассмотренных проектах:
На основании данного систематического обзора gen-emerge идентифицируется как первая система, которая одновременно:
Ближайший аналог — Botto, который решает разнообразие через объём (70 000/неделю) и толпу (5 000+ голосующих). Gen-emerge должен решить ту же проблему через архитектуру (мультимодельность, adversarial, QD) при 1–4 изображениях за цикл и одном человеке. Это более сложная инженерная задача, но потенциально более элегантное решение.