Research / Article 05Статья 05
Research Исследование

Autonomous Generative Art Systems:
A Systematic Review

Автономные генеративные арт-системы:
систематический обзор

10 Landmark Projects Across 50+ Years — Convergence Patterns, Anti-Convergence Mechanisms, and Positioning of Gen-Emerge

10 ключевых проектов за 50+ лет — паттерны конвергенции, механизмы противодействия и позиционирование Gen-Emerge

February 2026
Февраль 2026
30 min read
30 мин чтения

1. Selection Methodology

From the extensive field of generative art, projects were selected according to five criteria of relevance to gen-emerge: (1) autonomy — serial generation without manual triggering of each iteration; (2) feedback — a mechanism for evaluation/selection influencing subsequent generations; (3) continuous evolution — temporal operation with accumulated history; (4) diversity problem — explicit or implicit encounter with convergence; (5) scale — the project produced results beyond a prototype stage.

From approximately 30 identified projects and experiments, 10 were selected as most significant, organized across three eras: pre-deep-learning (before 2014), the GAN era (2014–2021), and the LLM + diffusion era (2021–present).

TIMELINE OF AUTONOMOUS GENERATIVE ART SYSTEMS Pre-Deep Learning GAN Era LLM + Diffusion Era AARON1973 Sims1991 E.Sheep1999 P.Fool2001 Picbreeder2007 CAN2017 Abraham2017 Artbreeder2018 LSI+QDHF2020 Botto2021 gen-emerge2025

2. Pre-Deep-Learning Era

2.1 AARON (Harold Cohen, 1973–2016)

AARON is recognized as the first long-lived autonomous art system. Developed by artist Harold Cohen as a C/Lisp expert system over 43 years, it generated drawings and paintings autonomously using codified knowledge of composition, perspective, and anatomy. Decisions on composition, color, and placement were made through internal rules with stochastic elements; output was produced through physical plotters and custom painting machines.

The system underwent approximately 60 iterations over its lifetime: from abstract lines (1970s) through figures and spaces (1980s) to autonomous color selection (1990s) and abstract painting (2000s). Each iteration was a result of manual codebase updates by Cohen.

Convergence Pattern

AARON converged to Cohen's own style — described as "an expert system that just automated the stylistic quirks specific to his own practice." Even with stochastic elements, the output space was bounded by rules encoded by a single individual. By 2009, Cohen experienced a creative crisis and returned to manual painting over AARON's outputs, recognizing that "creativity lay in neither the programmer alone nor in the program alone, but in the dialog between program and programmer."

Lesson for gen-emerge: A single-author system = inevitable convergence to the author's style. This constitutes the first historical example of the problem being addressed. Forty-three years of iteration did not resolve single-source bias. Multi-agent or adversarial pressure is required.

2.2 Karl Sims: Genetic Images / Galápagos (1991–1997)

A pioneering project in the evolution of visual forms through genetic algorithms. Genetic Images (1991) was the first published work on evolving 2D images from mathematical formula trees. Galápagos (1997) was an interactive installation at ICC Tokyo where visitors evolved 3D creatures by standing before screens. The genotype comprised a tree of mathematical functions (sin, cos, noise, etc.); the phenotype was an image computed from the tree for each pixel.

Convergence pattern: Interactive evolution is significantly limited by user fatigue — humans tire of evaluating after several dozen generations. This leads to insufficient evolutionary depth and convergence toward "attractive by default" patterns (symmetry, fractal-like textures) selected at a reflexive level.
Lesson for gen-emerge: A human-in-the-loop introduces bias faster than the algorithm. The semantic separation "favorite ≠ do more" in gen-emerge is a direct response to this problem.

2.3 Electric Sheep (Scott Draves, 1999–present)

A distributed system for evolving fractal flame animations, operating continuously for 27 years. Over 450,000 computers simultaneously render "sheep"; users vote for favorites; popular specimens mate and mutate. The fitness function is weighted by viewing time.

After 11 weeks of data analysis, Draves concluded that the system functions "more as an amplifier of its human collaborators' creativity rather than as a traditional genetic algorithm that optimizes a fitness function." Mass voting creates a median-taste bias. Diversity is maintained through manual submissions by "shepherds" — approximately 5–20 active participants who inject novel genetic material into the flock.

Lesson for gen-emerge: Electric Sheep is the oldest continuously operating analog of gen-emerge. Even with 450K participants, without active external injection the system converges to median taste. The "shepherd" role is a prototype for exogenous constraint injection (T4d). Distributed compute ≠ distributed creativity.

2.4 Picbreeder (Stanley et al., 2007–2021)

An online platform for collaborative interactive evolution of images using CPPN-NEAT (Compositional Pattern Producing Networks evolved by NeuroEvolution of Augmenting Topologies). The key innovation was "branching" — any user could continue evolving any other user's image.

Stanley demonstrated on Picbreeder that "pursuing an objective limits evolution" — images found through free branching could not be rediscovered when made explicit targets of the same algorithm. A skull was found by branching from an alien face, branched from a butterfly, branched from a blob. This became the empirical foundation for Novelty Search and the Quality-Diversity algorithm family.

Lesson for gen-emerge: Objective-driven optimization suppresses creativity. The QD approach (B6) with coverage as primary metric is confirmed experimentally. Branching = ideological predecessor of stepping stones (B11).

3. GAN Era

3.1 CAN / AICAN (Elgammal et al., 2017)

The Creative Adversarial Network is a GAN modification where the generator receives two contradictory signals: (1) "does this look like art?" (minimize deviation from art distribution) and (2) "which style is this?" (maximize style ambiguity). A discriminator trained on 80K WikiArt images spanning five centuries provides both signals.

The theoretical foundation is Berlyne's arousal potential theory (1970s): maximal aesthetic pleasure at moderate novelty — familiar enough to be recognized as art, novel enough to surprise. In blind tests, humans could not distinguish AICAN outputs from works by contemporary artists at leading art fairs.

Lesson for gen-emerge: The dual contradictory signals of CAN are a prototype for the MAE Triplet (ε), where Proposer and Generator optimize different objectives. Berlyne's theory (arousal = f(novelty)) may be useful for calibrating the quality/novelty balance in scoring. A "style ambiguity bonus" could be implemented as a scoring component.

3.2 The Painting Fool (Simon Colton, 2001–present)

A program-"artist" aiming to be accepted as an autonomous creative agent. The focus is not on quality optimization but on demonstrating three properties: skill, appreciation, and imagination. Before each portrait, The Painting Fool reads newspapers, determines the day's emotional tone, and selects style and palette accordingly — with the capacity to refuse to paint if the news is too depressing.

Lesson for gen-emerge: The "mood from news" mechanism is a direct analog of the Snapshot → Ontology pipeline. The refusal capability is a prototype for Minimal Criteria. The convergence problem persists: the system converges to "styles encoded by the programmer" (analogous to AARON).

3.3 Abraham / Eden (Gene Kogan, 2017–present)

Conceived as an "autonomous artificial artist" — a sovereign creative spirit generating original art through multi-party computation, making it impossible for any single participant to reconstruct the full model. Governance operates through a DAO with tokens.

Lesson for gen-emerge: Abraham formulates three criteria for an autonomous artist: autonomy, originality, uniqueness. Decentralized governance ≠ decentralized aesthetic biases of the underlying model. Multi-model architecture (ε, η, θ) is gen-emerge's response.

3.4 Artbreeder / Ganbreeder (Joel Simon, 2018–present)

A platform for collaborative generative art — spiritual successor to Picbreeder built on StyleGAN/BigGAN. With 14M+ users and 300M+ generated images, it employs "gene sliders" (semantic axes in latent space) and "breeding" (weighted interpolation between latent vectors). Full lineage tracking is maintained for each image.

Lesson for gen-emerge: Single-model latent space = ceiling on diversity (GAN aesthetic). Multi-model architecture = different latent spaces = transcending the single-model ceiling. Community branching is a powerful anti-convergence mechanism, but it depends on community activity.

4. LLM + Diffusion Era

4.1 Botto (Mario Klingemann / BottoDAO, 2021–present)

The most proximate public analog to gen-emerge. A Decentralized Autonomous Artist operating continuously since October 2021 (~4.5 years). The system generates ~70K images per week; a taste model selects 350 for DAO voting; one canonical work per week is minted as an NFT and auctioned on SuperRare (first work: ~$325,000).

DimensionBottoGen-Emerge
Human participants5,000+ DAO voters1 human curator
Generation volume~70K/week1–4/cycle
Selection mechanismTaste model trained on votes8 feedback channels
Diversity strategyVolume (statistical)Architecture (multi-model, QD)
Prompt generationRandom combinationsContext-aware (Snapshot → Ontology)

Botto evolves aesthetically through "creative periods" (Genesis, Fragmentation, etc.). The taste model, trained on votes, creates a feedback loop: popular works breed similar works → convergence to median DAO taste. Solutions include periodic creative period transitions, addition of new models (through BIP — Botto Improvement Proposals), and theme voting via LLM.

Critical lesson: Botto resolves diversity through volume (from 70K/week, diversity is statistically inevitable). Gen-emerge cannot afford this (1–4/cycle) → architectural solutions are required, not brute force.

4.2 Latent Space Illumination + QDHF (Fontaine et al., 2020–2024)

Application of Quality-Diversity algorithms (MAP-Elites) to the latent space of generative models (GAN, Stable Diffusion). A MAP-Elites archive (20×20 grid) stores latent vectors; CLIP evaluates fitness; diversity metrics are either manual (CLIP-attributes) or learned (QDHF — contrastive learning on human similarity judgments via DreamSim).

Key finding: CLIP embedding distance correlates poorly with perceived diversity — calibration on human judgments is required. QDHF-learned diversity metrics outperform manual axes because they reflect what humans consider "different," not what is metrically distant in CLIP space.

Lesson for gen-emerge: Direct prototype for approach T2e (QDHF-calibrated descriptors). The dual fingerprint (T2d: palette + CLIP) is a pragmatic compromise; the QDHF-calibrated space is the gold standard.

5. Comparative Analysis

ProjectPeriodGenerationFeedbackDiversity MechanismConvergence Problem
AARON1973–2016Rule-based (Lisp)Author manuallyManual rule updatesAuthor style lock-in
Karl Sims1991–1997Genetic algoInteractive (human)User diversityFatigue + beauty bias
Electric Sheep1999–presentFractal FlameCrowd voting (450K)Shepherd submissionsMedian taste
Picbreeder2007–2021CPPN-NEATInteractive + branchBranching lineagesCommunity decay
CAN/AICAN2017Modified GANAdversarialStyle ambiguity lossMode collapse
Painting Fool2001–presentMulti-techniqueSelf-evaluationCapability expansionAuthor bias
Abraham/Eden2017–presentCLIP+VQGAN → SDDAO governanceDecentralized dataModel bias
Botto2021–presentSD + taste modelDAO voting (5K+)Volume + periodsTaste model convergence
LSI+QDHF2020–2024SD + MAP-ElitesCLIP + human cal.QD archiveArchive saturation
Artbreeder2018–presentStyleGAN/BigGANUser slidersCommunity branchingGAN aesthetic ceiling
ProjectModelsMemoryHuman RoleAnti-Convergence
AARON1 (rule system)Code = memoryAuthor-programmerManual code changes
Electric Sheep1 (Flame algo)Flock genomeVoter + shepherdsExternal injection
Picbreeder1 (CPPN-NEAT)Lineage treeSelector + brancherBranching + NEAT
CAN1 (GAN)NoneNone (fully auto)Adversarial style loss
BottoMultipleTaste modelDAO votingPeriods + new models
LSI+QDHF1 (SD) + MAP-ElitesArchive gridPreference calibrationQD archive + emitters
ArtbreederMultiple GANsLineage + communitySlider/breederMass user diversity

6. Synthesis: Universal Patterns and Anti-Patterns

6.1 Universal Convergence Patterns

All 10 projects exhibit convergence. Sources differ, but five recurring patterns have been identified:

FIVE UNIVERSAL CONVERGENCE PATTERNS P1: Single-Source Bias 1 author → 1 style 1 model → 1 bias AARON, Painting Fool → Multi-model required P2: Median-Taste Attractor Crowd voting → regression to mean E.Sheep, Botto, Artbreeder → Favorite ≠ repeat P3: Objective Kills Novelty Targeted search < random branching Picbreeder, CAN → QD approach (B6) P4: Volume vs Architecture Botto: 70K/week → statistical diversity gen-emerge: 1–4/cycle → Architectural diversity P5: Model Ceiling 1 model = 1 latent space = ceiling Artbreeder, Abraham → Multi-model (η, θ)

6.2 Validated Anti-Convergence Mechanisms

From the 10 projects, six mechanisms with confirmed effectiveness have been identified:

#MechanismSource ProjectsGen-Emerge Implementation
1External injectionElectric Sheep (shepherds), Botto (creative periods)T4d — curriculum from external data
2Branching / stepping stonesPicbreeder, ArtbreederB11 — stepping stones archive
3Adversarial style pressureCAN/AICANT4e/T4f, ε architecture
4QD archiveLSI+QDHFB6 — QD-score + coverage
5Multi-model diversityBotto, Artbreederη (ensemble), θ (HACN clusters)
6Human-calibrated metricsQDHF, Artbreeder genesT2e — QDHF-calibrated descriptors

6.3 Unsolved Problems

Four problems remain unsolved across all reviewed projects:

  1. Long-term diversity without external intervention. No system has maintained diversity autonomously beyond several hundred cycles. Electric Sheep requires shepherds, Botto requires creative periods, Picbreeder requires community. Gen-emerge requires an automatic mechanism.
  2. Formalized forgetting. No project has implemented formalized forgetting. AARON accumulated rules indefinitely; Botto's taste model trains cumulatively. FadeMem (B4) has no precedent in art systems.
  3. Multi-agent with different models. No project uses multiple LLMs in adversarial roles for art generation. Botto uses multiple image models but with a single decision pipeline. The ε/η/θ architectures would be the first such implementations.
  4. Stagnation detection. No project has a formal stagnation detector. The Martingale Score (B9) has no analogs in the reviewed literature.

7. Catalog of Mechanisms and Design Patterns

7.1 Generative Mechanics

Overnight batch production (AARON)
Cohen left AARON running overnight, reviewing 100+ images in the morning. Removing real-time observation eliminates the temptation to micromanage. For gen-emerge: a formalized "batch overnight → morning surprise dashboard" mode highlighting the most unexpected results by novelty.
Style ambiguity as objective (CAN)
If a CLIP-based style classifier assigns softmax > 0.7 for any style class, this signals convergence. If no class exceeds 0.3, this is the sweet spot. Implementable as a "style ambiguity bonus" in gen-emerge scoring.
Genotype-level crossover (Sims, Picbreeder)
Crossover at the level of mathematical trees or CPPN networks, not pixel-level averaging, produces meaningful hybrids. For gen-emerge: crossover between constraint sets (e.g., {warm palette, organic} × {cold palette, geometric} → {warm palette, geometric}).

7.2 Social Mechanics

Shepherds (Electric Sheep)
Among 450K passive participants, ~5–20 active shepherds manually create fractals and inject them into the gene pool. They are seed injectors, not controllers. For gen-emerge: formalize the "shepherd" role as a periodic async channel — every N cycles, inject a constraint unrelated to the current series (exogenous shock).
Staking votes (Botto)
Vote weight is proportional to staked $BOTTO tokens — skin in the game leads to more careful evaluation. For gen-emerge without tokens: "confidence-weighted favorites" — "interesting" (weak signal) vs. "breakthrough" (max 1 per series, strong signal).
Gene sliders (Artbreeder)
Latent space decomposed into semantically interpretable axes. For gen-emerge: a dashboard showing constraint space as visual sliders (warm↔cold, organic↔geometric, macro↔micro) instead of text lists, making async steering more intuitive.

7.3 Economic and Distribution Mechanics

Weekly auction cadence (Botto)
Predictable rhythm creates anticipation. From 70K candidates, scarcity (1/week) creates value. For gen-emerge: from N generated per cycle, only the best enters the "canonical collection."
BIP — model governance (Botto)
New models are added through formal proposals. Entering with 15% share, auto-removed if <5% after a round. For gen-emerge: automatic model lifecycle management — model enters with small weight → proves useful (coverage gain) → weight increases → stagnates → removed.
Canonical vs. Discards (Botto)
Discards are not destroyed — 520 best discards from the Genesis period were later collected for a special exhibition. For gen-emerge: periodic "re-mining" of old high-novelty-but-low-score works as a source of stepping stones.

8. Positioning of Gen-Emerge

Based on this systematic review, gen-emerge is identified as the first system that simultaneously:

  1. Utilizes LLM + image model (not GAN, rules, or fractals)
  2. Operates in a multi-agent multi-model architecture
  3. Implements formalized forgetting (FadeMem)
  4. Applies a QD approach to art generation with a single human
  5. Realizes adversarial roles between different models
  6. Incorporates stagnation detection (Martingale Score)
Positioning Statement

The nearest analog is Botto, which resolves diversity through volume (70K/week) and crowd (5K+ voters). Gen-emerge must solve the same problem through architecture (multi-model, adversarial, QD) at 1–4 images/cycle with a single human. This constitutes a more challenging engineering problem, but a potentially more elegant solution.

1. Методология отбора

Из обширного поля генеративного искусства проекты отбирались по пяти критериям релевантности для gen-emerge: (1) автономность — серийная генерация без ручного запуска каждой итерации; (2) обратная связь — наличие механизма оценки/отбора, влияющего на последующие поколения; (3) непрерывная эволюция — работа во времени с накоплением истории; (4) проблема разнообразия — явное или неявное столкновение с конвергенцией; (5) масштаб — проект не остался прототипом, имеются результаты и данные.

Из приблизительно 30 выявленных проектов и экспериментов были отобраны 10 наиболее значимых, организованных по трём эрам: доглубинного обучения (до 2014), эра GAN (2014–2021) и эра LLM + diffusion (2021–настоящее время).

2. Эра до глубокого обучения

2.1 AARON (Гарольд Коэн, 1973–2016)

AARON признаётся первой долгоживущей автономной арт-системой в мире. Разработанная художником Гарольдом Коэном как экспертная система на C/Lisp на протяжении 43 лет, она автономно генерировала рисунки и картины с использованием кодифицированных знаний о композиции, перспективе и анатомии. Решения о композиции, цвете и расположении принимались на основе внутренних правил со стохастическими элементами; вывод осуществлялся через физические плоттеры и специальные рисовальные машины.

Система прошла через приблизительно 60 итераций за свою жизнь: от абстрактных линий (1970-е) через фигуры и пространства (1980-е) к автономному выбору цвета (1990-е) и абстрактной живописи (2000-е). Каждая итерация была результатом ручного обновления кодовой базы Коэном.

Паттерн конвергенции

AARON конвергировал к собственному стилю Коэна — система описывается как «экспертная система, автоматизировавшая стилистические особенности практики самого автора». Даже со стохастическими элементами пространство выходов было ограничено правилами, закодированными одним человеком. К 2009 году Коэн пережил творческий кризис и вернулся к ручной живописи поверх выходов AARON, осознав: «творчество заключалось не в программисте и не в программе по отдельности, а в диалоге между программой и программистом».

Урок для gen-emerge: одно-авторская система = неизбежная конвергенция к стилю автора. Это первый исторический пример решаемой проблемы. 43 года итераций не преодолели single-source bias. Необходима мультиагентность или adversarial pressure.

2.2 Карл Симс: Genetic Images / Galápagos (1991–1997)

Пионерский проект по эволюции визуальных форм посредством генетических алгоритмов. Genetic Images (1991) — первая публикация об эволюции 2D-изображений из деревьев математических формул. Galápagos (1997) — интерактивная инсталляция в ICC Tokyo, где посетители эволюционировали 3D-существ.

Паттерн конвергенции: интерактивная эволюция существенно ограничена утомлением пользователя — человек устаёт оценивать после нескольких десятков поколений. Это приводит к недостаточной глубине эволюции и конвергенции к «привлекательным по умолчанию» паттернам (симметрия, фракталоподобные текстуры), отбираемым на уровне рефлекса.
Урок для gen-emerge: человек в цикле вносит смещение быстрее, чем алгоритм. Семантическое разделение «фаворит ≠ делай больше» в gen-emerge — прямой ответ на эту проблему.

2.3 Electric Sheep (Скотт Дрейвс, 1999–настоящее время)

Распределённая система эволюции фрактальных анимаций, непрерывно работающая 27 лет. Свыше 450 000 компьютеров одновременно рендерят «овец»; пользователи голосуют за лучших; популярные особи спариваются и мутируют.

По результатам анализа 11 недель данных Дрейвс заключил, что система функционирует «скорее как усилитель творчества человеческих соавторов, нежели как традиционный генетический алгоритм, оптимизирующий фитнес-функцию». Массовое голосование создаёт аттрактор медианного вкуса. Разнообразие поддерживается через ручные инъекции «пастухами» (shepherds) — примерно 5–20 активными участниками, внедряющими новый генетический материал.

Урок для gen-emerge: Electric Sheep — старейший непрерывно работающий аналог gen-emerge. Даже с 450 000 участниками, без активной внешней инъекции система конвергирует к медианному вкусу. Роль «пастуха» — прототип экзогенной инъекции ограничений (T4d). Распределённые вычисления ≠ распределённое творчество.

2.4 Picbreeder (Стэнли и соавт., 2007–2021)

Онлайн-платформа коллаборативной интерактивной эволюции изображений с использованием CPPN-NEAT. Ключевая инновация — «ветвление» (branching): любой пользователь мог продолжить эволюцию любого чужого изображения.

Стэнли продемонстрировал на Picbreeder, что «преследование цели ограничивает эволюцию» — изображения, найденные через свободное ветвление, не могли быть переоткрыты при использовании того же алгоритма с этими изображениями в качестве явных целей. Это стало эмпирическим основанием для алгоритма Novelty Search и всего семейства QD-алгоритмов.

Урок для gen-emerge: целенаправленная оптимизация подавляет творчество. QD-подход (B6) с покрытием в качестве основной метрики подтверждён экспериментально. Ветвление = идеологический предшественник stepping stones (B11).

3. Эра GAN

3.1 CAN / AICAN (Elgammal и соавт., 2017)

Креативная состязательная сеть — модификация GAN, в которой генератор получает два противоречивых сигнала: (1) «выглядит ли это как искусство?» (минимизация отклонения от распределения искусства) и (2) «к какому стилю это относится?» (максимизация стилевой неопределённости). Дискриминатор обучен на 80 000 изображений WikiArt, охватывающих пять веков.

Теоретическое основание — теория потенциала возбуждения Берлайна (1970-е): максимальное эстетическое удовольствие при умеренной новизне. В слепых тестах люди не могли отличить выходы AICAN от работ современных художников на ведущих ярмарках.

Урок для gen-emerge: два противоречивых сигнала CAN — прототип MAE-триплета (ε), где Proposer и Generator оптимизируют разные цели. Теория Берлайна может быть полезна для калибровки баланса качество/новизна в скоринге.

3.2 The Painting Fool (Саймон Колтон, 2001–настоящее время)

Программа-«художник», стремящаяся быть принятой как самостоятельный креативный агент. Фокус — не на оптимизации качества, а на демонстрации трёх свойств: мастерства, оценки и воображения. Перед каждым портретом система читает газеты, определяет эмоциональный тон дня и выбирает стиль и палитру — с возможностью отказаться рисовать, если новости слишком мрачны.

Урок для gen-emerge: механизм «чтение новостей → настроение → стиль» — прямой аналог конвейера Snapshot → Ontology. Способность к отказу — прототип Minimal Criteria. Проблема конвергенции сохраняется: система конвергирует к «стилям, закодированным программистом».

3.3 Abraham / Eden (Джин Коган, 2017–настоящее время)

Задуман как «автономный искусственный художник» — sovereign creative spirit, генерирующий оригинальное искусство через многосторонние вычисления (multi-party computation), делающие невозможным восстановление полной модели любым одним участником.

Урок для gen-emerge: Abraham формулирует три критерия автономного художника: автономность, оригинальность, уникальность. Децентрализация управления ≠ децентрализация эстетических смещений базовой модели. Мультимодельная архитектура (ε, η, θ) — ответ gen-emerge.

3.4 Artbreeder / Ganbreeder (Джоэл Саймон, 2018–настоящее время)

Платформа коллаборативного генеративного искусства на базе StyleGAN/BigGAN. 14M+ пользователей, 300M+ сгенерированных изображений. Используются «ген-слайдеры» (семантические оси в латентном пространстве) и «скрещивание» (взвешенная интерполяция между латентными векторами). Для каждого изображения ведётся полная генеалогия.

Урок для gen-emerge: одномодельное латентное пространство = потолок разнообразия (GAN-эстетика). Мультимодельная архитектура = различные латентные пространства = преодоление одномодельного потолка. Коммунитарное ветвление — мощный механизм противодействия конвергенции, но зависит от активности сообщества.

4. Эра LLM + Diffusion

4.1 Botto (Марио Клингеманн / BottoDAO, 2021–настоящее время)

Наиболее близкий публичный аналог gen-emerge. Децентрализованный автономный художник, непрерывно работающий с октября 2021 (~4.5 года). Система генерирует ~70 000 изображений в неделю; вкусовая модель отбирает 350 для голосования DAO; одна каноническая работа в неделю минтится как NFT и продаётся на SuperRare (первая работа: ~$325 000).

ИзмерениеBottoGen-Emerge
Участники-люди5 000+ голосующих DAO1 человек-куратор
Объём генерации~70 000/неделю1–4/цикл
Механизм отбораВкусовая модель на голосах8 каналов обратной связи
Стратегия разнообразияОбъём (статистическая)Архитектура (мультимодельная, QD)
Генерация промптовСлучайные комбинацииКонтекстно-зависимая (Snapshot → Ontology)

Botto эволюционирует эстетически через «творческие периоды» (Genesis, Fragmentation и т.д.). Вкусовая модель, обученная на голосах, создаёт петлю обратной связи: популярные работы порождают похожие → конвергенция к медианному вкусу DAO. Решения включают периодическую смену творческих периодов, добавление новых моделей (через BIP) и голосование за темы через LLM.

Критический урок: Botto решает разнообразие через объём (из 70 000/неделю разнообразие статистически неизбежно). Gen-emerge не может себе этого позволить (1–4/цикл) → необходимы архитектурные решения, а не brute force.

4.2 Latent Space Illumination + QDHF (Fontaine и соавт., 2020–2024)

Применение алгоритмов Quality-Diversity (MAP-Elites) к латентному пространству генеративных моделей (GAN, Stable Diffusion). Архив MAP-Elites (сетка 20×20) хранит латентные вектора; CLIP оценивает качество; метрики разнообразия — либо ручные (CLIP-атрибуты), либо обученные (QDHF — контрастивное обучение на человеческих суждениях о сходстве через DreamSim).

Ключевой результат: расстояние в CLIP-эмбеддинговом пространстве плохо коррелирует с воспринимаемым разнообразием — необходима калибровка по человеческим суждениям. Обученные QDHF метрики разнообразия превосходят ручные оси, поскольку отражают то, что люди считают «различным».

Урок для gen-emerge: прямой прототип для подхода T2e (QDHF-калиброванные дескрипторы). Двойной отпечаток (T2d: палитра + CLIP) — прагматичный компромисс; QDHF-калиброванное пространство — золотой стандарт.

5. Сравнительный анализ

ПроектПериодГенерацияОбратная связьМеханизм разнообразияПроблема конвергенции
AARON1973–2016На правилах (Lisp)Автор вручнуюРучное обновление правилФиксация на стиле автора
Карл Симс1991–1997Генетический алг.Интерактивная (человек)Разнообразие пользователейУтомление + bias красоты
Electric Sheep1999–н.в.Fractal FlameГолосование толпы (450K)Инъекции пастуховМедианный вкус
Picbreeder2007–2021CPPN-NEATИнтерактивная + ветвлениеВетвящиеся линииУгасание сообщества
CAN/AICAN2017Модиф. GANСостязательнаяСтилевая неопределённостьMode collapse
Painting Fool2001–н.в.Мульти-техникаСамооценкаРасширение возможностейBias автора
Abraham/Eden2017–н.в.CLIP+VQGAN → SDУправление DAOДецентрализованные данныеBias модели
Botto2021–н.в.SD + вкусовая модельГолосование DAO (5K+)Объём + периодыКонвергенция вкусовой модели
LSI+QDHF2020–2024SD + MAP-ElitesCLIP + чел. калибровкаQD-архивНасыщение архива
Artbreeder2018–н.в.StyleGAN/BigGANСлайдеры пользователяКоммунитарное ветвлениеПотолок GAN-эстетики

6. Синтез: универсальные паттерны и антипаттерны

6.1 Универсальные паттерны конвергенции

Все 10 проектов демонстрируют конвергенцию. Источники различаются, однако было идентифицировано пять повторяющихся паттернов:

6.2 Подтверждённые механизмы противодействия

#МеханизмПроекты-источникиРеализация в gen-emerge
1Внешняя инъекцияElectric Sheep (пастухи), Botto (творческие периоды)T4d — учебный план из внешних данных
2Ветвление / stepping stonesPicbreeder, ArtbreederB11 — архив stepping stones
3Adversarial давление стиляCAN/AICANT4e/T4f, архитектура ε
4QD-архивLSI+QDHFB6 — QD-score + покрытие
5Мультимодельное разнообразиеBotto, Artbreederη (ансамбль), θ (HACN-кластеры)
6Калиброванные метрикиQDHF, ArtbreederT2e — QDHF-калиброванные дескрипторы

6.3 Нерешённые проблемы

Четыре проблемы остаются нерешёнными во всех рассмотренных проектах:

  1. Долгосрочное разнообразие без внешнего вмешательства. Ни одна система не поддержала разнообразие автономно дольше нескольких сотен циклов. Gen-emerge нуждается в автоматическом механизме.
  2. Формализованное забывание. Ни один проект не реализовал формализованного забывания. FadeMem (B4) не имеет прецедента в арт-системах.
  3. Мультиагентность с разными моделями. Ни один проект не использует несколько LLM в adversarial ролях для генерации искусства. Архитектуры ε/η/θ потенциально будут первыми.
  4. Детекция стагнации. Ни один проект не имеет формального детектора стагнации. Martingale Score (B9) не имеет аналогов в рассмотренной литературе.

7. Каталог механик и паттернов проектирования

7.1 Генеративные механики

Ночное пакетное производство (AARON)
Коэн оставлял AARON работать на ночь, утром просматривая 100+ изображений. Устранение наблюдения в реальном времени ликвидирует соблазн микроуправления. Для gen-emerge: формализованный режим «ночная генерация → утренний дашборд с сюрпризами», выделяющий наиболее неожиданные результаты по новизне.
Стилевая неопределённость как цель (CAN)
Если CLIP-классификатор стилей присваивает softmax > 0.7 для любого класса — это сигнал конвергенции. Если ни один класс не превышает 0.3 — это оптимальная зона. Реализуемо как «бонус за стилевую неопределённость» в скоринге gen-emerge.
Кроссовер на уровне генотипа (Симс, Picbreeder)
Скрещивание на уровне математических деревьев или CPPN-сетей, а не пиксельное усреднение, даёт осмысленные гибриды. Для gen-emerge: кроссовер между наборами ограничений (например, {тёплая палитра, органика} × {холодная палитра, геометрия} → {тёплая палитра, геометрия}).

7.2 Социальные механики

Пастухи (Electric Sheep)
Среди 450 000 пассивных участников ~5–20 активных «пастухов» вручную создают фракталы и инжектируют их в генофонд. Они — seed-инжекторы, не контролёры. Для gen-emerge: формализация роли «пастуха» как периодического асинхронного канала — каждые N циклов инъекция ограничения, не связанного с текущей серией (экзогенный шок).
Стейкинг голосов (Botto)
Вес голоса пропорционален застейканным токенам $BOTTO — skin in the game ведёт к более тщательной оценке. Для gen-emerge без токенов: «фавориты с уровнем уверенности» — «интересно» (слабый сигнал) vs. «прорыв» (макс. 1 за серию, сильный сигнал).
Ген-слайдеры (Artbreeder)
Латентное пространство декомпозировано в семантически интерпретируемые оси. Для gen-emerge: дашборд, показывающий пространство ограничений как визуальные слайдеры (тёплое↔холодное, органика↔геометрия, макро↔микро) вместо текстовых списков.

7.3 Экономические механики и механики распространения

Еженедельный аукционный каденс (Botto)
Предсказуемый ритм создаёт антиципацию. Из 70 000 кандидатов дефицит (1/неделя) создаёт ценность. Для gen-emerge: из N сгенерированных за цикл только лучший попадает в «каноническую коллекцию».
BIP — управление моделями (Botto)
Новые модели добавляются через формальные предложения. Входят с 15% долей, автоматически удаляются при <5% после раунда. Для gen-emerge: автоматическое управление жизненным циклом моделей — модель входит с малым весом → доказывает полезность → вес увеличивается → стагнирует → удаляется.
Каноника vs. отбросы (Botto)
Отбросы не уничтожаются — 520 лучших отбросов периода Genesis были позднее собраны для специальной выставки. Для gen-emerge: периодическое «re-mining» старых работ с высокой новизной, но низкой оценкой как источник stepping stones.

8. Позиционирование Gen-Emerge

На основании данного систематического обзора gen-emerge идентифицируется как первая система, которая одновременно:

  1. Использует LLM + image model (не GAN, не правила, не фракталы)
  2. Работает в мультиагентной мультимодельной архитектуре
  3. Реализует формализованное забывание (FadeMem)
  4. Применяет QD-подход к генерации искусства с одним человеком
  5. Реализует adversarial роли между различными моделями
  6. Включает детекцию стагнации (Martingale Score)
Позиционирование

Ближайший аналог — Botto, который решает разнообразие через объём (70 000/неделю) и толпу (5 000+ голосующих). Gen-emerge должен решить ту же проблему через архитектуру (мультимодельность, adversarial, QD) при 1–4 изображениях за цикл и одном человеке. Это более сложная инженерная задача, но потенциально более элегантное решение.

PreviousПредыдущая 04 · Image Feedback Research04 · Обратная связь на изображения NextСледующая 06 · Experiment Plan v506 · План экспериментов v5