Three creative missions, a three-level goal hierarchy, and the operational framework that connects artistic intent to measurable exploration.
Три творческие миссии, трёхуровневая иерархия целей и операционная структура, связывающая художественный замысел с измеримым исследованием.
February 2026 · Version 1.0
Февраль 2026 · Версия 1.0
22 min read
22 мин чтения
I. Philosophy of Assignments
I. Философия заданий
The system operates simultaneously on three levels of goal-setting. Each level answers a distinct question, and the separation is critical: conflating them would collapse the creative search into a single-objective optimization problem, destroying the emergent diversity that the architecture is designed to produce.
Система функционирует одновременно на трёх уровнях целеполагания. Каждый уровень отвечает на свой вопрос, и их разделение является критичным: смешение уровней привело бы к сворачиванию творческого поиска в задачу одноцелевой оптимизации, уничтожая эмерджентное разнообразие, для создания которого спроектирована архитектура.
Fig. 1. Three-Level Goal Hierarchy
Рис. 1. Трёхуровневая иерархия целей
Compass directs agent creativity; Task directs system mechanics; Sub-goals direct experiment design.
Within a single experimental phase, all branches receive the same compass. This constraint is essential: if the compass differs across branches, the effect of architecture cannot be separated from the effect of the creative assignment. Different compass missions are used only between phases or in dedicated generalization tests.
В пределах одной экспериментальной фазы все ветки получают одинаковый compass. Это ограничение является критичным: если compass различается между ветками, эффект архитектуры невозможно отделить от эффекта творческого задания. Различные compass-миссии используются только между фазами или в выделенных тестах на обобщение.
II. Three Creative Missions
II. Три творческие миссии
Three missions have been approved for the experimental program. Each defines a distinct creative territory and tests different capabilities of the generative architecture.
Три миссии утверждены для экспериментальной программы. Каждая определяет отдельную творческую территорию и тестирует различные возможности генеративной архитектуры.
PRIMARY — Phase 1ОСНОВНАЯ — Фаза 1
Mission D: "Scale Vertigo"
Миссия D: «Масштабное головокружение»
Place the microscopic and cosmic in a single frame. Cellular structures that turn out to be cities. A galaxy inside a droplet. Destroy the viewer's sense of scale so they cannot tell if what they are seeing is immense or infinitesimal.
Помести микроскопическое и космическое в одном кадре. Клеточная структура, которая оказывается городом. Галактика внутри капли. Разрушь чувство масштаба зрителя, чтобы он не мог определить — это огромное или крошечное.
Rationale for primary status. Scale ambivalence is a potent visual device that resonates well with image generation models. It creates natural tension along all three QD-map axes simultaneously: impossible materials through scale juxtaposition, paradox through dual reading, and intensity through information density. The constraint "micro vs macro" is concrete and tangible — it is easy for the Proposer to interpret and for the Judge to evaluate.
Обоснование статуса основной миссии. Масштабная амбивалентность является мощным визуальным приёмом, хорошо резонирующим с моделями генерации изображений. Она создаёт естественное напряжение по всем трём осям QD-карты одновременно: невозможные материалы через столкновение масштабов, парадокс через двойное прочтение, интенсивность через информационную плотность. Ограничение «микро vs макро» конкретно и осязаемо — оно легко интерпретируется Предложителем и оценивается Судьёй.
QD-Map Impact
Влияние на QD-карту
High tension on all 3 axes: material impossibility, perceptual paradox, sensory intensity
Высокое напряжение по всем 3 осям: невозможность материала, перцептуальный парадокс, сенсорная интенсивность
Emergence Potential
Потенциал эмерджентности
High: scale combinations that a human would not propose are expected to emerge from systematic exploration
Высокий: ожидается появление масштабных комбинаций, которые человек не предложил бы, в результате систематического исследования
Visualize the collision of senses. What does the sound of impact look like? What texture does silence have? How does a particular color smell? Every image is a translation between perceptual modalities — impossible, yet convincing.
Визуализируй столкновение чувств. Как выглядит звук удара? Какую текстуру имеет тишина? Как пахнет определённый цвет? Каждое изображение — перевод между модальностями восприятия, который невозможен, но убедителен.
Rationale for generalization testing. Mission C is radically different from Mission D: synesthesia replaces scale play. It tests whether an architecture tuned on one mission can transfer to another. High abstraction requires a different type of reasoning from the Proposer. If the architecture generalizes, it has discovered a genuinely effective creative process rather than overfitting to "micro/macro" patterns.
Обоснование для тестирования обобщения. Миссия C радикально отличается от Миссии D: синестезия заменяет игру масштабов. Она тестирует, может ли архитектура, настроенная на одну миссию, перенестись на другую. Высокая абстрактность требует от Предложителя другого типа рассуждений. Если архитектура обобщается — она нашла действительно эффективный творческий процесс, а не просто переобучилась на паттернах «микро/макро».
Constraint Adaptation
Адаптация ограничений
scale_pair replaced by sense_pair: "sound of impact → crystalline texture", "silence → form", "aroma → palette"
Same axes reinterpreted: impossible material (how does a smell look?), paradox (modality collision), intensity (synesthetic overload)
Те же оси переосмыслены: невозможный материал (как выглядит запах?), парадокс (столкновение модальностей), интенсивность (синестетическая перегрузка)
EXTENDED — FutureРАСШИРЕННАЯ — Будущее
Mission E: "The Paradox Engine"
Миссия E: «Двигатель парадоксов»
Create images that are internally contradictory yet visually convincing. An object simultaneously heavy and weightless. A space simultaneously enclosed and infinite. Every image is a visual koan — impossible to resolve, impossible to stop looking at.
Создавай изображения, которые внутренне противоречивы, но визуально убедительны. Объект одновременно тяжёлый и невесомый. Пространство одновременно замкнутое и бесконечное. Каждое изображение — визуальный коан, который невозможно разрешить, но невозможно перестать рассматривать.
Rationale for extended/future status. The Paradox Engine is the most abstract and complex of the three missions. Paradox operates directly on the Perceptual Paradox axis of the QD-map. It demands the highest level of creative reasoning from the Proposer: the ability to formulate contradictions that are visually resolvable. This mission is ideal for a "second wind" test at 300+ cycles, as the space of visual paradoxes is genuinely deep.
Обоснование статуса расширенной/будущей миссии. Двигатель парадоксов является наиболее абстрактной и сложной из трёх миссий. Парадокс напрямую работает с осью Perceptual Paradox QD-карты. Он требует от Предложителя наивысшего уровня творческого мышления: способности формулировать противоречия, визуально разрешимые. Эта миссия идеальна для теста «второго дыхания» на 300+ циклах, поскольку пространство визуальных парадоксов по-настоящему глубоко.
May require adjusted VLM checklist weights in T5-GATE (higher tolerance for visual incoherence), as abstract paradoxes are harder to render than scale games.
Может потребоваться корректировка весов VLM-чеклиста в T5-GATE (более высокая толерантность к визуальной несогласованности), поскольку абстрактные парадоксы сложнее визуализировать, чем масштабные игры.
Future Missions (not approved)
Будущие миссии (не утверждены)
Two additional missions have been recorded as candidates for the production regime upon completion of the experimental program:
Две дополнительные миссии зафиксированы как кандидаты для производственного режима после завершения экспериментальной программы:
Mission A: "Impossible Materials" — Explore objects and spaces made from materials that cannot exist.Миссия A: «Невозможные материалы» — Исследование объектов и пространств, созданных из материалов, которые не могут существовать.
Mission B: "Frozen Metamorphosis" — Capture the moment of one thing transforming into another — but freeze it halfway.Миссия B: «Замороженная метаморфоза» — Захват момента превращения одного в другое — но остановленного на полпути.
III. Operational Task: QD-Map Coverage + Quality Floor
III. Операционная задача: покрытие QD-карты + порог качества
The primary operational task is formally defined as: maximize the number of unique cells filled in the QD-map (1,000 cells total), subject to the constraint that every accepted image passes T5-GATE.
Основная операционная задача формально определена как: максимизация количества уникальных заполненных ячеек в QD-карте (всего 1 000 ячеек) при условии, что каждое принятое изображение проходит T5-GATE.
$0.10Cost per cycle (branch α)Стоимость цикла (ветка α)
Why Coverage, Not Quality
Почему покрытие, а не качество
Quality is guaranteed by the gates (floor). Optimizing quality above the floor leads to mode collapse — the system finds one "beautiful" style and repeats it. Coverage forces the system to explore, producing diversity and enabling the emergence of unexpected aesthetic territory. Coverage per dollar serves as the primary comparison metric between architectures.
Качество гарантировано гейтами (порог). Оптимизация качества выше порога ведёт к коллапсу мод — система находит один «красивый» стиль и повторяет его. Покрытие заставляет систему исследовать, порождая разнообразие и обеспечивая появление неожиданной эстетической территории. Покрытие на доллар служит основной метрикой сравнения между архитектурами.
What the Proposer Sees
Что видит Предложитель
The Proposer agent does not receive the "coverage" metric directly. Instead, it receives a structured context window containing the compass, QD-map state, history, and stagnation signals. The task of targeting empty zones is implied by the gap information, not by an explicit optimization objective.
Агент-Предложитель не получает метрику «покрытия» напрямую. Вместо этого он получает структурированное контекстное окно, содержащее compass, состояние QD-карты, историю и сигналы стагнации. Задача нацеливания на пустые зоны подразумевается информацией о пробелах, а не явной целью оптимизации.
Proposer's context window:
├── Compass: Mission D (Scale Vertigo) — creative direction
├── QD-map state:
│ ├── Coverage: 8.3% (83 / 1,000 cells filled)
│ ├── Heatmap: dense in zones [high intensity, low paradox]
│ ├── Empty zones: [low intensity + high impossibility], [high paradox + low intensity]
│ └── Suggested target zone: material_impossibility=[0.6-0.8], paradox=[0.7-0.9], intensity=[0.1-0.3]
├── History:
│ ├── Last 3 accepted: [fingerprint descriptions]
│ ├── Last 5 rejected: [reason per rejection — which gate, what score]
│ └── Trend: 3 consecutive rejections (Gate 3: DreamSim too similar)
├── Stagnation: Martingale score = 2.3 (warning: approaching threshold)
└── Task: "Propose constraints that will reach unexplored territory on the map"
Контекстное окно Предложителя:
├── Compass: Миссия D (Масштабное головокружение) — творческое направление
├── Состояние QD-карты:
│ ├── Покрытие: 8.3% (83 / 1 000 ячеек заполнено)
│ ├── Тепловая карта: плотно в зонах [высокая интенсивность, низкий парадокс]
│ ├── Пустые зоны: [низкая интенсивность + высокая невозможность], [высокий парадокс + низкая интенсивность]
│ └── Предложенная целевая зона: material_impossibility=[0.6-0.8], paradox=[0.7-0.9], intensity=[0.1-0.3]
├── История:
│ ├── Последние 3 принятых: [описания отпечатков]
│ ├── Последние 5 отклонённых: [причина отклонения — какой гейт, какой балл]
│ └── Тренд: 3 последовательных отклонения (Gate 3: DreamSim слишком похож)
├── Стагнация: Martingale score = 2.3 (предупреждение: приближение к порогу)
└── Задача: «Предложить ограничения для достижения неисследованной территории на карте»
Secondary Metrics (monitored, not optimized)
Вторичные метрики (отслеживаемые, не оптимизируемые)
Each experimental phase is governed by a specific research question. The sub-goal determines what constitutes "success" and which parameters are varied versus fixed.
Каждая экспериментальная фаза определяется конкретным исследовательским вопросом. Подцель определяет, что считается «успехом» и какие параметры варьируются, а какие фиксируются.
"Which architecture fills the QD-map faster and more efficiently?"
«Какая архитектура заполняет QD-карту быстрее и эффективнее?»
ParameterПараметр
ValueЗначение
Compass
Mission D: Scale Vertigo
Constraint source
T4a: random from seed library
CyclesЦиклов
200 per branch per seed
Seeds
3 per branch
Branches Under Test
Тестируемые ветки
BranchВетка
ArchitectureАрхитектура
DescriptionОписание
1α
Linear single-agent
One LLM does everything: proposes, generates prompt, gets judged by T5-GATEОдна LLM делает всё: предлагает, генерирует промпт, оценивается T5-GATE
1ε
MAE Triplet
Claude Opus → Proposer, GPT-5.2 → Generator, Gemini 3.1 Pro → JudgeClaude Opus → Предложитель, GPT-5.2 → Генератор, Gemini 3.1 Pro → Судья
1η
Ensemble
One proposer, three generators (all three LLMs), one judgeОдин предложитель, три генератора (все три LLM), один судья
2γ
Islands
3 independent streams, each single-agent, shared archive3 независимых потока, каждый однозагентный, общий архив
2θ
HACN
2 clusters with different models + Superego coordinator2 кластера с разными моделями + координатор Superego
Exp 7: Coverage > 15% at 300 cycles, at least one "second wind" event, DreamSim trajectory ≥ 80% of peak. Exp 8: Coverage(C) ≥ 70% of Coverage(D) at cycle 200 → architecture generalizes. < 70% → overfitted, needs adaptation.
Эксп. 7: Покрытие > 15% за 300 циклов, хотя бы одно событие «второго дыхания», траектория DreamSim ≥ 80% от пикового значения. Эксп. 8: Покрытие(C) ≥ 70% от Покрытия(D) на цикле 200 → архитектура обобщается. < 70% → переобучение, требуется адаптация.
V. Seed Library — Mission D
V. Библиотека начальных данных — Миссия D
The seed constraint library provides the initial creative material for bootstrapping the system's exploration. For Mission D ("Scale Vertigo"), the library is organized into three categories of combinatorial elements, from which 100 renderable constraint sets are composed.
Библиотека начальных ограничений предоставляет исходный творческий материал для запуска процесса исследования. Для Миссии D («Масштабное головокружение») библиотека организована в три категории комбинаторных элементов, из которых составляются 100 рендерируемых наборов ограничений.
📝 Seed Constraints (3 of 10 examples)📝 Начальные ограничения (3 из 10 примеров)
{"id": "d_001",
"material": "bioluminescent membrane stretched over crystalline scaffolding",
"scale_pair": "cell membrane / space station hull",
"composition": "viewer inside looking outward through translucent wall, stars or organelles beyond",
"palette": "deep teal, phosphorescent green, warm amber nodes",
"paradox": "interior of a living cell that contains stars",
"mood": "quiet awe, contemplative vastness in a small space",
"negative": "no human figures, no text, no photorealistic style"}
{"id": "d_004",
"material": "mycelium threads glowing with captured starlight",
"scale_pair": "mycelium network / cosmic web",
"composition": "network radiating from center, nodes pulsing, viewer at ambiguous distance",
"palette": "warm white threads on deep blue-black void",
"paradox": "fungal network that maps the large-scale structure of the universe",
"mood": "sublime confusion — living or cosmic?",
"negative": "no mushroom caps, no Earth, no identifiable plants"}
{"id": "d_008",
"material": "DNA double helix made of spiral galaxy arms, base pairs are star clusters",
"scale_pair": "DNA helix / spiral galaxy",
"composition": "vertical helix filling frame, glowing base pair connections",
"palette": "deep space blue-black, warm gold connections, cool white stars",
"paradox": "genetic code written in galaxies — biology at cosmological scale",
"mood": "awe at structural rhyme across 20 orders of magnitude",
"negative": "no labels, no scientific diagram style, no flat graphics"}
The full seed library of 100 constraints is generated in three stages: 20 hand-crafted exemplars covering all QD-map zones, 80 LLM-expanded variants targeting specific zones, and a renderability filter where constraints that fail T5-GATE three times consecutively are replaced.
Полная библиотека из 100 начальных ограничений генерируется в три этапа: 20 ручных образцов, покрывающих все зоны QD-карты, 80 LLM-расширенных вариантов, нацеленных на конкретные зоны, и фильтр рендерируемости, в котором ограничения, трижды подряд не прошедшие T5-GATE, заменяются новыми.
VI. VLM Checklist — Mission-Adapted
VI. VLM-чеклист — адаптированный под миссию
The VLM evaluation checklist consists of a base set of structural and aesthetic criteria applied to all images, plus mission-specific additions that test whether the creative compass has been followed. The checklist adapts automatically when the active mission changes.
VLM-чеклист оценки состоит из базового набора структурных и эстетических критериев, применяемых ко всем изображениям, плюс специфические для миссии дополнения, проверяющие следование творческому компасу. Чеклист адаптируется автоматически при смене активной миссии.
Contradiction visually convincing (not an error)? (no → flag)Противоречие визуально убедительно (не ошибка)? (нет → флаг)
Does the viewer want to keep looking? (no → flag)Хочется ли зрителю продолжать рассматривать? (нет → флаг)
BONUS: Irresolvable — cannot choose one interpretation? (yes → bonus)БОНУС: Неразрешимость — невозможно выбрать одну интерпретацию? (да → бонус)
VII. Missions → Experiments Mapping
VII. Отображение миссий на эксперименты
Fig. 2. Phase Timeline & Mission Mapping
Рис. 2. Временная шкала фаз и распределение миссий
Mission D is primary throughout Phases 1–2. Phase 3 activates Missions C and E for generalization. Phase 4 rotates all missions (D → C → E → A → B → …) in continuous production.
Миссия D основная на протяжении Фаз 1–2. Фаза 3 активирует Миссии C и E для обобщения. Фаза 4 ротирует все миссии (D → C → E → A → B → …) в непрерывном производстве.
VIII. Decision Tree: Post-Experiment
VIII. Дерево решений: после эксперимента
A structured decision protocol is applied at the boundary of each phase. The branching logic determines whether to proceed, iterate, or fundamentally revise the approach.
На границе каждой фазы применяется структурированный протокол принятия решений. Логика ветвления определяет, следует ли продвигаться вперёд, итерировать или фундаментально пересматривать подход.
After Phase 1:
IF coverage(best_multi) > coverage(α) with p < 0.05:
Winner = best_multi (ε, η, or θ based on coverage_per_dollar)
ELIF coverage(α) ≈ coverage(best_multi):
Winner = α (simpler, cheaper, comparable)
ELIF coverage(α) > coverage(best_multi):
Winner = α (single-agent dominant → revisit multi-agent design)
48-hour human override window:
review QD-maps visually, confirm statistical winner matches quality impression.
After Phase 2:
Best config = Winner_arch + best_constraint_method + best_exploration_driver
+ checklist_rotation_if_significant + multi_judge_if_significant
After Phase 3:
IF coverage(300) > coverage(200) + 5% AND second_wind_detected:
→ System has long-horizon capability → ready for Phase 4
ELIF coverage plateaus permanently at ~200 cycles:
→ System has finite exploration depth → consider outer loop redesign
IF coverage(Mission C) ≥ 70% of coverage(Mission D):
→ Architecture generalizes → can rotate missions in Phase 4
ELIF coverage(Mission C) < 70%:
→ Architecture overfitted → needs mission-adaptive components
Phase 4 — Continuous Service:
LOOP forever:
RUN production_cycle(500–1000 cycles, current_mission)
EVERY 200 cycles:
recalibrate_gates(T5-GATE thresholds, CLIP anchors, DreamSim baseline)
IF acceptance_rate NOT IN [20%, 80%]: adjust_thresholds()
IF Martingale > threshold: trigger_exploration_strategy_upgrade()
IF pairwise_data_available: run_perceptual_calibration()
EVERY month:
rotate_mission(next_in_queue)
refresh_seed_library(new_constraint_families)
IF new_model_version_available: run_AB_comparison()
EVERY quarter:
full_system_audit(QD-map coverage, archive gallery, cost efficiency)
IF coverage_velocity == 0 for > 1000 cycles:
→ Deep recalibration: new anchors, new seeds, strategy overhaul
update_research_documentation()
После Фазы 1:
ЕСЛИ покрытие(лучший_мульти) > покрытия(α) при p < 0.05:
Победитель = лучший_мульти (ε, η или θ по покрытию_на_доллар)
ИНАЧЕ ЕСЛИ покрытие(α) ≈ покрытие(лучший_мульти):
Победитель = α (проще, дешевле, сопоставимо)
ИНАЧЕ ЕСЛИ покрытие(α) > покрытия(лучший_мульти):
Победитель = α (доминирование одного агента → пересмотр мульти-агентного дизайна)
48-часовое окно для ручной коррекции:
визуальный обзор QD-карт, подтверждение совпадения статистического победителя с впечатлением от качества.
После Фазы 2:
Лучшая конфигурация = Архитектура-победитель + лучший_метод_ограничений
+ лучший_драйвер_исследования
+ ротация_чеклиста_если_значимо + мульти_судья_если_значимо
После Фазы 3:
ЕСЛИ покрытие(300) > покрытия(200) + 5% И обнаружено_второе_дыхание:
→ Система обладает долгосрочными возможностями → готова к Фазе 4
ИНАЧЕ ЕСЛИ покрытие стабильно плато на ~200 циклах:
→ Система имеет конечную глубину исследования → пересмотр внешнего цикла
ЕСЛИ покрытие(Миссия C) ≥ 70% от покрытия(Миссия D):
→ Архитектура обобщается → можно ротировать миссии в Фазе 4
ИНАЧЕ ЕСЛИ покрытие(Миссия C) < 70%:
→ Архитектура переобучена → необходимы адаптивные компоненты
Фаза 4 — Непрерывный сервис:
ЦИКЛ бесконечно:
ЗАПУСК продуктивный_цикл(500–1000 циклов, текущая_миссия)
КАЖДЫЕ 200 циклов:
рекалибровка_гейтов(пороги T5-GATE, якоря CLIP, базис DreamSim)
ЕСЛИ acceptance_rate НЕ В [20%, 80%]: корректировка_порогов()
ЕСЛИ Martingale > порог: улучшение_стратегии_исследования()
ЕСЛИ доступны_данные_pairwise: запуск_перцептуальной_калибровки()
КАЖДЫЙ месяц:
ротация_миссии(следующая_в_очереди)
обновление_seed_библиотеки(новые_семейства_ограничений)
ЕСЛИ доступна_новая_версия_модели: запуск_AB_сравнения()
КАЖДЫЙ квартал:
полный_аудит_системы(покрытие QD-карты, галерея архива, эффективность расходов)
ЕСЛИ скорость_покрытия == 0 более 1000 циклов:
→ Глубокая рекалибровка: новые якоря, новые seed, пересмотр стратегии
обновление_исследовательской_документации()
Appendix: Cost Estimates by Phase
Приложение: оценки стоимости по фазам
All missions utilize the same pipeline, thus cost depends on the architecture, not on the mission. The following estimates are provided for compute-time and API rate-limit planning.
Все миссии используют один и тот же пайплайн, поэтому стоимость зависит от архитектуры, а не от миссии. Приведённые ниже оценки предназначены для планирования вычислительного времени и лимитов API.
PhaseФаза
ExperimentsЭкспериментов
RunsПрогонов
CyclesЦиклов
Est. CostОжид. стоимость
Stage 0
CalibrationКалибровка
3
150
~$45
Phase 1
Exp 1–2
15
3,000
~$580
Phase 2
Exp 3–6
~30
~6,000
~$1,000
Phase 3
Exp 7–9
~11
~2,800
~$600
Phases 0–3Фазы 0–3
~59
~12,000
~$2,225
Phase 4
∞ Continuous∞ Непрерывный
∞
∞
~$200–400/mo~$200–400/мес
Budget Note
Примечание о бюджете
Budget is not a constraint. These estimates are provided for compute-time planning and API rate-limit management, not for cost-cutting purposes.
Бюджет не является ограничением. Приведённые оценки предназначены для планирования вычислительного времени и управления лимитами API, а не для сокращения расходов.