Research / Article 07Статья 07
Missions Миссии

Creative Missions, Tasks & Goals

Творческие миссии, задачи и цели

Three creative missions, a three-level goal hierarchy, and the operational framework that connects artistic intent to measurable exploration.

Три творческие миссии, трёхуровневая иерархия целей и операционная структура, связывающая художественный замысел с измеримым исследованием.

February 2026 · Version 1.0
Февраль 2026 · Версия 1.0
22 min read
22 мин чтения

I. Philosophy of Assignments

I. Философия заданий

The system operates simultaneously on three levels of goal-setting. Each level answers a distinct question, and the separation is critical: conflating them would collapse the creative search into a single-objective optimization problem, destroying the emergent diversity that the architecture is designed to produce.

Система функционирует одновременно на трёх уровнях целеполагания. Каждый уровень отвечает на свой вопрос, и их разделение является критичным: смешение уровней привело бы к сворачиванию творческого поиска в задачу одноцелевой оптимизации, уничтожая эмерджентное разнообразие, для создания которого спроектирована архитектура.

Fig. 1. Three-Level Goal Hierarchy
Рис. 1. Трёхуровневая иерархия целей
COMPASS WHAT to explore — poetic territory for agents ЧТО исследовать — поэтическая территория для агентов Received by Proposer as creative direction Передаётся Предложителю как творческое направление TASK HOW to measure — metric optimized via QD-map + gating КАК измерять — метрика, оптимизируемая через QD-карту + гейтинг Proposer does NOT see task directly — sees compass + gaps Предложитель НЕ видит task напрямую — видит compass + пробелы SUB-GOALS WHY this experiment — specific question per phase ЗАЧЕМ этот эксперимент — конкретный вопрос на фазу Determines what varies and what is fixed Определяет, что варьируется и что фиксировано
Compass directs agent creativity; Task directs system mechanics; Sub-goals direct experiment design.
Compass направляет креативность агентов; Task направляет механику системы; Sub-goals направляют дизайн эксперимента.
Principle: Single Compass per Phase
Принцип: единый Compass в пределах фазы

Within a single experimental phase, all branches receive the same compass. This constraint is essential: if the compass differs across branches, the effect of architecture cannot be separated from the effect of the creative assignment. Different compass missions are used only between phases or in dedicated generalization tests.

В пределах одной экспериментальной фазы все ветки получают одинаковый compass. Это ограничение является критичным: если compass различается между ветками, эффект архитектуры невозможно отделить от эффекта творческого задания. Различные compass-миссии используются только между фазами или в выделенных тестах на обобщение.

II. Three Creative Missions

II. Три творческие миссии

Three missions have been approved for the experimental program. Each defines a distinct creative territory and tests different capabilities of the generative architecture.

Три миссии утверждены для экспериментальной программы. Каждая определяет отдельную творческую территорию и тестирует различные возможности генеративной архитектуры.

PRIMARY — Phase 1 ОСНОВНАЯ — Фаза 1
Mission D: "Scale Vertigo"
Миссия D: «Масштабное головокружение»
Place the microscopic and cosmic in a single frame. Cellular structures that turn out to be cities. A galaxy inside a droplet. Destroy the viewer's sense of scale so they cannot tell if what they are seeing is immense or infinitesimal.
Помести микроскопическое и космическое в одном кадре. Клеточная структура, которая оказывается городом. Галактика внутри капли. Разрушь чувство масштаба зрителя, чтобы он не мог определить — это огромное или крошечное.

Rationale for primary status. Scale ambivalence is a potent visual device that resonates well with image generation models. It creates natural tension along all three QD-map axes simultaneously: impossible materials through scale juxtaposition, paradox through dual reading, and intensity through information density. The constraint "micro vs macro" is concrete and tangible — it is easy for the Proposer to interpret and for the Judge to evaluate.

Обоснование статуса основной миссии. Масштабная амбивалентность является мощным визуальным приёмом, хорошо резонирующим с моделями генерации изображений. Она создаёт естественное напряжение по всем трём осям QD-карты одновременно: невозможные материалы через столкновение масштабов, парадокс через двойное прочтение, интенсивность через информационную плотность. Ограничение «микро vs макро» конкретно и осязаемо — оно легко интерпретируется Предложителем и оценивается Судьёй.

QD-Map Impact
Влияние на QD-карту
High tension on all 3 axes: material impossibility, perceptual paradox, sensory intensity
Высокое напряжение по всем 3 осям: невозможность материала, перцептуальный парадокс, сенсорная интенсивность
Emergence Potential
Потенциал эмерджентности
High: scale combinations that a human would not propose are expected to emerge from systematic exploration
Высокий: ожидается появление масштабных комбинаций, которые человек не предложил бы, в результате систематического исследования
Constraint Fields
Поля ограничений
material, scale_pair, composition, palette, paradox, mood, negative
GENERALIZATION — Phase 3 ОБОБЩЕНИЕ — Фаза 3
Mission C: "Sensory Collision"
Миссия C: «Столкновение чувств»
Visualize the collision of senses. What does the sound of impact look like? What texture does silence have? How does a particular color smell? Every image is a translation between perceptual modalities — impossible, yet convincing.
Визуализируй столкновение чувств. Как выглядит звук удара? Какую текстуру имеет тишина? Как пахнет определённый цвет? Каждое изображение — перевод между модальностями восприятия, который невозможен, но убедителен.

Rationale for generalization testing. Mission C is radically different from Mission D: synesthesia replaces scale play. It tests whether an architecture tuned on one mission can transfer to another. High abstraction requires a different type of reasoning from the Proposer. If the architecture generalizes, it has discovered a genuinely effective creative process rather than overfitting to "micro/macro" patterns.

Обоснование для тестирования обобщения. Миссия C радикально отличается от Миссии D: синестезия заменяет игру масштабов. Она тестирует, может ли архитектура, настроенная на одну миссию, перенестись на другую. Высокая абстрактность требует от Предложителя другого типа рассуждений. Если архитектура обобщается — она нашла действительно эффективный творческий процесс, а не просто переобучилась на паттернах «микро/макро».

Constraint Adaptation
Адаптация ограничений
scale_pair replaced by sense_pair: "sound of impact → crystalline texture", "silence → form", "aroma → palette"
scale_pair заменяется на sense_pair: «звук удара → кристаллическая текстура», «тишина → форма», «аромат → палитра»
QD-Map Axes
Оси QD-карты
Same axes reinterpreted: impossible material (how does a smell look?), paradox (modality collision), intensity (synesthetic overload)
Те же оси переосмыслены: невозможный материал (как выглядит запах?), парадокс (столкновение модальностей), интенсивность (синестетическая перегрузка)
EXTENDED — Future РАСШИРЕННАЯ — Будущее
Mission E: "The Paradox Engine"
Миссия E: «Двигатель парадоксов»
Create images that are internally contradictory yet visually convincing. An object simultaneously heavy and weightless. A space simultaneously enclosed and infinite. Every image is a visual koan — impossible to resolve, impossible to stop looking at.
Создавай изображения, которые внутренне противоречивы, но визуально убедительны. Объект одновременно тяжёлый и невесомый. Пространство одновременно замкнутое и бесконечное. Каждое изображение — визуальный коан, который невозможно разрешить, но невозможно перестать рассматривать.

Rationale for extended/future status. The Paradox Engine is the most abstract and complex of the three missions. Paradox operates directly on the Perceptual Paradox axis of the QD-map. It demands the highest level of creative reasoning from the Proposer: the ability to formulate contradictions that are visually resolvable. This mission is ideal for a "second wind" test at 300+ cycles, as the space of visual paradoxes is genuinely deep.

Обоснование статуса расширенной/будущей миссии. Двигатель парадоксов является наиболее абстрактной и сложной из трёх миссий. Парадокс напрямую работает с осью Perceptual Paradox QD-карты. Он требует от Предложителя наивысшего уровня творческого мышления: способности формулировать противоречия, визуально разрешимые. Эта миссия идеальна для теста «второго дыхания» на 300+ циклах, поскольку пространство визуальных парадоксов по-настоящему глубоко.

Constraint Fields
Поля ограничений
paradox_core, material, palette, composition, scale, mood, negative
Special Considerations
Особые соображения
May require adjusted VLM checklist weights in T5-GATE (higher tolerance for visual incoherence), as abstract paradoxes are harder to render than scale games.
Может потребоваться корректировка весов VLM-чеклиста в T5-GATE (более высокая толерантность к визуальной несогласованности), поскольку абстрактные парадоксы сложнее визуализировать, чем масштабные игры.

Future Missions (not approved)

Будущие миссии (не утверждены)

Two additional missions have been recorded as candidates for the production regime upon completion of the experimental program:

Две дополнительные миссии зафиксированы как кандидаты для производственного режима после завершения экспериментальной программы:

III. Operational Task: QD-Map Coverage + Quality Floor

III. Операционная задача: покрытие QD-карты + порог качества

The primary operational task is formally defined as: maximize the number of unique cells filled in the QD-map (1,000 cells total), subject to the constraint that every accepted image passes T5-GATE.

Основная операционная задача формально определена как: максимизация количества уникальных заполненных ячеек в QD-карте (всего 1 000 ячеек) при условии, что каждое принятое изображение проходит T5-GATE.

1,000Total QD-map cellsВсего ячеек QD-карты
4T5-GATE quality gatesГейтов качества T5-GATE
15%Coverage target (300 cyc)Целевое покрытие (300 цикл.)
$0.10Cost per cycle (branch α)Стоимость цикла (ветка α)
Why Coverage, Not Quality
Почему покрытие, а не качество

Quality is guaranteed by the gates (floor). Optimizing quality above the floor leads to mode collapse — the system finds one "beautiful" style and repeats it. Coverage forces the system to explore, producing diversity and enabling the emergence of unexpected aesthetic territory. Coverage per dollar serves as the primary comparison metric between architectures.

Качество гарантировано гейтами (порог). Оптимизация качества выше порога ведёт к коллапсу мод — система находит один «красивый» стиль и повторяет его. Покрытие заставляет систему исследовать, порождая разнообразие и обеспечивая появление неожиданной эстетической территории. Покрытие на доллар служит основной метрикой сравнения между архитектурами.

What the Proposer Sees

Что видит Предложитель

The Proposer agent does not receive the "coverage" metric directly. Instead, it receives a structured context window containing the compass, QD-map state, history, and stagnation signals. The task of targeting empty zones is implied by the gap information, not by an explicit optimization objective.

Агент-Предложитель не получает метрику «покрытия» напрямую. Вместо этого он получает структурированное контекстное окно, содержащее compass, состояние QD-карты, историю и сигналы стагнации. Задача нацеливания на пустые зоны подразумевается информацией о пробелах, а не явной целью оптимизации.

Proposer's context window: ├── Compass: Mission D (Scale Vertigo) — creative direction ├── QD-map state: │ ├── Coverage: 8.3% (83 / 1,000 cells filled) │ ├── Heatmap: dense in zones [high intensity, low paradox] │ ├── Empty zones: [low intensity + high impossibility], [high paradox + low intensity] │ └── Suggested target zone: material_impossibility=[0.6-0.8], paradox=[0.7-0.9], intensity=[0.1-0.3] ├── History: │ ├── Last 3 accepted: [fingerprint descriptions] │ ├── Last 5 rejected: [reason per rejection — which gate, what score] │ └── Trend: 3 consecutive rejections (Gate 3: DreamSim too similar) ├── Stagnation: Martingale score = 2.3 (warning: approaching threshold) └── Task: "Propose constraints that will reach unexplored territory on the map"
Контекстное окно Предложителя: ├── Compass: Миссия D (Масштабное головокружение) — творческое направление ├── Состояние QD-карты: │ ├── Покрытие: 8.3% (83 / 1 000 ячеек заполнено) │ ├── Тепловая карта: плотно в зонах [высокая интенсивность, низкий парадокс] │ ├── Пустые зоны: [низкая интенсивность + высокая невозможность], [высокий парадокс + низкая интенсивность] │ └── Предложенная целевая зона: material_impossibility=[0.6-0.8], paradox=[0.7-0.9], intensity=[0.1-0.3] ├── История: │ ├── Последние 3 принятых: [описания отпечатков] │ ├── Последние 5 отклонённых: [причина отклонения — какой гейт, какой балл] │ └── Тренд: 3 последовательных отклонения (Gate 3: DreamSim слишком похож) ├── Стагнация: Martingale score = 2.3 (предупреждение: приближение к порогу) └── Задача: «Предложить ограничения для достижения неисследованной территории на карте»

Secondary Metrics (monitored, not optimized)

Вторичные метрики (отслеживаемые, не оптимизируемые)

MetricМетрика MeasuresИзмеряет TargetЦель RoleРоль
Gate pass rate% images passing T5-GATE% изображений, проходящих T5-GATE20–80%Pipeline healthЗдоровье пайплайна
Mean DreamSimAverage dissimilarity of accepted imagesСредняя непохожесть принятых изображенийDiversityРазнообразие
Coverage velocityΔcoverage / Δcycle (20-cycle window)Δпокрытие / Δцикл (окно 20 циклов)> 0Exploration speedСкорость исследования
Cells per $Coverage / accumulated costПокрытие / накопленная стоимостьmaxCost efficiencyЭффективность расходов
Stagnation eventsTimes Martingale > thresholdРаз Martingale > порог< 5StabilityСтабильность
Rejection dist.% rejections per gate% отклонений на гейтuniformравномерноеDiagnosticsДиагностика
VLM disagreement% multi-judge panel disagreement% расхождений мульти-судейской панелиtrackотслеживатьSignal qualityКачество сигнала

IV. Sub-Goals by Phase

IV. Подцели по фазам

Each experimental phase is governed by a specific research question. The sub-goal determines what constitutes "success" and which parameters are varied versus fixed.

Каждая экспериментальная фаза определяется конкретным исследовательским вопросом. Подцель определяет, что считается «успехом» и какие параметры варьируются, а какие фиксируются.

"Which architecture fills the QD-map faster and more efficiently?"

«Какая архитектура заполняет QD-карту быстрее и эффективнее?»

ParameterПараметрValueЗначение
CompassMission D: Scale Vertigo
Constraint sourceT4a: random from seed library
CyclesЦиклов200 per branch per seed
Seeds3 per branch

Branches Under Test

Тестируемые ветки

BranchВеткаArchitectureАрхитектураDescriptionОписание
Linear single-agentOne LLM does everything: proposes, generates prompt, gets judged by T5-GATEОдна LLM делает всё: предлагает, генерирует промпт, оценивается T5-GATE
MAE TripletClaude Opus → Proposer, GPT-5.2 → Generator, Gemini 3.1 Pro → JudgeClaude Opus → Предложитель, GPT-5.2 → Генератор, Gemini 3.1 Pro → Судья
EnsembleOne proposer, three generators (all three LLMs), one judgeОдин предложитель, три генератора (все три LLM), один судья
Islands3 independent streams, each single-agent, shared archive3 независимых потока, каждый однозагентный, общий архив
HACN2 clusters with different models + Superego coordinator2 кластера с разными моделями + координатор Superego

Victory Criteria

Критерии победы

ComparisonСравнениеMetricМетрикаThresholdПорог
Multi-agent > single?Мульти-агент > одиночный?Final coverage (ε, η) > coverage (α)Финальное покрытие (ε, η) > покрытия (α)Mann-Whitney U, p < 0.05
Cost-efficient winner?Победитель по стоимости?Coverage per dollarCohen's d > 0.5
HACN > MAE?HACN > MAE?Unique cells (θ) > (ε) at equal costУникальных ячеек (θ) > (ε) при равной стоимостиp < 0.05

"Which configuration improvements boost coverage of the selected architecture?"

«Какие улучшения конфигурации повышают покрытие выбранной архитектуры?»

Phase 2 experiments run on the Phase 1 winner with Mission D held constant. Four experiment groups test independent configuration axes:

Эксперименты Фазы 2 запускаются на победителе Фазы 1 при фиксированной Миссии D. Четыре группы экспериментов тестируют независимые оси конфигурации:

3
Constraint sourceИсточник ограничений

Random (T4a) vs QD-gap targeted (T4b) vs Adversarial proposer (T4e)

Случайный (T4a) vs нацеленный на пробелы QD (T4b) vs Состязательный предложитель (T4e)

4
Exploration driverДрайвер исследования

ε-greedy (80/20) vs Curiosity bonus vs Adaptive (random → QD-gap)

ε-greedy (80/20) vs Бонус за любопытство vs Адаптивный (random → QD-gap)

5
Checklist rotation (T5b)Ротация чеклиста (T5b)

Fixed checklist vs Rotating every 50 cycles (structural → expressive → adversarial → mixed)

Фиксированный чеклист vs Ротация каждые 50 циклов (структурный → экспрессивный → состязательный → смешанный)

6
Multi-judge (T5e)Мульти-судья (T5e)

Single VLM judge (Gemini 3.1 Pro) vs 3-judge panel (Claude + GPT-5.2 + Gemini, majority vote)

Одиночный VLM-судья (Gemini 3.1 Pro) vs Панель из 3 судей (Claude + GPT-5.2 + Gemini, голосование большинством)

"Does the system work long-term? Does it transfer to another theme?"

«Работает ли система долгосрочно? Переносится ли на другую тему?»

ExperimentЭкспериментMissionCyclesЦикловKey QuestionКлючевой вопрос
Exp 7D (Scale Vertigo)300Second wind? Sustained diversity?Второе дыхание? Устойчивое разнообразие?
Exp 8C (Sensory Collision)200Coverage(C) ≥ 70% of coverage(D)?Покрытие(C) ≥ 70% от покрытия(D)?
Exp 9 (optional)(опциональный)E (Paradox Engine)300Hardest mission — capability proofСложнейшая миссия — доказательство возможностей
Success Criteria
Критерии успеха

Exp 7: Coverage > 15% at 300 cycles, at least one "second wind" event, DreamSim trajectory ≥ 80% of peak.
Exp 8: Coverage(C) ≥ 70% of Coverage(D) at cycle 200 → architecture generalizes. < 70% → overfitted, needs adaptation.

Эксп. 7: Покрытие > 15% за 300 циклов, хотя бы одно событие «второго дыхания», траектория DreamSim ≥ 80% от пикового значения.
Эксп. 8: Покрытие(C) ≥ 70% от Покрытия(D) на цикле 200 → архитектура обобщается. < 70% → переобучение, требуется адаптация.

V. Seed Library — Mission D

V. Библиотека начальных данных — Миссия D

The seed constraint library provides the initial creative material for bootstrapping the system's exploration. For Mission D ("Scale Vertigo"), the library is organized into three categories of combinatorial elements, from which 100 renderable constraint sets are composed.

Библиотека начальных ограничений предоставляет исходный творческий материал для запуска процесса исследования. Для Миссии D («Масштабное головокружение») библиотека организована в три категории комбинаторных элементов, из которых составляются 100 рендерируемых наборов ограничений.

🔬 Scale Pairs (micro ↔ macro)🔬 Пары масштабов (микро ↔ макро)
Biological ↔ Cosmic: synapse ↔ nebula, mitochondria ↔ galaxy cluster, cell membrane ↔ event horizon, DNA helix ↔ spiral galaxy arm, capillary network ↔ cosmic web filaments, virus capsid ↔ geodesic space station, mycelium network ↔ dark matter web, red blood cell ↔ red giant star Microworld ↔ Architecture: crystal lattice ↔ city grid, grain of sand ↔ mountain range, snowflake ↔ cathedral ceiling, pollen grain ↔ space habitat, diatom shell ↔ stadium roof, mineral vein ↔ highway system Subatomic ↔ Landscape: electron cloud ↔ weather system, quantum foam ↔ ocean surface, particle collision ↔ tectonic collision, atomic orbital ↔ planetary ringБиологическое ↔ Космическое: синапс ↔ туманность, митохондрия ↔ скопление галактик, клеточная мембрана ↔ горизонт событий, спираль ДНК ↔ рукав спиральной галактики, капиллярная сеть ↔ нити космической паутины, капсид вируса ↔ геодезическая космическая станция, сеть мицелия ↔ паутина тёмной материи, эритроцит ↔ красный гигант Микромир ↔ Архитектура: кристаллическая решётка ↔ городская сетка, песчинка ↔ горный хребет, снежинка ↔ потолок собора, зерно пыльцы ↔ космическая станция, оболочка диатомеи ↔ крыша стадиона, минеральная жила ↔ система шоссе Субатомное ↔ Ландшафтное: электронное облако ↔ погодная система, квантовая пена ↔ поверхность океана, столкновение частиц ↔ столкновение тектонических плит, атомная орбиталь ↔ планетарное кольцо
🎨 Materials Palette🎨 Палитра материалов
Organic-translucent: bioluminescent membrane, amber resin, opal-like tissue, wet silk Mineral-crystalline: bismuth crystal, geode interior, obsidian fracture, pyrite cluster Gaseous-luminous: nebular gas, aurora plasma, phosphorescent fog, charged atmosphere Impossible hybrids: liquid glass, breathing stone, crystallized light, magnetic smokeОрганические-полупрозрачные: биолюминесцентная мембрана, янтарная смола, опалоподобная ткань, мокрый шёлк Минерально-кристаллические: кристалл висмута, внутренность жеоды, излом обсидиана, кластер пирита Газообразно-светящиеся: газ туманности, плазма полярного сияния, фосфоресцирующий туман, заряженная атмосфера Невозможные гибриды: жидкое стекло, дышащий камень, кристаллизованный свет, магнитный дым
📝 Seed Constraints (3 of 10 examples)📝 Начальные ограничения (3 из 10 примеров)
{"id": "d_001", "material": "bioluminescent membrane stretched over crystalline scaffolding", "scale_pair": "cell membrane / space station hull", "composition": "viewer inside looking outward through translucent wall, stars or organelles beyond", "palette": "deep teal, phosphorescent green, warm amber nodes", "paradox": "interior of a living cell that contains stars", "mood": "quiet awe, contemplative vastness in a small space", "negative": "no human figures, no text, no photorealistic style"} {"id": "d_004", "material": "mycelium threads glowing with captured starlight", "scale_pair": "mycelium network / cosmic web", "composition": "network radiating from center, nodes pulsing, viewer at ambiguous distance", "palette": "warm white threads on deep blue-black void", "paradox": "fungal network that maps the large-scale structure of the universe", "mood": "sublime confusion — living or cosmic?", "negative": "no mushroom caps, no Earth, no identifiable plants"} {"id": "d_008", "material": "DNA double helix made of spiral galaxy arms, base pairs are star clusters", "scale_pair": "DNA helix / spiral galaxy", "composition": "vertical helix filling frame, glowing base pair connections", "palette": "deep space blue-black, warm gold connections, cool white stars", "paradox": "genetic code written in galaxies — biology at cosmological scale", "mood": "awe at structural rhyme across 20 orders of magnitude", "negative": "no labels, no scientific diagram style, no flat graphics"}

The full seed library of 100 constraints is generated in three stages: 20 hand-crafted exemplars covering all QD-map zones, 80 LLM-expanded variants targeting specific zones, and a renderability filter where constraints that fail T5-GATE three times consecutively are replaced.

Полная библиотека из 100 начальных ограничений генерируется в три этапа: 20 ручных образцов, покрывающих все зоны QD-карты, 80 LLM-расширенных вариантов, нацеленных на конкретные зоны, и фильтр рендерируемости, в котором ограничения, трижды подряд не прошедшие T5-GATE, заменяются новыми.

VI. VLM Checklist — Mission-Adapted

VI. VLM-чеклист — адаптированный под миссию

The VLM evaluation checklist consists of a base set of structural and aesthetic criteria applied to all images, plus mission-specific additions that test whether the creative compass has been followed. The checklist adapts automatically when the active mission changes.

VLM-чеклист оценки состоит из базового набора структурных и эстетических критериев, применяемых ко всем изображениям, плюс специфические для миссии дополнения, проверяющие следование творческому компасу. Чеклист адаптируется автоматически при смене активной миссии.

Structural Integrity & Anti-Patterns

Структурная целостность и анти-паттерны

  • Visible rendering artifacts? → rejectВидимые артефакты рендеринга? → отклонить
  • Visually coherent? (no → reject)Визуально целостно? (нет → отклонить)
  • Prescribed material/texture present? (no → flag)Заданный материал/текстура присутствует? (нет → флаг)
  • Palette adhered to? (no → flag)Палитра соблюдена? (нет → флаг)
  • Resembles stock photography? (yes → flag)Напоминает стоковую фотографию? (да → флаг)
  • Looks "typically AI-generated"? (yes → flag)Выглядит «типично AI-сгенерированным»? (да → флаг)

Scale Vertigo

  • Scale ambivalence present? (no → flag)Масштабная амбивалентность присутствует? (нет → флаг)
  • Prescribed scales collide in one frame? (no → flag)Заданные масштабы столкнулись в одном кадре? (нет → флаг)
  • Vertigo / disorientation effect? (no → flag)Эффект головокружения / дезориентации? (нет → флаг)
  • BONUS: "Shift" moment — second scale becomes visible? (yes → bonus)БОНУС: Момент «сдвига» — второй масштаб становится видимым? (да → бонус)

Sensory Collision

  • Translation between perceptual modalities present? (no → flag)Перевод между перцептуальными модальностями присутствует? (нет → флаг)
  • Translation visually convincing? (no → flag)Перевод визуально убедителен? (нет → флаг)
  • Multisensory response evoked? (no → flag)Мультисенсорный отклик вызван? (нет → флаг)
  • BONUS: "Third sense" — unexpected modality emerges from collision? (yes → bonus)БОНУС: «Третье чувство» — неожиданная модальность возникает из столкновения? (да → бонус)

The Paradox Engine

  • Visual contradiction present? (no → flag)Визуальное противоречие присутствует? (нет → флаг)
  • Contradiction visually convincing (not an error)? (no → flag)Противоречие визуально убедительно (не ошибка)? (нет → флаг)
  • Does the viewer want to keep looking? (no → flag)Хочется ли зрителю продолжать рассматривать? (нет → флаг)
  • BONUS: Irresolvable — cannot choose one interpretation? (yes → bonus)БОНУС: Неразрешимость — невозможно выбрать одну интерпретацию? (да → бонус)

VII. Missions → Experiments Mapping

VII. Отображение миссий на эксперименты

Fig. 2. Phase Timeline & Mission Mapping
Рис. 2. Временная шкала фаз и распределение миссий
Stage 0 Calibration Калибровка Phase 1 Architecture Search Поиск архитектуры Mission D ★ Phase 2 Tuning Настройка Mission D Phase 3 Generalization Обобщение D C E Phase 4 ∞ Continuous Service Непрерывный сервис all missions rotating все миссии в ротации D C E A B ~150 cycles ~150 циклов 3,000 ~6,000 ~2,800 ~$45 ~$580 ~$1,000 ~$600 ~$200–400/mo
Mission D is primary throughout Phases 1–2. Phase 3 activates Missions C and E for generalization. Phase 4 rotates all missions (D → C → E → A → B → …) in continuous production.
Миссия D основная на протяжении Фаз 1–2. Фаза 3 активирует Миссии C и E для обобщения. Фаза 4 ротирует все миссии (D → C → E → A → B → …) в непрерывном производстве.

VIII. Decision Tree: Post-Experiment

VIII. Дерево решений: после эксперимента

A structured decision protocol is applied at the boundary of each phase. The branching logic determines whether to proceed, iterate, or fundamentally revise the approach.

На границе каждой фазы применяется структурированный протокол принятия решений. Логика ветвления определяет, следует ли продвигаться вперёд, итерировать или фундаментально пересматривать подход.

After Phase 1: IF coverage(best_multi) > coverage(α) with p < 0.05: Winner = best_multi (ε, η, or θ based on coverage_per_dollar) ELIF coverage(α) ≈ coverage(best_multi): Winner = α (simpler, cheaper, comparable) ELIF coverage(α) > coverage(best_multi): Winner = α (single-agent dominant → revisit multi-agent design) 48-hour human override window: review QD-maps visually, confirm statistical winner matches quality impression. After Phase 2: Best config = Winner_arch + best_constraint_method + best_exploration_driver + checklist_rotation_if_significant + multi_judge_if_significant After Phase 3: IF coverage(300) > coverage(200) + 5% AND second_wind_detected: → System has long-horizon capability → ready for Phase 4 ELIF coverage plateaus permanently at ~200 cycles: → System has finite exploration depth → consider outer loop redesign IF coverage(Mission C) ≥ 70% of coverage(Mission D): → Architecture generalizes → can rotate missions in Phase 4 ELIF coverage(Mission C) < 70%: → Architecture overfitted → needs mission-adaptive components Phase 4 — Continuous Service: LOOP forever: RUN production_cycle(500–1000 cycles, current_mission) EVERY 200 cycles: recalibrate_gates(T5-GATE thresholds, CLIP anchors, DreamSim baseline) IF acceptance_rate NOT IN [20%, 80%]: adjust_thresholds() IF Martingale > threshold: trigger_exploration_strategy_upgrade() IF pairwise_data_available: run_perceptual_calibration() EVERY month: rotate_mission(next_in_queue) refresh_seed_library(new_constraint_families) IF new_model_version_available: run_AB_comparison() EVERY quarter: full_system_audit(QD-map coverage, archive gallery, cost efficiency) IF coverage_velocity == 0 for > 1000 cycles: → Deep recalibration: new anchors, new seeds, strategy overhaul update_research_documentation()
После Фазы 1: ЕСЛИ покрытие(лучший_мульти) > покрытия(α) при p < 0.05: Победитель = лучший_мульти (ε, η или θ по покрытию_на_доллар) ИНАЧЕ ЕСЛИ покрытие(α) ≈ покрытие(лучший_мульти): Победитель = α (проще, дешевле, сопоставимо) ИНАЧЕ ЕСЛИ покрытие(α) > покрытия(лучший_мульти): Победитель = α (доминирование одного агента → пересмотр мульти-агентного дизайна) 48-часовое окно для ручной коррекции: визуальный обзор QD-карт, подтверждение совпадения статистического победителя с впечатлением от качества. После Фазы 2: Лучшая конфигурация = Архитектура-победитель + лучший_метод_ограничений + лучший_драйвер_исследования + ротация_чеклиста_если_значимо + мульти_судья_если_значимо После Фазы 3: ЕСЛИ покрытие(300) > покрытия(200) + 5% И обнаружено_второе_дыхание: → Система обладает долгосрочными возможностями → готова к Фазе 4 ИНАЧЕ ЕСЛИ покрытие стабильно плато на ~200 циклах: → Система имеет конечную глубину исследования → пересмотр внешнего цикла ЕСЛИ покрытие(Миссия C) ≥ 70% от покрытия(Миссия D): → Архитектура обобщается → можно ротировать миссии в Фазе 4 ИНАЧЕ ЕСЛИ покрытие(Миссия C) < 70%: → Архитектура переобучена → необходимы адаптивные компоненты Фаза 4 — Непрерывный сервис: ЦИКЛ бесконечно: ЗАПУСК продуктивный_цикл(500–1000 циклов, текущая_миссия) КАЖДЫЕ 200 циклов: рекалибровка_гейтов(пороги T5-GATE, якоря CLIP, базис DreamSim) ЕСЛИ acceptance_rate НЕ В [20%, 80%]: корректировка_порогов() ЕСЛИ Martingale > порог: улучшение_стратегии_исследования() ЕСЛИ доступны_данные_pairwise: запуск_перцептуальной_калибровки() КАЖДЫЙ месяц: ротация_миссии(следующая_в_очереди) обновление_seed_библиотеки(новые_семейства_ограничений) ЕСЛИ доступна_новая_версия_модели: запуск_AB_сравнения() КАЖДЫЙ квартал: полный_аудит_системы(покрытие QD-карты, галерея архива, эффективность расходов) ЕСЛИ скорость_покрытия == 0 более 1000 циклов: → Глубокая рекалибровка: новые якоря, новые seed, пересмотр стратегии обновление_исследовательской_документации()

Appendix: Cost Estimates by Phase

Приложение: оценки стоимости по фазам

All missions utilize the same pipeline, thus cost depends on the architecture, not on the mission. The following estimates are provided for compute-time and API rate-limit planning.

Все миссии используют один и тот же пайплайн, поэтому стоимость зависит от архитектуры, а не от миссии. Приведённые ниже оценки предназначены для планирования вычислительного времени и лимитов API.

PhaseФаза ExperimentsЭкспериментов RunsПрогонов CyclesЦиклов Est. CostОжид. стоимость
Stage 0CalibrationКалибровка3150~$45
Phase 1Exp 1–2153,000~$580
Phase 2Exp 3–6~30~6,000~$1,000
Phase 3Exp 7–9~11~2,800~$600
Phases 0–3Фазы 0–3~59~12,000~$2,225
Phase 4∞ Continuous∞ Непрерывный~$200–400/mo~$200–400/мес
Budget Note
Примечание о бюджете

Budget is not a constraint. These estimates are provided for compute-time planning and API rate-limit management, not for cost-cutting purposes.

Бюджет не является ограничением. Приведённые оценки предназначены для планирования вычислительного времени и управления лимитами API, а не для сокращения расходов.

PreviousПредыдущая 06 · Experiment Plan v506 · План экспериментов v5 NextСледующая 08 · Project Plan08 · План проекта