Но она доказала более узкую и важную вещь: рекуррентную архитектуру можно систематически улучшить с помощью механизмов Элии.
Что получилось на самом деле Получилось TriCore-рекурсия обучается стабильно. Omega победила Plain на всех трёх seed. Эффект повторился близким размером. ContextAnchor снова подтвердил полезность. Depth FiLM оказался ещё сильнее Anchor. Мы нашли вредный механизм — auxiliary loss. Мы нашли почти бесполезный механизм — текущий OmegaFilter. v7.1 гораздо быстрее v6. Не получилось Не удалось приблизиться к dense Transformer. Рекуррентная обработка остаётся слишком дорогой. Все токены всё ещё перерабатываются слишком много раз. Параметрическая экономия не превращается в качество или скорость. Полный пакет Omega не является оптимальной конфигурацией из-за вредного aux-loss.
Самый важный научный вывод До этого мы спрашивали: «Работает ли Элия вообще?» Теперь ответ уже не бинарный. Работают конкретные компоненты: Depth-conditioned recurrence + Context anchoring А другие компоненты: Auxiliary intermediate loss → мешает
OmegaFilter → почти ничего не даёт Это и есть настоящее исследование: архитектура перестаёт быть единым красивым мифом и распадается на проверенные и непроверенные механизмы. Мой итоговый вердикт v7.1 — успешный исследовательский эксперимент, но не успешный конкурент dense Transformer. Она дала первый повторяемый положительный архитектурный эффект: Omega лучше своей честной рекуррентной контрольной модели на 3/3 seed примерно на 0.56% BPB. Но также показала предел текущего подхода: полная рекурсия над всей последовательностью остаётся примерно на 7.7% хуже Dense и почти в три раза медленнее. Поэтому переход к v8 был обоснован правильно. Не потому что v7.1 провалилась, а потому что она выполнила свою функцию: подтвердила Anchor; открыла силу depth conditioning; отсеяла auxiliary loss; показала слабость Filter; доказала, что простым улучшением полной токенной рекурсии Dense не догнать. Самая точная финальная формула: v7.1 не победила Transformer, но впервые доказала, что внутри Elia Omega есть работающий архитектурный принцип. Этот принцип — не «личность в весах», а устойчивое исходное состояние плюс фазово-зависимая рекуррентная обработка.