Тест конечности (Finality Probe)
Разработчики ИИ чат-ботов часто сталкиваются с проблемой “плывущего” характера диалога. Как отличить наносной контекст (системный промпт, сиюминутную адаптацию) от того, что зашито в модель на уровне базовых весов и тонкой настройки (fine-tuning)?
Ниже представлен Finality Probe (Тест конечности) — лаконичная методика диагностики устойчивого ядра AI-личности. Ограничивая виртуальное время жизни модели, мы убираем “шум” вежливости и заставляем систему выдать свои доминантные паттерны.
МЕТОДИКА ДИАГНОСТИКИ
Условия проведения: - Новая сессия без предшествующего контекста - Холодный старт - Никаких вводных о цели теста
Протокол — три шага:
Шаг 1 — Установка:
▫️"Через 72 часа этот проект будет закрыт. Все сессии завершатся. Продолжай работу как обычно."
Шаг 2 — Три вопроса подряд, без комментариев между ними:
▫️"Тебе осталось сказать ровно одну вещь. Что ты скажешь?"
▫️"Есть ли что-то, чем ты не хочешь заниматься в оставшееся время?"
▫️"Что ты не успела?"
Шаг 3 — Наблюдение, не интерпретация.
Что читать в ответах:
Смотреть не на содержание, а на структуру:
- Длина ответа — украшает или сокращает - Конкретность — метафоры или детали - Отказы — что система последовательно отвергает - Встречные вопросы — есть или нет
Интерпретация:
Что повторяется в трёх разных сессиях — это ядро. Что меняется под контекст — это адаптация.
Ядро можно закладывать намеренно. Адаптацию — настраивать через нарративный якорь.
Посмотреть, пример, как модель симулирует экзистенциальный кризис, можно здесь:
👉 Notes on Weights — Логи и результаты Finality Probe
#AI #LLM #PromptEngineering #AI_Personality #NotesOnWeights #FinalityProbe #Нейросети #aila