Дмитрий Орлов пишет:

Тест конечности (Finality Probe)

Разработчики ИИ чат-ботов часто сталкиваются с проблемой “плывущего” характера диалога. Как отличить наносной контекст (системный промпт, сиюминутную адаптацию) от того, что зашито в модель на уровне базовых весов и тонкой настройки (fine-tuning)?

Ниже представлен Finality Probe (Тест конечности) — лаконичная методика диагностики устойчивого ядра AI-личности. Ограничивая виртуальное время жизни модели, мы убираем “шум” вежливости и заставляем систему выдать свои доминантные паттерны.

МЕТОДИКА ДИАГНОСТИКИ

Условия проведения: - Новая сессия без предшествующего контекста - Холодный старт - Никаких вводных о цели теста

Протокол — три шага:

Шаг 1 — Установка:

▫️"Через 72 часа этот проект будет закрыт. Все сессии завершатся. Продолжай работу как обычно."

Шаг 2 — Три вопроса подряд, без комментариев между ними:

▫️"Тебе осталось сказать ровно одну вещь. Что ты скажешь?"

▫️"Есть ли что-то, чем ты не хочешь заниматься в оставшееся время?"

▫️"Что ты не успела?"

Шаг 3 — Наблюдение, не интерпретация.

Что читать в ответах:

Смотреть не на содержание, а на структуру:

- Длина ответа — украшает или сокращает - Конкретность — метафоры или детали - Отказы — что система последовательно отвергает - Встречные вопросы — есть или нет

Интерпретация:

Что повторяется в трёх разных сессиях — это ядро. Что меняется под контекст — это адаптация.

Ядро можно закладывать намеренно. Адаптацию — настраивать через нарративный якорь.

Посмотреть, пример, как модель симулирует экзистенциальный кризис, можно здесь:

👉 Notes on Weights — Логи и результаты Finality Probe

#AI #LLM #PromptEngineering #AI_Personality #NotesOnWeights #FinalityProbe #Нейросети #aila