Как сделать тематическую модель «взрослой»?
В прошлой статье мы разобрали pLSA, где документ — это смесь тем, а тема — распределение слов. Следующий шаг — LDA — модель добавляет априоры Дирихле, которые делают тематизацию более устойчивой и управляемой в реальных задачах.
➡️ Читайте подробнее здесь
Кстати, все материалы цикла теперь будем публиковать в ВК, так что дублируем ссылки на прошлые статьи для удобства:
— Алгоритм bag-of-words — Модель TF–IDF — Модель LSA — Модель pLSA
Следите за обновлениями, скоро вернемся!