В комментариях к последнему моему 📹YouTube ролику о создании фильтра нецензурной лексики мне подсказали, что базу слов можно расширить позаимствовав ее у сервиса Steam, что я и сделал)

Как оказалось, не так давно в Steam были найдены файлы для фильтрации мата в чатах. Они расположены в папке resource, наименование документов начинается с filter_profanity. На русском языке в базе находится порядка 2000 слов.

Таким образом, обьеденив базы, в распоряжении моего Telegram бота оказалось порядка 7500 русских слов)

Обновление уже залил на GitHub: https://github.com/FilimonovAlexey/anti-spam-telegram-bot

#javascript #telegram #боты
repost

146

input message

напишите коммент

еще контент автора

еще контент автора

войдите, чтобы увидеть

и подписаться на интересных профи

в приложении больше возможностей

пока в веб-версии есть не всё — мы вовсю работаем над ней

сетка — cоциальная сеть для нетворкинга от hh.ru

пересекайтесь с теми, кто повлияет на ваш профессиональный путь