Junior Frontend разработчик
· 23.07 · ред.В комментариях к последнему моему 📹YouTube ролику о создании фильтра нецензурной лексики мне подсказали, что базу слов можно расширить позаимствовав ее у сервиса Steam, что я и сделал)
Как оказалось, не так давно в Steam были найдены файлы для фильтрации мата в чатах. Они расположены в папке resource, наименование документов начинается с filter_profanity. На русском языке в базе находится порядка 2000 слов.
Таким образом, обьеденив базы, в распоряжении моего Telegram бота оказалось порядка 7500 русских слов)
Обновление уже залил на GitHub: https://github.com/FilimonovAlexey/anti-spam-telegram-bot
#javascript #telegram #боты
0 комментов