Кисель в Айти | Python разработка
27.02
Оказывается существует модуль для обнаружения кодировки текста. Называется chardet. Под капотом оно анализирует частотность символов и структуру, находя закономерности, которые есть у разных кодировок.
Использовать максимально просто:
`import chardet
#Пример текста в неизвестной кодировкеtext_bytes = "Привет, мир!".encode("windows-1251")
#Определение кодировкиresult = chardet.detect(text_bytes)
print(result)
Вывод следующий: {'encoding': 'windows-1251', 'confidence': 0.99, 'language': 'Russian'}
#python`еще контент в этом сообществе
еще контент в этом соообществе
Кисель в Айти | Python разработка
27.02
войдите, чтобы увидеть
и подписаться на интересных профи