что-то я запутался, вот ситуация: был текст в cp1251, его приложение прочитало как latin1 и сохранило в utf-8 (насчет последнего шага не уверен). нужно эту солянку перевести обратно в cp1251 и закодировать в обычный юникод. вот пример (слово 'Ария'):
Àðèÿ
опытным путем выяснить комбинацию encode, decode как-то не получается
MiBBiM писал(а):что-то я запутался, вот ситуация: был текст в cp1251, его приложение прочитало как latin1 и сохранило в utf-8 (насчет последнего шага не уверен). нужно эту солянку перевести обратно в cp1251 и закодировать в обычный юникод. вот пример (слово 'Ария'):
Àðèÿ
опытным путем выяснить комбинацию encode, decode как-то не получается
а можно файл с таким текстом прицепить здесь , больно хочется на сие чудо перекодировки поглядеть ...
не знаю, может не в тему - просто слова знакомые увидел в линуксе есть пакет который кодировку сам исходную выясняет app-i18n/enca ENCA detects the character coding of a file and converts it if desired
Добавлено спустя 22 минуты 16 секунд: проблема перекодировки решается в файле __init__.py, процедуре on_tags_parsed (сейчас в репозитории в тексте процедуры костыль). в коде происходит получение двух значений - artist и title, которые и нужно привести к читаемому виду. вот код, которым я пользовался во время тестов: