Сисадмин-любитель (ulrith) wrote,
Сисадмин-любитель
ulrith

лечение плохой кодировки mp3-файлов выжатых из Звуковыжималки

Полтора года назад я столкнулся с тем, что некоторые мои Audio CD Звуковыжималка выжимает в плохой кодировке, так что получаются кракозябры вроде таких: Àíñàìáëü 4'33". Долгими месяцами я курил мануалы, изучал теги id3 и думал, думал, думал. И вот они, очередные 5 копеек в копилку мировой гармонии. :-)

Как оказалось, проблема имеет две части: плохие имена получающихся файлов и плохие id3-теги. «Плохость» их заключается в том, что на самом диске они записаны в кодировке cp1251, что программа Sound Juicer по какой-то причине воспринимает как cp1252 и преобразует в формат Unicode неверно.

Привожу bash-скрипт, который исправляет кодировку и в именах файлов, и в id3-тегах. Параметром ему передаётся папка где лежат пациенты.

#!/bin/bash
cd "$1"
for f in *
do
name=`echo "$f" | iconv -c -f utf8 -t cp1252 | iconv -c -f cp1251 -t utf8`
echo "Обработка: $f ===> $name"
mv "$f" "$name"
mid3iconv -e cp1251 "$name" # apt-get install python-mutagen
done
Tags: unixway
Subscribe
  • Post a new comment

    Error

    default userpic

    Your reply will be screened

    When you submit the form an invisible reCAPTCHA check will be performed.
    You must follow the Privacy Policy and Google Terms of use.
  • 0 comments