Sunday, October 2, 2011

wget & invalid encoding в именах файлов

При загрузке файлов, содержащих в имени символы отличные от английского языка с помощью wget из консоли, часто возникает ситуация, когда результрующий файл получается вида "??????? ?????.pdf (invalid encoding)". По умолчанию в wget экранирует символы, как %HH, где HH - шестандцатиричное число, соответствующее этому символу. Как результат файлы отображаются некорректно. Для этого чтобы отключить подмену символов необходимо воспользоваться параметром: --restrict-file-names=nocontrol. В этом случае, подмена символов будет откючена. Отключением экранирования стоит пользоваться острожно, и использовать в том случае, когда вы точно знаете, что это не создаст проблем с файловой системой.

0 comments:

Post a Comment