169 похожих чатов

Добрый день, чат. А кто-нибудь работал в перле с zip

архивами, в которых лежат файлики с именами в utf-8?
Использую https://metacpan.org/pod/IO::Uncompress::Unzip получаю кракозябры.
В новых релизах появился флаг Efs, я поставил, но не помогло.
Что-то я делаю не так может быть? Или надо другой модуль взять?

20 ответов

20 просмотров

звучит как двойная кодировка в виндовой реализации зипа

Askar-Timirgazin Автор вопроса
Askar Timirgazin
выглядит вообще как тройная

скопируйте название файла, может получится раскодировать

была похожая проблема, но с созданием архивов zip делался Archive::Zip - ом, имена файлов были с юникодом, а потом это архив не открывался помогло при при создании это: $Archive::Zip::UNICODE = 1;

Askar-Timirgazin Автор вопроса
Askar Timirgazin
в 1с

iconv -f cp862 -t utf8 - помогает?

Askar Timirgazin
в 1с

виндовой или нативной?

Askar-Timirgazin Автор вопроса
Askar Timirgazin
не знаю

так начни с того, чтобы с помощью iconv определить кодировку вангую, 1251

Askar-Timirgazin Автор вопроса
Alex Bush
iconv -f cp862 -t utf8 - помогает?

unzip нормально разархивирует, в перле не получается

Askar Timirgazin
unzip нормально разархивирует, в перле не получает...

сейчас в никсах unzip обычно собран с libnatspec, потому проблем с кодировкой нет

Askar Timirgazin
ubuntu

а в нем патченный поди unzip

Askar-Timirgazin Автор вопроса

возвращаясь к напечатанному: я распотрошил чтение полей заголовка файла в архиве и вот что он получает для имени "УПД": d7 a3 d7 9f d7 94 Это почти UTF-8 с заменой d7 на d0, верный вариант будет d0 a3 d0 9f d0 94 Кто-нибудь знает, это кодировка какая-то, или баг, или что?

Askar Timirgazin
возвращаясь к напечатанному: я распотрошил чтение ...

Если маленькими буквами "упд" то WINDOWS-1251 -> ISO-8859-8

Askar Timirgazin
возвращаясь к напечатанному: я распотрошил чтение ...

мне не удалось вспомнить такой пары кодировок что бы за одно перекодирование получался такой фифект. может или кодировка экзотическая или двойная перекодировка.

Askar-Timirgazin Автор вопроса
Askar Timirgazin
возвращаясь к напечатанному: я распотрошил чтение ...

удивительно, сколько в подсказках было кодировок иврита: cp862, windows-1255, но почему-то никто не подсказал про cp866 Итак, правильный ответ: имена в zip-архиве,созданном под виндой были закодированы в cp866 У модуля IO::Compress (из которого IO::Uncompress::Unzip) есть задача в трекере на этот счёт https://github.com/pmqs/IO-Compress/issues/16, но движения по ней нет. Может у вас есть идеи, как это можно реализовать, а соберу патч автору?

Похожие вопросы

Обсуждают сегодня

Какой-то там пердун в 90-х решил, что есть какая-то разная типизация. Кого вообще это волнует?
КТ315
49
void terminal_scroll() { memmove(terminal_buffer, terminal_buffer + VGA_WIDTH, buffer_size - VGA_WIDTH); memset(terminal_buffer + buffer_size - VGA_WIDTH, 0, VGA_WIDTH); ...
Егор
47
Всем привет! Подскажите, пожалуйста, в чем ошибка? Настраиваю подключение к MySQL. Либы лежат рядом с exe. Все как по "учебнику"
Евгений
16
А можете как-то проверить меня по знаниям по ассемблеру?
A A
132
Здравствуйте! У меня появилась возможность купить книгу "Изучай Haskell во имя добра!". Но я где-то слышал, что эта книга устарела. Насколько это правда??
E
22
Здравствуйте! Я вот на stepic решаю задачи на хаскеле https://stepik.org/lesson/8443/step/8?unit=1578 мой код import Data.List (isInfixOf) removing :: String -> [String] ->...
E
10
Камрады, кто тесно работал с vtv, хотел уточнить. Ширина column задаётся жёстко на этапе создания дерева или можно в рантайме ее менять программно (не мышкой)?
Ed Doc
10
да ладно ... что там неочевидного ? глянуть в исх-ки датасета и/или кверика чтобы понять в каком месте и как выполняется обращения к св-вам blablaSQL - минутное дело, даже е...
Сергей
7
Здесь для arm кто-нибудь кодит ?
Nothing
52
Всем привет, у меня есть сервер принимающий входящие HTTP подключения, как проверить, что подключение было через прокси или нет, есть какие то поля в заголовках по которым мо...
DS
8
Карта сайта