169 похожих чатов

Подскажите, пожалуйста. Использую fread. Если данных в какой-то

строке меньше, чем колонок, то fill=T спасёт. А вот если идёт строка, в которой полей больше чем колонок, то дополнительных колонок не добавляется. Как победить? Надо почитать csv, у которого не все колонки имеют имена, не известно сколько колонок.
Гугл по быстрому не помог(

6 ответов

8 просмотров

Возможно, эти дополнительные поля в одну колонку просто читаются? Тогда их можно разделить по своему усмотрению

Анатолий- Автор вопроса
Andrey
Возможно, эти дополнительные поля в одну колонку п...

Чтение останавливается с сообщением Stopped early on line 1002. Expected 23 fields but found 25. Consider fill=TRUE and comment.char=. Fill не помогает(

"неизвестно сколько колонок" - это какой-то плохой csv, по идее должно быть в каждой строке одинаковое число незакавыченных запятых (или какой там разделитель) можно попробовать сначала определить сколько максимально колонок в файле (построчным подсчетом запятых через средства командной строки), а потом задать colClasses для fread

Анатолий
Чтение останавливается с сообщением Stopped early...

Я с таким при помощи awk как-то справлялся.

Анатолий- Автор вопроса
Evgeniy
"неизвестно сколько колонок" - это какой-то плохой...

Попробовал. ColClasses не добавляет "лишних" колонок, если не видит данных для них в начале файла. Проблему решил написанием вручную в csv названий недостающих колонок (мда:/) и разговором с создателем csv чтобы так больше не делал. Странно, что нет готового решения "из коробки"

Анатолий
Попробовал. ColClasses не добавляет "лишних" коло...

Нет решения, потому описанный кейс не про CSV. Есть вполне себе стандарт обмена данными в формате CSV: https://tools.ietf.org/html/rfc4180 Описанный файл не подпадает под определение CSV. Within the header and each record, there may be one or more fields, separated by commas. Each line should contain the same number of fields throughout the file. Spaces are considered part of a field and should not be ignored. The last field in the record must not be followed by a comma. Код пакетов/утилит для работы с CSV пишется с опорой на стандарт. Покрыть все аномалии, а твой случай именно аномалия, не возможно.

Похожие вопросы

Обсуждают сегодня

Какой-то там пердун в 90-х решил, что есть какая-то разная типизация. Кого вообще это волнует?
КТ315
49
void terminal_scroll() { memmove(terminal_buffer, terminal_buffer + VGA_WIDTH, buffer_size - VGA_WIDTH); memset(terminal_buffer + buffer_size - VGA_WIDTH, 0, VGA_WIDTH); ...
Егор
47
Всем привет! Подскажите, пожалуйста, в чем ошибка? Настраиваю подключение к MySQL. Либы лежат рядом с exe. Все как по "учебнику"
Евгений
16
А можете как-то проверить меня по знаниям по ассемблеру?
A A
132
Здравствуйте! У меня появилась возможность купить книгу "Изучай Haskell во имя добра!". Но я где-то слышал, что эта книга устарела. Насколько это правда??
E
22
Здравствуйте! Я вот на stepic решаю задачи на хаскеле https://stepik.org/lesson/8443/step/8?unit=1578 мой код import Data.List (isInfixOf) removing :: String -> [String] ->...
E
10
Камрады, кто тесно работал с vtv, хотел уточнить. Ширина column задаётся жёстко на этапе создания дерева или можно в рантайме ее менять программно (не мышкой)?
Ed Doc
10
да ладно ... что там неочевидного ? глянуть в исх-ки датасета и/или кверика чтобы понять в каком месте и как выполняется обращения к св-вам blablaSQL - минутное дело, даже е...
Сергей
7
Здесь для arm кто-нибудь кодит ?
Nothing
52
Всем привет, у меня есть сервер принимающий входящие HTTP подключения, как проверить, что подключение было через прокси или нет, есть какие то поля в заголовках по которым мо...
Кибер Бомж
8
Карта сайта