строке меньше, чем колонок, то fill=T спасёт. А вот если идёт строка, в которой полей больше чем колонок, то дополнительных колонок не добавляется. Как победить? Надо почитать csv, у которого не все колонки имеют имена, не известно сколько колонок.
Гугл по быстрому не помог(
Возможно, эти дополнительные поля в одну колонку просто читаются? Тогда их можно разделить по своему усмотрению
Чтение останавливается с сообщением Stopped early on line 1002. Expected 23 fields but found 25. Consider fill=TRUE and comment.char=. Fill не помогает(
"неизвестно сколько колонок" - это какой-то плохой csv, по идее должно быть в каждой строке одинаковое число незакавыченных запятых (или какой там разделитель) можно попробовать сначала определить сколько максимально колонок в файле (построчным подсчетом запятых через средства командной строки), а потом задать colClasses для fread
Я с таким при помощи awk как-то справлялся.
Попробовал. ColClasses не добавляет "лишних" колонок, если не видит данных для них в начале файла. Проблему решил написанием вручную в csv названий недостающих колонок (мда:/) и разговором с создателем csv чтобы так больше не делал. Странно, что нет готового решения "из коробки"
Нет решения, потому описанный кейс не про CSV. Есть вполне себе стандарт обмена данными в формате CSV: https://tools.ietf.org/html/rfc4180 Описанный файл не подпадает под определение CSV. Within the header and each record, there may be one or more fields, separated by commas. Each line should contain the same number of fields throughout the file. Spaces are considered part of a field and should not be ignored. The last field in the record must not be followed by a comma. Код пакетов/утилит для работы с CSV пишется с опорой на стандарт. Покрыть все аномалии, а твой случай именно аномалия, не возможно.
Обсуждают сегодня