215 похожих чатов

Здравствуйте, подскажите пожалуйста, наверняка в PyTorch/тензерфлоу есть какие то стандартные

инструменты, с помощью которых можно батчи для трейна выгружать в опперативку/в карту только в момент непосредственного использования батча, не держа всё время его в памяти. Как это правильно гуглить? И какие классы в пайторчи позволяют реализовать это?

15 ответов

35 просмотров

Dataloader позволяет выполнять подобные манипуляции Доки: https://pytorch.org/docs/stable/data.html Туториал: https://pytorch.org/tutorials/beginner/basics/data_tutorial.html

Призрачный-Человек Автор вопроса
Максим Синяев
Dataloader позволяет выполнять подобные манипуляци...

спасибо, но в туториале, насколько я понял, ничего не сказано про побатчивое чтение данных. Я так понял, надо смотреть в сторону Iterable-style datasets, да?

Призрачный Человек
спасибо, но в туториале, насколько я понял, ничего...

Там же указывается размер батча при создании экземпляра даталоадера. Потом при каждой итерации он будет возвращать один батч. Если ничего не путаю

Призрачный-Человек Автор вопроса
aur
Там же указывается размер батча при создании экзем...

ну насколько я понял он будет возвращать один батч нейронки, но при этом держать все данные в оперативки. А я о том, что бы данные считывались в оперативку только когда их нужно отдавать нейронки

Призрачный Человек
ну насколько я понял он будет возвращать один батч...

как напишешь Dataset так и будет. Обычно там происходит чтение только в момент подготовки очередного сэмпла (в функции getitem)

Призрачный-Человек Автор вопроса
Oleg Shapovalov
как напишешь Dataset так и будет. Обычно там проис...

так а как надо написать? можно гайд какой то? или хотя бы ключевые слова, по которым можно найти примеры/гайды

Призрачный-Человек Автор вопроса
Oleg Shapovalov
https://pytorch.org/tutorials/beginner/basics/data...

в этом примере весь датасет изображений не будет хранится целиком в памяти?

Призрачный Человек
в этом примере весь датасет изображений не будет х...

Там несколько примеров, про какой вопрос? Вообще чтоб не было вопросов - просто читайте все туториала на pytorch.org, их должно быть достаточно

Призрачный-Человек Автор вопроса
Oleg Shapovalov
screenshot посередине у мыши есть скролл

ну так, это и есть пример с mnist'ом. Я и спрашиваю, как здесь будет работать? Картинки будут загружаться в память, только в рамках батча, что бы отдать в нейронку, или весь датасет целиком будет в памяти всегда?

Призрачный-Человек Автор вопроса
Oleg Shapovalov
только в рамках батча

окей, тогда попробую

Завтра могу на tf решение глянуть, если напомнишь. Сегодня выключился уже.

Похожие вопросы

Обсуждают сегодня

Господа, а что сейчас вообще с рынком труда на делфи происходит? Какова ситуация?
Rꙮman Yankꙮvsky
29
А вообще, что может смущать в самой Julia - бы сказал, что нет единого стандартного подхода по многим моментам, поэтому многое выглядит как "хаки" и произвол. Короче говоря, с...
Viktor G.
2
30500 за редактор? )
Владимир
47
а через ESC-код ?
Alexey Kulakov
29
Чёт не понял, я ж правильной функцией воспользовался чтобы вывести отладочную информацию? но что-то она не ловится
notme
18
У меня есть функция где происходит это: write_bit(buffer, 1); write_bit(buffer, 0); write_bit(buffer, 1); write_bit(buffer, 1); write_bit(buffer, 1); w...
~
14
Добрый день! Скажите пожалуйста, а какие программы вы бы рекомендовали написать для того, чтобы научиться управлять памятью? Можно написать динамический массив, можно связный ...
Филипп
7
Недавно Google Project Zero нашёл багу в SQLite с помощью LLM, о чём достаточно было шумно в определённых интернетах, которые сопровождались рассказами, что скоро всех "ибешни...
Alex Sherbakov
5
Ребят в СИ можно реализовать ООП?
Николай
33
https://github.com/erlang/otp/blob/OTP-27.1/lib/kernel/src/logger_h_common.erl#L174 https://github.com/erlang/otp/blob/OTP-27.1/lib/kernel/src/logger_olp.erl#L76 15 лет назад...
Maksim Lapshin
20
Карта сайта