Здравствуйте, подскажите пожалуйста, наверняка в PyTorch/тензерфлоу есть какие то стандартные

Question

Здравствуйте, подскажите пожалуйста, наверняка в PyTorch/тензерфлоу есть какие то стандартные

инструменты, с помощью которых можно батчи для трейна выгружать в опперативку/в карту только в момент непосредственного использования батча, не держа всё время его в памяти. Как это правильно гуглить? И какие классы в пайторчи позволяют реализовать это?

#database #programming #russian #software

0

23.03.2022

15 ответов

35 просмотров

Призрачный Человек Автор вопроса

Максим Синяев
Dataloader позволяет выполнять подобные манипуляци...

спасибо, но в туториале, насколько я понял, ничего не сказано про побатчивое чтение данных. Я так понял, надо смотреть в сторону Iterable-style datasets, да?

0

23.03.2022

aur

Призрачный Человек
спасибо, но в туториале, насколько я понял, ничего...

Там же указывается размер батча при создании экземпляра даталоадера. Потом при каждой итерации он будет возвращать один батч. Если ничего не путаю

0

23.03.2022

Призрачный Человек Автор вопроса

aur
Там же указывается размер батча при создании экзем...

ну насколько я понял он будет возвращать один батч нейронки, но при этом держать все данные в оперативки. А я о том, что бы данные считывались в оперативку только когда их нужно отдавать нейронки

0

23.03.2022

Oleg Shapovalov

Призрачный Человек
ну насколько я понял он будет возвращать один батч...

как напишешь Dataset так и будет. Обычно там происходит чтение только в момент подготовки очередного сэмпла (в функции getitem)

0

23.03.2022

Призрачный Человек Автор вопроса

Oleg Shapovalov
как напишешь Dataset так и будет. Обычно там проис...

так а как надо написать? можно гайд какой то? или хотя бы ключевые слова, по которым можно найти примеры/гайды

0

23.03.2022

Oleg Shapovalov

Призрачный Человек
так а как надо написать? можно гайд какой то? или ...

https://pytorch.org/tutorials/beginner/basics/data_tutorial.html

0

23.03.2022

Призрачный Человек Автор вопроса

Oleg Shapovalov
https://pytorch.org/tutorials/beginner/basics/data...

в этом примере весь датасет изображений не будет хранится целиком в памяти?

0

23.03.2022

Oleg Shapovalov

Призрачный Человек
в этом примере весь датасет изображений не будет х...

Там несколько примеров, про какой вопрос? Вообще чтоб не было вопросов - просто читайте все туториала на pytorch.org, их должно быть достаточно

0

23.03.2022

Призрачный Человек Автор вопроса

Oleg Shapovalov
Там несколько примеров, про какой вопрос? Вообще ч...

так там ровно один пример с mnist'ом

0

23.03.2022

Oleg Shapovalov

Призрачный Человек
так там ровно один пример с mnist'ом

посередине у мыши есть скролл

0

23.03.2022

Призрачный Человек Автор вопроса

Oleg Shapovalov

посередине у мыши есть скролл

ну так, это и есть пример с mnist'ом. Я и спрашиваю, как здесь будет работать? Картинки будут загружаться в память, только в рамках батча, что бы отдать в нейронку, или весь датасет целиком будет в памяти всегда?

0

23.03.2022

Oleg Shapovalov

Призрачный Человек
ну так, это и есть пример с mnist'ом. Я и спрашива...

только в рамках батча

0

23.03.2022

Призрачный Человек Автор вопроса

Oleg Shapovalov
только в рамках батча

окей, тогда попробую

0

23.03.2022

Алексей Крапивницкий

Завтра могу на tf решение глянуть, если напомнишь. Сегодня выключился уже.

0

23.03.2022

Максим Синяев · Accepted Answer

Максим Синяев

Dataloader позволяет выполнять подобные манипуляции Доки: https://pytorch.org/docs/stable/data.html Туториал: https://pytorch.org/tutorials/beginner/basics/data_tutorial.html

0

23.03.2022

215 похожих чатов

Здравствуйте, подскажите пожалуйста, наверняка в PyTorch/тензерфлоу есть какие то стандартные

15 ответов

Похожие вопросы