сборке пк мощнее ориентироваться на частоту процессора, а не на число ядер? А то вполне может оказаться, что какой-нибудь пентиум последних поколений с очень большой частотой будет лучше, нежели i7 с большим число ядер.
Причем нигде толком не нашел тестов либо размышлений на эту тему. А ведь для R это важная фича, когда мы говорим об однопотоке по дефолту.
Скорее всего кроме Р будет ещë что-то. Плюс запускать джобы, просто скрипты. Кажется, что 1-2 потока лучше оставить всë-таки под печатные машинки
насколько я в курсе, ориентироваться на число ядер vs частоту процессора недостаточно. Тут очень важены еще (1) объем оперативки, (2) кэш процессора (т.е. сколько данных он сможет "заглатывать" за один раз и таким образом снижать число обращений к памяти). И еще важна (3) частота системной шины и (4) тайминги RAM - если они там как-то не совпадают, то память/процессор не синхрониризированы и часть тактов пропускают, из-за чего система немного простаивает. У современных процессоров есть ограничения по частоте (что-то около 5Ггц), в high end сегменте особой разницы частота роли не играет, если протупить с остальными критериями.
Я просто ищу способы сэкономить на комплектующих, чтобы достичь максимума в однопотоке
Я не знаю, у вас мобильная или настольная система будет, но, грубо говоря, можно сэкономить, если взять проц с кэшем побольше, немного пожертвовав частотой и числом ядер (я на сайте интела смотрю, иногда разница в 100 баксов может быть). а эту жертву можно отчасти компенсировать более внимательным выбором матери и памяти
важно и то и другое. любопытства ради можно попробовать запустить винду на виртуалке только с 2-мя ядрами. вопросы про малое число ядер отпадут сразу. 4 ядра нынче миниум разумного. по скорости Ryzen существенно быстрее Intel нынче при меньшей стоимости. И ни в коем случае не брать процессор для мобильных систем. Там энергоэффективность во главе, производительность просаживается в угоду.
data.table, ranger, tidymodels и даже новая ветка dplyr работают в мультипотоке
Но это только меньшая часть))
Много пакетов поддерживают параллельные вычисления , есть просто пакеты где такие функции ни к селу ни к городу
Правильно ли я понял, что тидимоделс используют все ядра, а не одно как базовый Р?
Для тюнинга можно использовать параллезацию, остальное особо не нуждается в этом
можно чуть поточнее, где именно dplyr работает в многопоточном режиме?
https://multidplyr.tidyverse.org/articles/multidplyr.html
если это, то это не фоновая многопоточность. тут ручное управление потоками, разбиение данных по обработчикам... практически все тоже самое делается с помощью furrr
Спасибо за уточнение
Обсуждают сегодня