делаешь например registerDoParallel(cores = 3) ? Одно ядро работает в сессии, но 5 минут задача на 100 объектов. А когда 4 ядра — уже 1.5 минуты. Но как только запускаю функцию — кэггл все сбрасывает и начинай сначала.
The number of physical CPU cores is only 2 on Kaggle (4 virtual cores). ` возможно поэтому
Щас смешно даже. Semnet window принадлежит пакету corpustools. Я его предварительно загрузил. Как только в таком виде настраиваю — Кэггл включает дурака.
Есть физический комп, но там столько данных, что хочу распараллелить. А future позволяет, допустим, на ксеоне сделать так, чтобы две функции работали параллельно? Это и есть то, что обозначается как асинхронное исполнение?
library(future) library(furrr) future::plan("multisession", workers = 12) И затем future_map - мне вот этого обычно достаточно
А как настроить число ядер? Или пакет сам решает, сколько ядер подключать?
вот же workers = 12
не совсем понятно «две функции параллельно», но могу предположить, что многоуважаемого дона может спасти %<-%. См детали в https://www.jottr.org/2016/07/02/future-user2016-slides/
Обсуждают сегодня