169 похожих чатов

Всем привет, снова вопрос по мультипотокам. > registerDoParallel(4) + system.time( + foreach (i

= 1:100) %dopar% {
+ create_tcorpus(small_set[i,], doc_column = 'ID_doc', text_columns = 'Article_Proc', udpipe_model = "english-gum")
+ })
Error in { : task 1 failed - "cannot open the connection"
Timing stopped at: 83.97 2.248 31.04

Бывали ли у кого-то такое, что при настройке 4 потоков валится с ошибкой cannot open the connection, а когда 3 потока или меньше — все работает. Функция create_tcorpus из спец.пакета corpustools: функция берет строчку с текстом, а потом превращает в что-то типа S4 / R6 сложный список.

Вся проблема именно в том, что при увеличении числа потоков итератор не хочет работать. А когда работаю с векторами — там хоть 10 потоков, все ок.

Может ли foreach и им подобные эффективно работать с суб-листами в пределах одного листа?

5 ответов

15 просмотров
Stan- Автор вопроса

У меня точно идеально работает stringr на 1.3М текстов: делают пачку str_replace_all, и всё идет отлично. Просто тут специфичный пакет, не рассчитанный на обработку кучи текстов, а я пытаюсь сделать именно 1 строка = 1 датафрейм, и чтобы функция отработала так для всех случаев.

1 .verbose = TRUE — будет много информации. 2. Чем списки плохи? Почему нет? Только надо правильно передавать данные в воркеры. 3. Идеологически лучше сформировать наборы заданий. 4. Лучше так гнать задание: foreach(it = iter(fnames_tbl, by = "row")

Stan- Автор вопроса
Ilya Shutov
1 .verbose = TRUE — будет много информации. 2. Чем...

О, сейчас попробую. Спасибо. Хочу сегодня добить дебаг и запустить задачу. Со виолончелью 10 потоков делают работу за 15 секунд на 1.3М, а в один поток 270:))

Stan
О, сейчас попробую. Спасибо. Хочу сегодня добить д...

Могу предположить, что это проблема связана с R6, не передать его. Можно через файлы поступить и объединить после. Либо в базовые типы преобразовать. От задачи зависит. library(corpustools) colnames(sotu_texts) #> [1] "id" "date" "party" "text" "president" tc <- create_tcorpus(sotu_texts, doc_column = 'id', text_columns = 'text') dput(tc) #> <environment> class(tc) #> [1] "tCorpus" "R6" qs::qsave(tc, "tc.qs") m <- qs::qread("tc.qs") dput(m) #> <environment> m #> tCorpus containing 90827 tokens #> grouped by documents (n = 1090) #> contains: #> - 3 columns in $tokens: doc_id, token_id, token #> - 4 columns in $meta: doc_id, date, party, president

Stan
О, сейчас попробую. Спасибо. Хочу сегодня добить д...

вот тут вот интересный текст: https://stackoverflow.com/questions/57349958/how-to-use-foreach-and-dopar-with-an-r6-class-in-r

Похожие вопросы

Обсуждают сегодня

Hi there everyone Is there anyone who have not started hamster bot yet? I need only one, I'll be glad if you do this for me DM if you haven't yet
Mehrshad
53
hi my MyAsus app has informed me of a new version of bios (version 300), i tried installing it but after this attempt it said: Update failed. Does anyone have any solution? My...
Sahand 🏔️
13
всем привет! у кого есть опыт подписания и нотаризации electron приложений для macos? такая проблема: использовал @electron/osx-sign и notaritool. процесс подписания и нотараз...
Артем Клементьев
11
@Dreamer_0x01 @helgispbru @Ambrion Разговор шёл об уязвимости. Меня беспокоит именно она. Все прочие вопросы, а равно и жизненная мудрость - пока в сторону :) Так вот сам ...
Андрей [aharito] Харитонов
9
why some site like google has separate page for username/email and password?
Mr Thieves
21
Тут кто-то шарит в мед оборудовании?
Benz
10
А как старый хаскел с новым стыковать ? потому как тут работает https://play.haskell.org/saved/C3xpMzcd, а вот тут https://stepik.org/lesson/7602/step/9?unit=1473 нет ошибка C...
Fedor
131
Может быть небольшое отступление, но я тут решил обратить внимание на то, сколько весит хелловорлд на с++... Зачем он весит почти 250 Кб? У меня оконное приложение на фасме ве...
The Bird of Hermes
14
What do you wanna learn?
Malware ( DM = BLOCK )
12
даже если пофиксят... все подписки то уже закончились, что на дельфи, что на компоненты tms. Меня пока XE7 вроде почти полностью устраивает, за исключением одной вещи - чтобы ...
Олег Гранишевский
4
Карта сайта