Почему же он ненавидит R, а не разрабов панд?

Интересно с каким объёмом он работает. Я лично работая с целой биржей по всем парам (около 1000) с 30 параметрами по каждой никаких проблем с памятью не испытывал, не испытываю и врятли буду испытывать . Может он что то не договаривает?

0

15.01.2022

Ivan K

𝖀𝕾𝕰𝕽 𝕹𝕬𝕸𝕰
Интересно с каким объёмом он работает. Я лично раб...

Вообще фьючерсы это большой сегмент рынка финансовых дериватив, там можно, если есть возможность, очень прилично накопать. В 2020 было там что-то типа более чем 25 трлн сделок по фьючерсам по всему миру, там есть откуда таким проблем браться

0

15.01.2022

𝖀𝕾𝕰𝕽 𝕹𝕬𝕸𝕰

Ivan K
Вообще фьючерсы это большой сегмент рынка финансов...

Соглашусь, только вопрос в том, откуда взять все логи совершенных сделок со всех бирж за всю историю. В целом, это крайне ценные данные. Тут я полностью признаю что никакой там пандас просто не силён. Я даже не знаю, тут мне кажется датацентр нужен что ли

0

15.01.2022

Evgeny Vlasov

𝖀𝕾𝕰𝕽 𝕹𝕬𝕸𝕰
Соглашусь, только вопрос в том, откуда взять все л...

Если данных больше 10ГБ, то проще всего запилить базу на BigQuery и дергать ее аром или сиквелом. По уму надо бы хадуп или подобное заводить.

0

15.01.2022

Ilya Shutov

𝖀𝕾𝕰𝕽 𝕹𝕬𝕸𝕰
Соглашусь, только вопрос в том, откуда взять все л...

Локальный кликхаус ест это все и не морщится. А размеры 10 гб даже не заметны. И вот ещё подход, не нужны никакие датацентры для таких копеек https://habr.com/ru/post/597943/

0

16.01.2022

Ilya Shutov

Evgeny Vlasov
Если данных больше 10ГБ, то проще всего запилить б...

И ни в коем случае всякие кладбища данных в виде хадупа

0

16.01.2022

Evgeny Vlasov

Ilya Shutov
И ни в коем случае всякие кладбища данных в виде х...

Чем плох хадуп?

0

16.01.2022

Dm Kb

Ilya Shutov
Локальный кликхаус ест это все и не морщится. А ра...

Duckdb вроде не тянет больших объемов

0

16.01.2022

Ilya Shutov

Dm Kb
Duckdb вроде не тянет больших объемов

Что есть большой объём? Сейчас простейшая рабочая станция может иметь 64-128 гиг оперативки за копейки. О чем речь идёт? А arrow может весь локальный ssd использовать

0

16.01.2022

Ilya Shutov

Evgeny Vlasov
Чем плох хадуп?

Не я его назвал. А чем может быть хороша файловая помойка для быстрой и сложной аналитики?

0

16.01.2022

Evgeny Vlasov

Ilya Shutov
Не я его назвал. А чем может быть хороша файловая ...

Ну это вы его называете файловой помойкой, а другие говорят, что это современное хранилище для больших объемов данных с возможностью быстрого доступа и обработки. Кому верить?

0

16.01.2022

Владислав Lazycat

Evgeny Vlasov
Ну это вы его называете файловой помойкой, а други...

Это дорогое удовольствие на свои деле. И его чаще используют в качестве холодного хранилища для данных

0

16.01.2022

Ilya Shutov

Evgeny Vlasov
Ну это вы его называете файловой помойкой, а други...

Никому. Обратите внимание на специфику технологии, характерные объемы и времена доступа. Поработайте с ним и составьте собственное мнение.

0

16.01.2022