169 похожих чатов

Почему же он ненавидит R, а не разрабов панд?

32 ответов

24 просмотра

Об том же подумал. Ну и спросил заодно на всякий.

У аналитиков на питоне своя логика)

Grigoriy Demin
У аналитиков на питоне своя логика)

Я, к сожалению, не могу воспринимать словосочетание "аналитик на питоне" без улыбки

Igor Yegin
Я, к сожалению, не могу воспринимать словосочетани...

Сегодня общался с квантом из Чикаго, который 3 месяца переписывал структуру данных в коде, т.к. в пандасе данные по фьючерсам не пролезали по памяти.

Ivan K
должны

Интересно с каким объёмом он работает. Я лично работая с целой биржей по всем парам (около 1000) с 30 параметрами по каждой никаких проблем с памятью не испытывал, не испытываю и врятли буду испытывать . Может он что то не договаривает?

𝖀𝕾𝕰𝕽 𝕹𝕬𝕸𝕰
Интересно с каким объёмом он работает. Я лично раб...

Вообще фьючерсы это большой сегмент рынка финансовых дериватив, там можно, если есть возможность, очень прилично накопать. В 2020 было там что-то типа более чем 25 трлн сделок по фьючерсам по всему миру, там есть откуда таким проблем браться

Ivan K
Вообще фьючерсы это большой сегмент рынка финансов...

Соглашусь, только вопрос в том, откуда взять все логи совершенных сделок со всех бирж за всю историю. В целом, это крайне ценные данные. Тут я полностью признаю что никакой там пандас просто не силён. Я даже не знаю, тут мне кажется датацентр нужен что ли

𝖀𝕾𝕰𝕽 𝕹𝕬𝕸𝕰
Соглашусь, только вопрос в том, откуда взять все л...

Если данных больше 10ГБ, то проще всего запилить базу на BigQuery и дергать ее аром или сиквелом. По уму надо бы хадуп или подобное заводить.

𝖀𝕾𝕰𝕽 𝕹𝕬𝕸𝕰
Соглашусь, только вопрос в том, откуда взять все л...

Локальный кликхаус ест это все и не морщится. А размеры 10 гб даже не заметны. И вот ещё подход, не нужны никакие датацентры для таких копеек https://habr.com/ru/post/597943/

Evgeny Vlasov
Если данных больше 10ГБ, то проще всего запилить б...

И ни в коем случае всякие кладбища данных в виде хадупа

Dm Kb
Duckdb вроде не тянет больших объемов

Что есть большой объём? Сейчас простейшая рабочая станция может иметь 64-128 гиг оперативки за копейки. О чем речь идёт? А arrow может весь локальный ssd использовать

Evgeny Vlasov
Чем плох хадуп?

Не я его назвал. А чем может быть хороша файловая помойка для быстрой и сложной аналитики?

Ilya Shutov
Не я его назвал. А чем может быть хороша файловая ...

Ну это вы его называете файловой помойкой, а другие говорят, что это современное хранилище для больших объемов данных с возможностью быстрого доступа и обработки. Кому верить?

Evgeny Vlasov
Ну это вы его называете файловой помойкой, а други...

Это дорогое удовольствие на свои деле. И его чаще используют в качестве холодного хранилища для данных

Evgeny Vlasov
Ну это вы его называете файловой помойкой, а други...

Никому. Обратите внимание на специфику технологии, характерные объемы и времена доступа. Поработайте с ним и составьте собственное мнение.

Evgeny Vlasov
Ну это вы его называете файловой помойкой, а други...

Начните использовать кликхаус для olap. И будет Вам счастье

Ilya Shutov
Никому. Обратите внимание на специфику технологии...

Я для больших объемов использую bigquery. Вполне счастлив, но он платный. Можно сдуру написать запрос на пару тысяч долларов.

Ilya Shutov
Начните использовать кликхаус для olap. И будет Ва...

Я тоже не занимаюсь биг датой, просто у компании очень много данных.

Ilya Shutov
Сколько в граммах?

Ну, больше ста гигов точно. Мне из этого не нужно 99.99%

Ilya Shutov
Это Мышкины слёзы

Больше не значит равно )

Evgeny Vlasov
Больше не значит равно )

Да хоть несколько терабайт — ерунда

Ilya Shutov
Что есть большой объём? Сейчас простейшая рабочая ...

У меня с 50гб возникли проблемы, база лежала на ssd

Похожие вопросы

Обсуждают сегодня

Господа, а что сейчас вообще с рынком труда на делфи происходит? Какова ситуация?
Rꙮman Yankꙮvsky
29
А вообще, что может смущать в самой Julia - бы сказал, что нет единого стандартного подхода по многим моментам, поэтому многое выглядит как "хаки" и произвол. Короче говоря, с...
Viktor G.
2
30500 за редактор? )
Владимир
47
а через ESC-код ?
Alexey Kulakov
29
Чёт не понял, я ж правильной функцией воспользовался чтобы вывести отладочную информацию? но что-то она не ловится
notme
18
У меня есть функция где происходит это: write_bit(buffer, 1); write_bit(buffer, 0); write_bit(buffer, 1); write_bit(buffer, 1); write_bit(buffer, 1); w...
~
14
Добрый день! Скажите пожалуйста, а какие программы вы бы рекомендовали написать для того, чтобы научиться управлять памятью? Можно написать динамический массив, можно связный ...
Филипп
7
Недавно Google Project Zero нашёл багу в SQLite с помощью LLM, о чём достаточно было шумно в определённых интернетах, которые сопровождались рассказами, что скоро всех "ибешни...
Alex Sherbakov
5
Ребят в СИ можно реализовать ООП?
Николай
33
https://github.com/erlang/otp/blob/OTP-27.1/lib/kernel/src/logger_h_common.erl#L174 https://github.com/erlang/otp/blob/OTP-27.1/lib/kernel/src/logger_olp.erl#L76 15 лет назад...
Maksim Lapshin
20
Карта сайта