Мне надо переписать скрипты с питона на скалу. У меня есть n скриптов, каждый из которых запускают отдельно, хочу также сделать n jar-ников, создав n проектов. Но есть ещё оди...
Имеется ввиду примерно эта конструкция для чтения: spark.read.format("jdbc").option("driver", "net.ucanaccess.jdbc.UcanaccessDriver").option("url", "jdbc"ucanaccess://...").op...
Добрый день! Кратко: Как при помощи spark.read.format("jdbc") считывать файл, расположенный локально? Не кратко: Пытаюсь считать данные с ms access. Файл находится на HDFS. И...
Никого не смущает, что при любом действии с df, надо делать операцию присваивания? Это ведь траты производительности. Хорошо что есть inplace, но он не всегда присутствует. Ес...
Добрый день! Столкнулся с проблемой, а точнее с дискомфортом, что у меня слишком много места занимают данные. Не больше 15 столбов в каждой из таблиц, и все данные представляю...
Привет всем! Вопрос больше по статистике, но я надеюсь, что здесь и такое можно =) Если имеется у меня выборка из 6 случаев, в каждом случае может произойти одно из двух событ...
Пожалуй очень детский вопрос, но тем не менее. Программирую на Юпитере и сталкиваюсь с проблемой, что надо создать новую функцию, сделать дополнительные импорты и прочее. Пери...
Почему не пишется, кого кикают?
А не бот ли ты часом?
Привет всем! Столкнулся с набором dataset-ов, который слегка превышает мою ОЗУ, и я поэтому я не могу загрузить через пандас весь файл. Как можно считать из csv файла только з...
Эх, смотря на картинку, вспоминаю, как я провалил собеседование, ответив на вопрос "Чем вы планируете заниматься через 5 лет?" - "Разработкой скайнета" XD
Вопрос появился. Можно ли с точки зрения (целесообразности, рациональности, религии) к алгоритму МО, например RF, MLP, добавлять конструкции IF. Например к его выходу? Вот нап...
Извините за столь нубский вопрос. Но Гугл мне особо не помог. Pandas Series Хочу получить значение по индексу, а данного индекса нет. Выходит ошибка. Как без обработчика исклю...
Если обучающая выборка имеет вид x1, x2, x3, y1, y2, то есть у меня 2 столбца являются целевыми для предсказания, то в случае задачи классификации, мне для каждого Y обучать о...
А если у меня заданы индексы, то тоже самое, только через loc?
В таком случае сеть сможет понять, что некоторые номинальные значения сильнее влияют на ответ? Например, если это ингредиенты салата, то мазик сделает салат вкуснее, по сравне...
Если у меня в керас оценка не тестовом наборе выглядит так, это нормально? Evaluate on test data 10000/1 [===============================
Имеется признак у объекта, который представлен набором из 3-8 номинальных значений. Всего вариантов номинальных значений 400+. Как такой признак в нейронку загнать?
Извините за оффтоп, но все же =) Нельзя ли в телеге начать чат с самим собой? Просто тут иногда интересные ссылки появляться, хочу их сохранить, а некуда
В книжном все книги забиты на тему big data + excel, анализ данных + excel. Вообще, есть смысл осваивать анализ данных в excel? Если да, то как глубоко?