169 похожих чатов

Может пример есть какой-то хороший?

11 ответов

18 просмотров

ну тебе надо в датафрейме df1 оставить только те строки, у которых колонка uid присутствует в колонке _c0 некого другого df2, так?

Sergey-Kaurov Автор вопроса
Skeptical Lynx
ну тебе надо в датафрейме df1 оставить только те с...

Там только выгрузка из csv с одной колонкой (других в csv нет) без header. Вижу, при ошибке её spark автоматом обозвал _c0

Sergey Kaurov
Там только выгрузка из csv с одной колонкой (други...

ну так джоин всё равно поможет в этой ситуации

Sergey-Kaurov Автор вопроса
Skeptical Lynx
ну так джоин всё равно поможет в этой ситуации

.filter("uid").join(df.select("_c0").dropDuplicates(), $"uid" === $"_c0", "left").drop("_c0")" Так?

Sergey Kaurov
.filter("uid").join(df.select("_c0").dropDuplicate...

ну да, только без фильтра в начале

Sergey-Kaurov Автор вопроса
Skeptical Lynx
ну да, только без фильтра в начале

Ура! Отработало если out.show(false) сделать (правда 20 верхних строк только показывает). Но при записи в фаил пишет: CSV data source does not support array<string> data type. ;

Sergey Kaurov
Ура! Отработало если out.show(false) сделать (прав...

ну я уж не знаю какие колонки у вас там типа array, это лучше самому разбираться или действительно сходить в @hadoopusers

Sergey-Kaurov Автор вопроса
Skeptical Lynx
ну да, только без фильтра в начале

Привет. На самом деле странно отрабатывает. В файлике 700 номеров, а на вывод выходить с десяток тысяч. Что-то не то

Sergey Kaurov
Привет. На самом деле странно отрабатывает. В файл...

ну значит неправильно джоин написали, погуглите почитайте как он работает

Sergey-Kaurov Автор вопроса
Sergey Kaurov
Привет. На самом деле странно отрабатывает. В файл...

Там dropDublicates() просто удаляет после Join совпадения по видимому.. Не читал пока про Join.. Отхожу от стресса жизненного.. Еле еле что-то воспринимаю.. Но разберусь, уверен.

Sergey Kaurov
Там dropDublicates() просто удаляет после Join сов...

ну так его надо до джоина применить

Похожие вопросы

Обсуждают сегодня

Какой-то там пердун в 90-х решил, что есть какая-то разная типизация. Кого вообще это волнует?
КТ315
49
void terminal_scroll() { memmove(terminal_buffer, terminal_buffer + VGA_WIDTH, buffer_size - VGA_WIDTH); memset(terminal_buffer + buffer_size - VGA_WIDTH, 0, VGA_WIDTH); ...
Егор
47
Всем привет! Подскажите, пожалуйста, в чем ошибка? Настраиваю подключение к MySQL. Либы лежат рядом с exe. Все как по "учебнику"
Евгений
16
А можете как-то проверить меня по знаниям по ассемблеру?
A A
132
Здравствуйте! У меня появилась возможность купить книгу "Изучай Haskell во имя добра!". Но я где-то слышал, что эта книга устарела. Насколько это правда??
E
22
Здравствуйте! Я вот на stepic решаю задачи на хаскеле https://stepik.org/lesson/8443/step/8?unit=1578 мой код import Data.List (isInfixOf) removing :: String -> [String] ->...
E
10
Камрады, кто тесно работал с vtv, хотел уточнить. Ширина column задаётся жёстко на этапе создания дерева или можно в рантайме ее менять программно (не мышкой)?
Ed Doc
10
да ладно ... что там неочевидного ? глянуть в исх-ки датасета и/или кверика чтобы понять в каком месте и как выполняется обращения к св-вам blablaSQL - минутное дело, даже е...
Сергей
7
Здесь для arm кто-нибудь кодит ?
Nothing
52
Всем привет, у меня есть сервер принимающий входящие HTTP подключения, как проверить, что подключение было через прокси или нет, есть какие то поля в заголовках по которым мо...
DS
8
Карта сайта