169 похожих чатов

Может пример есть какой-то хороший?

11 ответов

22 просмотра

ну тебе надо в датафрейме df1 оставить только те строки, у которых колонка uid присутствует в колонке _c0 некого другого df2, так?

Sergey-Kaurov Автор вопроса
Skeptical Lynx
ну тебе надо в датафрейме df1 оставить только те с...

Там только выгрузка из csv с одной колонкой (других в csv нет) без header. Вижу, при ошибке её spark автоматом обозвал _c0

Sergey Kaurov
Там только выгрузка из csv с одной колонкой (други...

ну так джоин всё равно поможет в этой ситуации

Sergey-Kaurov Автор вопроса
Skeptical Lynx
ну так джоин всё равно поможет в этой ситуации

.filter("uid").join(df.select("_c0").dropDuplicates(), $"uid" === $"_c0", "left").drop("_c0")" Так?

Sergey Kaurov
.filter("uid").join(df.select("_c0").dropDuplicate...

ну да, только без фильтра в начале

Sergey-Kaurov Автор вопроса
Skeptical Lynx
ну да, только без фильтра в начале

Ура! Отработало если out.show(false) сделать (правда 20 верхних строк только показывает). Но при записи в фаил пишет: CSV data source does not support array<string> data type. ;

Sergey Kaurov
Ура! Отработало если out.show(false) сделать (прав...

ну я уж не знаю какие колонки у вас там типа array, это лучше самому разбираться или действительно сходить в @hadoopusers

Sergey-Kaurov Автор вопроса
Skeptical Lynx
ну да, только без фильтра в начале

Привет. На самом деле странно отрабатывает. В файлике 700 номеров, а на вывод выходить с десяток тысяч. Что-то не то

Sergey Kaurov
Привет. На самом деле странно отрабатывает. В файл...

ну значит неправильно джоин написали, погуглите почитайте как он работает

Sergey-Kaurov Автор вопроса
Sergey Kaurov
Привет. На самом деле странно отрабатывает. В файл...

Там dropDublicates() просто удаляет после Join совпадения по видимому.. Не читал пока про Join.. Отхожу от стресса жизненного.. Еле еле что-то воспринимаю.. Но разберусь, уверен.

Sergey Kaurov
Там dropDublicates() просто удаляет после Join сов...

ну так его надо до джоина применить

Похожие вопросы

Обсуждают сегодня

Господа, а что сейчас вообще с рынком труда на делфи происходит? Какова ситуация?
Rꙮman Yankꙮvsky
29
А вообще, что может смущать в самой Julia - бы сказал, что нет единого стандартного подхода по многим моментам, поэтому многое выглядит как "хаки" и произвол. Короче говоря, с...
Viktor G.
2
30500 за редактор? )
Владимир
47
а через ESC-код ?
Alexey Kulakov
29
Чёт не понял, я ж правильной функцией воспользовался чтобы вывести отладочную информацию? но что-то она не ловится
notme
18
У меня есть функция где происходит это: write_bit(buffer, 1); write_bit(buffer, 0); write_bit(buffer, 1); write_bit(buffer, 1); write_bit(buffer, 1); w...
~
14
Добрый день! Скажите пожалуйста, а какие программы вы бы рекомендовали написать для того, чтобы научиться управлять памятью? Можно написать динамический массив, можно связный ...
Филипп
7
Недавно Google Project Zero нашёл багу в SQLite с помощью LLM, о чём достаточно было шумно в определённых интернетах, которые сопровождались рассказами, что скоро всех "ибешни...
Alex Sherbakov
5
Ребят в СИ можно реализовать ООП?
Николай
33
https://github.com/erlang/otp/blob/OTP-27.1/lib/kernel/src/logger_h_common.erl#L174 https://github.com/erlang/otp/blob/OTP-27.1/lib/kernel/src/logger_olp.erl#L76 15 лет назад...
Maksim Lapshin
20
Карта сайта