Может пример есть какой-то хороший?

Ура! Отработало если out.show(false) сделать (правда 20 верхних строк только показывает). Но при записи в фаил пишет: CSV data source does not support array<string> data type. ;

0

24.03.2021

Skeptical Lynx

Sergey Kaurov
Ура! Отработало если out.show(false) сделать (прав...

ну я уж не знаю какие колонки у вас там типа array, это лучше самому разбираться или действительно сходить в @hadoopusers

0

24.03.2021

Sergey Kaurov Автор вопроса

Skeptical Lynx
ну да, только без фильтра в начале

Привет. На самом деле странно отрабатывает. В файлике 700 номеров, а на вывод выходить с десяток тысяч. Что-то не то

0

25.03.2021

Skeptical Lynx

Sergey Kaurov
Привет. На самом деле странно отрабатывает. В файл...

ну значит неправильно джоин написали, погуглите почитайте как он работает

0

25.03.2021

Sergey Kaurov Автор вопроса

Sergey Kaurov
Привет. На самом деле странно отрабатывает. В файл...

Там dropDublicates() просто удаляет после Join совпадения по видимому.. Не читал пока про Join.. Отхожу от стресса жизненного.. Еле еле что-то воспринимаю.. Но разберусь, уверен.

0

26.03.2021

Skeptical Lynx

Sergey Kaurov
Там dropDublicates() просто удаляет после Join сов...

ну так его надо до джоина применить

0

26.03.2021

Skeptical Lynx · Accepted Answer

Skeptical Lynx

ну тебе надо в датафрейме df1 оставить только те строки, у которых колонка uid присутствует в колонке _c0 некого другого df2, так?

0

24.03.2021

169 похожих чатов

Может пример есть какой-то хороший?

11 ответов

Похожие вопросы