схожие столбцы и хочу посчитать количество вхождений для каждой строки среди обоих. Беру value_counts() от одного и другого, но никак не получается нормально объединить:
Если складываю две серии, то получаю пустой df, а если через append, то не могу сделать строки с одинковыми ключами.
Как их сделать?
a = gemodializ[name].value_counts().rename_axis('unique_values').reset_index(name='gemo')
a.append(users[name].value_counts().rename_axis('unique_values').reset_index(name='users'))
покажи оба фрейма
Оба взяты из данных: 1. https://pastebin.com/k7Z0yfb3 2. https://pastebin.com/TTaxnCDz Серии беру как gemodializ['Пол'].value_counts() и users['Пол'].value_counts() соотвественно.
самое простое - собери лямбдой новый столкеы с конканенацией строк из двух иследуемых, и по нему посчитай
https://towardsdatascience.com/combine-two-string-columns-pandas-fde0287485d9
зачем для конкатенации лямбда?
потому что я умею ей пользоваться)
С разбивкой по тому, что какому файлу принадлежит, для дальнейшего построения гистограммы.
Обсуждают сегодня