мне нужны индексы максимальных, как такое получить?
df.groupby('column')[['column2', 'column3']].max() такое?
Он так берёт максимум по обеим колонкам, а мне надо найти записи с максимальным значением в col1, а потом для этих записей вывести значения col2.
Сделай группировку с максимальным значением, заджойнь потом с оригинальным датафреймом по этому значению и получи свои значения с любой колонки оригинального датафрейма
Я думал об этом, но у меня нет гарантии, что по значению сджоинится без наложений. Это не будет проблемой?
Типа несколько одинаковых максимальных значений?
Во-первых это, во вторых если просто делать колонку is_max через apply v: v in max_vals, то могут быть дубли из разных групп.
Так заджойнь по группе+макс значению
.idxmax() решает ровно эту задачу.
Обсуждают сегодня