169 похожих чатов

Привет Насколько корректно сравнивать два разных фрейма по хэшу? например хэш

от str(df.uids)
фреймы на разных контейнерах, гонять данные между ними затруднительно

21 ответов

63 просмотра

некорректно

Eduard- Автор вопроса

странное поведение, а если серию предварительно обернуть в список то ничего не теряется

Eduard- Автор вопроса
Eduard
странное поведение, а если серию предварительно об...

наверное не столь странное сколь неочевидное

А вот у меня тоже вопрос про это: можно ли хеш дф делать так: functools.reduce(lambda acc, el: acc+hash(el), df['id'], 0)

Ілія Малекі
А почему?

потому что хеши нельзя складывать

Ілія Малекі
А вот у меня тоже вопрос про это: можно ли хеш дф ...

выглядит как некая малоэффективная вариация на тему тигрохэша. Как минимум будет лучше объединять хеши по парам, тогда сложность будет логарифмическая.

AL RE
выглядит как некая малоэффективная вариация на тем...

Загуглил tiger hash, абсолютно нихрена не понял

Mikhail Akimov
потому что хеши нельзя складывать

А кто запретил? И какое именно полезное свойство хешей потеряется при этом?

Pavel Zheltouhov
А кто запретил? И какое именно полезное свойство х...

потому что сумма хешей кусков данных и хеш сразу всех кусков данных это не одно и то же, или по крайней мере странно было бы это предполагать, не зная свойств конкретной хеш-функции и не являясь специалистом про криптографии

Ілія Малекі
А зачем это предполагать?

потому что хеш-функции заточены под то, чтобы иметь минимальную вероятность коллизии, когда вы начинаете хеши складывать, это свойство может потеряться

А может не потеряться. Особенно если способ разбивания на куски одинаков. И тут даже не криптография, а кеширование.

Pavel Zheltouhov
А может не потеряться. Особенно если способ разбив...

во-первых, хеширование, во-вторых, хеширование это криптография если вы хотите использовать хеш-функцию как ключ для кэша, лучше всего ей пользоваться нормально, чтобы не возникло коллизии и вы не отдали пользователю чужие данные из кэша, например

Pavel Zheltouhov
А может не потеряться. Особенно если способ разбив...

ну типа это рассуждение про может или не может потеряться я готов послушать от практикующего специалиста хеш-алгоритмам

Mikhail Akimov
во-первых, хеширование, во-вторых, хеширование это...

Кеширование. Кеширование результата вычисления сравнения df

Похожие вопросы

Обсуждают сегодня

Господа, а что сейчас вообще с рынком труда на делфи происходит? Какова ситуация?
Rꙮman Yankꙮvsky
29
А вообще, что может смущать в самой Julia - бы сказал, что нет единого стандартного подхода по многим моментам, поэтому многое выглядит как "хаки" и произвол. Короче говоря, с...
Viktor G.
2
30500 за редактор? )
Владимир
47
а через ESC-код ?
Alexey Kulakov
29
Чёт не понял, я ж правильной функцией воспользовался чтобы вывести отладочную информацию? но что-то она не ловится
notme
18
У меня есть функция где происходит это: write_bit(buffer, 1); write_bit(buffer, 0); write_bit(buffer, 1); write_bit(buffer, 1); write_bit(buffer, 1); w...
~
14
Добрый день! Скажите пожалуйста, а какие программы вы бы рекомендовали написать для того, чтобы научиться управлять памятью? Можно написать динамический массив, можно связный ...
Филипп
7
Недавно Google Project Zero нашёл багу в SQLite с помощью LLM, о чём достаточно было шумно в определённых интернетах, которые сопровождались рассказами, что скоро всех "ибешни...
Alex Sherbakov
5
Ребят в СИ можно реализовать ООП?
Николай
33
https://github.com/erlang/otp/blob/OTP-27.1/lib/kernel/src/logger_h_common.erl#L174 https://github.com/erlang/otp/blob/OTP-27.1/lib/kernel/src/logger_olp.erl#L76 15 лет назад...
Maksim Lapshin
20
Карта сайта