169 похожих чатов

Привет Насколько корректно сравнивать два разных фрейма по хэшу? например хэш

от str(df.uids)
фреймы на разных контейнерах, гонять данные между ними затруднительно

21 ответов

59 просмотров

некорректно

Eduard- Автор вопроса

странное поведение, а если серию предварительно обернуть в список то ничего не теряется

Eduard- Автор вопроса
Eduard
странное поведение, а если серию предварительно об...

наверное не столь странное сколь неочевидное

А вот у меня тоже вопрос про это: можно ли хеш дф делать так: functools.reduce(lambda acc, el: acc+hash(el), df['id'], 0)

Ілія Малекі
А почему?

потому что хеши нельзя складывать

Ілія Малекі
А вот у меня тоже вопрос про это: можно ли хеш дф ...

выглядит как некая малоэффективная вариация на тему тигрохэша. Как минимум будет лучше объединять хеши по парам, тогда сложность будет логарифмическая.

AL RE
выглядит как некая малоэффективная вариация на тем...

Загуглил tiger hash, абсолютно нихрена не понял

Mikhail Akimov
потому что хеши нельзя складывать

А кто запретил? И какое именно полезное свойство хешей потеряется при этом?

Pavel Zheltouhov
А кто запретил? И какое именно полезное свойство х...

потому что сумма хешей кусков данных и хеш сразу всех кусков данных это не одно и то же, или по крайней мере странно было бы это предполагать, не зная свойств конкретной хеш-функции и не являясь специалистом про криптографии

Ілія Малекі
А зачем это предполагать?

потому что хеш-функции заточены под то, чтобы иметь минимальную вероятность коллизии, когда вы начинаете хеши складывать, это свойство может потеряться

А может не потеряться. Особенно если способ разбивания на куски одинаков. И тут даже не криптография, а кеширование.

Pavel Zheltouhov
А может не потеряться. Особенно если способ разбив...

во-первых, хеширование, во-вторых, хеширование это криптография если вы хотите использовать хеш-функцию как ключ для кэша, лучше всего ей пользоваться нормально, чтобы не возникло коллизии и вы не отдали пользователю чужие данные из кэша, например

Pavel Zheltouhov
А может не потеряться. Особенно если способ разбив...

ну типа это рассуждение про может или не может потеряться я готов послушать от практикующего специалиста хеш-алгоритмам

Mikhail Akimov
во-первых, хеширование, во-вторых, хеширование это...

Кеширование. Кеширование результата вычисления сравнения df

Похожие вопросы

Обсуждают сегодня

30500 за редактор? )
Владимир
47
Недавно Google Project Zero нашёл багу в SQLite с помощью LLM, о чём достаточно было шумно в определённых интернетах, которые сопровождались рассказами, что скоро всех "ибешни...
Alex Sherbakov
5
вы делали что-то подобное и как? может есть либы готовые? увидел картинку нокода, где всё линиями соединено и стало интересно попробовать то же в ddl на lua сделать. решил с ч...
Victor
8
Подскажите пожалуйста, как в CustomDrawCell(Sender: TcxCustomGridTableView; ACanvas: TcxCanvas; AViewInfo: TcxGridTableDataCellViewInfo; var ADone: Boolean); получить наз...
A Z
7
Ребят в СИ можно реализовать ООП?
Николай
33
https://github.com/erlang/otp/blob/OTP-27.1/lib/kernel/src/logger_h_common.erl#L174 https://github.com/erlang/otp/blob/OTP-27.1/lib/kernel/src/logger_olp.erl#L76 15 лет назад...
Maksim Lapshin
20
Как передать управляющий символ в открытую через CreateProcess консоль? Собсна, есть процедура: procedure TRedirectThread.WriteData(Data: OEMString); var Written: Cardinal;...
Serjone
1
Он в одиночку это дело запилил или была какая-то команда?
Aquinary
12
~ 2m21s  nix shell github:nixos/nixpkgs#stack ~  stack ghc -- --version error: … while calling the 'derivationStrict' builtin at /builtin/derivation.nix:...
Rebuild your mind.
6
Всем привет, нужна как никогда, нужна помощь с IO в загрузчике. Пишу в code16 после установки сегментных регистров, пишу вывод символа. Пробовал 2 варианта: # 1 mov $0x0E, %a...
Shadow Akira
14
Карта сайта