169 похожих чатов

Привет Насколько корректно сравнивать два разных фрейма по хэшу? например хэш

от str(df.uids)
фреймы на разных контейнерах, гонять данные между ними затруднительно

21 ответов

19 просмотров

некорректно

Eduard- Автор вопроса

странное поведение, а если серию предварительно обернуть в список то ничего не теряется

Eduard- Автор вопроса
Eduard
странное поведение, а если серию предварительно об...

наверное не столь странное сколь неочевидное

А вот у меня тоже вопрос про это: можно ли хеш дф делать так: functools.reduce(lambda acc, el: acc+hash(el), df['id'], 0)

Ілія Малекі
А почему?

потому что хеши нельзя складывать

Ілія Малекі
А вот у меня тоже вопрос про это: можно ли хеш дф ...

выглядит как некая малоэффективная вариация на тему тигрохэша. Как минимум будет лучше объединять хеши по парам, тогда сложность будет логарифмическая.

AL RE
выглядит как некая малоэффективная вариация на тем...

Загуглил tiger hash, абсолютно нихрена не понял

Mikhail Akimov
потому что хеши нельзя складывать

А кто запретил? И какое именно полезное свойство хешей потеряется при этом?

Pavel Zheltouhov
А кто запретил? И какое именно полезное свойство х...

потому что сумма хешей кусков данных и хеш сразу всех кусков данных это не одно и то же, или по крайней мере странно было бы это предполагать, не зная свойств конкретной хеш-функции и не являясь специалистом про криптографии

Ілія Малекі
А зачем это предполагать?

потому что хеш-функции заточены под то, чтобы иметь минимальную вероятность коллизии, когда вы начинаете хеши складывать, это свойство может потеряться

А может не потеряться. Особенно если способ разбивания на куски одинаков. И тут даже не криптография, а кеширование.

Pavel Zheltouhov
А может не потеряться. Особенно если способ разбив...

во-первых, хеширование, во-вторых, хеширование это криптография если вы хотите использовать хеш-функцию как ключ для кэша, лучше всего ей пользоваться нормально, чтобы не возникло коллизии и вы не отдали пользователю чужие данные из кэша, например

Pavel Zheltouhov
А может не потеряться. Особенно если способ разбив...

ну типа это рассуждение про может или не может потеряться я готов послушать от практикующего специалиста хеш-алгоритмам

Mikhail Akimov
во-первых, хеширование, во-вторых, хеширование это...

Кеширование. Кеширование результата вычисления сравнения df

Похожие вопросы

Обсуждают сегодня

@MrMiscipitlick А можешь макрос написать, который будет вычислять смещение относительно переданных меток? Просто .label1-.label2, и вернуть значение.
КТ315
35
я не магистр хаскеля, но разве не может лейзи тип конвертнуться в не-лейзи запросив вычисление содержимого прям при инициализации?
deadgnom32 λ madao
100
А еще в перле можно уже @arr1 + @arr2?
Sergei Zhmylove
53
Подобного рода ;Следующие три строки это директивы ассемблера, ;которые можно не задавать, т.к.работаем в Visual Studio. ;Символ ";" - это начало однострочного комментария ...
Егор Анелькин
3
Кто-нибудь знает почему SPM клонирует репо целиком? Некоторые репы просто огромные, как та же swift-syntax которая нужна для использования макросов. Сначала подумал, что это...
iMike
6
Привет всем. появился вопрос. Разрабатываю сайт, в данный момент он запущен. Хостинг beget. Добавляю на сайт яндекс метрику с помощью полей client-settings (взято отсюда http...
Andrew
2
Подскажите, где смотреть результат выполнения программы? Код: ;.686 ;Система команд процессора 686 ;.MODEL FLAT,stdcall ;Модель памяти плоская, станда...
Егор Анелькин
5
еще вопрос, допустим мы создадим char массив из 10 элементов и присвоим ему через сканф 10 символов. и выведем все символы. Хотел спросить последний элемент /0 будет включать...
Anthem
11
;.686 ;Система команд процессора 686 ;.MODEL FLAT,stdcall ;Модель памяти плоская, стандартный ;вызов процедуры ;option casemap:no...
Егор Анелькин
1
Где в Астане можно купить мясо для шашлыков?
Dancing Іңұқәһүғө
21
Карта сайта