170 похожих чатов

Вопрос по lockfree-очереди. Реализовал её по алгоритму Майкла-Скотта + с

оглядкой на бустовскую и примеры в интернете.
Как и полагается, спустя месяц пришли к выводу, что время от времени падает именно она.

Как дебажить?
Санитайзеров на платформе нет, имеющиеся средства анализа не вылавливают ошибку, однако удалось создать +- повторяемые условия её проявления.

22 ответов

22 просмотра

А вы ошибку уверенно локализовали? Тестик сделали там на hardware_max потоков, которые пытаются её перегружать?

Dmitriy-[Отпуск] Автор вопроса
Constantine Drozdov
А вы ошибку уверенно локализовали? Тестик сделали ...

Можно считать, что да. При > 32 потоков падает в 1 из 100 циклов теста практически гарантированно

Вообще, я бы при хорошей плотности воспроизведения делал примерно так: 0. Поднять все барьеры до seq_cst. Ошибка сохраняется? Да. Добавить целенаправленную ошибку в каждую редкую ветку и сопоставить статистику ошибок. Нет. Понятно, в чём проблема.

Dmitriy-[Отпуск] Автор вопроса
Constantine Drozdov
А исходный код не можете показать?

Да. Но круг поиска может быть шире, чем кажется :) https://github.com/DymOK93/KTL/blob/lockfree_queue_fix/modules/lockfree/queue.hpp

Dmitriy-[Отпуск] Автор вопроса
Constantine Drozdov
Вообще, я бы при хорошей плотности воспроизведения...

Проверил с seq_cst (в моей реализации для x86-64 - на основе MSVC-интринсиков _InterlockedExchange() для store(), _InterlockedCompareExchange для load()) Ошибка сохранилась. Спасибо - буду проверять отдельные ветви исполнения...

Dmitriy [Отпуск]
Проверил с seq_cst (в моей реализации для x86-64 -...

https://github.com/DymOK93/KTL/blob/lockfree_queue_fix/modules/lockfree/queue.hpp#L122 начните с вот этой, тут, кажется, что-то очень странное написано

Dmitriy-[Отпуск] Автор вопроса
Constantine Drozdov
https://github.com/DymOK93/KTL/blob/lockfree_queue...

Хм, вроде не странное... Но перепроверю

Dmitriy [Отпуск]
Хм, вроде не странное... Но перепроверю

ладно, вот это-то точно повод для паранойи https://github.com/DymOK93/KTL/blob/lockfree_queue_fix/modules/lockfree/queue.hpp#L154 мы не захватили владение узлом, почему во время этого присваивания rhs не умер?

Dmitriy-[Отпуск] Автор вопроса
Constantine Drozdov
ладно, вот это-то точно повод для паранойи https:/...

1) head == current_head => "голова" на месте 2) !(head==tail) => очередь не пуста 3) value = next_ptr->value => считали значение 4) cas_weak_helper(m_head.get_ptr(), head, new_head) => если true, то голова все еще наша, считанное значение валидно Если предположить, что между 2) и 4) другой поток прошел тот же путь и "снял голову", то вопрос лишь в том, кто раньше придет в 4) Так это вижу я... И не видел иного рассмотрения в источниках

Dmitriy [Отпуск]
1) head == current_head => "голова" на месте 2) !(...

ну вопрос что поток (А) выполняет это присваивание, а два соседа просто съели элемент и вызвали его деаллокацию

Класс!

Один вопрос: зачем вам lock free queue?

Dmitriy-[Отпуск] Автор вопроса
Ilya Zviagin
Один вопрос: зачем вам lock free queue?

Честно? Больше развлечения ради)) Бутылочным горлышком в том коде очередь не была

Dmitriy [Отпуск]
Честно? Больше развлечения ради)) Бутылочным горлы...

Спасибо за честный ответ! Но зато у вас теперь жизнь такая интересная!

Dmitriy-[Отпуск] Автор вопроса
Ilya Zviagin
Спасибо за честный ответ! Но зато у вас теперь жиз...

Забавнее то, что сама очередь оказалась вообще не при делах - косяк по невнимательности в другом месте

Dmitriy-[Отпуск] Автор вопроса
Андрей Руссков
а почему не std::atomic?

Потому что его у меня нет :)

И чё, реально улучшило перформанс относительно очереди с синхронизацией?

Dmitriy-[Отпуск] Автор вопроса
Roman
И чё, реально улучшило перформанс относительно оче...

В диалоге ниже есть ответы на все вопросы)

написать на TLA+ её сначала. (сорри что поздно)

Dmitriy-[Отпуск] Автор вопроса
Konstantin Osipov
написать на TLA+ её сначала. (сорри что поздно)

Во-первых, поздно, во-вторых, дело вообще не в ней было)

Похожие вопросы

Обсуждают сегодня

Господа, а что сейчас вообще с рынком труда на делфи происходит? Какова ситуация?
Rꙮman Yankꙮvsky
29
А вообще, что может смущать в самой Julia - бы сказал, что нет единого стандартного подхода по многим моментам, поэтому многое выглядит как "хаки" и произвол. Короче говоря, с...
Viktor G.
2
30500 за редактор? )
Владимир
47
а через ESC-код ?
Alexey Kulakov
29
Гайс, вопрос для разносторонее развитых: читаю стрим с юарта, нада выделять с него фреймы с определенной структурой, если ли чо готовое, или долбаться с ринг буффером? нада у...
Vitaly
9
Чёт не понял, я ж правильной функцией воспользовался чтобы вывести отладочную информацию? но что-то она не ловится
notme
18
У меня есть функция где происходит это: write_bit(buffer, 1); write_bit(buffer, 0); write_bit(buffer, 1); write_bit(buffer, 1); write_bit(buffer, 1); w...
~
14
Добрый день! Скажите пожалуйста, а какие программы вы бы рекомендовали написать для того, чтобы научиться управлять памятью? Можно написать динамический массив, можно связный ...
Филипп
7
Недавно Google Project Zero нашёл багу в SQLite с помощью LLM, о чём достаточно было шумно в определённых интернетах, которые сопровождались рассказами, что скоро всех "ибешни...
Alex Sherbakov
5
длина пакета фиксированная, или меняется?
Okhsunrog
7
Карта сайта