Народ, смотрю тут доклад про UB и там демонстрируется такой

Roman
>> непонятно почему авторы комплятора решили что о...

оптимизации можно проводить только на основе уб и сопутствующего этому Описанный вами алгоритм 1. невозможен 2. если найдутся гении которые его напишут, то ошибки у всех компиляторов будут разные 3. int x = fooNOT42(); if(x == 42) returtn *nullptr; не получилось доказать, ошибка, потрясающее программирование будет

0

20.05.2022

Богдан Автор вопроса

А почему сразу завтипы которых нет в плюсах? Я вот ни разу не функциональщик и мало представляю что такое завтипы но я вижу что это проблема не языка а реализации компилятора. Компилятор ведь может проанализировать код всей программы и построить data-flow и range-analysis? Может, я вот просматривал доклады про Clang Static Analyzer и там все это есть. Так почему же нельзя просто проверить эти переменные которые участвуют в небезопасных операциях и выдать ошибку если мы не смогли доказать что ошибки/ub не будет? Я не думаю что будет много ложноположительных срабатываний если не будем использовать раздельную компиляцию и компилятор будет анализировать data-flow/range-analysis всей программы

0

20.05.2022

Богдан
А почему сразу завтипы которых нет в плюсах? Я вот...

потому что если ты не смог что-то доказать, это не значит что тут ошибка

0

20.05.2022

Roman

Богдан
А почему сразу завтипы которых нет в плюсах? Я вот...

потому что если бы так можно было сделать, то ты бы мог найти решение проблемы останова. а т.к. эта проблема неразрешима, то такого компилятора нет и быть не может.

0

20.05.2022

Богдан
А почему сразу завтипы которых нет в плюсах? Я вот...

>> но я вижу что это проблема не языка а реализации компилятора Нет, это проблема проблема несовершенства(?) этого мироустройства >> Компилятор ведь может проанализировать код всей программы и построить data-flow и range-analysis? Никого не устроит частное решение в качестве стандарта ввиду ложноположительных срабатываний, а полное решение, полагаю, невозможно ввиду проблемы останова и других смежных проблем

0

20.05.2022

Богдан Автор вопроса

Roman
потому что если бы так можно было сделать, то ты б...

Нет, проблемы останова здесь ни при чем. Можно было бы сказать про теорему Райса но у нас ведь нет цели полностью избавиться от ложноположительных срабатываний. Ничего страшного в том что в редких случаях компилятор попросит юзера вставить if-ы. Суть в том что если что-то доказать не получилось то зачастую эта переменная приходит извне или над ней производят нетривиальные математические преобразования про которые компилятор не в курсе (что встречается довольно редко в реальном коде) и тогда компилятор выдает ошибку а юзеру досточно будет просто добавить условие перед использованием небезопасной операции которое как бы валидирует значение переменной учавствующей в этой операции. Например если компилятор в редких случаях не смог доказать безопасность обращения к вектору то он выдает ошибку а юзер добавляет условие if (i < arr.size()) arr[i] перед считыванием ну и дальше компилятор видит по range-analysys что значение переменной i находится в пределах массива и успешно доказывает безопасность обращения к массиву

0

20.05.2022

Богдан
Нет, проблемы останова здесь ни при чем. Можно был...

> редких случаях компилятор попросит юзера вставить if-ы не редких. Страшно.

0

20.05.2022

Богдан
Нет, проблемы останова здесь ни при чем. Можно был...

>> нет цели полностью избавиться от ложноположительных срабатываний. Ничего страшного в том что в редких случаях компилятор попросит юзера вставить if-ы В редких случаях GCC, в редких Clang, иногда MSVC или ICC. И во что превратится ваш код? В портянки #ifdef? А что делать с другой веткой if-а? Сейчас у нас есть возможность и явно, и неявно сказать "она не может исполняться, оптимизируй". А что вы предлагаете взамен? Вы уверены, что настоящая цель бизнеса – это медленные в работе или разработке, но надёжные программы? Мне кажется, что обычно интересы там другие

0

20.05.2022

Богдан Автор вопроса

Ofee Oficsu
>> нет цели полностью избавиться от ложноположител...

Добавление условия вокруг небезопасной операции по сути будет валидировать разброс значений переменных которые участвуют в этой операции и это будет понимать любой компилятор умеющий в range-analysis так что достаточно будет написать один if а не для каждого компилятора свой #ifdef. Другая ветка условия не нужна так как это ложноположительная операция чисто для компилятора который не смог доказать что код в действительности является корректной и не вызывает ub/ошибку (вторая ветка условия не может выполниться по определению) Но кстати да, без развитого data-flow анализа этот подход не работает (либо if-ы придется писать на каждом шагу) но хорошая новость что подобный анализ уже наверное есть в большинстве компиляторов - в том же clang это clang static analyzer, касательно mvsv я тоже встречал доклад с демонстрацией path analysis ну а в gcc тоже скорее всего что-то пилят. Плюс типичный проект (допустим сервер/бэкенд или gui-приложение) в компании обычно собирается одним конкретным компилятором который меняется очень редко а баги обычно встречаются в коде проекта а не библиотек у которых в отличие от проекта есть требование работы под разными компиляторами и они хорошо протестированы). Соотвественно добавив эту возможность (принимать UB не как ошибку а как теорему которую надо доказать) даже в один компилятор Clang мы покроем значительную часть рынка и улучшим качество кода избавившись от UB и связанных с ними непредсказуемых оптимизаций

0

20.05.2022

Богдан
Добавление условия вокруг небезопасной операции по...

не знаю какие у вас там развитые системы в компиляторах, у меня msvc не можт структуру внутри структуры объявить без ошибок

0

20.05.2022

Богдан
Добавление условия вокруг небезопасной операции по...

>> Добавление условия вокруг небезопасной операции по сути будет валидировать разброс значений переменных А каким образом? Что делать, если вторая ветка невозможна с точки зрения семантики? Бросить исключение? Сделать std::terminate? >> Плюс типичный проект (допустим сервер/бэкенд или gui-приложение) в компании обычно собирается одним конкретным компилятором Это, конечно же, наинаглейшая ложь. Во-первых, нет, во вторых, в качестве зависимостей обычно используются фреймворки и библиотеки, которым нужно собираться любым компилятором >> а баги обычно встречаются в коде проекта а не библиотек Что, кончено же, ложь >> а с тем что UB это не достоинство а недостаток Наличие возможности оптимизации через UB – это свойство, которое не является ни положительным, ни отрицательным

0

20.05.2022

Богдан Автор вопроса

Ofee Oficsu
>> Добавление условия вокруг небезопасной операции...

А каким образом? Что делать, если вторая ветка невозможна с точки зрения семантики? Бросить исключение? Сделать std::terminate? Ок, пусть будет trap/std::terminate для второй ветки Это, конечно же, наинаглейшая ложь. Во-первых, нет, во вторых, в качестве зависимостей обычно используются фреймворки и библиотеки, которым нужно собираться любым компилятором так я и написал что требование работы под разными компиляторами есть у библиотек а у проектов как настроили сборку проекта каким-то компилятором так она может работы годами без смены комплятора Что, кончено же, ложь Какой процент багов в ежедневной разработкой связан с фреймворком/библиотекой а какой с кодом проекта? Модульный проекты части которых представлены библиотеками не считается я имею ввиду системные зависимости и библиотеки вроде qt Наличие возможности оптимизации через UB – это свойство, которое не является ни положительным, ни отрицательным К UB как к возможности relax-ить условия и лучше оптимизировать код у меня претензий нет. Моя претензия заключается в том что компилятор языка слепо доверяет коду беря за аксимоу что в коде нет UB из-за чего получаем примеры кода которые вызывают удивление (пример в первом сообщении или можно еще нагуглить never-called function) Получается какая-то каламбурная ситуация - с одной стороны в компиляторе развивают диагностики и анализ кода на ошибки - а с другой слепо доверяют коду и бросаются оптимизировать вместо того чтобы скачала доказать что UB нет и только потом проводить преобразования и оптимизации

0

20.05.2022

Богдан
А каким образом? Что делать, если вторая ветка нев...

концепция предупреждений в компиляторе вам знакома?

0

20.05.2022

Богдан
А каким образом? Что делать, если вторая ветка нев...

А если у меня std::terminate машину в kernel panic/BSOD роняет - юзер точно оценит? Или что-то крутится на МК и по некоторой причине вынужден отлаживаться исключительно логами?

0

20.05.2022

Богдан
А каким образом? Что делать, если вторая ветка нев...

Процент багов малый, зато они всегда нескучные: только вчера Boost.Beast на коленке пришлось чинить

0

20.05.2022

Богдан Автор вопроса

Kelbon
концепция предупреждений в компиляторе вам знакома...

А в компиляторе можно настроить предупреждения чтобы они предупреждали что компилятор не смог доказать отсутствие UB и бросился оптимизировать код (считая что UB нет) ? Если так то я всеми руками за. Вопрос только в том как это настроить в том же кланге?

0

20.05.2022

Богдан Автор вопроса

Dmitriy [Отпуск]
А если у меня std::terminate машину в kernel panic...

Эта ветка ведь никогда не выполниться в корректно работающей программе. А если она выполнилась значит в коде содержится баг и тут уж лучше std::teminate чем UB который может обнаружиться очень далеко от места ошибки

0

20.05.2022

Богдан
Эта ветка ведь никогда не выполниться в корректно ...

Но она как минимум существует (а как максимум - платим за лишний if, и разница между, скажем, at() и operator[] исчезает)

0

20.05.2022

Богдан
А каким образом? Что делать, если вторая ветка нев...

>> Ок, пусть будет trap/std::terminate для второй ветки Прямо на hot path? >> Модульный проекты части которых представлены библиотеками не считается А почему, собственно? >> Какой процент багов в ежедневной разработкой связан с фреймворком/библиотекой а какой с кодом проекта? Я лично статистику не собирал, но прямо сейчас занят исправлением багов в нескольких зависимостях. Вы можете попробовать ещё провести анализ существующих CVE в таких библиотеках и фреймворках – они тоже пишутся на C++

0

20.05.2022

Богдан
Нет, проблемы останова здесь ни при чем. Можно был...

осталось узнать, что бывает раздельная компиляция и динамическое связывание. Невозможно в принципе все доказать.

0

20.05.2022

Boris Usievich
осталось узнать, что бывает раздельная компиляция ...

ТС предложил решение для недоказуемых случаев, но...

0

20.05.2022

Dmitriy [Отпуск]
ТС предложил решение для недоказуемых случаев, но....

Угадайте куда отправят это "решение" авторы миллионов строк существующего рабочего кода, который невозможно доказать?

0

20.05.2022

Boris Usievich
Угадайте куда отправят это "решение" авторы миллио...

Понятно, что в пешее эротическое

0

20.05.2022

Богдан Автор вопроса

Ofee Oficsu
>> Ок, пусть будет trap/std::terminate для второй ...

Прямо на hot path? Как получиться) Предполагается что после мощного data-flow/range/path/symbolic-execution анализа кейсы в которых нужно будет вставлять if чтобы помочь компилятору доказать корректность (отсутсвие ub/рантайм-ошибки) на какой-то небезопасной операции будут ничтожно малы в реальном коде и если исключить случаи динамических переменных (которые получают значение из инпута или где-то извне) для которых в подавляющем большинстве случаев и так нужна будет валидация (что является тем же if-ом который сужает значение и помогает компилятору доказать корректность) то остальные случаи относятся к сложным математическим преобразованиям которые сложно доказать без добавления в компилятор математических формул преобразования. Например есть формула квадратичного уравнения которая говорит что если для динамических переменных a, b, c, x1, x2 a * x1 * x1 + b * x1 + c == 0 && a * x2 * x2 + b * x2 + c == 0 и если a + b + c == 0 и если x1 * a == c то значение x2 будет равно 1 и операция arr[8 + x2] вполне себе безопасна для массива размером 10 но никто не захочет раздувать исходный код компилятора формулами для всевозможных математических преобразований соотвественно компилятор не сможет доказать что arr[8 + x2] можно безопасно считать и выдаст ошибку а юзер должен будет заврапить в условие if (8 + x2 > 0 && 8 + x2 < 10) value = arr[8 + x2] и дальше компилятор увидит по rage-analysis разброс значений для индек-выражения и докажет безопасность обращения к массиву. Соотвественно выполнение второй ветки будет говорить об ошибке в самом коде (например неправильно закодили выражение квадратного уравнения) и здесь получаем трейдофф - либо платим дополнительными инструкциями на if в рантайме чтобы сразу поймать ошибку через trap в другом бранче либо каким-то интристиком говорим компилятору что "зуб даю - чтение массива в этом месте безопасно" и компилятор верит на слово но тогда получаем UB которое сложно дебажить если мы сами ошиблись

0

20.05.2022

Богдан
Прямо на hot path? Как получиться) Предполагается ...

Зачем сложные преобразования-то?) SomeOsApi(..., nullptr, ...) - UB или нет?

0

20.05.2022

Богдан
Прямо на hot path? Как получиться) Предполагается ...

хотите гарантий доступа в массив - идите в java, там это гарантировано

0

20.05.2022

Богдан
Прямо на hot path? Как получиться) Предполагается ...

глупо предполагать хоть в одном месте программы, что программист дурак и не даёт зуб за то что пишет

0

20.05.2022

Богдан Автор вопроса

Dmitriy [Отпуск]
Зачем сложные преобразования-то?) SomeOsApi(..., ...

Ну системный вызов принципиально не отличается от динамического инпута - любое взаимодействие с окружающей средой за пределами нашей статически-проверяемой песочницы либо нужно либо оборачивать рантайм-проверками (дополнительные if-ы которые сужают разброс значений и помогают доказывать корректность для дальнейших небезопасных операций) либо верить напрямую тем типам и поведению которое описываются в сигнатуре

0

20.05.2022

Богдан
Ну системный вызов принципиально не отличается от ...

Идея вставлять в код ненужные if приведет к падению производительности. Кое где в разы, если убьет векторизацию внутреннего нагруженного цикла.

0

20.05.2022

Dmitriy [Отпуск]
Что нужно проверить в моём примере?)

Что нужно проверить в моём примере?)

0

20.05.2022

Богдан Автор вопроса

а где там может быть ub?

0

20.05.2022