Где можно почитать о том как писать препроцессоры (ну вот

Или можно здесь посмотреть https://github.com/romart/EduCC/blob/master/src/pp.c и задать вопросы где не понятно

0

12.06.2023

Кстати, если тут стадии указаны в порядке, то полу...

Miroslav Belov

Технически препроцессор это часть лексера, он получает на вход поток "raw" - токенов, преобразует его в другой поток и отдает в парсер. Правила преобразования можно определять самому с помощью макросов и директив

0

12.06.2023

кана

Miroslav Belov

Кстати, если тут стадии указаны в порядке, то полу...

> препроцессор встроен во фронтенд компилятора а куда его еще встраивать, до парсера должны дойти токены уже после препроцессинга

0

12.06.2023

кана

а лексер это не часть фронтенда?

0

12.06.2023

В GCC так и есть :)

0

12.06.2023

SNEJANA ONE LOVE
В GCC так и есть :)

Для фортрана. Для сишечки- нет

0

12.06.2023

Miroslav Belov Автор вопроса

У меня сложилось впечатление, что в очень любят рассказывать про то что компилятор это что-то отдельное, парсер отдельно

0

12.06.2023

Mar Ort
Технически препроцессор это часть лексера, он полу...

Хотя в chibicc препроцессор отделен от лексера и парсера, это отдельный проход по потоку токенов вида (map expand raw_tokens). Так просто проще делать, не надо заморачиваться с лексическим стеком

0

12.06.2023

Miroslav Belov
У меня сложилось впечатление, что в очень любят р...

Парсер - да. А вот препроцессор в современных компиляторах - часть парсера

0

12.06.2023

Alex
Парсер - да. А вот препроцессор в современных комп...

В каких компиляторах это часть парсера? Может все-таки лексера?

0

12.06.2023

Mar Ort
В каких компиляторах это часть парсера? Может все-...

Ок, лексера (я парсинг в более глобальном смысле имею ввиду). Но в том же гцц лексер и парсер несколько переплетены

0

12.06.2023

Alex
Ок, лексера (я парсинг в более глобальном смысле и...

потому что это СИ, и там иначе никак. Но это именно на уровне lexer-hack, и препроцессор к этмоу переплетению отношения не имеет

0

12.06.2023

Mar Ort
потому что это СИ, и там иначе никак. Но это именн...

Я с этим и не спорю. Кстати, в clang, если я правильно понял, обошлись без lexer hack

0

12.06.2023

Alex
Я с этим и не спорю. Кстати, в clang, если я прав...

ну как, выше головы не прыгнешь, там просто лексер выдает что-то общее типа ID кажется, а парсер сам у себя решает что это такое. В любом случае токен, определение типа которого задача лексера, определается в парсере по информации из семантики. Суть то та же

0

12.06.2023

Mar Ort
ну как, выше головы не прыгнешь, там просто лексер...

Суть да. Но сделано красивее

0

12.06.2023

Alex
Суть да. Но сделано красивее

да, мне такой подход тоже нравится. Я в данном случае под "lexer hack" понимаю не конкретную реализацию а сам факт того что для правильного определения типа токена нужно залезать на уровень семантики сквозь парсер

0

12.06.2023

Alex
Для фортрана. Для сишечки- нет

А lcc для фортрана GNU-шную libcpp вызывает или пользуется препроцессором от EDG?

0

12.06.2023

SNEJANA ONE LOVE
А lcc для фортрана GNU-шную libcpp вызывает или по...

Хз. Никогда не проверял

0

12.06.2023

Alex
Хз. Никогда не проверял

А ведь надо бы :)

0

12.06.2023

SNEJANA ONE LOVE
А ведь надо бы :)

Зачем?

0

12.06.2023

Miroslav Belov Автор вопроса

Mar Ort
Технически препроцессор это часть лексера, он полу...

Получается, есть три сценария: 1. [препроцессор + компилятор] парсить исходный кода в rawTokens с учетом сразу и препроцессора, и компилятора. Тогда, эти токены скармливаем препроцессору он выдает некую другую последовательность токенов (с информацией о перестановках) и эти токены уже скармливаем в компилятор 2. [компилятор] получаем последовательность rawTokens токенов где, уже нет токенов препроцессор, но есть информация о перестановках и собственно компилируем 3. [только препроцессор] парсим в rawTokens с учетом только токенов для препроцессор и выдаем наружу (в виде простого потока (для человеков) или опять таки с релокациями для дальнейшего использования) Я думал сделать 2 и 3. А 1 реализовать через 2 > 3. А то если в 1 сразу парсить и для препроцессора, и для компилятора - то как-то сложно, наверное. И долго (если пользователю только препроцессор нужен, и может он его запускает для своих нужд каких-то (какие-то свои языки им собирает))

0

12.06.2023

кана

Miroslav Belov
Получается, есть три сценария: 1. [препроцессор + ...

а зачем компилятору знать о том что там куда переставлялось? сам препроцессор может сказать, что и куда было expanded

0

12.06.2023

кана
а зачем компилятору знать о том что там куда перес...

диагностики как минимум выдать и отладочную информацию правильно построить

0

12.06.2023

Miroslav Belov Автор вопроса

А cpp это что тогда?

0

12.06.2023

Miroslav Belov
Получается, есть три сценария: 1. [препроцессор + ...

ну да, можно конечно и так сделать, просто на практике оказывается удобнее делать все вместе. Но если вы хотите сделать сишный компилятор то сначала сделать без PP вполне допускается, потом просто допилите что нужно или внешний возмете как тут уже предлагалось

0

12.06.2023

Miroslav Belov Автор вопроса

Запросто. Ибо в основном от университетских преподователей и слышал)

0

12.06.2023

кана
а зачем компилятору знать о том что там куда перес...

Есть CoCo, но обычно все пользуются ссишным, причем тем, что до стандарта был

0

12.06.2023

Miroslav Belov Автор вопроса

Ммм? Не понял. В этом подходе компилятор получив последовательность rawTokens без информации о перестановках от препроцессора и захотев понять, что откуда expanded (например, для вывода диагностики) должен пойти в препроцессор (с чем? с ранее полученными rawTokens без информации о перестановках) и спросить, а помнишь ты вот что-то препроцесил, вспомни и скажи что и куда) Надо выходит таки где-то эту информацию хранить таки

0

12.06.2023

Miroslav Belov Автор вопроса

Наверное. Это имел ввиду man7.org/linux/man-pages/man1/cpp.1.html

0

12.06.2023