и знал про жадность лексера, но реально думал, что, ну это просто такая штука, которая откусывает цепочки символов и превращает их в токены, чтобы парсеру проще было. Связывал с тем фактом, что в 70е или когда эта теория и, главное, реальные компиляторы на ее основе активно разрабатывались памяти было мало и оперировать токенами (тройками "начало", "конец" или "длина" и "тип") требует гораздо меньшего объема памяти чем каждым символом. О таком потрясающем влиянии жадности на теоретические аспекты CFG/не-CFG как-то не задумывался. Интересно, это наблюдение про "чудо" превращения не-CFG грамматики в CFG под влиянием лексера сделано самостоятельно или что-то можно почитать?
IMNSHO — это совершенно очевидный вывод (и следствия из него широко используются на практике, как раз когда "обычные" parser generators (или parsers), использующие "слабые" методы разбора (вроде LR(1) или даже LL(1)), применяются для parsing ЯП, которые, будучи определёнными "на уровне символов", нередко являются контекстно-зависимыми (а то относятся к unrestricted grammars, как, кажется, perl). См. сообщение выше. ;)
Обсуждают сегодня