тип из содержимого файла? Если да, то не подходит. Информация о типах содержится только в коде парсинга.
Сейчас будет очень упрощенная аналогия моего типа данных:
union A { struct B { int a,b,c; }; struct C { float a,b,c; }; struct D { unsigned char strLen; char str[11]; } }; И какой из вариантов B/C/D хранится в А известно из контекста (например, из какого файла происходит чтение, или какие метаданные были получены при чтении файла).
Если из контекста известен тип, зачем union?
Информация о типах кодируется разными способами - специальными метками, кодами, последовательностью битов, сигнатурно, символами, и т.п. Все можно реализовать через SAX-парсинг. Насколько я вас понял, вы хотите в парсере тип расшифровывать и заполнять какой-то variant. Т.е. вы будете делать одну суперфункцию на все случаи жизни. А парсинг будет простым проходом. Формат усложнится и все. Придется писать парсер над парсером, чтобы уже парсить то что спарсено. Расширяемость такого подхода низкая, а количество кода, какой надо написать будет увеличиваться по мере добавления новых и новых типов. Получится over-engineering.
Чтобы при помощи одного универсального типа возвращать разобранные данные из функции парсинга. А потом при помощи методов какой-то однотипно обрабатывать эти разобранные данные (сериализация в тот же protobuf, запись в бд, и т.д.).
то есть распарсить и свалить все в кучу опять?
Да, только это будет уже не шифрованная, сжатая, закодированная куча, а куча строгой системы типов плюсов )
Обсуждают сегодня