Во, раз уж тут обсуждают архитектурные излишества... Как логичнее всего

М... Чуть больше контекста. Есть некий описанный схемой и прочим формат, который пользователи должны заполнять и подавать на вход числодробилке, которая его знает целимом. Формат жутко многоловный и кроме того не всем все операции можно делать. Поэтому есть производный от него упрощённый формат. Наша задача сконвертировать одно в другое, повалидировать, сделать какие-то специфические для нас вещи. Нюанс в том, что полной спецификации исходного формата у нас нет (и в общем целиком он нам не требуется). Часть тегов и аттрибутов из упрощённого просто должны быть перенесены в итоговый файл.

0

29.06.2022

Denis Pobedrya

evle
М... Чуть больше контекста. Есть некий описанный ...

Самый лучший способ сохранить xml как есть это… сохранить его как xml, потоком байт, в блоб там или в файл

0

29.06.2022

Pavel Павлик

evle
М... Чуть больше контекста. Есть некий описанный ...

Ладно, но я не понимаю, в чем вопрос

0

29.06.2022

evle Автор вопроса

Denis Pobedrya
Самый лучший способ сохранить xml как есть это… со...

Не, с сохранить нет вопросов. Вопросы с тем, как с этим работать. Грубо говоря, обработки могут быть такого плана: <Container><Element a="1" b="2"><Filter>...</Filter></Element></Container> Наша задча тут — найти все Element, посмотреть в Filter внутри, подёргать базу данных по запросу из Filter и каких-то атрибутов Element, получить оттуда список подходящего и сгенерировать такое: <Container><Element a="1" b="2" с="5" d="6"></Element><Element a="1" b="2" с="7" d="8"></Element></Container> c и d придут из базы, остальное переносится из исходного элемента. Беда, собственно, в том, что мы не очень в курсе, какие атрибуты вообще могут быть и какие у них возможные значения.

0

29.06.2022

Pavel Павлик

evle
Не, с сохранить нет вопросов. Вопросы с тем, как с...

Надо выяснить, иначе код не напишешь

0

29.06.2022

Denis Pobedrya

evle
Не, с сохранить нет вопросов. Вопросы с тем, как с...

Если файл помещается в память — читаем в какой-нибудь lxml.etree, манипулируем данными про которые знаем, дампаем

0

29.06.2022

evle Автор вопроса

Pavel Павлик
Надо выяснить, иначе код не напишешь

Там сотни атрибутов и потенциальных комбинаций, которые контролируем не мы и которые на нас вообще никак не влияют, пока такой задачи не стоит. Была мысль налепить датаклассов для полного маппинга и следить за изменением схемы — но это нереально.

0

29.06.2022

Pavel Павлик

evle
Там сотни атрибутов и потенциальных комбинаций, ко...

Я не понимаю вообще. Схему меняют постоянно?

0

29.06.2022

evle Автор вопроса

Denis Pobedrya
Если файл помещается в память — читаем в какой-ниб...

Вот от одного гигантского ElementTree и хочется избавиться — крайне сложно следить за тем, что там вообще происходит.

0

29.06.2022

evle Автор вопроса

Pavel Павлик
Я не понимаю вообще. Схему меняют постоянно?

В целом — да, часто.

0

29.06.2022

Denis Pobedrya

evle
Вот от одного гигантского ElementTree и хочется из...

Если программа сложна для понимания, то от написания 100500 моделей про чужой формат за которыми надо следить она понятнее не станет

0

29.06.2022

evle Автор вопроса

Denis Pobedrya
Если программа сложна для понимания, то от написан...

Именно что хочется сделать модели для того, с чем мы непосредственно работать и какой-нибудь extra_attributes: dict для того, на что нам пофиг.

0

29.06.2022

Denis Pobedrya

evle
Именно что хочется сделать модели для того, с чем ...

сделайте, но вместо extra_attributes пусть будет исходная хмл-ка как есть, строкой

0

29.06.2022

evle Автор вопроса

Denis Pobedrya
сделайте, но вместо extra_attributes пусть будет и...

Ну, строка тут не спасёт. Вложенности дофига.

0

29.06.2022

Denis Pobedrya

evle
Ну, строка тут не спасёт. Вложенности дофига.

ну хранить не куски напротив каждого аттрибута, а один раз исходный документ

0

29.06.2022

evle Автор вопроса

Denis Pobedrya
ну хранить не куски напротив каждого аттрибута, а ...

Бр. А дёргать потом нужное из него как?

0

29.06.2022

Denis Pobedrya

evle
Бр. А дёргать потом нужное из него как?

вот то что вам нужно xpath'ом достаньте и схороните уже в базу или куда вам там удобнее

0

29.06.2022

Pavel Павлик

evle
Там сотни атрибутов и потенциальных комбинаций, ко...

Объясни, почему работать с постоянно изменяющейся схемой без датаклассов реально, а с датаклассами — нет?

0

29.06.2022

evle Автор вопроса

Pavel Павлик
Объясни, почему работать с постоянно изменяющейся ...

Вопрос не в датаклассах как таковых а в классах в целом. Допустим, пришёл на вход тег: <Constants value1="1" value2="3" wtf="random_stuff"> На value1 и value2 у нас завязано куча расчётов по остальному документу, а что такое wtf — мы вообще не знаем и нам даже никто не сообщил, что его добавили, но сообщили пользователям, и в конечном xml это значение должно сохраниться. Мы делаем @dataclass class Constants: value1: int value2: int Куда нам запихнуть wtf?

0

29.06.2022

denis

evle
Вопрос не в датаклассах как таковых а в классах в ...

NotRequired[wtf_type]

0

29.06.2022

Pavel Павлик

evle
Вопрос не в датаклассах как таковых а в классах в ...

@dataclass class Constants: value1: int value2: int extra: dict[str, str]

0

29.06.2022

Tishka17

evle
Вопрос не в датаклассах как таковых а в классах в ...

unknown: Dict[str, Any]

0

29.06.2022

evle Автор вопроса

denis
NotRequired[wtf_type]

Мы не знаем, какие поля вообще есть, чтобы так писать.

0

29.06.2022

denis

evle
Мы не знаем, какие поля вообще есть, чтобы так пис...

т.е. к ним не надо обращаться?

0

29.06.2022

evle Автор вопроса

Tishka17
unknown: Dict[str, Any]

Вот что-то такое и думаю сделать в итоге. Но вопрос — как потом переводить их в известные, когда придёт тз "а вы знаете, мы тут добавили атрибут something, можно вы будете проверять, что он используется только совместно с такими-то тегами в другом углу xml".

0

29.06.2022

Tishka17

evle
Вот что-то такое и думаю сделать в итоге. Но вопро...

не понял

0

29.06.2022

Tishka17

evle
Вот что-то такое и думаю сделать в итоге. Но вопро...

переложишь

0

29.06.2022