2. Препаративная форма,
3. Содержание д.в.,
4. Регистрант,
5. Классы опасности,
6. Номер государственной регистрации,
7. Ограничения,
8. Дата окончания срока регистрации (число, месяц, год)
Да вполне можно выдернуть при желании. Недавно извращался, писал скрипт, который таблицу из одной строки в docx превращал в просто текст: https://github.com/mikhailnov/docx-hackery Распаковывал docx как zip, прогонял word/documentx.xml через xmllint, чтобы xml стал человекочитаем, дальше bash-ем работал с как просто строками. Можно, наверное, и специальные инструменты для работы с xml применить.
Обсуждают сегодня