стандартно, но я уже мальца плавленный.
Предположим, захотелось мне вести в Rmarkdown "бортовой журнал" проекта. Мол: вот глянул на данные (табличка), нашёл аутлаера (график), по таким-то соображениям решил его удалить и теперь данные выглядят вот так (табличка) и т.д.
Понятно, что если данные это условные ирисы и машинки, то можно не париться, и создать сколько угодно версий датасета ("до", "после" и т.д.). Но что делать, если датасет тяжёлый и преобразования долгоиграющие? Сохранять иллюстрации файлом на диск и в Rmarkdown подставлять файл вместо честной генерации картинки?
а сделать сэмпл данных с косяком?
Это ж mlops в целом и отчасти feature store
Не совсем. Тут как раз хочется соблюсти простой и человекочитаемый нарратив. Чтобы ход мысли был описан прямо в тексте и где надо проиллюстрирован таблицей или графиком. Читать комменты к коммитам и сравнивать diffы в гите -- это другое.
Нормальный вариант. Очумелые ручки. Так часто и делаем, сохраняемся снапшот, а потом рефакторим. В рмаркдаун сохраняются только картинки и статистика. А датасет можно на схд слить
Ну тогда остается вопрос, как в коде сохранять картинкой вывод таблички в консоли.
Статистику? Миллион способов
Обсуждают сегодня