fine tuning от instruction tuning? Можете показать на примере?
Вот есть датасет databricks/dolly. Там есть колонки context, instruction, response.
Верно ли я понимаю, что для обычного файтюнинга я просто беру и конкатенирую context, instruction, response в одну строку и все, а для instruction tuning я делаю что-то типа такого: f'[cont] {context}[/cont] [inst]{instruction}[/inst][resp]{response}[/resp]',
то есть обрамляю каждый из столбцов некоторым токеном для инструкции?
По сути ничем
Обсуждают сегодня