шаблон промпта как в функции ниже, мне нужно все данные оработать с учетом этого шаблона или же это ток для инференса?
def generate_prompt(data_point):
return f"""
Below is an instruction that describes a task. Write a response that appropriately completes the request
### Instruction: {data_point["request"]}
### Response: {data_point["responce"]}
""".strip()
def process_observation(data_point):
complete_prompt = generate_prompt(data_point)
return tokenizer(complete_prompt, padding=True, truncation=True)
data = Dataset.from_pandas(pd.read_excel(DATA_DIR))
data = data.map(process_observation)
Конечно с форматом
Как хочется в инференсе, так и должно быть в обучении
Обсуждают сегодня