массив строчек?
они пишут что принимают avro но массив в avro формате не фурычит
{
"type":"record",
"name":"Items",
"namespace":"com.amazonaws.personalize.schema",
"fields":[
{
"name":"ITEM_ID",
"type":"string"
},
{
"name":"LABELS",
"type":{
"type":"array",
"items":{
"name":"Child",
"type":"record",
"fields":[
{
"name":"LABEL",
"type":"string",
"categorical":true
}
]
}
}
}
],
"version":"1.0"
}
Можно, но немного по другому. Там надо использовать | (pipe) для разделения. Вас ещё не хватает categorical: true для собственных атрибутов Посмотрите вот тут примеры. Если надо будет готов созвонится и обсудить подробнее. Я как раз сейчас за этот сервис отвечаю в AWS https://docs.aws.amazon.com/personalize/latest/dg/how-it-works-dataset-schema.html
класс, спасибо)) завтра попробую!
мне нужно что LABELS это []string не понял как написать это через |
| это уже в данных, если у атрибута может быть несколько значений (например несколько жанров у кино) Вы же просто хотите иметь несколько атрибутов у item? Тогда просто их перечислите в fields { "type": "record", "name": "Items", "namespace": "com.amazonaws.personalize.schema", "fields": [ { "name": "ITEM_ID", "type": "string" }, { "name": "GENRES", "type": [ "null", "string" ], "categorical": true }, { "name": "Actors", "type": [ "null", "string" ], "categorical": true }, { "name": "CREATION_TIMESTAMP", "type": "long" } ], "version": "1.0" }
ну вот в примере выше позволит положить в GENRES = ["rock", "hip-hop"] ? Я про это
Нет, в данных надо будет положить «rock|hip-hop”
Обсуждают сегодня