игра, в ней есть инвентарь, он выглядит почти как сетка, в ячейке нарисован предмет и есть название предмета.
Сейчас с помощью opencv хорошо нахожу сами предметы, выреза название, читаю его tesseract'ом. Предметы определяются с 60-80% вероятности.
Сейчас планирую прикрутить yolo. Знаний в этом очень мало. Пошел по пути чтения гайдов на https://docs.ultralytics.com/.
Попробовал скачать готовые датасеты, обучить на них сеть, работает, нравится!
Но теперь план сделать свой датасет на тех 60-80% которые уже и так классифицирую тессерактом(но крайне на надежный метод). Фактически каркас приложения которое порежет скриншот, и разложит на классам уже есть.
Но я открываю чужие датасеты там не координаты объектов, и не пиксели, а "25 0.0402099639474045 0.8337668576088162 0.018510377627308117 0.5455582268333451 0.38286378609188887 0.5181261985631227 0.40457323932150757 0.806324466468793"
Вопрос пока в формате описания датасета?
Ps почитал разговор выше, у меня нет цели прокачивать навык в профессиональную плоскость, просто играюсь и пишу публичный сервис) т.е. все выглядит для моей цели вроде бы просто, сильно углубляться не планирую
Там всё просто, чуть позже обьясню
А вы пока почитайте про аугментации
Обсуждают сегодня