Привет, подскажите, где описаны форматы файлов для аннотаций? Предыстория, есть

игра, в ней есть инвентарь, он выглядит почти как сетка, в ячейке нарисован предмет и есть название предмета.

Сейчас с помощью opencv хорошо нахожу сами предметы, выреза название, читаю его tesseract'ом. Предметы определяются с 60-80% вероятности.

Сейчас планирую прикрутить yolo. Знаний в этом очень мало. Пошел по пути чтения гайдов на https://docs.ultralytics.com/.

Попробовал скачать готовые датасеты, обучить на них сеть, работает, нравится!


Но теперь план сделать свой датасет на тех 60-80% которые уже и так классифицирую тессерактом(но крайне на надежный метод). Фактически каркас приложения которое порежет скриншот, и разложит на классам уже есть.

Но я открываю чужие датасеты там не координаты объектов, и не пиксели, а "25 0.0402099639474045 0.8337668576088162 0.018510377627308117 0.5455582268333451 0.38286378609188887 0.5181261985631227 0.40457323932150757 0.806324466468793"

Вопрос пока в формате описания датасета?

Ps почитал разговор выше, у меня нет цели прокачивать навык в профессиональную плоскость, просто играюсь и пишу публичный сервис) т.е. все выглядит для моей цели вроде бы просто, сильно углубляться не планирую

4 ответов

51 просмотр

Там всё просто, чуть позже обьясню

А вы пока почитайте про аугментации

Датасет ёлки описывается в .yaml файле. По дефолту они в ./data лежат:

Похожие вопросы

Обсуждают сегодня

upvote plz https://www.kaggle.com/code/bassetkerouche/swapping-face?scriptVersionId=207300096
benkerrouche Statoinary
1
Hi! Could you please upvote my new notebook? thanks a lot. https://www.kaggle.com/code/melissamonfared/anime-character-generation-dsgan-gan
məru
4
-- Привет всем. -- Есть csv, проблема в том что он содержит очень много повторов по столбцам и по строкам. -- Решил перекинуть это в базу данных, чтобы было проще. Но я не ша...
Oleg Ivanov
1
hi, Can you upvote? https://www.kaggle.com/code/durjoychandrapaul/rag-q-a-system-by-langchain-huggingface-for-pdf?scriptVersionId=204704280
A
1
Как считаете - вопрос на собесе: «Как быстрее всего запустить ec2 машину в aws (в чистом аккаунте) и показать вывод от любой команды с нее» не очень ли сложный для условного м...
Sergey
50
Hi could you please help me with my two new projects? https://www.kaggle.com/code/hesankazemnia/rice-image-classification-cnn-pytorch https://www.kaggle.com/code/hesankazemnia...
Hesan
6
Господа, у меня вопрос. Что вообще такое этот ваш data science и data scientists? А то гуглю, а мне какую-то расплывчатую фигню говорят.
Inkosta
44
Исходя из ваших комментариев, получается, что чтобы получить марты в CH из данных в PG, неправильно тянуть сырые данные в CH и там их обрабатывать, лепить справочники и джойни...
unhingedlunatic
42
Could you upvote and comment please? https://www.kaggle.com/code/tatianapetrushkevich/beginner-images https://www.kaggle.com/code/tatianapetrushkevich/python-for-beginners1 ...
Tazziyana
7
Может кто подсказать какие требования к изображениям для обучения Yolo v8? Как то разрешение, размер выделяемого обьекта в пикселях, оптимальное кол-во изображений. А то я пыт...
Владислав😎
16
Карта сайта