в тессеракт?
он там точно поместится?
Тессеракт многомерен. Туда поместится не только сербский, но и хорватский с боснийским
черногорский тоже туда, как раз 4хмерка и 4 языка
https://groups.google.com/g/proverapisanja/c/GavKEfkCAPY?pli=1 С версии 3.0 держит сербскую латиницу, насколько я понимаю
я находил репу с данными для трейна как кириллицы так и латиницы, но хотелось бы готовые веса просто
Мне теперь ужасно любопытно о чем речь. Что за тессеракт и зачем туда разные языки пихать? Вроде что-то такое было в Марвел или в трансформерах, но не думаю, что это связано здесь😁
это библиотека для распознавания текстов на картинках для поддержки разных языков — нужны разные пакеты, дефолтно идет латиница с английским
В Марвел. :) Но тут речь про программу распознавания текстов, которая почему-то названа Тессерактом и работает рабочей лошадью для гугловых OCR включая AR-ки и сопутствующую хрень
https://tesseract-ocr.github.io/tessdoc/Data-Files-in-different-versions.html обе. а оно вообще годное? я недавно пытался найти что-нибудь фриварное на эту тему, но консоль меня отпугнула (не потому что консоль, а потому что консоль означает отсутствие визуального сравнения с исходником для правки, я полагаю)
ладно, оффтопик https://tesseract-ocr.github.io/tessdoc/User-Projects-%E2%80%93-3rdParty.html
Обсуждают сегодня