data science без какого либо стартап опыта, где нужно не просто в пайтоне что-то печатать, а понимать как работает система в продакшне от и до. У меня есть идея, но с точки зрения system design нужен совет как лучше. Идея следующая. Это приложение на адроид, которое:
1) конвертирует аудио в текст (для начала возьму vosk опенсорс, в будущем возможно буду использовать что-то другое).
2) сохраняет текст, фиксит ошибки, расставляет пунктуацию
3) делает суммаризацию
4) приложение имеет чат, где пользователь может задать вопрос и получить ответ на основе записанного аудио.
Вопросы:
1. на каком этапе мне нужно использовать Google Cloud Storage (или FIrebase, до сих пор не понимаю разницу)?
2. нужно ли мне для обработки текста пункт 2), 3), 4) использовать python библиотеки, соответственно нужно ли мне каким-то образом с Android конвертированный текст передавать в хранилище и потом в python код обработку или же мне нужно делать все на Kotlin?
А вместо приложение телеграмм бот бы подошел? Ну то есть чтобы всё работала в телеграмм боте, а не в отдельном приложении?
основная цель сделать mvp и ходить по инвесторам. Думаю, телеграм бот не очень стандартное решение
А почему в вебе не сделать?
потому что аудио как минимум удобнее записывать с телефона
ну вот я прийду на какое-то мероприятие оффлайн, подойду к какому-то миллионеру со своим питч, то ли мне с ноутбуком все показывать, то ли с телефоном в руках
А миллионер с айфоном..
Кнопочный телефон для делового человека
я был лично знаком с одним человеком из списка форбс, он реально гонял с древней кнопочной мобилой. Образ довершал мятый пиджачок)
у Путина вообще телефона нет. миллиардерам не нужен телефон в принципе. помощники все делают
Я просто знаю тг-бота, который делает почти 1в1 что вы написали. И кстати ещё одно приложение знаю, оно тоже похожие функции имеет.ю, первая бука C а последняя T, всего 7 букв
А бота как искать?
Кажется вот этот @my_voice_messages_bot Я с лета им не пользовался, поэтому возможно что-то поменяли
А почему воск? Когда есть whisper?
ну я проверил. работает хорошо. оно использует OpenAI, пользование по подписке если более 20 мин
Обсуждают сегодня