семинаре у IBM, которые тоже по озеро рассказывали, но так и не понял в чем отличие от, например, хадупа, в который данные будут сгружаться тоннами из всех источников
Концепция data lake'ов родилась из того, что любые данные могут быть полезными для решения задач мл. Интерес в том, что можно хранить структурированную, полу- и неструктурированную информацию в любом формате любых размеров. Это позволяет создавать модель данных для каждого конкретного случая за меньшую стоимость, чем в хадупе. В итоге гибче и дешевле
Обсуждают сегодня