preprocessing is that any preprocessing statistics (e.g. the data mean) must only be computed on the training data, and then applied to the validation / test data. E.g. computing the mean and subtracting it from every image across the entire dataset and then splitting the data into train/val/test splits would be a mistake. Instead, the mean must be computed only over the training data and then subtracted equally from all splits (train/val/test).
По каким причинам рекомендуется считать среднее по всему train сету, а потом это среднее применять к валидации и тесту, А НЕ считать среднее изначально на всем сете (не только на train)?
чтобы не иметь никакой информации о валидации
Обсуждают сегодня