Я не думаю, что это можно нормально сделать для tf-idf. Если данных очень много, то можно использовать https://scikit-learn.org/stable/modules/generated/sklearn.feature_extraction.text.HashingVectorizer.html Он как раз и стримить может
Обсуждают сегодня