содержатся названия товаров в расширенной форме, типа "Zipper Molded Plastic Jacket Zipppers 18" Color Orange 18 inch Zippper Teeth Width 3 mm". Надо выбрать товары определенных цветов.
Пока делаю так:
red_count = zippers[zippers['title'].str.contains('Red')]['selled'].sum()
green_count = zippers[zippers['title'].str.contains('Green')]['selled'].sum()
blue_count = zippers[zippers['title'].str.contains('Blue')]['selled'].sum()
Суть в том, что в тайтле может быть несколько наименований цветов - типа там белая молния с красными пятнами и синим замочком.
Можно наверное сделать так:
black_count = zippers[(zippers['title'].str.contains('Black') == True)&(zippers['title'].str.contains('White') == False)]['selled'].sum()
Но этих цветов вариантов 20. Как тут лучше поступить?
Я не пойму как отсечь несколько цветов. Т.е. выбрать только черные молнии, не учитывая, что у них белый горошек и синий замочек
Возможно по двум условиям? Это молния и она чёрная. А вообще это задача типа NER
https://dfedorov.spb.ru/pandas/%D0%AD%D1%84%D1%84%D0%B5%D0%BA%D1%82%D0%B8%D0%B2%D0%BD%D0%B0%D1%8F%20%D0%BE%D1%87%D0%B8%D1%81%D1%82%D0%BA%D0%B0%20%D1%82%D0%B5%D0%BA%D1%81%D1%82%D0%B0%20%D1%81%20%D0%BF%D0%BE%D0%BC%D0%BE%D1%89%D1%8C%D1%8E%20Pandas.html
Не, не прокатит в товарах с тайтлом типа Ribbon 1 inch Black with White Polka Dots Ribbons for Crafts Gift Ribbon Satin Red Solid Ribbon Roll 1 in x 25 Yards. Вот цвет у ленты черный, но есть какие-то белые и красные запчасти, и все это указано в тайтле.
Обсуждают сегодня