другом, Б, другие объекты с координатами
Как сделать функцию, чтобы в для каждого объекта из А узнать количество объектов из датафрейма Б в радиусе N метров?
Сделал
df = gpd.GeoDataFrame(df, crs="EPSG:4326", geometry=gpd.points_from_xy(df.geo_lon, df.geo_lat))
df.geometry = df.geometry.buffer(100)
df = df.to_crs(4326)
в df_osm находится поле geometry из Point (x, y) и поле id
дальше делаю sjoin
df_new = sjoin(df, df_osm, how="inner", op='intersects')
а затем как делать...?
отложим питон пока в сторону. Предполагаем, что там евклидова геометрия (точки относительно близко). Задача легко и быстро решается в 2 итерации. 1. для каждой точки из Б делаем слияние по условию abs(x - x0) < N & abs(y - y0) < N. Резко сократили множество возможных точек. 2. делаем тонкую фильтрацию через расстояние (x-x0)^2 + (y-y0)^2 <= N^2 Все, задача решена. Есть два комментария. 1. никаких объектов, точек и прочей ООП чуши. Есть две длинных таблицы/датафрейма. И классические операции с прямоугольными данными. 2. питон ужасно неудачен даже для таких тривиальных задачек. в пандасе нет conditional join (для итерации 1). https://github.com/pandas-dev/pandas/issues/8962 Доставайте бубны, если поклонник питона. Для 5 точек слева и 10 справа можно и циклами циклов в циклах решить. Только такое решение предается анафеме, не показывайте его никому и стыдитесь. Но есть другие варианты, из простейших — сделать все в R / Spark / БД, где все эти джойны есть. Решение задачи — пара строчек.
cross join+фильтр - и вот тебе conditional join под капотом)
Касаемо питона - ну да, (гео)пандас А так, данные у df находились в постгресе в формате float + float и тд всякие другие а данные с осма - это файл osm.pbf умножений делать много, где-то 300-500к на 100-200к строк
Обсуждают сегодня