кластера. Все действия выполнял из этого мануала - https://github.com/VictoriaMetrics/operator/blob/master/docs/quick-start.MD#VMSingle
1. Задеплоил самого оператора
2. Добавил VMCluster:
apiVersion: operator.victoriametrics.com/v1beta1
kind: VMCluster
metadata:
name: example-vmcluster-persistent
namespace: victoriametrics
spec:
# Add fields here
retentionPeriod: "4"
replicationFactor: 2
vmstorage:
replicaCount: 2
storageDataPath: "/vm-data"
storage:
volumeClaimTemplate:
spec:
storageClassName: longhorn
resources:
requests:
storage: 10Gi
resources:
limits:
cpu: "0.5"
memory: 500Mi
vmselect:
replicaCount: 2
cacheMountPath: "/select-cache"
storage:
volumeClaimTemplate:
spec:
resources:
requests:
storage: 2Gi
resources:
limits:
cpu: "0.3"
memory: "300Mi"
vminsert:
replicaCount: 2
3. Перед созданием агента как положено сделал ему кластерную роль. Затем создал самого агента:
apiVersion: operator.victoriametrics.com/v1beta1
kind: VMAgent
metadata:
name: example-vmagent
namespace: victoriametrics
spec:
serviceScrapeNamespaceSelector:
matchLabels:
name: victoriametrics
serviceScrapeSelector: {}
podScrapeNamespaceSelector: {}
podScrapeSelector: {}
probeSelector: {}
probeNamespaceSelector: {}
replicaCount: 1
remoteWrite:
- url: "http://vminsert-example-vmcluster.default.svc.cluster.local:8480/insert/0/prometheus/api/v1/write"
# - url: "http://vmsingle-example-vmsingle-persisted.default.svc:8429/api/v1/write"
Суть проблемы: агент не может достучаться до хранилища вот с такими логами:
2021-01-14T11:49:26.625Z error VictoriaMetrics/app/vmagent/remotewrite/client.go:220 couldn't send a block with size 11719 bytes to "1:secret-url": Post "http://vminsert-example-vmcluster.default.svc.cluster.local:8480/insert/0/prometheus/api/v1/write": lookup vminsert-example-vmcluster.default.svc.cluster.local on 10.43.0.10:53: no such host; re-sending the block in 60.000 seconds
2021-01-14T11:49:32.380Z error VictoriaMetrics/app/vmagent/remotewrite/client.go:220 couldn't send a block with size 14459 bytes to "1:secret-url": Post "http://vminsert-example-vmcluster.default.svc.cluster.local:8480/insert/0/prometheus/api/v1/write": lookup vminsert-example-vmcluster.default.svc.cluster.local on 10.43.0.10:53: no such host; re-sending the block in 60.000 seconds
и далее в том же духе...
Для меня пока не очень понятно как он вообще должен резолвить этот адрес. Я запустил dnsutils в том же namespace из этого image -gcr.io/kubernetes-e2e-test-images/dnsutils:1.3. С помощью nslookup, например
```kubernetes.default`` резолвится, а ```vminsert-example-vmcluster.default.svc.cluster.local```
ответ:
** server can't find vmsingle-example-vmsingle-persisted.default.svc: NXDOMAIN
Есть идеи?
там или баг или где то в конфигах с неймспейсами беда
да вроде я ничего кроме названия namespаce не менял... все по инстукции делал)
ну как бы у вас кластер в одном ns, а агент его ищет в дефолт
Изменил remoteWrite: - url: "http://vminsert-example-vmcluster.default.svc.cluster.local:8480/insert/0/prometheus/api/v1/write" На - url: "http://vminsert-example-vmcluster.victoriametrics.svc.cluster.local:8480/insert/0/prometheus/api/v1/write" Ничего не изменилось после apply. Если я правильно понял ваш коммент
не изменилось что? Таже ошибка с резолвом?
Обсуждают сегодня