Я пытался собрать kubernetes с помощью kubeadm на моем чистом-металлическом сервере с containerd в качестве cri, но оказалось, что coredns не удалось запустить после установки cni (weave-нетто).
Два контейнера coredns теперь находятся в состоянии «CrashLoopBackOff», и их журналы:
plugin/forward: no nameservers found
И описание «kubectl описать pod» выглядит следующим образом:
Events:
Type Reason Age From Message
---- ------ ---- ---- -------
Warning FailedScheduling 4m52s (x9 over 13m) default-scheduler 0/1 nodes are available: 1 node(s) had taint {node.kubernetes.io/not-ready: }, that the pod didn't tolerate.
Normal Scheduled 4m7s default-scheduler Successfully assigned kube-system/coredns-58cf647449-8pq7k to k8s
Normal Pulled 3m13s (x4 over 4m6s) kubelet Container image "localhost:5000/coredns:v1.8.4" already present on machine
Normal Created 3m13s (x4 over 4m6s) kubelet Created container coredns
Normal Started 3m13s (x4 over 4m6s) kubelet Started container coredns
Warning Unhealthy 3m13s kubelet Readiness probe failed: Get "http://10.32.0.3:8181/ready": dial tcp 10.32.0.3:8181: connect: connection refused
Warning BackOff 2m54s (x12 over 4m5s) kubelet Back-off restarting failed container
Если я добавлю некоторые настройки, такие как «nameserver 8.8.8.8», в /etc/resolv.conf запускаются модули coredns. Однако в настоящее время я вообще не использую никаких внешних DNS, а с Docker в качестве cri, coredns работал хорошо, хотя в /etc/resolv.conf не было никаких настроек.
Можно ли решить эту проблему, не устанавливая какой-либо вышестоящий DNS-сервер в resolv.conf?
Информация о сервере:
OS: RedHat Enterprise Linux 8.4
cri: containerd 1.4.11
cni: weave-net 1.16
tools: kubeadm, kubectl, kubelet 1.22.1
Я также пробовал использовать calico в качестве cni, но результат был тот же.
Причина заключалась в том, что coredns по умолчанию имеет параметр переадресации в своей ConfigMap. Он пытался перенаправить запросы на вышестоящий DNS-сервер, хотя в /etc/resolv.conf нет настроек DNS.
# kubectl edit configmap coredns -n kube-system
После удаления следующего раздела он запустился и работал нормально.
forward. /etc/resolv.conf {
max_concurrent 1000
}