跳到主要内容

02、Kubernetes 实战 - K8s集群环境搭建

前言

集群环境的搭建的全程。

第一节 集群类型

kubernetes 集群大体上分为两类:一主多从,多主多从。

一主多从:一个Master节点和多个Node节点,搭建简单,但是有单机故障风险,适用于测试环境

多主多从:多个Master节点和多个Node节点,搭建麻烦,安全性高,适用于生成环境。

 

第二节 安装方式

k8s有多种安装部署方式,目前主流的方式有kubeadm、minikube、二进制包

minikube: 一个用于快速搭建单节点kubernetes的工具

kubeadm: 一个用于快速搭建kubernetes集群的工具

二进制包:从官网下载每个组件的二进制包,依次去安装,此方式对于理解kubernetes 组件更加有效

现在需要安装kubernetes的集群环境,但是又不想过于麻烦,所以选择使用kubeadm方式

第三节 主机规划

类型 IP 系统信息 配置
master 192.168.88.100 Centos 7.9.2009 2核1G 50G磁盘
node1 192.168.88.101 Centos 7.9.2009 2核1G 50G磁盘
node2 192.168.88.102 Centos 7.9.2009 2核1G 50G磁盘

安装过程设置:

  • 操作系统环境 CPU(2C),内存(1G),硬盘50G
  • 语言选择:中文简体
  • 软件选择:基础设施服务器
  • 分区选择:自动分区
  • 网络配置:

网络地址: 192.168.88.100 (不同主机ip不同)
子网掩码: 255.255.255.0
默认网关: 192.168.88.2 (vm的默认网关是x.x.x.2)
DNS: 223.5.5.5 (阿里云DNS)

主机安装流程请见: vmware安装centos7并制作多副本

第四节 环境搭建

本次环境搭建安装三台CentOS,一主二从,然后在每台服务器上安装docker,kuberadmin,kubelet,kubectl程序。

1. 环境初始化

这里使用xshell7软件 链接到多台服务器。

1、 检查操作系统;

此方式安装kubenetes集群要求CentOS版本要在7.5或以上

[root@master ~]# cat /etc/redhat-release
CentOS Linux release 7.9.2009 (Core)

1、 主机域名解析;
为了方便后面集群节点间的直接调用,在这配置一下主机名解析,企业中推荐使用内部DNS服务器

vim /etc/hosts

#主机名解析,编辑三台服务器的/etc/hosts文件,添加下面的内容
192.168.88.100  master
192.168.88.101  node1
192.168.88.102  node2

为了方便,可以使用发送键到所有会话,这样可以同时控制多个服务器,执行同样的命令。
 

 

1、 时间同步,kubernetes要求集群中的节点时间必须精确一致,这里直接使用chronyd服务从网络同步时间;

企业中建议配置内部的时间同步服务器

systemctl start chronyd     启动chronyd服务
systemctl enable chronyd    设置chronyd服务开机自启动
date                        在chronyd服务启动后几秒,使用date命令验证时间

 

1、 禁用iptables和firewalld服务,kubernetes和docker在运行中会产生大量的iptables规则,为了不让系统规则跟它们混淆,直接关闭系统的规则;

#关闭firealld服务
systemctl stop firewalld
systemctl disable firewalld

#关闭iptables服务,这里没有iptables,所以可以忽略这一步
systemctl stop iptables
systemctl disable iptables

 
5、 禁用selinux,selinux是linux系统下的一个安全服务,如果不关闭它,在安装集群中会产生各种各样的奇葩问题;

#查看selinux开启状态,默认是开启状态
[root@master ~]# getenforce
Enforcing
[root@master ~]# 

#编辑 /etc/selinux/config 文件,修改SELINUX的值为disabled
#注意修改完毕后注意重启linux服务
vim /etc/selinux/config  

SELINUX=disabled

 
6、 禁用swap分区;

swap分区指的是虚拟内存分区,它的作用是在物理内存使用完之后,将磁盘空间虚拟成内存来使用

启用swap设备会对系统的性能产生非常负面的影响,因此kubernetes要求每个节点都要禁止swap设备
但是如果因为某些原因确实不能关闭swap分区,就需要在集群安装过程中通过明确的参数进行配置说明

vim /etc/fstab

#编辑分区配置文件/etc/fstab, 注释掉swap分区一行
#注意修改完成后重启linux服务
/dev/mapper/centos-root /                       xfs     defaults        0 0
UUID=97331e16-0f44-41fd-bb3b-103d0fa6095d /boot                   xfs     defaults        0 0
#/dev/mapper/centos-swap swap                    swap    defaults        0 0

 
7、 修改linux内核参数;

vim /etc/sysctl.d/kubernetes.conf

#修改linux的内核参数,添加网桥过滤和地址转发功能
#编辑/etc/sysctl.d/kubernetes.conf文件,添加如下配置:
net.bridge.bridge-nf-call-ip6tables = 1
net.bridge.bridge-nf-call-iptables = 1
net.ipv4.ip_forward = 1

 

#重新加载配置
sysctl -p  

#加载网桥过滤模块
modprobe br_netfilter

#查看网桥过滤模块是否加载成功
lsmod | grep br_netfilter

 
8、 配置ipvs功能;
在kubernetes中service有两种代理模型,一种是基于iptables的,一种是基于ipvs的
两者比较的话,ipvs的性能明显更高一些,但是如果要使用它,需要手动载入ipvs模块
(1)安装ipset和ipvsadm

yum install ipset ipvsadmin -y

 

(2)添加需要加载的模块写入脚本文件,(copy命令直接回车即可)

cat <<EOF > /etc/sysconfig/modules/ipvs.modules
#!/bin/bash
modprobe -- ip_vs
modprobe -- ip_vs_rr
modprobe -- ip_vs_wrr
modprobe -- ip_vs_sh
modprobe -- nf_conntrack_ipv4
EOF

 
(3)为脚本文件添加执行权限

chmod +x /etc/sysconfig/modules/ipvs.modules

 
(4)执行脚本文件

/bin/bash /etc/sysconfig/modules/ipvs.modules

 
(5)查看相应的模块是否加载成功

lsmod | grep -e ip_vs -e nf_conntrack_ipv4

 
9、 重启服务器;
上面步骤执行完成之后,重启一下linux服务

reboot

 
10、 重启完成之后,检查一下;

#查看SELINUX是否为禁用状态,可以看到为disabled状态 
getenforce
#查看内存分配,可以发现swap都为0
free -m 

 

2. 安装docker

(1). 切换镜像源(如果不切换,默认使用国外的镜像源,速度较慢)

wget https://mirrors.aliyun.com/docker-ce/linux/centos/docker-ce.repo -O /etc/yum.repos.d/docker-ce.repo

 

(2)查看当前镜像源中支持的docker版本

yum list docker-ce --showduplicates

 
(3)安装特定版本的docker-ce

为什么安装这个版本(docker-ce-18.06.3.ce-3.el7)?
因为这个版本比较稳定,很多参数进行了初始化,不需要我们去修改。当然也可以选择其它版本。

#必须指定--setopt=obsoletes=0,否则yum会自动安装更高版本
yum -y  install --setopt=obsoletes=0 docker-ce-18.06.3.ce-3.el7 

 (4) 添加一个配置文件

#Docker在默认的情况下使用Cgroup Driver为cgroups,而kubernetes推荐使用systemd来代替cgroups

mkdir /etc/docker

cat <<EOF > /etc/docker/daemon.json
{
   "exec-opts": ["native.cgroupdriver=systemd"],
   "registry-mirrors": ["https://khs8qcsu.mirror.aliyuncs.com"]
}
EOF

systemctl daemon-reload 重新加载配置

注意 千万不要写成中文逗号,网上某些资料资料写中文逗号,直接坑死人

可以在阿里云容器镜像中找到自己的镜像加速器,也可以使用公共的镜像地址。如果不配置镜像地址,默认使用docker官方的地址。
 

(5)重启docker

systemctl restart docker   重启docker
systemctl enable docker    设置开机启动

3. 安装kubernetes组件

1、 由于kubernetes的镜像源在国外,速度比较慢,这里使用阿里云的镜像;
编辑/etc/yum.repos.d/kubernetes.repo,添加下面的配置

vim /etc/yum.repos.d/kubernetes.repo

[kubernetes]
name=Kubernetes
baseurl=http://mirrors.aliyun.com/kubernetes/yum/repos/kubernetes-el7-x86_64
enabled=1
gpgcheck=0
repo_gpgcheck=0
gpgkey=http://mirrors.aliyun.com/kubernetes/yum/doc/yum-key.gpg
       http://mirrors.aliyun.com/kubernetes/yum/doc/rpm-package-key.gpg

 

1、 安装kubeadm、kubelet和kubectl;

yum -y install --setopt=obsolete=0 kubeadm-1.17.4-0 kubelet-1.17.4-0 kubectl-1.17.4-0

 

1、 配置kubelet的cgroup;

vim /etc/sysconfig/kubelet

KUBELET_CGROUP_ARGS="--cgroup-driver=systemd"
KUB_PROXY_MODE="ipvs"

 
4、 设置kubelet开机自启动;

systemctl enable kubelet

 

4. 准备集群镜像

由于kubernetes所需要的镜像在国外,某些原因导致我们无法访问,因此我们需要提前镜像。如果你的服务器在海外,则不需要准备镜像
在安装kubernetes集群前,必须提前准备好集群需要的镜像,所需的镜像可以通过命令查看

kubeadm config images list

 
下载镜像,此镜像在kubernetes的仓库中,由于网络原因,无法连接,下面提供替代方案

#此镜像在kubernets的仓库中,由于网络原因,无法连接,下面提供一种替代方案

#定义集群镜像
images=(
    kube-apiserver:v1.17.4
    kube-controller-manager:v1.17.4
    kube-scheduler:v1.17.4
    kube-proxy:v1.17.4
    pause:3.1
    etcd:3.4.3-0
    coredns:1.6.5
)

# 拉取镜像并修改镜像名
for imageName in ${images[@]} ; do
    docker pull registry.cn-hangzhou.aliyuncs.com/google_containers/$imageName
    docker tag registry.cn-hangzhou.aliyuncs.com/google_containers/$imageName k8s.gcr.io/$imageName
    docker rmi registry.cn-hangzhou.aliyuncs.com/google_containers/$imageName
done

 

#查看镜像文件,可以看到镜像准备好了
docker images 

 

5. 集群初始化

下面集群进行初始化,并将node节点加入到集群

注意:只在master节点上执行即可

1、 创建集群;

kubeadm init --kubernetes-version=v1.17.4 --pod-network-cidr=10.244.0.0/16 --service-cidr=10.96.0.0/12 --apiserver-advertise-address=192.168.88.100

192.168.88.100 是master节点的ip,需要变更为自己的master节点的ip,不要写127.0.0.1,因为集群其它节点无法找到你的master,建议写成内网ip

 
 

1、 创建HOME/.kube文件,并复制/etc/kubernetes/admin.conf到HOME/.kube文件,并复制/etc/kubernetes/admin.conf到HOME/.kube文件,并复制/etc/kubernetes/admin.conf到HOME/.kube/config,并给$HOME/.kube/config赋予执行权限;

 mkdir -p $HOME/.kube
 sudo cp -i /etc/kubernetes/admin.conf $HOME/.kube/config
 sudo chown $(id -u):$(id -g) $HOME/.kube/config

1、 添加node到集群;

注意: 在node1节点上执行,将node添加到集群中

#命令在前面已红框标注
kubeadm join 192.168.88.100:6443 --token md5dfk.rwb3dww9dfwc6s01 \
    --discovery-token-ca-cert-hash sha256:3a77b5c3bee41edf3fa8e68a4b591bedf53d0b8a2d4cccc9c50e89733acb0012 

1、 回到master节点,查看节点情况,可以看到此时集群中包含了node1节点;

kubectl get nodes

 
我们已经把node1节点加入到集群中,同样的操作,把node2节点加入到集群中。
 

6. 安装网络插件

查看节点,发现它们的状态是NotReady,为什么?
 
节点之间需要通信,我们需要为集群安装网络插件,才能使节点运行。如何安装网络插件?
kubernetes 支持多种网络插件,比如flannel、calico、canal等,任选一个即可。本次使用flannel

下面的操作只在master节点上执行即可,插件使用的是 DaemonSet的控制器,它会在每个节点上都运行

1、 获取fannel的配置文件;

wget  https://raw.githubusercontent.com/coreos/flannel/master/Documentation/kube-flannel.yml

1、 修改文件中的quay.io仓库为quay-mirror.qiniu.com;

直接用下面这个文件即可,不用wget取文件太麻烦。
kube-flannel.yml

---
apiVersion: policy/v1beta1
kind: PodSecurityPolicy
metadata:
  name: psp.flannel.unprivileged
  annotations:
    seccomp.security.alpha.kubernetes.io/allowedProfileNames: docker/default
    seccomp.security.alpha.kubernetes.io/defaultProfileName: docker/default
    apparmor.security.beta.kubernetes.io/allowedProfileNames: runtime/default
    apparmor.security.beta.kubernetes.io/defaultProfileName: runtime/default
spec:
  privileged: false
  volumes:
  - configMap
  - secret
  - emptyDir
  - hostPath
  allowedHostPaths:
  - pathPrefix: "/etc/cni/net.d"
  - pathPrefix: "/etc/kube-flannel"
  - pathPrefix: "/run/flannel"
  readOnlyRootFilesystem: false
  Users and groups
  runAsUser:
    rule: RunAsAny
  supplementalGroups:
    rule: RunAsAny
  fsGroup:
    rule: RunAsAny
  Privilege Escalation
  allowPrivilegeEscalation: false
  defaultAllowPrivilegeEscalation: false
  Capabilities
  allowedCapabilities: ['NET_ADMIN', 'NET_RAW']
  defaultAddCapabilities: []
  requiredDropCapabilities: []
  Host namespaces
  hostPID: false
  hostIPC: false
  hostNetwork: true
  hostPorts:
  - min: 0
    max: 65535
  SELinux
  seLinux:
    SELinux is unused in CaaSP
    rule: 'RunAsAny'
---
kind: ClusterRole
apiVersion: rbac.authorization.k8s.io/v1
metadata:
  name: flannel
rules:
- apiGroups: ['extensions']
  resources: ['podsecuritypolicies']
  verbs: ['use']
  resourceNames: ['psp.flannel.unprivileged']
- apiGroups:
  - ""
  resources:
  - pods
  verbs:
  - get
- apiGroups:
  - ""
  resources:
  - nodes
  verbs:
  - list
  - watch
- apiGroups:
  - ""
  resources:
  - nodes/status
  verbs:
  - patch
---
kind: ClusterRoleBinding
apiVersion: rbac.authorization.k8s.io/v1
metadata:
  name: flannel
roleRef:
  apiGroup: rbac.authorization.k8s.io
  kind: ClusterRole
  name: flannel
subjects:
- kind: ServiceAccount
  name: flannel
  namespace: kube-system
---
apiVersion: v1
kind: ServiceAccount
metadata:
  name: flannel
  namespace: kube-system
---
kind: ConfigMap
apiVersion: v1
metadata:
  name: kube-flannel-cfg
  namespace: kube-system
  labels:
    tier: node
    app: flannel
data:
  cni-conf.json: |
    {
      "name": "cbr0",
      "cniVersion": "0.3.1",
      "plugins": [
        {
          "type": "flannel",
          "delegate": {
            "hairpinMode": true,
            "isDefaultGateway": true
          }
        },
        {
          "type": "portmap",
          "capabilities": {
            "portMappings": true
          }
        }
      ]
    }
  net-conf.json: |
    {
      "Network": "10.244.0.0/16",
      "Backend": {
        "Type": "vxlan"
      }
    }
---
apiVersion: apps/v1
kind: DaemonSet
metadata:
  name: kube-flannel-ds
  namespace: kube-system
  labels:
    tier: node
    app: flannel
spec:
  selector:
    matchLabels:
      app: flannel
  template:
    metadata:
      labels:
        tier: node
        app: flannel
    spec:
      affinity:
        nodeAffinity:
          requiredDuringSchedulingIgnoredDuringExecution:
            nodeSelectorTerms:
            - matchExpressions:
              - key: kubernetes.io/os
                operator: In
                values:
                - linux
      hostNetwork: true
      priorityClassName: system-node-critical
      tolerations:
      - operator: Exists
        effect: NoSchedule
      serviceAccountName: flannel
      initContainers:
      - name: install-cni
        image: quay.io/coreos/flannel:v0.14.0
        command:
        - cp
        args:
        - -f
        - /etc/kube-flannel/cni-conf.json
        - /etc/cni/net.d/10-flannel.conflist
        volumeMounts:
        - name: cni
          mountPath: /etc/cni/net.d
        - name: flannel-cfg
          mountPath: /etc/kube-flannel/
      containers:
      - name: kube-flannel
        image: quay.io/coreos/flannel:v0.14.0
        command:
        - /opt/bin/flanneld
        args:
        - --ip-masq
        - --kube-subnet-mgr
        resources:
          requests:
            cpu: "100m"
            memory: "50Mi"
          limits:
            cpu: "100m"
            memory: "50Mi"
        securityContext:
          privileged: false
          capabilities:
            add: ["NET_ADMIN", "NET_RAW"]
        env:
        - name: POD_NAME
          valueFrom:
            fieldRef:
              fieldPath: metadata.name
        - name: POD_NAMESPACE
          valueFrom:
            fieldRef:
              fieldPath: metadata.namespace
        volumeMounts:
        - name: run
          mountPath: /run/flannel
        - name: flannel-cfg
          mountPath: /etc/kube-flannel/
      volumes:
      - name: run
        hostPath:
          path: /run/flannel
      - name: cni
        hostPath:
          path: /etc/cni/net.d
      - name: flannel-cfg
        configMap:
          name: kube-flannel-cfg

上传文件到master
 
4、 安装flannel;

kubectl apply -f kube-flannel.yml

 
5、 稍等片刻,可以查看到节点准备状态;

kubectl get nodes

 

到这里kubernetes集群就搭建成功了。

第五节 服务部署

下面我们使用kubernetes,在集群中部署一个nginx程序,测试一下集群是否正常工作。

所有的部署操作都只需要在master进行即可。

1. 部署nginx

1、 部署nginx;

kubectl create deployment nginx --image=nginx:1.14-alpine

 

1、 暴露端口;

kubectl expose deployment nginx --port=80 --type=NodePort

 

1、 查看服务状态,可以看到nginx在32437这个端口对外提供服务;

kubectl get pod pod
kubectl get svc svc就是service,也可以写成kubectl get service

 

1、 访问一下nginx页面,注意端口号是前面查看到的端口;
 

第六节 扩展内容

1. 自建DNS服务器

前面搭建安装kubernetes集群的过程中,在每台主机上配置host,但是在企业中通常使用自建DNS服务器。

docker应用篇(9):搭建DNS服务器

2. 时间同步服务器

kubernetes集群中时间同步是非常重要的,服务器可能出现时间的同步问题,通常我们会自建时间同步服务器或者使用阿里云为我们提供的NTP服务器。下面是阿里云提供的NTP服务器,既可以用于内网,也可以用于公网。
同步服务器本地时间
 

阿里云已经提供了大量的NTP服务器,适用于不同的网络位置,并且针对不同的操作系统,提供了对应的操作指南。