Kubernetes Ansible

A collection of playbooks for deploying/managing/upgrading a Kubernetes cluster onto machines, they are fully automated command to bring up a Kubernetes cluster on bare-metal or VMs.

Feature list:

Quick Start

In this section you will deploy a cluster via vagrant.

Prerequisites:

Ansible version: v2.5 (or newer).
Vagrant: >= 2.0.0.
VirtualBox: >= 5.0.0.
Mac OS X need to install sshpass tool.

$ brew install http://git.io/sshpass.rb

The getting started guide will use Vagrant with VirtualBox to deploy a Kubernetes cluster onto virtual machines. You can deploy the cluster with a single command:

$ ./hack/setup-vms
Cluster Size: 1 master, 2 worker.
  VM Size: 1 vCPU, 2048 MB
  VM Info: ubuntu16, virtualbox
  CNI binding iface: eth1
Start to deploy?(y):

You also can use sudo ./hack/setup-vms -p libvirt -i eth1 command to deploy the cluster onto KVM.

If you want to access API you need to create RBAC object define the permission of role. For example using cluster-admin role:

$ kubectl create clusterrolebinding open-api --clusterrole=cluster-admin --user=system:anonymous

As of release 1.7 Dashboard no longer has full admin privileges granted by default, so you need to create a token to access the resources:

$ kubectl -n kube-system create sa dashboard
$ kubectl create clusterrolebinding dashboard --clusterrole cluster-admin --serviceaccount=kube-system:dashboard
$ kubectl -n kube-system get sa dashboard -o yaml
apiVersion: v1
kind: ServiceAccount
metadata:
  creationTimestamp: 2017-11-27T17:06:41Z
  name: dashboard
  namespace: kube-system
  resourceVersion: "69076"
  selfLink: /api/v1/namespaces/kube-system/serviceaccounts/dashboard
  uid: 56b880bf-d395-11e7-9528-448a5ba4bd34
secrets:
- name: dashboard-token-vg52j

$ kubectl -n kube-system describe secrets dashboard-token-vg52j
...
token:      eyJhbGciOiJSUzI1NiIsInR5cCI6IkpXVCJ9.eyJpc3MiOiJrdWJlcm5ldGVzL3NlcnZpY2VhY2NvdW50Iiwia3ViZXJuZXRlcy5pby9zZXJ2aWNlYWNjb3VudC9uYW1lc3BhY2UiOiJrdWJlLXN5c3RlbSIsImt1YmVybmV0ZXMuaW8vc2VydmljZWFjY291bnQvc2VjcmV0Lm5hbWUiOiJkYXNoYm9hcmQtdG9rZW4tdmc1MmoiLCJrdWJlcm5ldGVzLmlvL3NlcnZpY2VhY2NvdW50L3NlcnZpY2UtYWNjb3VudC5uYW1lIjoiZGFzaGJvYXJkIiwia3ViZXJuZXRlcy5pby9zZXJ2aWNlYWNjb3VudC9zZXJ2aWNlLWFjY291bnQudWlkIjoiNTZiODgwYmYtZDM5NS0xMWU3LTk1MjgtNDQ4YTViYTRiZDM0Iiwic3ViIjoic3lzdGVtOnNlcnZpY2VhY2NvdW50Omt1YmUtc3lzdGVtOmRhc2hib2FyZCJ9.bVRECfNS4NDmWAFWxGbAi1n9SfQ-TMNafPtF70pbp9Kun9RbC3BNR5NjTEuKjwt8nqZ6k3r09UKJ4dpo2lHtr2RTNAfEsoEGtoMlW8X9lg70ccPB0M1KJiz3c7-gpDUaQRIMNwz42db7Q1dN7HLieD6I4lFsHgk9NPUIVKqJ0p6PNTp99pBwvpvnKX72NIiIvgRwC2cnFr3R6WdUEsuVfuWGdF-jXyc6lS7_kOiXp2yh6Ym_YYIr3SsjYK7XUIPHrBqWjF-KXO_AL3J8J_UebtWSGomYvuXXbbAUefbOK4qopqQ6FzRXQs00KrKa8sfqrKMm_x71Kyqq6RbFECsHPA

Copy and paste the token to dashboard.

簡易指令：
kubectl -n kubernetes-dashboard get sa admin-user -o json | grep \"secrets\" -A 5 | grep name | awk '{print $2} ' | xargs kubectl -n kubernetes-dashboard describe secrets

Manual deployment

In this section you will manually deploy a cluster on your machines.

Prerequisites:

Ansible version: v2.5 (or newer).
Linux distributions: Ubuntu 16+/Debian/CentOS 7.x.
All Master/Node should have password-less access from deploy node.

For machine example:

IP Address	Role	CPU	Memory
172.16.35.9	vip	-	-
172.16.35.10	k8s-m1	4	8G
172.16.35.11	k8s-n1	4	8G
172.16.35.12	k8s-n2	4	8G
172.16.35.13	k8s-n3	4	8G

Add the machine info gathered above into a file called inventory/hosts.ini. For inventory example:

[etcds]
k8s-m1
k8s-n[1:2]

[masters]
k8s-m1
k8s-n1

[nodes]
k8s-n[1:3]

[kube_cluster:children]
masters
nodes

失敗及待辨事項：
1. (已修正) etcd 使用的 ca.pem 經初步測試，使用自定的中繼憑證會失敗，原因仍然在排查中，暫時使用舊有方式自簽 rootCA 的方式讓 etcd 能通過 (已修正)
2. (已修正) K8S-IM 也失敗，目前只要是使用自已的中繼憑證通通都宣告失敗，由於沒時間除錯，只能先全部復原，使用原本的自建root CA方式 (已修正)
3. 中繼憑證失敗問題，升級 cfssl 後，一切即可正常
4. haproxy 需要新增一個 dns server 以利辨別 haproxy 裡面設定的 server name 解析
  1. 目前是使用此方式：開始前要先把機器名及ip寫入所有機器的 /etc/hosts 裡
5. CNI 一樣是無法正常使用 typha 版本，目前只能使用一般版本 (待修正處理)
6. metrics-server 的參數目前設定仍然是未驗證成功 (待修正處理)

  echo -e "172.29.19.43 k8s-m1 k8s-n1\n172.29.19.48 k8s-m2 k8s-n2\n172.29.19.49 k8s-m3 k8s-n3" >> /etc/hosts

例：
172.29.19.43 k8s-m1 k8s-n1
172.29.19.48 k8s-m2 k8s-n2
172.29.19.49 k8s-m3 k8s-n3

組合現有 ca bundle 指令：

cat /etc/kubernetes/pki/ca.pem /etc/kubernetes/pki/front-proxy-ca.pem /etc/kubernetes/pki/etcd/etcd-ca.pem /etc/kubernetes/pki/intermediate/IM-CA-bundle.crt.pem > /etc/pki/ca-trust/source/anchors/etcd.ca-bundle.crt
update-ca-trust

建立secret resource
kubectl create secret tls frognew-com-tls-secret --cert=fullchain.pem --key=privkey.pem -n istio-system
猜測 --cert 這裡可能要將bundle完整的放入

目前 kubernetes cni 使用 calico 且用的是他們官網的設定，舊的設定 calico node 會一直無法啟動

要記得改以下的設定檔：

vip_address -> Keepalived virtual ip (在這裡主要是用在 ha kubernetes api server)
vip_interface -> virtual ip 網卡設定 example: eth0/eth1.....
encryption_token -> 已修改

  inventory/group_vars/all.yml
  inventory/hosts.ini.lupin-example 修改完後請存成 hosts.ini
  roles/downloads/package/defaults/main.yml
  roles/cluster-defaults/defaults/main.yml
  roles/k8s-setup/defaults/main.yml
    1. keepalived_password
    2. keepalived_priority  將 master 權限由 100 => 200 
    (查了一下keepalived裡 master 的設定應該是要比較高的值才對，原本是第一台設為 100，代表一開始的 api server 希望不是由第一台任職)
    1. haproxy_stats_user
    2. haproxy_stats_password

憑證相關需在執行前處理完成
1. 需提前瞭解及使用 cfssl 簽出中繼憑證並進行相關測試
2. 使用提前簽出的中繼憑證替換Ansible內部的 ca 憑證 (不需要，已修改對應 yml 檔)
3. 改寫對應 roles/cert 內容 (已進行相關修改)
其他注意事項
1. Kubernetes Audit 主要目的為記錄 kubernetes 的各種運行記錄，正式上線前需要詳細調整
2. 此 ansible 設定可能使用 fluentd 來將 Audit 的日志記錄存在磁碟上 -- 後續需追查
3. --audit-log-path 設定記錄檔，看到這個設定，判斷他是存在 api server 的 pod 上
4. 此Ansible 在 kubernetes Api server內的設定檔有將 /etc/ssl/certs 映射至本機一樣的位置
5. featureGates - PodPriority 參數經追查 PodPriority 已在 1.14 版本穩定化，不需要額外設定了
6. featureGates - DevicePlugins 參數從 1.10 版本開始進入 Beta ，仍然未穩定化
7. 10-kubelet.conf.j2 內部參數追查有如下限制：
  1. 在 1.18 仍然為 alpha 的參數如下：
    1. --network-plugin # 限制 cri 為 docker 時使用
    2. --cni-conf-dir # 限制 cri 為 docker 時使用
    3. --cni-bin-dir # 限制 cri 為 docker 時使用
    4. --node-labels # 在 1.15 版之後此參數規則有變，無法支援 node-role.kubernetes.io/master 該命名規則
      1. 修正如下：--node-labels=node.kubernetes.io/lupin=''
  2. 已完全消失參數
  3. --allow-privileged
8. 由於此 Ansible dns 解析方式採用 kubedns 需考慮改用 coredns 以利後續佈署至雲端正式集群 (未)
  1. 原因： coredns 別人的測試報告指出 coredns解析外部域名的時間約比 kubedns 快上三倍(12ms vs 41ms)，且 coredns 比 kubedns 更加靈活
  2. 雖不見得未來會需要使用外部域名的服務，保險起見還是先當成會使用
  3. https://github.com/kubernetes/kubernetes/tree/master/cluster/addons/dns/coredns
9. 需將 kubernetes 設定改為優先取用私人 docker repo
  1. 需新增下列 secret 以存取私人 docker registry

-- Kubernetes 集群使用 docker-registry 类型的 Secret 来通过容器仓库的身份验证，进而提取私有映像。

创建 Secret，命名为 regcred：
kubectl create secret docker-registry regcred --docker-server=${YOUR_DOCKER_REGISTRY} --docker-username=${USER} --docker-password=${PASSWORD} [email protected]

在 role\cert\main.yml 最下面有一段是刪除所有 .csr 及憑證設定檔 .json 若要長久使用同一憑證，這裡就不太適合刪除

Set the variables in group_vars/all.yml to reflect you need options. For example:

# overide kubernetes version(default: 1.10.6)
kube_version: 1.11.2

# container runtime, supported: docker, nvidia-docker, containerd.
container_runtime: docker

# container network, supported: calico, flannel.
cni_enable: true
container_network: calico
cni_iface: ''

# highly available variables
vip_interface: ''
vip_address: 172.16.35.9

# etcd variables
etcd_iface: ''

# kubernetes extra addons variables
enable_dashboard: true
enable_logging: false
enable_monitoring: false
enable_ingress: false
enable_metric_server: true
enable_ceph: true

# monitoring grafana user/password
monitoring_grafana_user: "admin"
monitoring_grafana_password: "p@ssw0rd"

Deploy a Kubernetes cluster

If everything is ready, just run cluster.yml playbook to deploy the cluster:

$ ansible-playbook -i inventory/hosts.ini cluster.yml

And then run addons.yml to create addons:

$ ansible-playbook -i inventory/hosts.ini addons.yml

Verify cluster

Verify that you have deployed the cluster, check the cluster as following commands:

$ kubectl -n kube-system get po,svc

NAME                                 READY     STATUS    RESTARTS   AGE       IP             NODE
po/haproxy-master1                   1/1       Running   0          2h        172.16.35.10   k8s-m1
...

Reset cluster

Finally, if you want to clean the cluster and redeploy, you can reset the cluster by reset-cluster.yml playbook.:

$ ansible-playbook -i inventory/hosts.ini reset-cluster.yml

Contributing

Pull requests are always welcome!!! I am always thrilled to receive pull requests.

make all chain

cd /etc/kubernetes/pki/
cat ca.pem intermediate/IM-CA-bundle.crt.pem > ca-chain.pem
cat front-proxy-ca.pem intermediate/IM-CA-bundle.crt.pem > front-proxy-ca-chain.pem
cat ./etcd/etcd-ca.pem ./intermediate/IM-CA-bundle.crt.pem > ./etcd/etcd-ca-chain.pem

cat apiserver.pem ca-chain.pem > apiserver-chain.pem
cat admin.pem ca-chain.pem > admin-chain.pem
cat controller-manager.pem ca-chain.pem > controller-manager-chain.pem
cat kubelet.pem ca-chain.pem > kubelet-chain.pem
cat scheduler.pem ca-chain.pem > scheduler-chain.pem

cat front-proxy-client.pem front-proxy-ca-chain.pem > front-proxy-client-chain.pem

cat ./etcd/etcd.pem ./etcd/etcd-ca-chain.pem > ./etcd/etcd-chain.pem

lupinchiu / kube-ansible Goto Github PK

kube-ansible's Introduction

Kubernetes Ansible

Quick Start

Manual deployment

Deploy a Kubernetes cluster

Verify cluster

Reset cluster

Contributing

make all chain

kube-ansible's People

Contributors

Watchers

Forkers

Recommend Projects

React

Vue.js

Typescript

TensorFlow

Django

Laravel

D3

Recommend Topics

javascript

web

server

Machine learning

Visualization

Game

Recommend Org

Facebook

Microsoft

Google

Alibaba

D3

Tencent