Kubernetes HPA and Rollingupdate

Submitted by Lizhe on Wed, 06/10/2020 - 06:20

补全一点 HPA 的内容

 

原理实在是没什么好说的,根据当前请求自动伸缩

 

下面以cpu使用率指标来说明hpa是如何来根据指标使用伸缩的:

CPUUtilizationPercentage即cpu使用率的百分比。hpa判断的标准是目标Pod所有副本自身的CPU利用率的平均值。一个Pod自身的CPU利用率是该Pod当前的CPU的使用量除以它的CPU Request的值。

比如定义一个Pod的CPU Request为0.4,而当前的Pod的CPU使用量为0.2,则它的CPU使用率为 50%,这样计算一个Deployment的所有Pod的cpu使用率的平均值。如果某一刻该值超过80%,则意味着当前的Pod 副本数很可能不足以支撑接来下更多的请求,需要进行动态扩容,而当前请求高峰时段过去后,Pod的 CPU 利用率又会降下来,此时对应的Pod副本数应该自动减少到一个合理的水平。

CPUUtilizationPercentage计算过程中使用到的Pod的CPU使用量通常是1min内的平均值。

 

ubuntu18 nvidia cuda tensorflow2.1 driver install

Submitted by Lizhe on Fri, 06/05/2020 - 10:16

conda

wget https://mirrors.tuna.tsinghua.edu.cn/anaconda/miniconda/Miniconda3-4.7.10-Linux-x86_64.sh

chmod 777 Miniconda3-4.7.10-Linux-x86_64.sh 

./Miniconda3-4.7.10-Linux-x86_64.sh 

conda create -n tf21 python=3.7

 

driver

sudo ubuntu-drivers devices

sudo apt install nvidia-driver-430

 

conda activate tf21

conda install cudatoolkit=10.1

conda install cudnn=7.6

Install rancher HA on EKS

Submitted by Lizhe on Thu, 06/04/2020 - 08:38

以下命令适用于 需要在 AWS EKS 上直接安装 rancher HA 的情况

首先你启动一个 EKS 组然后用 helm 在上面安装rancher,这时候你会发现 rancher admin 的 ingress 一直无法正确初始化

root cause 是这样的 在 rancher HA 的官方文档里 第一步是使用 RKE,RKE 在安装过程中默认会安装 nginx 的ingress,

所以在执行 helm 命令之前,ingress就已经被安装了,这里由于没有 RKE 介入,所以你需要先安装 ingress

( 当然 kong 和 traefic 也可以不一定非要nginx )

helm install stable/nginx-ingress --name rancher-nginx --set rbac.create=true

 

然后安装rancher,但是注意要指定 annotation,没有最后一行是不能正常工作的

blueprism (4)Data Item

Submitted by Lizhe on Wed, 06/03/2020 - 03:21

Environment Variable

1. 这里的环境变量是可以提供给所有用户使用的,不要写密码之类的

2. 设置完成之后,如果要从select框中选择,需要先重启

20200603125640

 

在 process 中引用刚才设置的 环境变量

rancher iam role

Submitted by Lizhe on Mon, 05/11/2020 - 16:31

{
    "Version": "2012-10-17",
    "Statement": [
        {
            "Effect": "Allow",
            "Action": "ec2:Describe*",
            "Resource": "*"
        },
        {
            "Effect": "Allow",
            "Action": "ec2:AttachVolume",
            "Resource": "*"
        },
        {
            "Effect": "Allow",
            "Action": "ec2:DetachVolume",
            "Resource": "*"
        },
        {
            "Effect": "Allow",