当创建一个Pod的时候,你可以为运行在Pod中的容器请求CPU和RAM资源。你还可以设置CPU和RAM资源的限制。请求CPU和RAM资源,在配置文件里面包含resources:requests字段。设置CPU和RAM限制包含resource:limits字段。如果节点上具有足够的CPU和RAM资源可用于所有容器要求的CPU和RAM总和,Kubernetes将把Pod调度在上面。同样当容器运行在节点上时,Kubernetes不允许容器消耗的CPU和RAM资源超出指定的容器的限制。如果容器超出他的RAM限制,他将结束。如果CPU超出限制,他将成为CPU节流的候选者。 了解CPU和RAM单元 CPU资源以cpus为单位。允许小数值。你可以用后缀m来表示mili。例如100m cpu等同于100 milicpu,意思是0.1cpu。 RAM资源以bytes为单位。你可以将RAM表示为纯整数或具有这些后缀之一的定点整数: E, P, T, G, M, K, Ei, Pi, Ti, Gi, Mi, Ki。例如,以下代表大约相同的数值: 128974848, 129e6, 129M , 123Mi 如果你不确定需要请求多少资源,首先你可以发布应用不指定资源,使用资源监控来确定合适的值。 如果容器超出他的RAM限制,它将从内存不足状态死亡。你可以指定比你期望稍高点的值来提高可靠性。 如果指定了请求(request),则保证了可以使用的资源。有关资源的限制和请求可以参考Resource QoS。 如果你没有指定限制和请求 如果没有指定RAM限制,Kubernetes对于容器可以使用的RAM没有上限。容器可以使用所在机器所有的可用RAM资源。类似,如果没有指定CPU限制,Kubernetes对于CPU资源没有限制,容器可以使用所在机器所有的可用CPU资源。 默认的限制应用参照默认命名空间的限制范围。你可以使用kubectl describe limitrange limits来查看默认的限制。 关于为什么要指定限制的相信信息,参考 Setting Pod CPU and Memory Limits。 关于如果没有指定CPU和RAM资源请求的发生情况,参考Resource Requests and Limits of Pod and Container。
为你的容器应用label, 以便能够多维度的观察你的集群。 作为参考, 你可以为你的应用设置如下的标签:
- Frontend/Backend
- Application (website, mobile app, database, cache…)
- Environment (prod, staging, dev…)
- Team
- Version
关于nodePort的使用 尽量避免使用nodeport, nodeport在集群里是全局占用的,使用nodeport有可能导致调度失败, 可能的原因是:
- 两个pod要声明占用主机上同样的端口
什么是Init Container?
从名字来看就是做初始化工作的容器。可以有一个或多个,如果有多个,这些 Init Container 按照定义的顺序依次执行,只有所有的Init Container 执行完后,主容器才启动。由于一个Pod里的存储卷是共享的,所以 Init Container 里产生的数据可以被主容器使用到。
Init Container可以在多种 K8S 资源里被使用到如 Deployment、Daemon Set, Pet Set, Job等,但归根结底都是在Pod启动时,在主容器启动前执行,做初始化工作。
我们在什么地方会用到 Init Container呢?
第一种场景是等待其它模块Ready,比如我们有一个应用里面有两个容器化的服务,一个是Web Server,另一个是数据库。其中Web Server需要访问数据库。但是当我们启动这个应用的时候,并不能保证数据库服务先启动起来,所以可能出现在一段时间内Web Server有数据库连接错误。为了解决这个问题,我们可以在运行Web Server服务的Pod里使用一个Init Container,去检查数据库是否准备好,直到数据库可以连接,Init Container才结束退出,然后Web Server容器被启动,发起正式的数据库连接请求。
第二种场景是做初始化配置,比如集群里检测所有已经存在的成员节点,为主容器准备好集群的配置信息,这样主容器起来后就能用这个配置信息加入集群。
还有其它使用场景,如将pod注册到一个中央数据库、下载应用依赖等。
这些东西能够放到主容器里吗?从技术上来说能,但从设计上来说,可能不是一个好的设计。首先不符合单一职责原则,其次这些操作是只执行一次的,如果放到主容器里,还需要特殊的检查来避免被执行多次。
这个例子创建一个Pod,这个Pod里跑的是一个nginx容器,Pod里有一个叫workdir的存储卷,访问nginx容器服务的时候,就会显示这个存储卷里的index.html 文件。
而这个index.html 文件是如何获得的呢?是由一个Init Container从网络上下载的。这个Init Container 使用一个busybox镜像,起来后,执行一条wget命令,获取index.html文件,然后结束退出。
由于Init Container和nginx容器共享一个存储卷(这里这个存储卷的名字叫workdir),所以在Init container里下载的index.html文件可以在nginx容器里被访问到。
可以看到 Init Container 是在 annotation里定义的。Annotation 是K8S新特性的实验场,通常一个新的Feature出来一般会先在Annotation 里指定,等成熟稳定了,再给它一个正式的属性名或资源对象名。
targetPort的值可以是字符串类型,这是暴露port的名称, 这个设计,为用户的应用部署升级提供了更多的灵活性, 比如用户可以在新版本的pod暴露新的端口(port名称不变), 此时service就无需重新构建, 从而无需切断客户端连接, 提高应用的可用性。 在deployment或者pod文件里定义暴露的containerPort的名称, 这样在service里的targetPort就可以使用这个名称了 。
有一类特殊的无选择器的service无需定义endpoint, 它是ExternalName Service
kind: Service
apiVersion: v1
metadata:
name: my-service
namespace: prod
spec:
type: ExternalName
externalName: my.database.example.com
当你访问这个service时, 会去通过集群dns, 集群的dns会返回一条CNAME的记录, 即my.database.example.com, 这个重定向是发生在dns层的, 没有任何的流量代理或者转发。 也就是说不是通过主机上的kube-proxy和iptables。 集群外部的一些服务, 建议以ExternalName的形式管理起来, 但有一点需要注意的是, 这个特性需要kubernetes的1.7版本支持, 或者高版本的kube-dns支持。
直接用iptables转发, 好处是转发性能更好,更稳定。 缺点是如果一开始选择的pod没有响应,iptables无法选择另外一个pod发起重试。客户端和后端的pod的连接就可能会出现错误连接状态, 除非客户端能够断开连接进行重连。 这个问题可以通过配置readiness probe来解决。当你为一个应用配置了准备就绪探针(readiness probe)时,kubelet进程会使用这个探针来判断哪些pod可以开始接受网络请求流量,即是否处于准备就绪状态。
用static pod来部署kubernetes的kube-proxy, kube-scheduler, kube-controller-manager, kube-apiserver等组件。其中部署kubernetes的kube-proxy, kube-scheduler, kube-controller-manager, kube-apiserver组件的机器,最好设置为不可调度状态(使用kubectl cordon <node_name> ),防止其它不相干的pod调度到master节点机器上, 影响master的可用性。
使用daemonset来运行一个需要在每个节点都起来的pod, 比如filebeat, rbd工具等
高可用的建议
- 把apiserver和etcd的数据目录放到可靠的存储上,防止数据丢失
- 主机宕机后能自动重启
- 应用能支持无预期的重启
- 为serviceaccount关联imagePullSecret,这样所有使用这个serviceaccount的pod, 会自动设置它的imagePullSecret 字段,就不要再一个个手动指定了
目前最常用的是手动管理manifest,比如kubernetes github代码库就提供了很多的manifest示例
- https://github.com/kubernetes/kubernetes/tree/master/examples
- https://github.com/kubernetes/contrib
- https://github.com/kubernetes/ingress 手动管理的一个问题就是繁琐,特别是应用复杂并且Manifest比较多的时候,还需要考虑他们之间部署关系。Kubernetes开源社区正在推动更易用的管理方法,如
- Helm提供了一些常见应用的模版
- operator则提供了一种有状态应用的管理模式
- Deis在Kubernetes之上提供了一个PaaS平台
- Draft是微软Deis团队开源的容器应用开发辅助工具,可以帮助开发人员简化容器应用程序的开发流程
- Kompose是一个将docker-compose配置转换成Kubernetes manifests的工具
- 理解Deployment, 并知道如何进行rolling update 和 rollback
滚动升级 kubectl set image deployment/ <container_name>=xxx:v2 , 如果有一个pod升级失败, 升级会停止。 回滚升级操作 kubectl rollout undo deployments 查看回滚状态 kubectl rollout status deployments
- 知道各种配置应用的方式
kubectl run --image=<images_name> <deployment_name> --port=8080 创建编排文件, 然后使用kubectl create -f <文件名> 创建, 用kubectl replace -f <文件名> 进行替换更新
- 知道如何为应用扩容
kubectl scale deployments <deployment name> --replicas=4
- 理解基本的应用自愈相关的内容
应用会维持一个稳定的数量,deployment controller会持续监控应用pod的数量, 使其维护在一个设定的数量。 如果发现少于设定数量, 就会自动创建新的应用的pod
要了解这方面的内容, 可以尝试下新手训练营的交互式课程https://kubernetesbootcamp.github.io/kubernetes-bootcamp
- 分离构建和运行环境
- 使用dumb-int等避免僵尸进程
- 不推荐直接使用Pod,而是推荐使用Deployment/DaemonSet等
- 不推荐在容器中使用后台进程,而是推荐将进程前台运行,并使用探针保证服务确实在运行中
- 推荐容器中应用日志打到stdout和stderr,方便日志插件的处理
- 由于容器采用了COW,大量数据写入有可能会有性能问题,推荐将数据写入到Volume中
- 不推荐生产环境镜像使用latest标签,但开发环境推荐使用并设置imagePullPolicy为Always
- 推荐使用Readiness探针检测服务是否真正运行起来了
- 使用activeDeadlineSeconds避免快速失败的Job无限重启
- 引入Sidecar处理代理、请求速率控制和连接控制等问题
注意分离构建和运行环境,直接通过Dockerfile构建的镜像不仅体积大,包含了很多运行时不必要的包,并且还容易引入安全隐患,如包含了应用的源代码。 可以使用Docker多阶段构建来简化这个步骤。
FROM golang:1.7.3 as builder
WORKDIR /go/src/github.com/alexellis/href-counter/
RUN go get -d -v golang.org/x/net/html
COPY app.go .
RUN CGO_ENABLED=0 GOOS=linux go build -a -installsuffix cgo -o app .
FROM alpine:latest
RUN apk --no-cache add ca-certificates
WORKDIR /root/
COPY --from=builder /go/src/github.com/alexellis/href-counter/app .
CMD ["./app"]
孤儿进程:一个父进程退出,而它的一个或多个子进程还在运行,那么那些子进程将成为孤儿进程。孤儿进程将被init进程(进程号为1)所收养,并由init进程对它们完成状态收集工作。 僵尸进程:一个进程使用fork创建子进程,如果子进程退出,而父进程并没有调用wait或waitpid获取子进程的状态信息,那么子进程的进程描述符仍然保存在系统中。 在容器中,很容易掉进的一个陷阱就是init进程没有正确处理SIGTERM等退出信号。这种情景很容易构造出来,比如
# 首先运行一个容器
$ docker run busybox sleep 10000
# 打开另外一个terminal
$ ps uax | grep sleep
sasha 14171 0.0 0.0 139736 17744 pts/18 Sl+ 13:25 0:00 docker run busybox sleep 10000
root 14221 0.1 0.0 1188 4 ? Ss 13:25 0:00 sleep 10000
# 接着kill掉第一个进程
$ kill 14171
# 现在会发现sleep进程并没有退出
$ ps uax | grep sleep
root 14221 0.0 0.0 1188 4 ? Ss 13:25 0:00 sleep 10000
解决方法就是保证容器的init进程可以正确处理SIGTERM等退出信号,比如使用dumb-init
$ docker run quay.io/gravitational/debian-tall /usr/bin/dumb-init /bin/sh -c "sleep 10000"
2.12 K8S Meetup 回顾|小米·陈迪豪《深度学习模型应用与实践》 目前主流的深度学习框架,无论是大家用的 TF,或者 Caffe,他们都是 library,没有解决分布式任务的调度和资源隔离问题,大部分应用也是运行在单机上的。我们认为。这可能是一种倒退,认为下一个阶段应该是云深度学习。我们需要一个云平台来解决我们深度学习框架本身的调度以及分布式计算。然后我们开发了 Cloud Machine Learning 平台。它大概的架构是这样的:
EasyStack发布容器,成为中国首个OpenStack+K8S专业开源企业 北京3月29日17点,中国开源云计算的领导者EasyStack(北京易捷思达科技发展有限公司)在德国柏林举行的CloudNativeCon+KubeCon容器大会上,正式发布基于Kubernetes技术的容器集群产品ESContainer。此举使得EasyStack同红帽、Mirantis一道成为全球三大同时具备OpenStack和Kubernetes(K8S)产品的专业开源企业,也是中国首个OpenStack+Kubernetes专业开源企业。 ESContainer 面向应用角度设计,自身提供应用管理服务,方便用户在平台中集中管理发布容器化应用;对于有状态应用场景进行优化,方便用户构建多层微服务化应用;支持无 Overlay 纯二层网络等多种网络方案,容器应用与虚拟化应用网络直通;增强监控与日志,面对庞大的容器集群,ESContainer还提供了增强的多级的监控、日志管理。
ESContainer 面向企业级容器化应用的管理和编排场景,产品提供包括自动化部署、强化的管理界面、应用商店,多级监控、支持虚拟机、可视化编排、物理机资源池的混合部署,并且与EasyStack的企业级OpenStack平台ESCloud 深度融合,无缝的使用 ESCloud 提供的计算、网络和存储资源以及丰富的软件基础设施,为云计算从以资源为中心到以应用为中心打通了最后一公里。
值得一提的是,EasyStack云计算内核ESCore 还专门为ESContainer进行裁剪与优化、提供适合容器运行的定制化操作系统,能够为容器集群带来更高密度的运行能力,同时提供了更加稳定高效的底层环境。 ESContainer最大的特色是能够让Kubernetes与OpenStack深度融合,带来1+1>2的能力:ESCloud 专注于数据中心基础设施的管理和支撑传统应用业务的运行,ESContainer专注于为企业新型应用的改造提供一站式平台,两者结合优势互补,成为新型的异构数据中心基础设施平台,为企业提供创新源动力。
1)ESContainer和ESCloud融合,Kubernetes 使用 OpenStack Keystone 作为用户管理系统,用 Keystone 作为统一用户管理平台,打通两个平台的认证体系。
2)ESContainer可使用 OpenStack Cinder 卷作为持久存储后端,这样能充分利用OpenStack 中已广泛支持的开源或主流商业存储设备,为容器提供持久存储能力,弥补目前 Kubernetes 对商业存储设备支持力度不够的问题。
3)ESContainer可使用Neutron LoadBalancer 作为服务的外部负载均衡器,充分提供对外服务的高可用性。
4)ESContainer可直接使用 Neutron 二层网络作为网络驱动,用 Neutron 统一管理虚拟机和容器网络,减少多层 Overlay 带来的性能损失;同时由于虚拟机和容器处于同一个子网中,可做到虚拟机和容器应用的二层网络直通,适用于企业中传统业务和云原生业务共存并需要直接数据交换的场景。
5)ESContainer可在裸金属以及虚机中部署容器集群,可根据容器集群的整体负载情况,快速弹性扩缩不同级别的资源池。
此外,ESContainer还可使用 Ceph 作为持久存储后端,为容器提供持久数据卷存储。
这是继今年1月EasyStack获得5000万美元C轮融资、创中国开源领域最大单笔融资之后的首次重大产品发布,使得EasyStack具备了Openstack+kubernetes的开源云计算能力,从而更好地满足企业用户的云计算需求。
这部分内容统计在生产或者开发环境中使用kubernetes的公司或者机构
|公司名称|产品|环境|参考来源|备注|
|普元|SEM|生产环境|[Flannel+K8s容器网络通信实践](http://chuansong.me/n/556535752235)||
|小米科技|Cloud Machine Learning 平台|生产环境|[2.12 K8S Meetup 回顾|小米·陈迪豪《深度学习模型应用与实践》](https://mp.weixin.qq.com/s?__biz=MzIzMzExNDQ3MA==&mid=2650093132&idx=1&sn=9d2e8685a665a8140b15ae8ce861a226)||
| EasyStack | 容器集群产品ESContainer | 生产环境 | [EasyStack发布容器,成为中国首个OpenStack+K8S专业开源企业](https://mp.weixin.qq.com/s?__biz=MzA3MjQxMjcxNQ==&mid=2649232237&idx=1&sn=276abca704f42107adc461f7dbdf80db) | |
| | | | | |
| | | | | |
| | | | | |
| | | | | |
| | | | | |
| | | | | |
| | | | | |
| | | | | |
| | | | | |
| | | | | |
| | | | | |
| | | | | |
- 2.12 K8S Meetup 回顾|小米·陈迪豪《深度学习模型应用与实践》
- EasyStack发布容器,成为中国首个OpenStack+K8S专业开源企业
- 文档解读 | K8S中的Pod和容器配置(二)
- K8S 老司机 | Kubernetes 有状态集群服务部署与管理(下)
- Kubernetes应用管理
Kubernetes生产环境经验告诉你如何实现蓝绿部署和负载均衡 基于kubernetes的docker集群实践 搜狐基于Docker+Kubernetes的一站式运维管理实践 中国移动Kubernetes多集群统一管理实践 为什么选择Kubernetes作为云平台的微服务治理框架 7个选择Kubernetes作为你的Docker编排工具的理由 Docker和容器云落地一年后的反思 Kubernetes 部署的最佳安全实践 kubernetes用户指南(三)--在生产环境中使用Pod来工作、管理部署 Kubernetes在企业中的场景运⽤及管理实践 ***** Kubernetes 落地案例|在线课程平台 Descomplica 使用 Kubernetes 5 个月的体验 Kubernetes在华为全球 IT 系统中的实践 使用Kubernetes快速部署Redis主从集群 惠普基于Kubernetes的容器私有云平台实践 | 视频 Docker 与 Kubernetes(k8s) 在企业基础设施服务的应用 编排管理成容器云关键,Kubernetes和Swarm该选谁 基于万节点Kubernetes支撑大规模云应用实践 乐视云基于Kubernetes的PssS平台建设 百分点大规模Kubernetes集群实践 how-to-easily-deploy-gitlab-on-kubernetes/ ***** 中小型团队的容器化之路 如何在Kubernetes中部署一个高可用的PostgreSQL集群环境 Kubernetes 架构浅析 网易蜂巢基于万节点kubernetes支撑大规模云应用实践 “Kubernetes 大咖秀” 来了!K8S 代码贡献#6 美国 Google 工程师徐超与你面对面 一个适合 Kubernetes 的最佳网络互联方案 干货|你想要的百分点大规模Kubernetes集群的应用实践来了 百分点大规模Kubernetes集群实践 Kubernetes 有状态集群服务部署与管理 百度研究院在 Kubernetes 上跑深度学习框架 PaddlePaddle 跑在Kubernetes上的开源深度学习,百度这次带来了哪些技术看点? 京东从 OpenStack 改用 Kubernetes 的始末 2016年容器技术思考: Docker, Kubernetes, Mesos将走向何方? Kubernetes和微服务的需求层次(马斯洛理论解读版) 【干货-容器系列】Kubernetes调度核心解密:从Google Borg说起 才云工程师原创|Kubernetes dynamic provisioning 及 glusterfs 对接 容器、Docker与Kubernetes——什么是Kubernetes以及它是如何使得容器化基础设施变得简单 一键部署基于 Kubernetes 的私有容器云 管理数万个实例,服务上百个业务:kubernetes在腾讯游戏的使用及演进历程 Kubernetes集群中的网络 In or Out? Kubernetes一统江湖的野心 - 写在Kubernetes 1.6即将发布之际 · 极术 Kubernetes 1.6 正式发布:大规模处理多用户多工作负载! Kubernetes Operators: Growing the Ecosystem With Rook, Elasticsearch, Kafka and More Rook存储:Kubernetes中最优秀的存储 用Harbor和Kubernetes构建高可用企业级镜像仓库 Kubernetes 1.6:大规模的多用户、多负载支持 技术干货|使用 Kubernetes 管理容器化的有状态应用 有一种信徒,叫 Kubernetes! 管理5000个节点,Kubernetes的目标是星辰大海 - KubeCon核心精神回顾 【雷锋网】离开谷歌云回国创业,他们想将AI与Kubernetes结合革新传统行业-今日头条 CloudNativeCon和KubeCon大会摘要:Kubernetes 1.6、Docker、CoreOS、捐赠以及资格认证 Kubernetes与微服务的层次要求 谁才有资格来装点 Kubernetes 这幢豪宅? K8S 弹药库 | Kubernetes 有状态集群服务部署与管理(上) Kubernetes 1.6 | 企业的福音! 一键部署kubernetes1.6高可用集群 基于Neutron的Kubernetes SDN实践经验之谈 干货│Kubernetes Storage Management @eBay 企业新混合云时代,Docker 和 Kubernetes 是最佳伴侣! GitHub - rootsongjc/distributed-load-testing-using-kubernetes: Kubernetes的分布式负载测试 干货 | 青云QingCloud容器平台负责人王渊命:青云容器及Kubernetes实践 在生产环境中使用Kubernetes部署可编程的基础设施 Kubernetes 是如何实现资源共享的 K8sMeetup 成都视频+PPT|才云唐鹏程:用 Prometheus 来监控你的 Kubernetes 集群 K8S Meetup成都站视频+PPT分享| IBM马达:Kubernetes 中基于策略的资源分配 DTCC2017|黄东旭:《When TiDB Meets Kubernetes》 使用Kubernetes-Jenkins实现CI/CD Flannel+K8s容器网络通信实践 趋势科技基于Docker和Kubernetes的持续部署实践