# 什么是服务网格？

Service mesh 又译作 “服务网格”，作为服务间通信的基础设施层。Buoyant 公司的 CEO Willian Morgan 在他的这篇文章 [WHAT’S A SERVICE MESH? AND WHY DO I NEED ONE?](https://buoyant.io/what-is-a-service-mesh/) 中解释了什么是 Service Mesh，为什么云原生应用需要 Service Mesh。

服务网格是用于处理服务间通信的专用基础设施层。它负责通过包含现代云原生应用程序的复杂服务拓扑来可靠地传递请求。实际上，服务网格通常通过一组轻量级网络代理来实现，这些代理与应用程序代码一起部署，而不需要感知应用程序本身。—— [Willian Morgan](https://twitter.com/wm) Buoyant CEO

服务网格（Service Mesh）这个术语通常用于描述构成这些应用程序的微服务网络以及应用之间的交互。随着规模和复杂性的增长，服务网格越来越难以理解和管理。它的需求包括服务发现、负载均衡、故障恢复、指标收集和监控以及通常更加复杂的运维需求，例如 A/B 测试、金丝雀发布、限流、访问控制和端到端认证等。

## 服务网格的特点

服务网格有如下几个特点：

* 应用程序间通讯的中间层
* 轻量级网络代理
* 应用程序无感知
* 解耦应用程序的重试/超时、监控、追踪和服务发现

目前两款流行的服务网格开源软件 [Linkerd](https://linkerd.io) 和 [Istio](https://istio.io) 都可以直接在 kubernetes 中集成，其中 Linkerd 是 CNCF 成员项目，并在 2021 年 7 月毕业。Istio 在 2018年7月31日宣布 [1.0](https://istio.io/zh/blog/2018/announcing-1.0/)，并在 2020 年 7 月将[商标捐献](https://istio.io/latest/blog/2020/open-usage/)给 [Open Usage Commons](https://openusage.org/)。

## 理解服务网格

如果用一句话来解释什么是服务网格，可以将它比作是应用程序或者说微服务间的 TCP/IP，负责服务之间的网络调用、限流、熔断和监控。对于编写应用程序来说一般无须关心 TCP/IP 这一层（比如通过 HTTP 协议的 RESTful 应用），同样使用服务网格也就无须关系服务之间的那些原来是通过应用程序或者其他框架实现的事情，比如 Spring Cloud、OSS，现在只要交给服务网格就可以了。

[Phil Calçado](http://philcalcado.com/) 在他的这篇博客 [Pattern: Service Mesh](http://philcalcado.com/2017/08/03/pattern_service_mesh.html) 中详细解释了服务网格的来龙去脉：

1. 从最原始的主机之间直接使用网线相连
2. 网络层的出现
3. 集成到应用程序内部的控制流
4. 分解到应用程序外部的控制流
5. 应用程序的中集成服务发现和断路器
6. 出现了专门用于服务发现和断路器的软件包/库，如 [Twitter 的 Finagle](https://finagle.github.io/) 和 [Facebook 的 Proxygen](https://code.fb.com/networking-traffic/introducing-proxygen-facebook-s-c-http-framework/)，这时候还是集成在应用程序内部
7. 出现了专门用于服务发现和断路器的开源软件，如 [Netflix OSS](http://netflix.github.io/)、Airbnb 的 [synapse](https://github.com/airbnb/synapse) 和 [nerve](https://github.com/airbnb/nerve)
8. 最后作为微服务的中间层服务网格出现

服务网格的架构如下图所示：

![Service Mesh 架构图](https://2177896272-files.gitbook.io/~/files/v0/b/gitbook-x-prod.appspot.com/o/spaces%2FmajWkgIPGGC4DVM73Sam%2Fuploads%2Fgit-blob-8fedf0e094b0062ee5e221d441f04b0ff787a713%2F00704eQkly1fswh7dbs1pj30id0bpmxl.jpg?alt=media)

图片来自：[Pattern: Service Mesh](http://philcalcado.com/2017/08/03/pattern_service_mesh.html)

服务网格作为 sidecar 运行，对应用程序来说是透明，所有应用程序间的流量都会通过它，所以对应用程序流量的控制都可以在 serivce mesh 中实现。

## 服务网格如何工作？

下面以 Istio 为例讲解服务网格如何在 Kubernetes 中工作。

1. Istio 将服务请求路由到目的地址，根据中的参数判断是到生产环境、测试环境还是 staging 环境中的服务（服务可能同时部署在这三个环境中），是路由到本地环境还是公有云环境？所有的这些路由信息可以动态配置，可以是全局配置也可以为某些服务单独配置。
2. 当 Istio 确认了目的地址后，将流量发送到相应服务发现端点，在 Kubernetes 中是 service，然后 service 会将服务转发给后端的实例。
3. Istio 根据它观测到最近请求的延迟时间，选择出所有应用程序的实例中响应最快的实例。
4. Istio 将请求发送给该实例，同时记录响应类型和延迟数据。
5. 如果该实例挂了、不响应了或者进程不工作了，Istio 将把请求发送到其他实例上重试。
6. 如果该实例持续返回 error，Istio 会将该实例从负载均衡池中移除，稍后再周期性得重试。
7. 如果请求的截止时间已过，Istio 主动失败该请求，而不是再次尝试添加负载。
8. Istio 以 metric 和分布式追踪的形式捕获上述行为的各个方面，这些追踪信息将发送到集中 metric 系统。

## 为何使用服务网格？

服务网格并没有给我们带来新功能，它是用于解决其他工具已经解决过的问题，只不过这次是在云原生的 Kubernetes 环境下的实现。

在传统的 MVC 三层 Web 应用程序架构下，服务之间的通讯并不复杂，在应用程序内部自己管理即可，但是在现今的复杂的大型网站情况下，单体应用被分解为众多的微服务，服务之间的依赖和通讯十分复杂，出现了 twitter 开发的 [Finagle](https://twitter.github.io/finagle/)、Netflix 开发的 [Hystrix](https://github.com/Netflix/Hystrix) 和 Google 的 Stubby 这样的 “胖客户端” 库，这些就是早期的服务网格，但是它们都近适用于特定的环境和特定的开发语言，并不能作为平台级的服务网格支持。

在云原生架构下，容器的使用给予了异构应用程序的更多可行性，Kubernetes 增强的应用的横向扩容能力，用户可以快速的编排出复杂环境、复杂依赖关系的应用程序，同时开发者又无须过分关心应用程序的监控、扩展性、服务发现和分布式追踪这些繁琐的事情而专注于程序开发，赋予开发者更多的创造性。

## 服务网格全景图

Service Mesh 的概念于 2016 年诞生至今仍在蓬勃发展，下面是部分服务网格或周边开源项目表：

* [amalgam8](https://github.com/amalgam8/amalgam8) - 用于异构微服务的基于版本的路由网格
* [ambassador](https://github.com/datawire/ambassador) - 开源的基于 Envoy proxy 构建的用于微服务的 Kubernetes 原生 API 网关
* [aspen-mesh](https://github.com/aspenmesh) - 隶属于 F5 的公司开发的 Service Mesh
* [conduit](https://conduit.io/) - 适用于 Kubernetes 的轻量级 Service Mesh
* [consul](https://github.com/hashicorp/consul) - Consul 一种分布式、高可用的和数据中心感知解决方案，用于跨动态分布式基础架构连接和配置应用程序。<>
* [dubbo](https://github.com/apache/incubator-dubbo) - Apache Dubbo™ (incubating)是一款高性能Java RPC框架。
* [envoy](https://github.com/envoyproxy/envoy) - C++ 前端/服务代理
* [istio](https://github.com/istio) - 用于连接、保护、控制和观测服务。
* [kong](https://github.com/Kong/kong) - 云原生 API 网关 <https://konghq.com/install>
* [linkerd](https://github.com/linkerd/linkerd) - 云原生应用的开源 Service Mesh [https://linkerd.io](https://linkerd.io/)
* [mesher](https://github.com/go-mesh/mesher) - 华为开源的基于轻量级基于 [go chassis](https://github.com/ServiceComb/go-chassis) 的 Service Mesh。
* [mosn](https://github.com/mosn/mosn) - MOSN是由蚂蚁金服开源的一个模块化可观测的智能网络，可用作为 sidecar 部署在 Service Mesh 中。
* [nginmesh](https://github.com/nginmesh/nginmesh) - 基于 Nginx 的 Service Mesh
* [servicecomb](https://github.com/ServiceComb) - ServiceComb 是华为开源的微服务框架，提供便捷的在云中开发和部署应用的方式。
* [tars](https://github.com/Tencent/Tars) - Tars 是腾讯开源的基于名称服务的高性能 RPC 框架。使用 tars 协议并提供半自动化运维平台。

## 参考

* [Istio: A service mesh for AWS ECS - medium.com](https://medium.com/attest-engineering/Istio-a-service-mesh-for-aws-ecs-937f201f847a)
* [初次了解 Istio - istio.io](https://istio.io/latest/news/releases/0.x/announcing-0.1/)
* [Application Network Functions With ESBs, API Management, and Now.. Service Mesh? - blog.christianposta.com](http://blog.christianposta.com/microservices/application-network-functions-with-esbs-api-management-and-now-service-mesh/)
* [Pattern: Service Mesh - philcalcado.com](http://philcalcado.com/2017/08/03/pattern_service_mesh.html)
* [Envoy 官方文档中文版 - cloudnative.to](https://cloudnative.to/envoy/)
* [Istio 官方文档 - istio.io](https://istio.io)
