软件行业资讯

限流和经常出现的三种算法 (限流和经常出现的区别)

  2024-10-22 14:41:10  473

本文目录导航：

限流和经常出现的三种算法
高并发，你真的了解透彻了吗？
HttpClient经常使用中发生的failed to respond意外疑问处置

限流和经常出现的三种算法

限流的三种算法限流要处置的疑问典型限流的运行场景：如何限流？普通网关都有这种配置。

gateway、nginx、zuul等限流：肯活期间内，只准许N次恳求。

从计算机友好的角度登程，是宿愿能在单位期间内均摊掉恳求，经常使用漏斗算法可以到达这种成果。

然而漏斗算法有个弊病，就是先快后慢的这种恳求，那么峰值的恳求也只能排队期待被消费。

实践上计算机是具有必定的高并发处置才干的，只需不是不时处于高并发下即可。

所以计数器限流和破绽限流折中的算法，令牌限流成为如今最干流的算法。

（Redis 联合expire打算可以成功) 第一次性恳求开局计时，例如1s以内，到达100次恳求就拒绝访问了，直到1s事先，从新开局计数。

好处：缺陷：持久的峰值过高对主机不友好。

主机宿愿能把恳求尽量的均摊开来，这样可以充沛应用计算机资源。

消费的速度是恒定的，关于主机而言是最友好的。

在算法成功方面，可以预备一个队列，用来保留恳求，另外经过一个线程池（ScheduledExecutorService）来活期从队列中失掉恳求并口头，可以一次性性失掉多个并发口头。

参数：消费速度、桶容量（超越就放弃，可以防止内存过大，有过多的期待的义务) 好处：缺陷：令牌桶算法是比拟经常出现的限流算法之一，大略形容如下： 1）一切的恳求在处置之前都须要拿到一个可用的令牌才会被处置； 2）依据限流大小，设置依照必定的速率往桶里参与令牌； 3）桶设置最大的搁置令牌限度，当桶满时、新参与的令牌就被放弃活着拒绝； 4）恳求到达后首先要失掉令牌桶中的令牌，拿着令牌才可以启动其余的业务逻辑，处置完业务逻辑之后，将令牌直接删除； 5）令牌桶有最低限额，当桶中的令牌到达最低限额的时刻，恳求处置完之后将不会删除令牌，以此保证足够的限流；这种算法，既可以保证系统由必定的高并发才干，比如以后令牌桶容量是100，一开局直接消费掉100个恳求。

有保证主机不会由于持久的迸发，而造成server端闲暇，由于令牌桶还会继续的消费令牌。

既有必定的并发才干，又不至于齐全失去控制，可控的兼具并发力和流量控制的限流算法.是计数器算法（必定的并发处置才干）和破绽限流（高峰事先依然会继续的发生令牌）的折中算法。

高并发，你真的了解透彻了吗？

高并发，简直是每个程序员都想领有的阅历。

要素很便捷：随着流质变大，会遇到各种各样的技术疑问，比如接口照应超时、CPU load升高、GC频繁、死锁、大数据量存储等等，这些疑问能推进咱们在技术深度上不时精进。

在过往的面试中，假设候选人做过高并发的名目，我通常会让对方谈谈关于高并发的了解，然而能系统性地回答好此疑问的人并不多。

大略分红这样几类：

1、对数据化的目的没有概念：不清楚选用什么样的目的来权衡高并发系统？分不清并发量和QPS，甚至不知道自己系统的总用户量、生动用户量，平峰和高峰时的QPS和TPS等关键数据。

3、了解全面，把高并发设计同等于性能优化：大谈并发编程、多级缓存、异步化、水平扩容，却漠视高可用设计、服务控制和运维保证。

4、把握慷慨案，却漠视最基本的物品：能讲清楚垂直分层、水平分区、缓存等大思绪，却没看法去剖析数据结构能否正当，算法能否高效，没想过从最基本的IO和计算两个维度去做细节优化。

这篇文章，我想联合自己的高并发名目阅历，系统性地总结下高并发须要把握的常识和通常思绪，宿愿对你有所协助。内容分红以下3个部分：

高并发象征着大流量，须要运用技术手腕抵制流量的冲击，这些手腕好比操作流量，能让流量更颠簸地被系统所处置，带给用户更好的体验。

咱们经常出现的高并发场景有：淘宝的双11、春运时的抢票、微广博V的热点资讯等。

除了这些典型事情，每秒几十万恳求的秒杀系统、每天千万级的订单系统、每天亿级日活的信息流系统等，都可以归为高并发。

很显然，上方谈到的高并发场景，并发量各不相反，那究竟多大并发才算高并发呢？

1、不能只看数字，要看详细的业务场景。

不能说10W QPS的秒杀是高并发，而1W QPS的信息流就不是高并发。

信息流场景触及复杂的介绍模型和各种人工战略，它的业务逻辑或许比秒杀场景复杂10倍不止。

因此，不在同一个维度，没有任何比拟意义。

2、业务都是从0到1做起来的，并发量和QPS只是参考目的，最关键的是：在业务量逐突变成原来的10倍、100倍的环节中，你能否用到了高并发的处置方法去演进你的系统，从架构设计、编码成功、甚至产品打算等维度去预防和处置高并发惹起的疑问？而不是一味的更新配件、加机器做水平裁减。

此外，各个高并发场景的业务特点齐全不同：有读多写少的信息流场景、有读多写多的买卖场景，那能否有通用的技术打算处置不同场景的高并发疑问呢？

我觉得大的思绪可以自创，他人的打算也可以参考，然而真正落地环节中，细节上还会有有数的坑。

另外，由于软配件环境、技术栈、以及产品逻辑都没法做到齐全分歧，这些都会造成雷同的业务场景，就算用相反的技术打算也会面临不同的疑问，这些坑还得一个个趟。

因此，这篇文章我会将重点放在基础常识、通用思绪、和我曾经通常过的有效阅历上，宿愿让你对高并发有更深的了解。

先搞清楚高并发系统设计的目的，在此基础上再探讨设计打算和通常阅历才无心义和针对性。

高并发绝不象征着只谋求高性能，这是很多人全面的了解。

从微观角度看，高并发系统设计的目的有三个：高性能、高可用，以及高可裁减。

1、高性能：性能表现了系统的并行处置才干，在有限的配件投入下，提高性能象征着节俭老本。

同时，性能也反映了用户体验，照应期间区分是100毫秒和1秒，给用户的感触是齐全不同的。

2、高可用：示意系统可以反常服务的期间。

一个全年不停机、无端障；另一个隔三差五出线上意外、宕机，用户必需选用前者。

另外，假设系统只能做到90%可用，也会大大连累业务。

3、高裁减：示意系统的裁减才干，流量高峰时能否在短期间内成功扩容，更颠簸地承接峰值流量，比如双11优惠、明星离婚等热点事情。

这3个目的是须要通盘思考的，由于它们互关系联、甚至也会相互影响。

比如说：思考系统的裁减才干，你会将服务设计成有形态的，这种集群设计保证了高裁减性，其实也直接优化了系统的性能和可用性。

再比如说：为了保证可用性，通常会对服务接口启动超时设置，以防少量线程阻塞在慢恳求上形成系统雪崩，那超时期间设置成多少正当呢？普通，咱们会参考依赖服务的性能表现启动设置。

再从微观角度来看，高性能、高可用和高裁减又有哪些详细的目的来权衡？为什么会选用这些目的呢？

2.2.1 性能目的

经过性能目的可以度量目前存在的性能疑问，同时作为性能优化的评价依据。

普通来说，会驳回一段期间内的接口照应期间作为目的。

1、平均照应期间：最罕用，然而缺陷很显著，关于慢恳求不敏感。

比如1万次恳求，其中9900次是1ms，100次是100ms，则平均照应期间为1.99ms，只管平均耗时仅参与了0.99ms，然而1%恳求的照应期间曾经参与了100倍。

2、TP90、TP99等分位值：将照应期间依照从小到大排序，TP90示意排在第90分位的照应期间，分位值越大，对慢恳求越敏感。

3、吞吐量：和照应期间呈正比，比如照应期间是1ms，则吞吐量为每秒1000次。

通常，设定性能目的时会统筹吞吐量和照应期间，比如这样表述：在每秒1万次恳求下，AVG控制在50ms以下，TP99控制在100ms以下。

关于高并发系统，AVG和TP分位值必需同时要思考。

另外，从用户体验角度来看，200毫秒被以为是第一个分界点，用户觉得不到提早，1秒是第二个分界点，用户能感遭到提早，然而可以接受。

因此，关于一个肥壮的高并发系统，TP99应该控制在200毫秒以内，TP999或许TP9999应该控制在1秒以内。

2.2.2 可用性目的

高可用性是指系统具有较高的无端障运转才干，可用性 = 反常运转期间 / 系统总运转期间，普通经常使用几个9来形容系统的可用性。

关于高并发系统来说，最基本的要求是：保证3个9或许4个9。

要素很便捷，假设你只能做到2个9，象征着有1%的缺点期间，像一些大公司每年动辄千亿以上的GMV或许支出，1%就是10亿级别的业务影响。

2.2.3 可裁减性目的

面对突发流量，无法能暂时变革架构，最快的形式就是参与机器来线性提高系统的处置才干。

关于业务集群或许基础组件来说，裁减性 = 性能优化比例 / 机器参与比例，现实的裁减才干是：资源参与几倍，性能优化几倍。

通常来说，裁减才干要维持在70%以上。

然而从高并发系统的全体架构角度来看，裁减的目的不只仅是把服务设计成有形态就行了，由于当流量参与10倍，业务服务可以极速扩容10倍，然而数据库或许就成为了新的瓶颈。

像MySQL这种有形态的存储服务通常是裁减的技术难点，假设架构上没提早做好布局（垂直和水平拆分），就会触及到少量数据的迁徙。

因此，高裁减性须要思考：服务集群、数据库、缓存和信息队列等两边件、负载平衡、带宽、依赖的第三方等，当并兴旺到某一个量级后，上述每个要素都或许成为裁减的瓶颈点。

了解了高并发设计的3大目的后，再系统性总结下高并发的设计打算，会从以下两部分倒退：先总结下通用的设计方法，而后再围绕高性能、高可用、高裁减区分给出详细的通常打算。

通用的设计方法关键是从「纵向」和「横向」两个维度登程，俗称高并发处置的两板斧：纵向裁减和横向裁减。

3.1.1 纵向裁减（scale-up）

它的目的是优化单机的处置才干，打算又包含：

1、优化单机的配件性能：经过参与内存、 CPU核数、存储容量、或许将磁盘更新成SSD 等堆配件的形式来优化。

2、优化单机的软件性能：经常使用缓存缩小IO次数，经常使用并发或许异步的形式参与吞吐量。

3.1.2 横向裁减（scale-out）

由于单机性能总会存在极限，所以最终还须要引入横向裁减，经过集群部署以进一步提高并发处置才干，又包含以下2个方向：

1、做好分层架构：这是横向裁减的提早，由于高并发系统往往业务复杂，经过火层处置可以简化复杂疑问，更容易做到横向裁减。

上方这种图是互联网最经常出现的分层架构，当然实在的高并发系统架构会在此基础上进一步完善。

比如会做动态分别并引入CDN，反向代理层可以是LVS+Nginx，Web层可以是一致的API网关，业务服务层可进一步按垂直业务做微服务化，存储层可以是各种异构数据库。

2、各层启动水平裁减：有形态水平扩容，有形态做分片路由。

业务集群通常能设计成有形态的，而数据库缓和存往往是有形态的，因此须要设计分区键做好存储分片，当然也可以经过主从同步、读写分别的打算优化读性能。

上方再联合我的团体阅历，针对高性能、高可用、高裁减3个方面，总结下可落地的通常打算。

3.2.1 高性能的通常打算

1、集群部署，经过负载平衡减轻单机压力。

2、多级缓存，包含静态数据经常使用CDN、本地缓存、散布式缓存等，以及对缓存场景中的热点key、缓存穿透、缓存并发、数据分歧性等疑问的处置。

3、分库分表和索引优化，以及借助搜查引擎处置复杂查征询题。

4、思考NoSQL数据库的经常使用，比如Hbase、TiDB等，然而团队必需相熟这些组件，且有较强的运维才干。

5、异步化，将无所谓流程经过多线程、MQ、甚至延时义务启动异步处置。

6、限流，须要先思考业务能否准许限流（比如秒杀场景是准许的），包含前端限流、Nginx接入层的限流、服务端的限流。

7、对流量启动削峰填谷，经过 MQ承接流量。

8、并发处置，经过多线程将串行逻辑并行化。

9、估量算，比如抢红包场景，可以提早计算好红包金额缓存起来，发红包时直接经常使用即可。

10、缓存预热，经过异步义务提早预热数据到本地缓存或许散布式缓存中。

11、缩小IO次数，比如数据库缓和存的批量读写、RPC的批量接口支持、或许经过冗余数据的形式干掉RPC调用。

12、缩小IO时的数据包大小，包含驳回轻量级的通讯协定、适合的数据结构、去掉接口中的多余字段、缩小缓存key的大小、紧缩缓存value等。

13、程序逻辑优化，比如将大略率阻断口头流程的判别逻辑前置、For循环的计算逻辑优化，或许驳回更高效的算法。

14、各种池化技术的经常使用和池大小的设置，包含HTTP恳求池、线程池（思考CPU密集型还是IO密集型设置外围参数）、数据库和Redis衔接池等。

15、JVM优化，包含重生代和老年代的大小、GC算法的选用等，尽或许缩小GC频率和耗时。

16、锁选用，读多写少的场景用失望锁，或许思考经过火段锁的形式缩小锁抵触。

上述打算无外乎从计算和 IO 两个维度思考一切或许的优化点，须要有配套的监控系统实时了解以后的性能表现，并撑持你启动性能瓶颈剖析，而后再遵照二八准则，抓关键矛盾启动优化。

3.2.2 高可用的通常打算

1、平等节点的缺点转移，Nginx和服务控制框架均支持一个节点失败后访问另一个节点。

2、非平等节点的缺点转移，经过心跳检测并实施主备切换（比如redis的哨兵形式或许集群形式、MySQL的主从切换等）。

3、接口层面的超时设置、重试战略和幂等设计。

4、升级处置：保证外围服务，就义非外围服务，必要时启动熔断；或许外围链路出疑问时，有备选链路。

5、限流处置：对超越系统处置才干的恳求直接拒绝或许前往失误码。

6、MQ场景的信息牢靠性保证，包含producer端的重试机制、broker侧的耐久化、consumer端的ack机制等。

7、灰度颁布，能支持按机器维度启动小流量部署，观察系统日志和业务目的，等运转颠簸后再推全量。

8、监控报警：全方位的监控体系，包含最基础的CPU、内存、磁盘、网络的监控，以及Web主机、JVM、数据库、各类两边件的监控和业务目的的监控。

9、灾备演练：相似以后的“混沌工程”，对系统启动一些破坏性手腕，观察部分缺点能否会惹起可用性疑问。

高可用的打算关键从冗余、取舍、系统运维3个方向思考，同时须要有配套的值班机制和缺点处置流程，当发生线上疑问时，可及时跟进处置。

3.2.3 高裁减的通常打算

1、正当的分层架构：比如上方谈到的互联网最经常出现的分层架构，另外还能进一步依照数据访问层、业务逻辑层对微服务做更细粒度的分层（然而须要评价性能，会存在网络多一跳的状况）。

2、存储层的拆分：依照业务维度做垂直拆分、依照数据特色维度进一步做水平拆分（分库分表）。

3、业务层的拆分：最经常出现的是依照业务维度拆（比如电商场景的商品服务、订单服务等），也可以依照外围接口和非外围接口拆，还可以依照恳求源拆（比如To C和To B，APP和H5 ）。

高并发确实是一个复杂且系统性的疑问，由于篇幅有限，诸如散布式Trace、全链路压测、柔性事务都是要思考的技术点。

另外，假设业务场景不同，高并发的落中央案也会存在差异，然而总体的设计思绪和可自创的打算基本相似。

高并发设计雷同要秉承架构设计的3个准则：便捷、适合和演进。

过早的优化是万恶之源，不能脱离业务的实践状况，更不要适度设计，适合的打算就是最完美的。

作者简介：985硕士，前亚马逊工程师，现大厂技术控制者。

HttpClient经常使用中发生的failed to respond意外疑问处置

zuul1.x经常使用环节中，偶然会发生failed to respond的意外信息，对应的意外为httpclient 的 NoHttpResponseException。

httpclient 自身在经常使用线程池时，偶然也会发生这个意外。

处置打算就是缩小 idle的衔接存活的期间，zuul 自身在里经过connectionManagerTimer 定时器来封锁超越time-to-live的衔接。

自动是delay 30s开局审核，每5s 口头一次性。

zuul作为client方衔接nginx代理的服务，对应的设置为：而nginx设置的keepalive_timeout=180s，所以当闲暇到达180s时，服务端曾经断开了衔接。

这时刻httpclient在拿到pool里的connection时就有或许发生NoHttpResponseException。

应该将-to-live设置为 <= nginx的keepalive_timeout。

另外-per-route-connections应该依据实践状况调配，不宜过大。

而且经过测试，只是偶然会发生，httpclient外部也在经常使用各种机制保证connection在断开之后能继续重连。

然而在某些不凡状况下，socket 的 write 操作会在毫无心外前往的状况下失败，Httpclient 无法处置这种失败，造成无法解析response。

请参考原文：

下一篇： windows系统nginx中止进行及罕用命令 (windows 11)
上一篇： 主机集群软件有哪些 (主机集群软件下载)

软件行业资讯

限流和经常出现的三种算法 (限流和经常出现的区别)

本文目录导航：

限流和经常出现的三种算法

高并发，你真的了解透彻了吗？

HttpClient经常使用中发生的failed to respond意外疑问处置

相关内容查看全部 

2024年折叠屏手机

北京屹唐半导体历

全国首方！多奈单

比亚迪汽车王朝网

金沙江创投朱啸虎

12岁失去右手的周

苹果Apple Watch

iOS 18.4正式版凌

AI看图猜地名轻松

3月30日开售售价7

限流和经常出现的三种算法 (限流和经常出现的区别)

本文目录导航：

限流和经常出现的三种算法

高并发，你真的了解透彻了吗？

HttpClient经常使用中发生的failed to respond意外疑问处置

相关内容 查看全部 

相关内容查看全部 