最新动态
阿里巴巴搜索服务调度
2025-01-02 23:33

目前阿里巴巴搜索的分布式服务一般都是基于Hippo+Carbon来调度的,包括部署、扩缩容、名字服务注册。如下图

其中


Hippo:一层调度(资源调度,解决机器资源分配问题,将一个物理机分成很多资源,根据应用单机不同的资源需求动态创建不同规格的容器(Docker)。一个容器被视作一个Slot。
Carbon:二层调度(业务调度,基于各种服务状态决策单机服务是否正常,以决策是否需要自动做机器迁移。同时实现服务的各种运维操作。

Drogo:业务管控系统,管理由多个二层调度管理的多个业务集群,并封装成用户操作的UI及API,作为用户及三方服务对接的入口。

Hippo + Carbon 的组合,可以简单理解为Yarn + Slider,或者Cloud Provider + Kubernetes。

这个架构提供了轻量容器的管理、异常机器的自动替换、应用的一键部署,包揽了用户日常的所有运维操作,达到了自动化、自助化的运维效果。但是对于服务容量来说,它不是弹性的。弹性的服务调度,主要解决服务容量自动化扩缩问题。


弹性调度

在目标服务流量上涨时,服务各种指标(例如CPU)上涨,导致服务质量下降。弹性调度自动发现这种情况,并做出扩容请求。相反,在服务流量较低时,弹性调度能够自动缩容,让服务始终保持在一个健康且不浪费的容量状态。

弹性调度在实现上包含以下部分

指标的透出:无论是服务主动汇报还是被动收集,需要有metric系统持有服务的实时指标。
决策:决策系统是整个弹性调度的大脑,决策算法需要的数据(如metrics)需要各个系统透出,并决策出扩缩容的目标,然后提交给“执行”系统
执行:执行系统真正地去完成决策目标,例如扩缩容,也可能是动态改变单容器资源

对应到搜索中无数据服务的弹性调度,如图


原有方案:基于carbon调度

无论是基于什么调度器来调度应用服务,流程上目前是相差无几的。2017年双11 SP服务是基于Carbon来调度的。整体的结构如下图

上图中


一个服务就是一个Role,服务下有多个instance,本质上是一个Hippo Slot
一个Slot由动态创建的容器、容器中的包(镜像)、进程构成
Drogo 引导用户将服务的部署plan提交给Carbon
Carbon 对服务做稳定性调度,确保服务的instance健康可服务;一个Carbon可以调度若干个Role
Hippo 提供Slot的管理,提供拉起Slot的能力 (拉包、启动进程及守护)
Carbon 向Hippo请求及归还Slot
Decision 是让整个服务动态化(动态扩缩容)的决策大脑,决策的依据是服务instance的各种指标(主要还是CPU),决策的结果提交给Drogo
Kmonitor 收集服务各个Slot的各种指标,并提供统一的数据查询
在整个系统中主要有两个问题


Decision决策扩容时,扩容速度达不到秒级
Decision的决策在面临复杂业务服务时,不够智能

第一个问题中,扩容的速度受很多方面的影响,需要针对每个问题进行优化


新的方案:基于fiber调度

Fiber是一个同Carbon相同角色的调度器。Fiber服务本身只能解弹性调度执行的问题。基于Fiber,我们优化了整个系统的各个部分。


Fiber

在Fiber调度中,我们整个系统演化成下图


在Fiber中增加了一个Slot Buffer,用作调度过程中向Hippo申请分配及归还Slot的一个中间缓冲。前面提到一个Slot从无到有是有代价的,而Slot Buffer的提出,则是让Slot提前准备好,Role的扩容请求只是在Fiber进程内改变下Slot的数据结构归属关系。但是Buffer本质上还是存在浪费资源的嫌疑,占用了整个Hippo集群的公共资源。因此,在Fiber中我们预期的使用方式

若干个Role共用同一个Buffer,整个系统的调度是努力在多个服务(Role)间取得资源的最高性价比使用。这也是Decision需要升级的地方。
共用同一个Buffer意味着多个服务具有相同的服务启动Plan,服务之间的差异性(一般就是业务数据)需要调度器与应用之间确定一个新的交互协议,也就是服务需要由调度器驱动来热加载业务数据。
针对第二点,Fiber调度器中相应发生了些变化


Slot的构成,在进程之上增加了app data,称为业务数据。进程最好能支持热加载业务数据(热加载更快)。举个例子,一个支持servlet的web容器(如tomat)是一个进程,各个servlet的包就是业务数据,希望在tomcat中可以热加载不同的servlet。这样就可以省掉tomcat的启动时间。
Fiber需要在某个Slot从Buffer中重新分配给新的Role时,及时通知更新hot plan。为了实现的容错性,我们实现为类似Carbon中设置Slot启动Plan一样的目标式方式,自然地也需要支持rolling、甚至最小可用度保证等功能。
总结下来可以看出,在Carbon中某个服务的启动/更新是Carbon与Hippo协作的结果;而在Fiber中,还包括了Fiber与服务之间的协作。理想中Fiber的使用方式,举个tomcat加载web .war包的例子


buffer中提前准备好了很多已经运行的tomcat进程,整体上就是很多Slot
业务方A需要部署服务A,提供了自己开发的业务.war包,提交到Fiber中
Fiber从Buffer拿出指定数量的Slot,并通知这些Slot上的tomcat进程热加载用户的.war包
Decision发现服务A负载较高,发出扩容请求
Fiber从Buffer拿出更多Slot,并热加载.war包
Buffer容量不足,从Hippo集群补充冷Slot,并准备好Slot (拉包、启动容器、启动tomcat)
Decision发现服务A负载过低,发出缩容请求

Fiber归还Slot到Buffer,Buffer过大则归还部分Slot回Hippo


未来

    以上就是本篇文章【阿里巴巴搜索服务调度】的全部内容了,欢迎阅览 ! 文章地址:http://ww.kub2b.com/news/19298.html
     栏目首页      相关文章      动态      同类文章      热门文章      网站地图      返回首页 企库往资讯移动站 http://ww.kub2b.com/mobile/ , 查看更多   
最新文章
荣耀手机数据恢复教程荣耀手机找回「荣耀手机数据恢复教程」
在使用荣耀手机的过程中,大家难免会遇到不小心删除重要照片的情况。这些照片可能包含了珍贵的回忆,一旦丢失,可能会让人感到非
手机副卡怎么注销手机副卡「手机副卡怎么注销」
随着移动通信技术的不断发展,手机副卡已成为许多家庭或企业用户的常用选择,它为用户提供了更多的便利和灵活性。然而,当不再需
三星s8怎么样值得买吗 64G版苏宁易购4999元s8手机「三星s8怎么样值得买吗 64G版苏宁易购4999元」
  【PConline 导购】当下很多手机都有一流的硬件配置和出色的使用体验,消费者在购机时也会优先考虑这些产品。就拿三星的旗舰
马拉松赛道上的奇特造型,究竟是展示自我还是博眼球,你怎么看?
或许你会发现,每次马拉松比赛都会出现奇特造型的人物。这不,2025象山马拉松也有一些打扮另类的跑者,他们的出现瞬间成为赛道上
售价21万的诺基亚Vertu手机 你肯定没用过!手机超长待机「售价21万的诺基亚Vertu手机 你肯定没用过!」
人人都说知道诺基亚,但你真的通晓诺基亚吗?在诺基亚旗下奢侈手机公司VERTU(威图、纬图)相信很多人都不知道。而Vertu品牌研发
苹果11原相机自拍是反的怎么调回来苹果手机拍照怎么是反的「苹果11原相机自拍是反的怎么调回来」
  苹果iPhone11(系统版本是iOS 14)相机自拍呈现反方向是【平面镜成像】原理,可在自带的相机设置中修改拍摄方向,也可以在自
阿维塔06即将上市,1天后公布价格
06倒计时一天,实际上有必要重新认识一下这个品牌。阿维塔成立于2018年,主要大事件:2021年阿维塔科技全球品牌首发,正式亮相,
最新个人简历电子版 个人简历手机版免费(三篇)手机简历「最新个人简历电子版 个人简历手机版免费(三篇)」
无论是身处学校还是步入社会,大家都尝试过写作吧,借助写作也可以提高我们的语言组织能力。写范文的时候需要注意什么呢?有哪些
360行车记录仪,走过风景,走过你——体验G300 3K版前,我要分享一份记录仪避坑指南!360行车记录仪怎么连接手机「360行车记录仪,走过风景,走过你——体验G300 3K版前,我要分享一份记录仪
***感谢众测君翻牌,感谢品牌方信任***说起,大家应该都不陌生了。这东西除了能让你在说不清的时候说清楚,还有点其他用处。比如