ModelMesh走向开源 使开发者能够大规模部署AI模型
来源:cnBeta.COM 发布时间:2021-10-14 20:03:31

模型服务是AI用例的一个关键组成部分。它涉及从人工智能模型中提供推论,以响应用户的请求。那些涉足企业级机器学习应用的人知道,通常不是一个模型提供推论,而是实际上有数百甚至数千个模型在同步运行。

这在计算上是一个非常昂贵的过程,因为你不可能在每次要提供请求时都启动一个专用容器。这对在Kubernetes集群中部署大量模型的开发者来说是一个挑战,因为存在一些限制,如允许的最大荚数和IP地址以及计算资源分配。

IBM通过其专有的ModelMesh模型服务管理层为Watson产品(如Watson Assistant、Watson Natural Language Understanding和Watson Discovery)解决了这个难题。由于这些模型已经在生产环境中运行了几年,ModelMesh已经针对各种场景进行了全面测试。现在,IBM正在将这一管理层与控制器组件以及为模型服务的运行时间一起贡献给开放源码社区。

ModelMesh使开发者能够在Kubernetes之上以"极端规模"部署AI模型。它具有缓存管理的功能,也是一个平衡推理请求的 路由器,模型被智能地放置在pod中,对临时中断提供弹性。ModelMesh的部署可以轻松升级,无需任何外部协调机制。它自动确保一个路由新请求到它之前已经完全更新和加载。

在用一些统计数据解释ModelMesh的可扩展性时,IBM表示:

一个部署在单个工人节点8vCPUx 64G集群上的ModelMesh实例能够打包20K个简单字符串模型。在密度测试的基础上,我们还对ModelMesh的服务进行了负载测试,通过发送成千上万的并发推理请求来模拟一个高流量的假日季节场景,所有加载的模型都以个位数毫秒的延迟进行响应。实验表明,单个工人节点支持20k个模型,每秒最多可进行1000次查询,并以个位数毫秒的延迟响应推理任务。

IBM将ModelMesh贡献给了KServe GitHub组织,该组织早在2019年就由IBM、Google、彭博社、英伟达和Seldon联合开发。

您可以在下面提到的各种GitHub存储库中查看ModelMesh的运用与实现:

模型服务控制器

用于协调模型放置和路由的 ModelMesh 容器 运行时适配器

ModelMesh运行时适配器 - 在每个模型服务 pod 中运行的容器,充当 ModelMesh 和第三方模型服务器容器之间的中介,它还包含了负责从存储中检索模型的"拉动器"逻辑。

triton-inference-server - NVIDIA的Triton推理服务器

seldon-mlserver - Python MLServer,是KFServing的一部分

【来源:cnBeta.COM】

关键词: ModelMesh 走向 开源 开发者

猜你喜欢

安卓板皇三星Galaxy Tab S8 Ultra曝光:14.6寸

1月14日消息,WinFuture曝光了三星GalaxyTabS8Ultra的渲染图和详细参数。更多

2022-01-15 22:44:36

体积瞬间缩小4倍!三星全新折叠屏笔记本专利曝光

近日,WIPO(世界知识产权局)公布了三星的一项技术专利,该专利展示了一种可多次折叠的电子设备。更多

2022-01-15 22:44:24

RTX 3060 Ti新版首曝:GA103核心、几个月没到货了

RTX206012GB、RTX308012GB、RTX3070Ti16GB……NVIDIA近期接连的打造了多款显卡的新版本,看起来只是...更多

2022-01-15 22:43:55

比亚迪宋PLUS DM-i斩获12月全国混动车型上险冠军

前不久,比亚迪公布了2021年年度销量数据,数据显示,比亚迪全年销售汽车730093辆,同比增长75 4%...更多

2022-01-15 22:43:19

可拆电池的安卓新机发布:TF卡槽/耳机孔都配齐了

回忆一下,你有多久没有见过或者用过电池可拆卸设计的智能手机了?更多

2022-01-15 19:46:21

LG新能源同一矿商签订70万干吨锂精矿采购协议

据国外媒体报道,随着电动汽车需求的大幅提升,对动力电池的需求也逐年增加,各大电池制造商也在尽...更多

2022-01-15 19:46:13

国产“电动牦牛”亮相 负重160公斤健步如飞

1月14日消息,据“央视军事”报道,我国自主研制的“电动牦牛”,是世界上体形最大、载重和越野能力...更多

2022-01-15 19:46:04

红魔7入网照片公布:全球首款骁龙8游戏旗舰

今天,红魔游戏手机7“证件照”正式对外公布,在外观上沿用了此前红魔系列的设计语言。更多

2022-01-15 19:45:53

PCIe 4.0硬盘份额仅10% PCIe 5.0/6.0技术普及有得等了

AMD在2019年的锐龙3000系列处理器上就首发了PCIe4 0技术,现在已经两年半时间了,各大SSD厂商也都...更多

2022-01-15 19:45:40

荣耀X30大内存版上新:12+256GB仅售2299元

上个月,荣耀在“2021荣耀周年庆暨荣耀X30新品发布会”上,正式推出了八年诚意之作——荣耀X30。更多

2022-01-15 16:44:44


© 2012-2020 财经快报网 版权所有

网站联系邮箱:98 28 36 7@qq.com