博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
降低人工智能成本50%阿里云推出新一代异构实例GN5i
阅读量:6548 次
发布时间:2019-06-24

本文共 1011 字,大约阅读时间需要 3 分钟。

9月12日,阿里云正式推出最新一代GPU实例GN5i。这款产品主要适用于深度学习的在线推理(Inference)阶段,可一键部署TensorFlow等主流深度学习框架,提供智能调度、自动运维、实时扩容等服务。人工智能产业用户可通过GN5i搭建微秒级响应的AI服务,在线服务成本减少50%以上。

image

阿里云官网显示,GN5i采用了英伟达Pascal架构P4图形处理器,提供最大45Tops INT8整型计算能力和11TFlops FP32单精度浮点计算能力,在满足数据处理吞吐的基础上,时延最低可达微秒级。支持小时付费,也支持包月包年。
此外,针对自建GPU服务器经常会遇到的扩容难、适配难的问题,GN5i规格族提供了灵活弹性的系列化配置,可以根据深度学习计算力的要求,按需选择合适的规格,分钟级即可完成实例的创建,并可根据运算力需求进行GPU实例的“Scale-out”水平扩容或“Scale-up”垂直变配。
阿里云高级技术专家龙欣介绍,在面向AI深度学习在线推理场景时,GN5i实例能够给客户带来以下价值:
• 稳定的企业级GPU计算能力,保障深度学习推理任务处理效率;
• 全面兼容主流深度学习框架,如TensorFlow、Caffe、MXNet、CNTK等;
• 配备阿里云高性能SSD云存储,加速数据的读取性能;搭配阿里云的OSS存储服务,能达到最佳的存储性价比;
• 在满足数据处理吞吐的基础上,时延最低可达微秒级;
• 推理型专用GPU,大幅降低AI在线服务建设成本;

image

• GN5i的推出进一步丰富了阿里云异构计算家族的产品线。针对模型训练学习,阿里云在今年5月推出了高性能GPU实例GN5,单实例最多可提供8个英伟达 P100 GPU、2万多个并行处理核心,最高75TFLOPS FP32单精度浮点、150 TFLOPS FP16半精度浮点和37 TFLOPS FP64双精度浮点运算能力,每个P100搭配的16GB HBM2 3D堆叠内存提供了高达732GB每秒的数据传输速率,配合GN5i可有效保障深度学习的处理效率。

除了产品层面,阿里云还提供了全方位的人工智能产业服务,包括智能语音交互、图像/视频识别、交通预测、情感分析等技术服务,这些技术正通过阿里云ET对外输出。过去一年,阿里云推出ET城市大脑、ET工业大脑、ET医疗大脑等行业垂直的人工智能系统,为工厂或者医院创造更多利润或者更高的诊断准确率。

转载地址:http://bagdo.baihongyu.com/

你可能感兴趣的文章
ThreadLocal使用出现的问题
查看>>
连接池并发的实现原理
查看>>
创建Pch预编译文件
查看>>
阿里云Centos配置iptables防火墙
查看>>
UML类图几种关系的总结
查看>>
PHP面试题汇总
查看>>
LeetCode (11): Container With Most Water
查看>>
【技巧】easyUI的datagrid,如何在翻页以后仍能记录被选中的行
查看>>
经过强制类型转换以后,变量a, b的值分别为( )short a = 128; byte b = (byte) a;
查看>>
ubuntu下msmtp+mutt的安装和配置
查看>>
QLabel显示图片,图片可以自适应label的大小
查看>>
BZOJ3994:[SDOI2015]约数个数和——题解
查看>>
3、EJB3.0开发第一个无会话Bean和客户端(jboss4.2.3)
查看>>
git fetch & pull详解
查看>>
boost_1.63.0编译VS2013
查看>>
jQuery 插件-(初体验一)
查看>>
PHP语言 -- Ajax 登录处理
查看>>
基于js的CC攻击实现与防御
查看>>
我的家庭私有云计划-19
查看>>
项目实践中Linux集群的总结和思考
查看>>