login
欢迎浏览华语科技网
凯发游戏-凯发k8国际手机app下载 凯发游戏-凯发k8国际手机app下载 凯发游戏-凯发k8国际手机app下载

凯发游戏-凯发k8国际手机app下载

您现在的位置是: 凯发游戏-凯发k8国际手机app下载 > 新闻 > 科技

科技

gtc 22 精彩看点 | 锁定阿里云硬核分享 -凯发游戏

2022-03-24 科技
3月21日,2022英伟达 gtc 大会即将拉开帷幕。此次 gtc 22 大会上,阿里云将带来有关推理优化/部署、深度学习编译器、大模型部署、训练优化、云手游等主题的内容,分享云端机器学习平台最新的创新实践。

简介: 3月21日,2022英伟达 gtc 大会即将拉开帷幕。此次 gtc 22 大会上,阿里云将带来有关推理优化/部署、深度学习编译器、大模型部署、训练优化、云手游等主题的内容,分享云端机器学习平台最新的创新实践。

3月21日,2022英伟达 gtc 大会即将拉开帷幕。此次 gtc 22 大会上,阿里云将带来有关推理优化/部署、深度学习编译器、大模型部署、训练优化、云手游等主题的内容,分享云端机器学习平台最新的创新实践。

gtc 22 阿里云精彩演讲提前看

[s41068] paisparse:面向深度学习的稀疏加速库

· 李与超,阿里云,高级算法工程师
· 朱斐文,nvidia, 高级算法专家
· 3 月 23 日 星期三 | 3:00 pm - 3:25 pm 北京时间

随着超大语言模型的流行, 如何部署超大模型正在成为迫切需要解决的问题。非结构化剪枝可以将模型规模缩小99%,让超大语言模型在单卡上部署成为可能。然而超大模型稀疏后会呈现不同的非零分布,而这些分布会直接影响硬件的计算量并影响最终的执行时间。同时与传统的 hpc 任务不同的是,基于训练后的稀疏矩阵分布的 tuning 在深度学习推理中是可以进行的。因此我们提出一个面向深度学习的稀疏加速库:paisparse,可以自动生成更高效的稀疏算子。实验表明,与 cusparse 相比,paisparse 可以提速1.5~5倍。

话题链接:
https://www.nvidia.com/gtc/session-catalog/#/session/1634303703593001xjhx

[s41501] ptxc:使用 xla 编译器通过云 gpu 扩展 pytorch 训练

· 刘小勇,高级主任工程师
· 3 月 23 日 星期三 | 9:00 pm - 9:25 pm 北京时间

在工业界实践中,模型训练和部署的效率、规模和适配性关系到最终的应用效果。为满足pytorch eager-first 的 gpu 编译流程,lazy tensor 架构被提出来。通过采用实践验证过的产品化 xla 编译器和分布式引擎,ptxc 能在阿里云 gpu 集群中以基于编译优化的方式一键快速搭建易用、弹性且高效的 pytorch 模型训练系统。

话题链接:
https://www.nvidia.com/gtc/session-catalog/#/session/1637553159784001rkub

[s41395] 通过 pai-blade 更易用、更可靠地使用 tensorrt

· 邱侠斐,阿里云,主任工程师
· 郭天佑,阿里云,高级工程师
· 李澜博,阿里云,高级工程师
· 3 月 24 日 星期四 | 9:00 am - 9:25 am 北京时间

tensorrt 是英伟达推出的业界领先的推理加速器,在深度学习推理场景应用广泛,但是通过 tensorrt 来优化深度学习模型仍有一定门槛。首先,通过 tensorrt 解析模型时会遇到转换失败或表现不理想的情况。其次,从零开始搭建网络比较耗时且难以扩展。此外,在生产环境里增加新的推理框架需要严谨的评估。本次演讲将介绍如何通过一站式 ai 加速器 pai-blade 解决上述问题。pai-blade 能够实现 tensorrt 后端上的自动圈图和自动化运行。同时还可以与 tensorrt plugin 协同工作,以实现更好的性能。目前 pai-blade 提供对 tensorflow 和 pytorch 的产品化支持。

话题链接:
https://www.nvidia.com/gtc/session-catalog/#/session/1635516028378001pxlx

[s41604] 未来游戏趋势:通过阿里云弹性云手机凯发游戏的解决方案打造云游戏

· 杨铭,阿里云,高级工程师
· 3 月 24 日 星期四|11:00 am - 11:25 am 北京时间

基于英伟达 t4 及原生的 arm 平台,阿里云设计研发了高性能的云手游凯发游戏的解决方案——弹性云手机,可实现虚拟化渲染及显存隔离,在确保隔离的情况下充分发挥 t4 性能。此外,弹性云手机无缝对接阿里巴巴云游戏流媒体平台,该平台兼容多种流媒体协议,并具备完整的“渲染-编码-串流”云手游架构。

话题链接:
https://www.nvidia.com/gtc/session-catalog/#/session/1638429961776001ihjm

[s41383] 云端 triton 生产实践

· 李文鹏,阿里云,主任工程师
· 邱侠斐,阿里云,主任工程师
· 李澜博,阿里云,高级工程师
· 3 月 24 日 星期四 | 1:00 pm - 1:25 pm 北京时间

triton 推理服务器是一款功能全面、可扩展且功能强大的推理凯发游戏的解决方案,在边缘设备和云上皆可部署。在云上将 triton 部署到生产环境中时,应考虑效率、可扩展性以及与 triton 自身外的云上基础设施的集成。我们将介绍在阿里云中通过 pai- eas 提供 triton 作为云服务的关键见解:1) 一键部署 triton 集群;2) 根据请求吞吐量扩展 triton 集群;3) 与 oss(对象存储服务)原生集成;以及 4) triton 和 gpu 共享调度。

话题链接:
https://www.nvidia.com/gtc/session-catalog/#/session/1635349148436001gnse

[s41073] 阿里云基于 ai 编译器的通用透明性能凯发游戏的解决方案

· 朱凯,阿里云,主任工程师
· 3 月 24 日 星期四 | 2:00 pm - 2:50 pm 北京时间

本次演讲将从云服务厂商的视角,分享在云端和机器学习平台上大规模部署 ai 编译器的实战经验。我们将详细介绍近期刚刚开源的动态 shape 深度学习编译器 bladedisc,包括它的背景和主要特性,具体设计架构和实现细节,动态 shape 语义下的性能优化经验,未来计划以及在 nvidia 设备上的应用等。

话题链接:
https://www.nvidia.com/gtc/session-catalog/#/session/1634431966251001jhrz

gtc 22 阿里云精彩演讲锁定攻略!

1. 点击访问 gtc 22 凯发k8国际手机app下载官网 https://www.nvidia.cn/gtc-global/?ncid=gtc-nvmaggiej
2. 注册 gtc 22
3. 登录后可将会议添加至会议日程如下图
4. 开始后登录即可观看会议,若错过直播时间,可登录查看会议点播,随时观看会议


扫描下方海报二维码,即刻注册 gtc 22,了解阿里云关于推理优化/部署、深度学习编译器、大模型部署、训练优化、云游戏等主题的精彩分享。




标签ad报错:该广告id(20)不存在。

文章评论

")); document.write(unescape("")); } // 引入jquery开关,下面这行代码请勿删除! console.log('ey_is_jquery');
加载中~
网站地图