深度学习性能分析架构师
2018-01-17 16:15
169 查看
公司介绍:
NVIDIA-人工智能计算领域-从游戏到人工智能计算 实践证明,GPU 能够非常有效地解决计算机科学领域中一些极其复杂的问题。GPU 一开始用作模拟人类想象力的引擎,创造出视频游戏和好莱坞电影中令人惊叹的虚拟世界。如今,NVIDIA GPU 用于模拟人类智力,运行深度学习算法,并在能够感知和理解世界的计算机、机器人和自动驾驶汽车中发挥大脑的作用。NVIDIA 的“AI 计算公司”名头越来越为人所知。 Website: http://www.nvidia.cn/object/ai-computing-cn.html
Deep
Learning Performance Architect
工作职责:
针对架构和算法特征开发汇编级或者CUDA代码优化cuBlas、cuDNN、TensorRT的核心kernel;
针对未来GPU架构开发原型代码,推进下一代架构的设计和优化;
基本要求:
严谨的逻辑思维和分析能力较强编程能力(C/C++)、算法分析和实现
熟悉计算机体系结构 优先
有CUDA代码调优经验(或者SIMD等架构的调优经验) 优先
熟悉矩阵计算的优化和加速优先
工作地点:上海
新竹
Contact: sbai@nvidia.com or
Linkedin: https://www.linkedin.com/in/xuebai52/
相关文章推荐
- 深度学习框架性能对比分析
- 深度学习笔记:主成分分析(PCA)(1)——标准化、协方差、相关系数和协方差矩阵
- 深度学习笔记——情感分析
- 6本互联网技术畅销书免费送(数据分析、深度学习、编程语言)!
- [深度学习]Hinton DBN code 代码分析
- Tensorflow实战学习(四十四)【TF.Contrib组件,统计分布,Layer,性能分析器tfprof】
- Castle ActiveRecord学习实践(10):深度分析Schema Pitfals
- xhprof性能分析学习
- Linux桌面操作系统性能分析学习总结
- .NET学习笔记-2:C#中判断空字符串的4种方法性能比较与分析
- 从深度学习计算过程来分析深度学习工作站\服务器的硬件配置
- 【Java EE 学习 72 下】【数据采集系统第四天】【移动/复制页分析】【使用串行化技术实现深度复制】
- Amazon宣布将MXNet作为AWS的深度学习框架——貌似性能比tf高啊
- 数据结构 学习笔记(完):散列查找:散列(哈希)表,散列函数的构造,冲突处理,性能分析
- 深度学习性能提升的诀窍
- 情感计算是人机交互核心?谈深度学习在情感分析中的应用
- 性能场景设计深度分析
- 深度学习在时空大数据分析中的应用
- B树第末节学习(高度及性能分析)