1. 负责深度学习中前向推理计算框架在CPU、GPU、NPU、DSP等平台上的实现与优化;
2. 负责根据不同平台下的体系结构的特点进行深度学习网络的选择、优化与落地。
1. 精通C/C++开发语言,熟悉常用的算法、数据结构、设计模式,掌握算法复杂度分析的基础知识;
2. 熟悉CPU/GPU/DSP的并行计算原理与硬件架构,了解架构中资源的调度、应用的执行性能与瓶颈分析,设计优化的实现方案;
3. 熟悉NEON、CUDA、OpenCL中的至少一种,对上述语言有实际的并行计算开发经验者优先;
4. 熟悉Caffe、Tensorflow等深度学习框架,有深度学习相关的项目经验者优先;
5. 熟悉嵌入式系统开发,具有嵌入式算法实现与优化经验者优先;
6. 对异构计算有一定了解,对深度学习的性能优化有激情和浓厚的兴趣。