Chuanqiz’s blog

分类:机器学习

TVM autotune优化的算子配置

TVM 跑通TF 模型

0. 参考文献 官方文档 https://tvm.apache.o…

TensorFlow 源码编译

TensorFlow 源码编译构建 大型工程编译坑还是太多,这波先…

对于异构计算的几个优化点

计算掩盖IO的延迟 例如 像 transpose 这种访存相关的操…

Tensorflow – 切片 Slice

1/循环 取前N个元素,也就是索引为0-(N-1)的元素,可以用循…

Tensorflow 打包-pack

用于din_64.py Reference https://zhu…

Caffe环境的一些坑合集

Caffe install in alios7 官方教程 http…

Tensorflow Dump HLO dot图

DUMP HLO 和 NLO的dot图,便于查看XLA PASS间…

关于深度学习加速优化总结(一)

留坑代填

广告关键词

最近投入到搜索推荐相关业务加速中,记录一些常见的关键词。 CVR …

旧的 文章 »
Page 1 of 3