1.卷积和全连接层计算量FLOPs 2.带宽计算 3.峰值计算能力
HWC_in为特征图,K为卷积核
FLOPs=2HW(C_{in}K^2+1)C_{out}
I输入维度,O输出维度
FLOPs=(2I-1)O
GPU设备的单精度计算能力的理论峰值计算公式:
单精度计算能力的峰值 = 单核单周期计算次数 × 处理核个数 × 主频
以GTX680为例, 单核一个时钟周期单精度计算次数为两次,处理核个数 为1536, 主频为1006MHZ,那他的计算能力的峰值P 为
P = 2 × 1536 × 1006MHZ = 3.09TFLOPS
这里1MHZ = 1000000HZ, 1T为1兆,也就是说,GTX680每秒可以进行超过3兆次的单精度运算。