图5描述了fpga方案的指令执行示意图。基于fpga平台设计的加速器,不需要如cpu一样经历if->id->exe->mem->wb固定的指令流水,其可以直接运行exe部分,因此fpga的运行效率更高;如果是fpga多指令执行,则如图6所示,随着执行单元的增加,指令的执行时间并不会有所增加。
比较上述cpu和fpga之间的方案,可以发现虽然cpu的主频时钟要比fpga更高,但是由于处理机制的问题,当指令执行的并行度提高到一定规模时,fpga的加速方案要比cpu更高效。但是基于fpga的加速方案其并行度并不能一味的增加,而需要受限于fpga本身的资源限制,因此设计者通常需要在性能与成本之间追求一个最优的平衡点满足自己设计的产品需要。