高効率にニューラルネットワークを演算するためには,アルゴリズムを活かすハードウェアアーキテクチャだけでなく,ハードウェアアーキテクチャを意識したアルゴリズムも必要不可欠です.
量子化ニューラルネットワークは処理の複雑さと要求メモリ容量を落とすことができる一方で,量子化する際に発生する誤差によって認識精度が低下してしまいます.この低下してしまう認識精度を回復させる技術として,QER(Quantization Error based Regularization)を発表しました.量子化誤差に基づく正則化項を損失関数に加えて学習することで,重みの量子化誤差を減らします.この技術を使用すると,推論時間に影響を与えることなく認識精度を向上させることができます.