-
Notifications
You must be signed in to change notification settings - Fork 4.2k
New issue
Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.
By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.
Already on GitHub? Sign in to your account
半精度和8bit量化的计算 #21
Comments
半精度计算现在的硬件还不支持,8bit实际只是量化存储,读出来还是单精度浮点数 |
@nihui 我们目前想做的是计算转换为8bit来进行 不知道精度损失会有多少 正在实现中 |
转换为8bit的网络,需要重新retraining一下可以提高model的精度,我也在做类似的工作,希望能多交流 |
@qfdong 请问你们在做8bit的乘法的时候,溢出问题严重吗?怎么规避的? |
@ccJia 我们在做量化的时候,会统计每层的输入,输出,以及参数的最大值,会选取合适的bit数来保证没有溢出的现象发生,然而每一层的layer的计算过程中,的确有可能溢出,中间的乘法的结果是存储在int类型来避免溢出,你是在什么平台上开发?这个受限于指令集 |
@qfdong 我是在V8上面搞的,我没有动态的划分BIT数,中间乘法也是转存了一下。 |
理论上耗时缩减为原来的25% |
move to #230 |
Closed
Sign up for free
to join this conversation on GitHub.
Already have an account?
Sign in to comment
您好!我看了您的代码,发现目前版本只支持半精度浮点和8bit量化的存储,但是没有提供这两种类型的计算。最近我也在做半精度浮点计算和8bit量化计算的工作,不知道您是否有提供半精度浮点和8bit量化计算的打算?
The text was updated successfully, but these errors were encountered: