半精度和8bit量化的计算 #21

asurachqtan · 2017-07-25T07:17:12Z

您好！我看了您的代码，发现目前版本只支持半精度浮点和8bit量化的存储，但是没有提供这两种类型的计算。最近我也在做半精度浮点计算和8bit量化计算的工作，不知道您是否有提供半精度浮点和8bit量化计算的打算？

nihui · 2017-07-25T07:57:32Z

半精度计算现在的硬件还不支持，8bit实际只是量化存储，读出来还是单精度浮点数

asurachqtan · 2017-07-25T08:00:44Z

@nihui 我们目前想做的是计算转换为8bit来进行不知道精度损失会有多少正在实现中

qfdong · 2017-07-27T13:53:48Z

转换为8bit的网络，需要重新retraining一下可以提高model的精度，我也在做类似的工作，希望能多交流

ccJia · 2017-08-02T02:40:08Z

@qfdong 请问你们在做8bit的乘法的时候，溢出问题严重吗？怎么规避的？

qfdong · 2017-08-02T05:56:56Z

@ccJia 我们在做量化的时候，会统计每层的输入，输出，以及参数的最大值，会选取合适的bit数来保证没有溢出的现象发生，然而每一层的layer的计算过程中，的确有可能溢出，中间的乘法的结果是存储在int类型来避免溢出，你是在什么平台上开发？这个受限于指令集

ccJia · 2017-08-02T09:29:55Z

@qfdong 我是在V8上面搞的，我没有动态的划分BIT数，中间乘法也是转存了一下。

quietsmile · 2017-11-20T04:30:15Z

请问，8bit优化在armv7上(3516/3519)有加速空间么？@ccJia @qfdong @nihui

BUG1989 · 2017-11-20T04:32:40Z

理论上耗时缩减为原来的25%

nihui · 2018-01-04T10:44:08Z

move to #230

nihui closed this as completed Jan 4, 2018

This was referenced Oct 15, 2018

ncnn 支持多线程吗？ #609

Closed

googlenet在ncnn上的应用 #355

Closed

jiyinghui39 mentioned this issue Apr 9, 2020

ncnn::Convolution_arm::forward运行时crash #1601

Closed

jiefly mentioned this issue May 13, 2020

ndk-r16b conv1x1s1_sgemm_pack4_neon crash #1760

Closed

arnoldfychen mentioned this issue Sep 29, 2021

coredump happend in ncnn::destroy_gpu_instance() #3260

Open

liuguicen mentioned this issue Oct 29, 2021

ncnn运行模型在特定机型报错 #3316

Closed

zhu-zhaofei mentioned this issue Dec 19, 2021

PNNX is an open standard for PyTorch model interoperability #3262

Merged

gmagic10 mentioned this issue May 12, 2022

ncnn convolution_vulkan forward时候崩溃 #3782

Open

gsx1378 mentioned this issue Jan 15, 2024

是否支持在国产化电脑上部署ncnn呢？比如麒麟、统信 #5286

Open

ljdang mentioned this issue Mar 19, 2024

extract的时候出现crash #5381

Open

Provide feedback