What are the problems?(screenshots or detailed error messages) <a

Segmentation fault at ppl::nn::x86::X86Kernel::DumpOutputTensors about ppl.nn HOT 5 CLOSED

111qqz commented on July 18, 2024

Segmentation fault at ppl::nn::x86::X86Kernel::DumpOutputTensors

from ppl.nn.

Comments (5)

Alcanderian commented on July 18, 2024 1

如果没有开启dump也出现了dump的文件的话，就要检查一下是否有内存越界把config改掉了

之前有多的图片反映到还有别的地方报错，恐怕是真的越界了

建议追踪一下enable_tensor_debug所在的内存有没有被修改到

from ppl.nn.

Alcanderian commented on July 18, 2024

出现这个错误可能是因为这些模型的Tensor名字和大小都相同，Dump接口同时写入这个文件导致冲突
Dump文件的命名规则https://github.com/openppl-public/ppl.nn/blob/master/src/ppl/nn/engines/x86/kernel.cc#L79

DumpDebugTensor一般只建议在单模型debug中间tensor的时候使用

先排查出输出错误的模型
dump出模型相应的输入输出数据
使用DumpDebugTensor检查具体在那一层出错

如果要在多模型的情况下使用，建议通过Configure选项x86::ENGINE_CONF_DEBUG_DATA_DIR使不同模型的Tensor输出到不同的文件夹中（记得先新建文件夹）
不然模型之间的Tensor文件名字很容易冲突

from ppl.nn.

111qqz commented on July 18, 2024

感谢回答！我的所有模型的Tensor名字和大小确实是相同的
DumpDebugTensor这个功能是通过 ENGINE_CONF_TENSOR_DEBUG 来控制的吗？
我没有手动开启这个选项，在某个地方的文档看这个功能是默认关闭的

不过我看了下代码
https://github.com/openppl-public/ppl.nn/blob/master/include/ppl/nn/engines/x86/options.h#L43

似乎注释和代码出现了不一致的情况

我手动关掉这个设置试试

from ppl.nn.

Alcanderian commented on July 18, 2024

感谢回答！我的所有模型的Tensor名字和大小确实是相同的 DumpDebugTensor这个功能是通过 ENGINE_CONF_TENSOR_DEBUG 来控制的吗？我没有手动开启这个选项，在某个地方的文档看这个功能是默认关闭的

不过我看了下代码 https://github.com/openppl-public/ppl.nn/blob/master/include/ppl/nn/engines/x86/options.h#L43

似乎注释和代码出现了不一致的情况

我手动关掉这个设置试试

这里的1指的使CONF的编号，并不是开关

默认关闭是在这里https://github.com/openppl-public/ppl.nn/blob/master/src/ppl/nn/engines/x86/engine_config.h#L27

from ppl.nn.

111qqz commented on July 18, 2024

确实默认关闭了，眼滑看错了...
之前贴的另一张图是挂在ppt::common的 BufferInfo了。我就提到pplcommon的仓库里了
那个错误应该是我没保证ppl::nn::engine的生命周期导致的,已经fix了
目前看fix后， core在 ppl::nn::x86::X86Kernel::DumpOutputTensors 的问题也没有继续出现了。

感谢解答！

from ppl.nn.

Segmentation fault at ppl::nn::x86::X86Kernel::DumpOutputTensors about ppl.nn HOT 5 CLOSED

Comments (5)

Related Issues (20)

Recommend Projects

React

Vue.js

Typescript

TensorFlow

Django

Laravel

D3

Recommend Topics

javascript

web

server

Machine learning

Visualization

Game

Recommend Org

Facebook

Microsoft

Google

Alibaba

D3

Tencent