-
Notifications
You must be signed in to change notification settings - Fork 14
New issue
Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.
By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.
Already on GitHub? Sign in to your account
关于用mmseg处理postsdam数据集的问题 #37
Comments
@1835969208 要裁剪和转换标签值,可能图像也要变成png方便读取,你不用mmseg来做数据处理也行,那就自己写脚本呗,这个数据集就没有裁剪好的啊,还得根据转换好的数据集标签类别顺序去修改相应的config,前提是你会改mmseg,不会改的话可能得学一下 |
感谢作者的帮助。我想自己写脚本进行数据的处理,跟您确定以下的几个要点。如果有什么不对的地方还请您能指出来。 |
@1835969208 在其他项目中,我们手动转换好了potsdam的标签,然后修改mmseg的config,完成了训练,不过其他人可能希望用mmseg自带的脚本去转换potsdam的标签,而mmseg官方脚本转换后的标签格式和顺序和我们手动转换好的有差异,因此其他人可能不能直接用我们的config,他们需要对config进行修改,其他的issue就是告诉他们该如何修改的,例如: ViTAE-Transformer/ViTAE-Transformer-Remote-Sensing#21 不过对于SAMRS这个项目文中的实验来说,可以不配置mmseg的config,因为我已经给出微调代码了,你只需要准备好具有正确标签格式的数据集就好了,SAMRS这个项目和其他项目的共通点是,采用了具有相同标签格式和顺序的potsdam数据集,所以我让你去看其他项目的issue,理解标签顺序与改代码之间的关系 数据处理的原因是,除了图像太大以外,原始的标签是RGB三通道图像,要转成单通道,不然没法训练,至于你·是手动处理转标签,还是根据mmseg自带的转换工具去做,都可以,裁剪当然裁剪成一般大小的了,尺寸和步长看你需求,如果用mmseg训练的话,就涉及到config,这个说不清楚,你去学一下mmseg吧,我在之前的issue里都说过了,你不了解mmseg的运行原理我再说也没用 |
感谢作者大人的帮助。我现在是在尝试用mmseg自带的tools/convert_dataset/potsdam.py对potsdam数据集进行处理,然后用您的微调代码进行训练。目前运行微调代码始终显示标签值超出了模型预期的类别范围。我认为是我用mmseg自带的tools/convert_dataset/potsdam.py对potsdam数据集进行处理是标签的格式和顺序不对。反复翻看往期issue,仍然不太明白,希望作者大人再讲解一下正确的标签顺序和格式,万分感谢 |
十分感谢作者大人一直以来对我的帮助,同时祝博主七夕节快乐。我也很高兴在今天复现这个项目的所有功能。之前再potsdam数据集的处理上面遇到很多的疑惑,最后都得到了解决。下面是我对potsdam数据集预处理的脚本,希望能帮助后面更多进来学习的研0宝宝。最后,再次对作者这段时间的耐心援助表达感谢。 #################使用方法说明######## import mmcv palette = { invert_palette = {v: k for k, v in palette.items()} def convert_from_color(arr_3d, palette=invert_palette):
def parse_args(): def clip_big_image(image_path, clip_save_dir, args, to_label=False):
def main():
if name == 'main': |
作者大人,我反复翻看往期issue,始终不太明白用mmseg处理postsdam数据集的目的以及作用。我已经按照readme完成了模型的预训练工作,需要用postsdam数据集对模型进行finetune。参照往期issue,我选用3_Ortho_IRRG.zip和5_Labels_all.zip。我去除了3_Ortho_IRRG.zip中所有的tfw文件,只保留了tif格式。同样,5_Labels_all.zip中也只保存了tif格式文件。然后整个文件夹的结构如下图所示。我不明白还需要用mmseg处理什么内容,是用mmseg进行训练吗?还是对图像进行裁剪(因为图像尺寸6000*6000太大的原因)?还有为什么不直接使用裁剪好的RGB图像呢。(小人实在是弄得有点迷糊了,希望博主能援助一下,完成整个项目后,我想录制一个从0复现整个项目的视频,希望对后面学习的同学有所帮助)。
The text was updated successfully, but these errors were encountered: