reuse ConvNormActivation in some vision models #40431

SigureMo · 2022-03-10T20:07:58Z

PR types

Others

PR changes

Others

Describe

由于目前 paddle.vision.models 中很多模块中都单独实现了 ConvBNLayer 这一结构，因此我们完全可以将这一共有结构提取成一个单独的 Layer，此前在 #38653 中已经将该 Layer 提取到 paddle.vision.ops.ConvNormActivation，在本 PR 中将会在其余 5 个模型中复用该 Layer。

需要重构的网络如下：

inceptionv3.ConvBNLayer（1 个权重）
mobilenetv1.ConvBNLayer（1 个权重）
mobilenetv2.ConvBNLayer（无需更新权重）
~~resnext.ConvBNLayer（6 个权重）~~
shufflenetv2.ConvBNLayer（7 个权重）

其中 mobilenetv2 中 ConvBNLayer 与 ConvNormActivation 实现方式一致（nn.Sequential），因此无需更新权重，但其余模型权重均需更新。

resnext 将会在 #40588 修改，原因见下面的 comments

全部模型更新后均重新测试了 performance，均未发生下降的问题，测试详情见：https://aistudio.baidu.com/studio/project/partial/verify/3593768/f4038fdf8eb14cc698ca8dcccbcd363c

paddle-bot-old · 2022-03-10T20:08:02Z

Thanks for your contribution!
Please wait for the result of CI firstly. See Paddle CI Manual for details.

SigureMo · 2022-03-15T11:22:43Z

@LielinJiang

已经使用 ConvNormActivation 替换掉其他 vision models 的 ConvBNLayer～麻烦有空 review 下下～

SigureMo · 2022-03-15T11:27:59Z

@LielinJiang

另外，我发现 ResNeXt 能够直接通过复用 ResNet 网络结构实现（torchvision 和 keras 都是这么做的），只需在 ResNet 网络结构上稍作改动即可，这样可以避免再额外在 resnext.py 中实现一遍网络结构

这个问题是上次做 WideResNet 时发现的，之后的 Hackathon 闭门会时也有其他开发者提及，但当时已经合入因此未做改动，当时刚做 ResNeXt 时候考虑不全面非常抱歉，请问是否可以直接复用 ResNet 来重新实现 ResNeXt 呢？

不过如果改动的话，也会同时移除掉 ResNeXt 这个 Layer API，仅保留 resnext_xxxx 这样的工厂函数 API，API 参数也会稍有变动，而且整体与本 PR 没什么关系，我觉得重新开一个 PR 比较好。（由于非常简单，目前已经尝试在 #40588 中实现了下～）

如果这是合适的话，我在本 PR 里 revert 掉对 resnext.py 的改动，避免重复对 resnext.py 的改动与权重变更～否则就直接 close 掉那个 PR 啦～

LielinJiang · 2022-03-16T02:08:00Z

接口不变的情况下，resnext用更好的实现是鼓励的

SigureMo · 2022-03-18T08:48:42Z

emmm，应该做不到接口完全不变，目前 #40588 中的实现大概是这样的

原 API：

# resnet.py
ResNet(block, depth=50, width=64, num_classes=1000, with_pool=True)
resnet50(pretrained=False, **kwargs)
resnet101(pretrained=False, **kwargs)
resnet152(pretrained=False, **kwargs)
wide_resnet50_2(pretrained=False, **kwargs)
wide_resnet101_2(pretrained=False, **kwargs)

# resnext.py
ResNeXt(depth=50, cardinality=32, num_classes=1000, with_pool=True)
resnext50_32x4d(pretrained=False, **kwargs)
resnext101_32x4d(pretrained=False, **kwargs)
resnext152_32x4d(pretrained=False, **kwargs)
resnext50_64x4d(pretrained=False, **kwargs)
resnext101_64x4d(pretrained=False, **kwargs)
resnext152_64x4d(pretrained=False, **kwargs)

修改后的 API：

# resnet.py
ResNet(block, depth=50, groups=1, width_per_group=64, num_classes=1000, with_pool=True)
resnet50(pretrained=False, **kwargs)
resnet101(pretrained=False, **kwargs)
resnet152(pretrained=False, **kwargs)
wide_resnet50_2(pretrained=False, **kwargs)
wide_resnet101_2(pretrained=False, **kwargs)
resnext50_32x4d(pretrained=False, **kwargs)
resnext101_32x4d(pretrained=False, **kwargs)
resnext152_32x4d(pretrained=False, **kwargs)
resnext50_64x4d(pretrained=False, **kwargs)
resnext101_64x4d(pretrained=False, **kwargs)
resnext152_64x4d(pretrained=False, **kwargs)

整体 diff：

- ResNeXt(depth=50, cardinality=32, num_classes=1000, with_pool=True)
- ResNet(block, depth=50, width=64, num_classes=1000, with_pool=True)
+ ResNet(block, depth=50, groups=1, width_per_group=64, num_classes=1000, with_pool=True)

@LielinJiang 请问这是可以接受的嘛？

LielinJiang · 2022-03-18T08:59:43Z

看样子是可以统一的，ResNeXt(depth=50, cardinality=32, num_classes=1000, with_pool=True)这个就先保留，ResNet添加一个默认参数group，width这个参数不变，在文档中说明具体含义，这样是否可行

SigureMo · 2022-03-18T09:11:12Z

看样子是可以统一的，ResNeXt(depth=50, cardinality=32, num_classes=1000, with_pool=True)这个就先保留，ResNet添加一个默认参数group，width这个参数不变，在文档中说明具体含义，这样是否可行

嗯嗯，我可以尝试做一下，之前主要是考虑到现在 ResNeXt 在最新的 release(2.2.2) 里还没有发布，因此以为这个 API 无需做兼容性考虑。

我已经在本 PR revert 掉了 resnext 相关变动啦，有时间可以 review 下本 PR 嘛？

LielinJiang · 2022-03-18T09:17:29Z

好的。resnext没有发布，那就不考虑了，可以随意改动

SigureMo · 2022-03-18T09:18:55Z

好的。resnext没有发布，那就不考虑了，可以随意改动

好哒～明白啦～

SigureMo · 2022-03-22T07:20:30Z

@LielinJiang 唔，可以 review 下这个 PR 嘛，这个 PR 没有任何 API 变动，只是复用了下 ConvNormActivation，不过需要更新下权重～

paddle-bot-old · 2022-04-06T07:52:02Z

Sorry to inform you that 18b24a5's CIs have passed for more than 7 days. To prevent PR conflicts, you need to re-run all CIs manually.

SigureMo · 2022-04-11T08:21:47Z

@LielinJiang 抱歉前段时间有些事情没有回复，可以麻烦上传下权重嘛？

Model name	Weights
inception_v3	https://bj.bcebos.com/v1/ai-studio-online/37bdfacc03a3478d807287da1433c27c3b4cb5094aca4ff78e1738fa5ddd45c0
mobilenetv1_1.0	https://bj.bcebos.com/v1/ai-studio-online/e4780dbc69e44e88af956736840ecf31a74a91dcbff64ede8e311fffcd99b64f
shufflenet_v2_x0_25	https://bj.bcebos.com/v1/ai-studio-online/648cc351973b4233a016d158621a8e600568c6de97a14b469b2902676d939e6c
shufflenet_v2_x0_33	https://bj.bcebos.com/v1/ai-studio-online/df83b6202b784a72b8486936333da529fca22335189e4b9e88b3e0bc9b7597b8
shufflenet_v2_x0_5	https://bj.bcebos.com/v1/ai-studio-online/ac3e4a06a3714939bed412307bafcc19193beff575dc48548b47b34d9ccbb3d8
shufflenet_v2_x1_0	https://bj.bcebos.com/v1/ai-studio-online/a20dfea65c614e8baeb6530dc1c84c3004cf2a09a96348938d0a14da9412bc05
shufflenet_v2_x1_5	https://bj.bcebos.com/v1/ai-studio-online/d9f3eaf999d345c7bba7683bc6cc69d61881c3c37e45479bbf4dcf9ab132025d
shufflenet_v2_x2_0	https://bj.bcebos.com/v1/ai-studio-online/653d1228c8ca4274984d341111d0254fecdbf0954cfe4f85bc4bddd9545912e4
shufflenet_v2_swish	https://bj.bcebos.com/v1/ai-studio-online/cb7a029e746a423c9219d034c4dd834438945503157b4b41aa26f7cda62e1fc9

另外 PR #40588 中也有一些需要上传

Model name	Weights
resnext50_32x4d	https://bj.bcebos.com/v1/ai-studio-online/d416003b0c2442ba84b7f1d979f758eeb9e806c3bb30409598e74caa2d091fd2
resnext50_64x4d	https://bj.bcebos.com/v1/ai-studio-online/ab91153a5f424e2da776b4567db8aba38bb2a962e4ce4476a08a7759fc40f4bd
resnext101_32x4d	https://bj.bcebos.com/v1/ai-studio-online/3a05705f6b5a4cc88c372312eedf6f91510440dc1d0740d0ac08235dae17a187
resnext101_64x4d	https://bj.bcebos.com/v1/ai-studio-online/4a68929db53c48039df7888b65bf5f161a4683676cce40aa92c0b7777422c16f
resnext152_32x4d	https://bj.bcebos.com/v1/ai-studio-online/708c5de2dcc14180b8792bd2d756c357929c695f97fc4837baf925ca147f1289
resnext152_64x4d	https://bj.bcebos.com/v1/ai-studio-online/a393f016a6fa425b9b666c01fb64c54015b49d683cf84fc4af16b37786bd4d54

SigureMo · 2022-04-21T11:20:12Z

@LielinJiang 有时间上传下权重嘛 😂

LielinJiang · 2022-04-21T12:06:01Z

@LielinJiang 有时间上传下权重嘛 😂

SigureMo · 2022-04-21T12:09:20Z

@LielinJiang 有时间上传下权重嘛 😂

抱歉，邮件漏了。一下是上传的链接，需要确认一下正确性： paddle-hapi.bj.bcebos.com/models/inception_v3.pdparams paddle-hapi.bj.bcebos.com/models/mobilenetv1_1.0.pdparams paddle-hapi.bj.bcebos.com/models/shufflenet_v2_x0_25.pdparams paddle-hapi.bj.bcebos.com/models/shufflenet_v2_x0_25.pdparams paddle-hapi.bj.bcebos.com/models/shufflenet_v2_x0_25.pdparams paddle-hapi.bj.bcebos.com/models/shufflenet_v2_x0_25.pdparams paddle-hapi.bj.bcebos.com/models/shufflenet_v2_x0_25.pdparams paddle-hapi.bj.bcebos.com/models/shufflenet_v2_x0_25.pdparams paddle-hapi.bj.bcebos.com/models/shufflenet_v2_x0_25.pdparams

好哒～我检查下 hash，如果没问题就替换掉～

trigger CI trigger ci trigger ci

This reverts commit efa97dfcfc140ee964f84c2b0e20ca24e232d5e1.

XiaoguangHu01

LGTM

* reuse ConvNormActivation in some vision models

* reuse ConvNormActivation in some vision models (#40431) * reuse ConvNormActivation in some vision models * reimplement ResNeXt based on ResNet (#40588) * refactor resnext

SigureMo force-pushed the reuse-convnorm-layer branch from 2c5d534 to 40dff20 Compare March 11, 2022 17:26

SigureMo marked this pull request as ready for review March 14, 2022 03:26

SigureMo force-pushed the reuse-convnorm-layer branch 2 times, most recently from 235ce62 to ddac292 Compare March 15, 2022 09:00

LielinJiang previously approved these changes Mar 23, 2022

View reviewed changes

SigureMo added 3 commits April 21, 2022 20:18

update mobilenetv2

8eb0938

update inceptionv3

bb21fa0

fix mobilenetv2 docstring position and align to cn docs

252f311

SigureMo added 5 commits April 21, 2022 20:18

update mobilenet_v1

4bd3e4c

update resnext

8bc067d

update shufflenet_v2

3dee3f8

trigger CI trigger ci trigger ci

Revert "update resnext"

19be4d5

This reverts commit efa97dfcfc140ee964f84c2b0e20ca24e232d5e1.

rebase and update pretrained weights links

e90262b

SigureMo dismissed LielinJiang’s stale review via e90262b April 21, 2022 12:32

SigureMo force-pushed the reuse-convnorm-layer branch from 18b24a5 to e90262b Compare April 21, 2022 12:32

TCChenlong requested a review from LielinJiang April 22, 2022 04:48

LielinJiang approved these changes Apr 22, 2022

View reviewed changes

TCChenlong approved these changes Apr 22, 2022

View reviewed changes

XiaoguangHu01 approved these changes Apr 22, 2022

View reviewed changes

LielinJiang merged commit f6219dd into PaddlePaddle:develop Apr 22, 2022

SigureMo deleted the reuse-convnorm-layer branch April 23, 2022 07:23

TCChenlong mentioned this pull request Apr 25, 2022

reimplement ResNeXt based on ResNet #40588

Merged

SigureMo added a commit to cattidea/Paddle that referenced this pull request Apr 25, 2022

reuse ConvNormActivation in some vision models (PaddlePaddle#40431)

769e047

* reuse ConvNormActivation in some vision models

SigureMo mentioned this pull request Apr 25, 2022

[cherry-pick] refactor vision models #42252

Merged

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

reuse ConvNormActivation in some vision models #40431

reuse ConvNormActivation in some vision models #40431

SigureMo commented Mar 10, 2022 •

edited

Loading

paddle-bot-old bot commented Mar 10, 2022

SigureMo commented Mar 15, 2022

SigureMo commented Mar 15, 2022

LielinJiang commented Mar 16, 2022

SigureMo commented Mar 18, 2022

LielinJiang commented Mar 18, 2022

SigureMo commented Mar 18, 2022

LielinJiang commented Mar 18, 2022

SigureMo commented Mar 18, 2022

SigureMo commented Mar 22, 2022

paddle-bot-old bot commented Apr 6, 2022

SigureMo commented Apr 11, 2022

SigureMo commented Apr 21, 2022

LielinJiang commented Apr 21, 2022 •

edited

Loading

SigureMo commented Apr 21, 2022

XiaoguangHu01 left a comment

reuse ConvNormActivation in some vision models #40431

reuse ConvNormActivation in some vision models #40431

Conversation

SigureMo commented Mar 10, 2022 • edited Loading

PR types

PR changes

Describe

paddle-bot-old bot commented Mar 10, 2022

SigureMo commented Mar 15, 2022

SigureMo commented Mar 15, 2022

LielinJiang commented Mar 16, 2022

SigureMo commented Mar 18, 2022

LielinJiang commented Mar 18, 2022

SigureMo commented Mar 18, 2022

LielinJiang commented Mar 18, 2022

SigureMo commented Mar 18, 2022

SigureMo commented Mar 22, 2022

paddle-bot-old bot commented Apr 6, 2022

SigureMo commented Apr 11, 2022

SigureMo commented Apr 21, 2022

LielinJiang commented Apr 21, 2022 • edited Loading

SigureMo commented Apr 21, 2022

XiaoguangHu01 left a comment

Choose a reason for hiding this comment

SigureMo commented Mar 10, 2022 •

edited

Loading

LielinJiang commented Apr 21, 2022 •

edited

Loading