包含"ViT架构"标签的文章

头条

从几个补丁中重建完整图像

Mae是一种自监督学习方法，这意味着它没有预先标记的目标数据，而是在训练时利用输入数据，这种方法主要涉及遮蔽图像的75%的补丁，因此，在创建补丁，H，补丁大小，W，补丁大小，之后，其中H和W是图像的高度和宽度，我们遮蔽75%的补丁，只使用其余的补丁并将其输入到标准的ViT中，这里的主要目标是仅使用图...

2024-11-14 226

共1页 1条

联系我们

QQ号：***

微信号：***

工作日：9:30-18:30，节假日休息