包含"ViT架构"标签的文章

  • 从几个 补丁 中重建完整图像

      Mae是一种自监督学习方法,这意味着它没有预先标记的目标数据,而是在训练时利用输入数据,这种方法主要涉及遮蔽图像的75%的补丁,因此,在创建补丁,H,补丁大小,W,补丁大小,之后,其中H和W是图像的高度和宽度,我们遮蔽75%的补丁,只使用其余的补丁并将其输入到标准的ViT中,这里的主要目标是仅使用图...

    2024-11-14 222

联系我们

QQ号:***

微信号:***

工作日:9:30-18:30,节假日休息