• 当前位置:
  • 首页
  • >>
  • 标签_FeatureExtraction
  • >
    • 模型描述Vision Transformer(ViT)是一个transformer编码器模型(类似于BERT),以自监督方式预训练于一个大型图像集合(即ImageNet-1k),分辨率为224...
    • huggingface.co
    • 2025-05-06
    TOP