零样本学习是指仅通过描述让AI“认出”未见过的物体,是评价模型泛化能力的重要指标。多模态预训练模型CLIP 作为零样本学习基础模型,广受业界认可。
智源视觉团队于2023年初发布的 EVA-CLIP 5B 版本, 创造了零样本学习性能新高度:超越此前最强的 OpenCLIP 模型,在 ImageNet1K 零样本 top1 达到最高的 82.0% 准确率。