基本信息
文件名称:从扩展视觉分词器用于重建与生成中的经验 Learnings from Scaling Visual Tokenizers for Reconstruction and Generation.docx
文件大小:1.21 MB
总页数:46 页
更新时间:2025-02-09
总字数:约9.19万字
文档摘要

1

arXiv:2501.09755v1[cs.CV]

arXiv:2501.09755v1[cs.CV]16Jan2025

LearningsfromScalingVisualTokenizersforReconstructionandGeneration

PhilippeHansen-Estruch1,2,t,DavidYan2,Ching-YaoChung2,OrrZohar2,4,t,JialiangWang2,TingboHou2,TaoXu2,SriramVishwanath1,Peter