从扩展视觉分词器用于重建与生成中的经验 Learnings from Scaling Visual Tokenizers for Reconstruction and Generation.docx

基本信息

文件名称：从扩展视觉分词器用于重建与生成中的经验 Learnings from Scaling Visual Tokenizers for Reconstruction and Generation.docx

文件大小：1.21 MB

总页数：46 页

更新时间：2025-02-09

总字数：约9.19万字

文档摘要

arXiv:2501.09755v1[cs.CV]

arXiv:2501.09755v1[cs.CV]16Jan2025

LearningsfromScalingVisualTokenizersforReconstructionandGeneration

PhilippeHansen-Estruch1,2,t,DavidYan2,Ching-YaoChung2,OrrZohar2,4,t,JialiangWang2,TingboHou2,TaoXu2,SriramVishwanath1,Peter