Qin Zhou's picture

In a Training Loop 🔄

6 2

Qin Zhou

Matrix53

·

https://matrix53.github.io

AI & ML interests

Computer Vision, Diffusion Model, Video Generation

Recent Activity

authored a paper about 3 hours ago

ELBO-T2IAlign: A Generic ELBO-Based Method for Calibrating Pixel-level Text-Image Alignment in Diffusion Models

authored a paper about 3 hours ago

Diffusion Model is Secretly a Training-free Open Vocabulary Semantic Segmenter

upvoted a collection about 5 hours ago

View all activity

Organizations

None yet

Collections 1

Papers 2

arxiv:2506.09740

arxiv:2309.02773

spaces 1

Vietnamese Handwriting

Generate Vietnamese handwriting

models 0

None public yet

datasets 1

Matrix53/elbo-t2ialign

Updated Sep 14 • 20