PolyU-VCLab

Welcome to the Visual Computing Lab at HK PolyU 👋

The Visual Computing Lab at The Hong Kong Polytechnic University, led by Prof. Lei Zhang, works on image/video restoration and quality assessment, multimodal perception and reasoning, image/video synthesis, 3D perception and generation, efficient architectures and training, as well as benchmarks and datasets.

Here we share our projects, code, models, benchmarks, datasets, and demos.

𝕏 X • 🤗 Hugging Face • 📕 Xiaohongshu

🔥 Research Areas and Representative Works

🖼️ Image / Video Restoration, Enhancement and Quality Assessment

Real-world image and video restoration, enhancement, super-resolution, and perceptual quality assessment.

2026

VOSR (CVPR 2026) — Paper | Code
GDPO-SR (CVPR 2026) — Paper | Code
Flickerformer (CVPR 2026) -Paper | Code
RASS (IJCV 2026) — Paper | Code

2025

NSARM (preprint) — Paper | Code
CCSR: (TIP 2025) - Paper | Code
InstructRestore (NeurIPS 2025) — Paper | Code | HF Paper
VisualQuality-R1 (NeurIPS 2025) — Paper | Code
DP²O-SR (NeurIPS 2025) — Paper | Code
DLoRAL (NeurIPS 2025) — Paper | Code
PURE (ICCV 2025) — Paper | Code | HF Paper
TVT (ICCV 2025) — Paper | Code
GSASR (ICCV 2025) — Paper | Code | HF Paper
A-FINE (CVPR 2025) — Paper | Code
PiSA-SR (CVPR 2025) — Paper | Code

2024

OSEDiff (NeurIPS 2024) — Paper | Code
EA-Adam (TIP 2024) — Paper | Code | HF Paper
SSL (ACM MM 2024) — Paper | Code | HF Paper
PASD (ECCV 2024) — Paper | Code
MGLD (ECCV 2024) — Paper | Code
SeeSR (CVPR 2024) — Paper | Code
TMP (TIP 2024) — Paper | Code | HF Paper

2023

Joint-HDRDN (CVPR 2023) — Paper | Code
HGGT (CVPR 2023) — Paper | Code
TPGSR (TIP 2023) — Paper | Code

2022

ELAN (ECCV 2022) — Paper | Code
DASR (ECCV 2022) — Paper | Code
UDKE (ECCV 2022) — Paper | Code
LDL (CVPR 2022) — Paper | Code
TATT (CVPR 2022) — Paper | Code
Image-Adaptive-3DLUT (TPAMI 2022) — Paper | Code

2021

ECBSR (ACM MM 2021) — Paper | Code
DCDicL (CVPR 2021) — Paper | Code
LPTN (CVPR 2021) — Paper | Code

2020

DML (ACCV 2020) — Paper | Code
BDNet (ECCV 2020) — Paper | Code
MDLCC (CVPR 2020) — Paper | Code

2019

VDNet (NeurIPS 2019) — Paper | Code
DPSR (CVPR 2019) — Paper | Code
CBDNet (CVPR 2019) — Paper | Code
SAN (CVPR 2019) — Paper | Code

2018

SRMD (CVPR 2018) — Paper | Code
FFDNet (TIP 2018) — Paper | Code
SICE (TIP 2018) — Paper | Code

2017

IRCNN (CVPR 2017) — Paper | Code
DnCNN (TIP 2017) — Paper | Code

🤖 Multimodal Perception, Understanding and Reasoning

MLLM-based visual perception, grounding, OOD detection, dense understanding, and multimodal reasoning.

2026

VideoITG (CVPR 2026) — Paper | Code
ANTS (CVPR 2026) — Paper | Code

2025

TokenPacker (IJCV 2025) — Paper | Code

2024

AdaNeg (NeurIPS 2024) — Paper | Code
LAPT (ECCV 2024) — Paper | Code
Osprey (CVPR 2024) — Paper | Code
DMN (CVPR 2024) — Paper | Code

🎨 Image and Video Synthesis and Generation

Efficient, controllable, and high-quality generative models for image synthesis, editing, and video generation.

2026

Memorize When Needed (arXiv 2026) — Paper | Code | HF Model | HF Paper
DP-DMD (ICML 2026) — Paper | Code
CoCoEdit (ICML 2026) — Paper | Code
Hybrid Forcing (preprint) — Paper / Code coming soon
Many-for-Many (ICLR 2026) - Paper | Code

2025

DNAEdit (NeurIPS 2025) — Paper | Code
GPSToken (NeurIPS 2025) — Paper | Code
InsViE-1M (ICCV 2025) — Paper | Code
RORem (CVPR 2025) — Paper | Code
FreCaS (ICLR 2025) — Paper | Code

2024

SPDInv (ECCV 2024) — Paper | Code

2023

ELITE (ICCV 2023) — Paper | Code

2022

EFDM (ECCV 2022) — Paper | Code

🌍 3D Perception, Reconstruction and Generation

3D reconstruction, scene generation, and versatile 3D editing from images, videos, and language prompts.

2026

Omni-3DEdit (CVPR 2026) — Paper | Code
Photo3D (CVPR 2026) — Paper | Code
One2Scene (ICLR 2026) — Paper | Code
ViP3DE (AAAI 2026) — Paper | Code
BEVDilation (AAAI 2026) — Paper | Code
AlignCVC (AAAI 2026) — Paper | Code

2025

TriplaneTurbo (CVPR 2025) — Paper | Code | HF Paper
SyncNoise (AAAI 2025) — Paper | Code

2024

ScaleDreamer (ECCV 2024) — Paper | Code | HF Paper
DMA (ECCV 2024) — Paper | Code
GGSD (ECCV 2024) — Paper | Code
GGA (ECCV 2024) — Paper | Code
ScatterFormer (ECCV 2024) — Paper | Code

2023

MSF (CVPR 2023) — Paper | Code
OTAvatar (CVPR 2023) — Paper | Code

⚡ Architecture and Training Paradigms

New model architectures and efficient training paradigms for vision models, diffusion transformers, LLMs, and VLMs.

2026

SPES (preprint) — Paper | Code
Self-transcendence (preprint) - Paper | Code
BinaryAttention (CVPR 2026) — Paper | Code

2025

Spatial-Mamba (ICLR 2025) — Paper | Code

2024

Voxel Mamba (NeurIPS 2024) — Paper | Code
UniVS (CVPR 2024) — Paper | Code

2023

Point2Mask (ICCV 2023) — Paper | Code
SAGM (CVPR 2023) — Paper | Code

2022

boxlevelset (ECCV 2022) — Paper | Code
VoxSeT (CVPR 2022) — Paper | Code
Image-Adaptive-YOLO (AAAI 2022) — Paper | Code

2020

Gradient Centralization (ECCV 2020) — Paper | Code
SA-SSD (CVPR 2020) — Paper | Code

2018

STRCF (CVPR 2018) — Paper | Code

📊 Benchmarks and Datasets

Benchmarks and datasets for rigorous evaluation and reproducible progress in visual computing.

2026

TIIF-Bench (preprint) — Paper | Code
VideoVerse (preprint) — Paper | Code
MICo-150K (CVPR 2026) — Paper | Code

2023

Real-CE (ICCV 2023) — Paper | Code

2021

RealVSR (ICCV 2021) — Paper | Code

2019

RealSR (ICCV 2019) — Paper | Code

📚 More

For a broader list of our papers, models, and datasets, please visit our Hugging Face Collections.

If you are interested in our work, welcome to follow the organization and star our repositories ⭐

Uh oh!

Uh oh!

Welcome to the Visual Computing Lab at HK PolyU 👋

🔥 Research Areas and Representative Works

2026

2025

2024

2023

2022

2021

2020

2019

2018

2017

2026

2025

2024

2026

2025

2024

2023

2022

2026

2025

2024

2023

2026

2025

2024

2023

2022

2020

2018

2026

2023

2021

2019

📚 More

Popular repositories Loading

Repositories

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

People

Top languages

Uh oh!

Most used topics

Uh oh!