#

audio-visual-event-localization

Here are 3 public repositories matching this topic...

ttengwang / Awesome_Long_Form_Video_Understanding

Awesome papers & datasets specifically focused on long-term videos.

video-representation-learning video-dataset dense-video-captioning video-grounding temporal-action-detection temporal-action-localization temporal-sentence-grounding audio-visual-event-localization long-term-video video-large-language-models video-llms

Updated Oct 9, 2025

jasongief / Mettle

[2025 TPAMI] Mettle: Meta-Token Learning for Memory-Efficient Audio-Visual Adaptation

audio-visual-segmentation audio-visual-video-parsing audio-visual-event-localization parameter-efficient-fine-tuning audio-visual-question-answering memory-efficient-fine-tuning

Updated Jan 3, 2026
Python

Huntersxsx / AVVP-Learning-List

Related papers about Weakly-supervised Audio-Visual Video Parsing (AVVP) & Audio-Visual Event Localization (AVE)

weakly-supervised-learning audio-visual-learning audio-visual-video-parsing audio-visual-event-localization

Updated Jun 11, 2024

Improve this page

Add a description, image, and links to the audio-visual-event-localization topic page so that developers can more easily learn about it.

Curate this topic

Add this topic to your repo

To associate your repository with the audio-visual-event-localization topic, visit your repo's landing page and select "manage topics."