#

audio-language

Here are 8 public repositories matching this topic...

OFA-Sys / ONE-PEACE

A general representation model across vision, audio, language modalities. Paper: ONE-PEACE: Exploring One General Representation Model Toward Unlimited Modalities

representation-learning multimodal vision-and-language contrastive-loss vision-language vision-transformer foundation-models audio-language

Updated Oct 6, 2024
Python

CASIA-IVA-Lab / VAST

[NIPS2023] Code and Model for VAST: A Vision-Audio-Subtitle-Text Omni-Modality Foundation Model and Dataset

dataset vision-language audio-language multimodal-foundation-model cross-modality-pretraining vision-audio-subtitle-text

Updated Mar 14, 2024
Jupyter Notebook

Sreyan88 / GAMA

Code for the paper: GAMA: A Large Audio-Language Model with Advanced Audio Understanding and Complex Reasoning Abilities

audio dataset question-answering reasoning large-language-model audio-language multimodal-large-language-models

Updated Dec 5, 2024
Python

Peace-Equalizer-Apo

Debimbo / Peace-Equalizer-Apo

peace equalizer apo gui download sourceforge setup guide windows 11 audio configuration tutorial parametric sound boost profiles autoeq latest version 2026

peace audio-processing equalizer equalizers equalizer-apo parametric-equalizer audio-equalizer autoeq easyeffects audio-language eq-presets eq-plugins peace-eq

Updated Jun 4, 2026
TypeScript

Sreyan88 / CompA

Code for ICLR 2024 Paper: CompA: Addressing the Gap in Compositional Reasoning in Audio-Language Models

audio nlp benchmark ai ml compositionality retreival audio-language

Updated Jul 10, 2024
Python

abduays / v0-tamil-writing-app

Tamil learning and writing app for children with audio support, focused on simple input and clear pronunciation.

nextjs react-app tamil tailwindcss tamil-nadu education-app tamil-learning audio-language audio-learning tamil-app tamil-writing tamil-education

Updated Apr 14, 2026
TypeScript

Giuseppepointblank314 / peace-equalizer-APO

Configure audio settings on Windows using this graphical interface for the Equalizer APO system-wide parametric equalizer.

swift kubernetes elixir osx openedx docker-compose audio-effect realtime lms representation-learning audio-processing equalizer equalizer-apo parametric-equalizer foundation-models audio-language eq-presets

Updated Jun 6, 2026
TypeScript

pro6692abou / llm-audio

Provide Whisper-based audio transcription and translation with lightweight C++ libraries for easy integration into LLM projects.

text music-information-retrieval neural-networks speech-to-text text-to-image music-ai large-language-models foundational-models speech-ai vision-language-model audio-language large-vision-language-models large-audio-models speech-llms audio-understanding

Updated Jun 6, 2026
C++

Improve this page

Add a description, image, and links to the audio-language topic page so that developers can more easily learn about it.

Curate this topic

Add this topic to your repo

To associate your repository with the audio-language topic, visit your repo's landing page and select "manage topics."