Dynamic-SUPERB

community

Activity Feed Request to join this org

AI & ML interests

None defined yet.

Recent Activity

kehanlu authored a paper 4 days ago

How Auditory Knowledge in LLM Backbones Shapes Audio Language Models: A Holistic Evaluation

kehanlu submitted a paper 4 days ago

How Auditory Knowledge in LLM Backbones Shapes Audio Language Models: A Holistic Evaluation

zenyn submitted a paper 9 days ago

Nudging Hidden States: Training-Free Model Steering for Chain-of-Thought Reasoning in Large Audio-Language Models

View all activity

authored a paper 4 days ago

How Auditory Knowledge in LLM Backbones Shapes Audio Language Models: A Holistic Evaluation

Paper • 2603.19195 • Published 17 days ago • 4

submitted a paper to Daily Papers 4 days ago

How Auditory Knowledge in LLM Backbones Shapes Audio Language Models: A Holistic Evaluation

Paper • 2603.19195 • Published 17 days ago • 4

submitted a paper to Daily Papers 9 days ago

Nudging Hidden States: Training-Free Model Steering for Chain-of-Thought Reasoning in Large Audio-Language Models

Paper • 2603.14636 • Published 20 days ago • 4

authored 3 papers 9 days ago

A Preliminary Exploration with GPT-4o Voice Mode

Paper • 2502.09940 • Published Feb 14, 2025

MUGEN: Evaluating and Improving Multi-audio Understanding of Large Audio-Language Models

Paper • 2603.09714 • Published 26 days ago

Nudging Hidden States: Training-Free Model Steering for Chain-of-Thought Reasoning in Large Audio-Language Models

Paper • 2603.14636 • Published 20 days ago • 4

authored 2 papers about 2 months ago

BioME: A Resource-Efficient Bioacoustic Foundational Model for IoT Applications

Paper • 2602.09970 • Published Feb 10 • 1

RobustDistiller: Compressing Universal Speech Representations for Enhanced Environment Robustness

Paper • 2302.09437 • Published Feb 18, 2023

authored 5 papers 2 months ago

Wav2Gloss: Generating Interlinear Glossed Text from Speech

Paper • 2403.13169 • Published Mar 19, 2024

TiDAL: Learning Training Dynamics for Active Learning

Paper • 2210.06788 • Published Oct 13, 2022

On the Effects of Heterogeneous Data Sources on Speech-to-Text Foundation Models

Paper • 2406.09282 • Published Jun 13, 2024

ESPnet-EZ: Python-only ESPnet for Easy Fine-tuning and Integration

Paper • 2409.09506 • Published Sep 14, 2024 • 4

Dynamic-SUPERB Phase-2: A Collaboratively Expanding Benchmark for Measuring the Capabilities of Spoken Language Models with 180 Tasks

Paper • 2411.05361 • Published Nov 8, 2024 • 5

authored a paper 2 months ago

Dynamic-SUPERB Phase-2: A Collaboratively Expanding Benchmark for Measuring the Capabilities of Spoken Language Models with 180 Tasks

Paper • 2411.05361 • Published Nov 8, 2024 • 5

authored 2 papers 2 months ago

OpenBEATs: A Fully Open-Source General-Purpose Audio Encoder

Paper • 2507.14129 • Published Jul 18, 2025 • 11

POWSM: A Phonetic Open Whisper-Style Speech Foundation Model

Paper • 2510.24992 • Published Oct 28, 2025 • 4

authored a paper 2 months ago

POWSM: A Phonetic Open Whisper-Style Speech Foundation Model

Paper • 2510.24992 • Published Oct 28, 2025 • 4

authored a paper 2 months ago

PRiSM: Benchmarking Phone Realization in Speech Models

Paper • 2601.14046 • Published Jan 20 • 7

authored a paper 2 months ago

PRiSM: Benchmarking Phone Realization in Speech Models

Paper • 2601.14046 • Published Jan 20 • 7

authored a paper 2 months ago

PRiSM: Benchmarking Phone Realization in Speech Models

Paper • 2601.14046 • Published Jan 20 • 7