Audio Visual Communication Diagram

Audio-Visual Target Speaker Extraction With Selective Auditory Attention

Abstract: Audio-visual target speaker extraction (AV-TSE) aims to extract the specific person's speech from the audio mixture given auxiliary visual cues. Previous methods usually search for the ...

IEEE

Reliable Multimodal Semantic Communication for Audio-Visual Event Localization

Abstract: The widespread adoption of smart mobile devices and applications has driven an exponential growth in wireless data traffic, posing significant challenges to modern communication systems.

GitHub

Audio-Visual Instance Segmentation

In this paper, we propose a new multi-modal task, termed audio-visual instance segmentation (AVIS), which aims to simultaneously identify, segment and track individual sounding object instances in ...

Some results have been hidden because they may be inaccessible to you

Show inaccessible results

Audio-Visual Target Speaker Extraction With Selective Auditory Attention

Reliable Multimodal Semantic Communication for Audio-Visual Event Localization

Audio-Visual Instance Segmentation

Trending now