HF Papers Archive

Echoes Over Time: Unlocking Length Generalization in Video-to-Audio Generation Models

Date: 2026-02-27Fetched: 2026-02-28T01:46:39.629701+00:00

Authors

Christian Simon, Masato Ishii, Wei-Yao Wang, Koichi Saito, Akio Hayakawa, Dongseok Shim, Zhi Zhong, Shuyang Cui, Shusuke Takahashi, Takashi Shibuya, Yuki Mitsufuji

Links

HF arXiv PDF

MMHNet通过整合分层方法和非因果Mamba实现从视频生成长音频，性能优于现有视频到音频方法。