Paper

PRVAE-VC2+: Improving PRVAE-VC2 Training With Time-Invariant and Time-Variant Data Augmentations
Shoma Kanno, Kou Tanaka, Hirokazu Kameoka, Takuhiro Kaneko, Yuto Kondo, Toshie Matsui

Audio Samples

Clean Input

Source Speaker: --> Target Speaker:

Source speech
Target speech (X)

Baseline vs. Proposed
B
P

Ablation study1
A1
A2
A3
A4
A5
A6

Ablation study2
BF
PF

Noisy Input