音素相关工具箱
音素相关的文本处理工具箱。
Librosa语音处理工具箱
语音处理包Librosa的java实现。
Java Sound声音工具箱
java常用声音工具箱。
ffmpeg音频工具箱
javacv ffmpeg音频工具箱。
NDArray 高级音频工具箱
Java NDArray 高级音频工具箱。
快速傅里叶变换(FFT)
快速傅里叶变换(FFT)的java实现。
语音活动检测
音语音活动检测(Voice Activity Detection,VAD)。
mel(梅尔)频谱提取
TacotronSTFT 提取mel(梅尔)频谱。
语音特征编码器提取特征向量
语音特征编码网络(encoder)提取说话者的语音特征。
生成文本基于目标音色的梅尔频谱图
Tacotron 2模型生成文本基于目标音色的梅尔频谱图。
文本转为语音
基于给定音色将文本转为语音。
中文语音识别【短语音】
基于DeepSpeech2模型实现中文语音识别。
中文语音识别【长语音】
VAD分割音频,基于DeepSpeech2模型实现中文语音识别。
声纹识别(VPR)
基于PaddlePaddle实现声纹识别模型。