基本信息
文件名称:多媒体信息处理Multimedia Lecture 10-2024 Audio 音频处理-20240424.pptx
文件大小:17.44 MB
总页数:76 页
更新时间:2025-05-26
总字数:约小于1千字
文档摘要

PowerPoint演示文稿;Lecture10Cont;文本处理发展里程碑;Transformer中的注意;Transformer中的注意;多头注意力的具体实现方式;Transformer-编码;Transformer位置偏;Transformer位置编;ChatGPT;AudioandSound;语音:声带的声音;频率计算公式;Homework08(Le;Homework08(Le;Homework08(Le;Lecture10Cont;钢琴频率分布;音乐家与乐器音域分布;等响曲线(EqualLoud;Q1:虽然我们的语音频率通常在;婴儿哭声的频率;音频特性3:波形;音频特性4:速度;Lecture10Cont;语音处理发展里程碑;里程碑1之音频特征分析;音频语音信号特征分析;语音特征分析与MFCC;语音数字化之采样、量化和编码;语音数字化之采样、量化和编码;采样误差-混叠Alias;混叠-“幽灵”信号;Nyquist奈奎斯特采样理;Quantization量化误;量化误差-SQNR;信噪比(SNR);声压级分贝(dB);脉冲编码调制PulseCo;DifferentialPC;Q2:为什么我们经常使用差分脉;DPCM;语音特征分析与MFCC;梅尔频率;梅尔频率计算公式;Mel滤波器组Filter;作业11;语音特征分析与MFCC;里程碑1之MFCC;梅尔频率倒谱系数;倒谱的数学公式;倒谱;Q3:为什么我们在MFCC中使;倒谱与语音信号处理;使用倒谱来获取频谱包络以方便语;Q4:为什么我们在MFCC中;梅尔频率倒谱;Mel频率倒谱系数;梅尔频率倒谱系数MFCC4步;基于MFCC的ASR自动语音识;Lecture10Cont;语音处理发展里程碑;里程碑2:语音识别之HMM;语音识别;语音识别的发展;语音识别的发展;马尔可夫模型;隐马尔可夫模型;隐马尔可夫模型-例;隐马尔可夫模型-例;隐马尔可夫模型-例;隐马尔可夫模型;HMM用于孤立字词语音识别;总结:语音处理发展里程碑;作业11;PowerPoint演示文稿