APP下载 微博 微信

Hao4K影音

首页书籍资料声学书籍通信声学_[德]J.布劳尔特
小uu

文档

47

关注

0

好评

0
PDF

通信声学_[德]J.布劳尔特

阅读 51 下载 0 大小 47.63M 总页数 349 页 2023-03-11 分享
价格: 500 H币
下载文档
/ 349
全屏查看
通信声学_[德]J.布劳尔特
还有 349 页未读 ,您可以 继续阅读 或 下载文档
1、本文档共计 349 页,下载后文档不带水印,支持完整阅读内容或进行编辑。
2、当您付费下载文档后,您只拥有了使用权限,并不意味着购买了版权,文档只能用于自身使用,不得用于其他商业用途(如 [转卖]进行直接盈利或[编辑后售卖]进行间接盈利)。
3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。
4、如文档内容存在违规,或者侵犯商业秘密、侵犯著作权等,请点击“违规举报”。
通信声学成为可能,是由于真空三极管的发明和“微弱电流”的放大成为了现实。因此,在1920年以后的几年中,声学的发展极为迅猛,除了纯粹的物理和听觉感知外,电子工程也成为该系统的一部分,而且产生了该领域的新名称,也就是“电声学”。创建了很多研究设施,还充实了一些有能力的教师,在德国如HBakhausen,W.Reichardt,,E.Meyer,.L.Cremer和V.Aschoff教授。此外,计算机在这个领域的应用给予通信声学的发展以实质上的促进。位于美国新泽西州萨米特市的贝尔实验室是在这方面做出了先驱工作的杰出实验室,而M.Schroeder66在1968年的演讲,打开了这个领域中很多视野。数字信号处理是通信声学不可或缺的部分。事实上,如果没有数字信号处理,通信声学儿乎所有的现代应用都是不可想象的31,4,52。因此,通信声学已经成为与现代技术有关的一个分支。由于各种源于通信声学的技术都可以被认为是许多先进应用实质上的“使能技术”,所以计算机对通信声学的促进作用变得特别明显。例如,语音技术、双耳技术、感觉编码、音频工程、环绕声和听觉虚拟环境都是这样的使能技术。最近几年来,有一个趋势令人瞩目,需要人们透彻分析,因为这一趋势很有可能形成通信声学在未来几年的研究热点。这种趋势反映一个事实:现代的信息和通信系统将会包含越来越多的内置智能和知识,事实上,这种普遍的趋向特别适用于通信声学,而通信声学在这方面也有了显著的进展,如在语音技术中,可以把先进的语音识别和对话系统作为例子。新的算法将要沿着这条路线发展,而且将出现更多巧妙和新奇的应用。有充分的证据表明通信声学的研究领域将得到进一步扩展,而且将会对技术和社会产生更重要的影响。1.1.2通信技术的经典范例通信技术的传统主题是携带信息跨越时空的信号传输。一个传输系统通常由级联在一起的下列部分表示:①信息源;②编码器;③传输通道;④解码器;⑤信宿。通道可以包含存储器,并加入线性和/或非线性失真和/或噪声。种类似的普遍结构广泛应用于通信声学的传输中,特别是常说的音频传输。这里的目的是把声音信号从空间上和/或时间上的某一点传输到另一点,在两种场合下的听觉感知彼此一致。在这点上,最严格的任务是“真实”再现,即要使收听者在回放端听到和传输链记录端同样的声音。达到真实再现的一个可能的方法是由双耳技术给出的2!,它试图在收听者两耳的人口,真实地再现声音信号。这样就提供了足以使感觉真实的所有的声音线索。这样的双耳传输系统在图1.1中给出。系统的输入信号从真人的耳道拾取,或者从装在人头复制品(所谓的人工头或人头模型)上的传声器拾取,在这里用耳机完成回放,扬声器技术也可用于实现这个目的。第1章听觉场景的分析和合成存储器信号处理判断理解评价真头或哑头真头图1.1双耳传输系统示意图为了可靠地再现耳信号,很显然需要均衡,例如,校正传声器或耳机加入的失真。如果要求录音存储,则系统中必须有存储器。事实上,我们看到的几乎所有的现代音频传输系统都有相当高的计算能力,即使你看一下某种标准的音响设备,如调音台,你也很可能发现里面有一台“计算机”。1.1.3经典传输链的分离观察图11,请考虑接收端收听者的作用。收听者,也就是信息理论术语中的信宿,要做一些如收听和分析他们的听觉事件,描述它们并对它们分类,评价它们并对它们加以判断。好的引导甚至能够使他们提供听到情况的定量描述,从而提供听觉场景的参数表示。在任何情况下,计算能力都是必须的,无论这些收听者所产生的问题是否能够很好地用计算机执行,回答总是肯定的,而且,这的确是完成多种任务时经常遇到的情况,如语音识别系统和声音的品质(质量)评价。这种系统的功能用更普遍的术语来说,称为“听觉场景分析”(ASA)。图1.2(a)表示相应的方框图。在分析侧所要实现的当然也就是合成侧试图要实现的。这里的重点是要对收听者的耳朵产生声音输入信号,用这样的方法,收听者用预先描述的方法接收到一个听觉事件。例如,听觉场景,这里的各种要素都是被控参数。这样的“听觉场景”称为“听觉虚拟环境”(AVE),而产生它们的系统就称为虚拟环境发生器。图1.2(b)给出了解释这一概念的方框图。存储器存储器信号处理参量输出参量输入信号处理(a)(b)图1.2表示从图1.1中的方框图分离得到的示意图。(a)“听觉场景分析”系统(ASA);(b)“听觉虚拟环境”产生系统(AVE)通信声学一个ASA系统和一个AVE系统,当它们级联的时候,能够形成一个参数传输系统。ASA系统会分析听觉场景并把它们表示为一组参数描述符。这些参数集传输到合成侧,AVE系统会重新合成在录音端所表现的听觉场景。参数传输系统已经广泛地用在通信声学中。作为一个例子,对于目前技术能够达到的这样一种复杂系统,人们可以想象如下:一个语音识别系统产生一个表示语音音位的标音,也就是在记录端所说的标音字母表,这是一个简单的ASA的例子。然后标音串传输到语音合成系统,它重新合成口头语音,这是一个简单的AVE发生器的例子。顺便说一下,对于标准速度的语音,标音串的传输速度能够低到50btUs。研究已经表明:这大致相当于人脑意识处理的比特率,关于这个题目重要的早期工作见文献[43]。下面将分别讨论ASA系统和AVE系统。很明显,两种系统都具有一个共同的趋向,也就是说,它们要求的内置智能和知识越多,它们就越复杂。1.2听觉场景分析人们对于听觉场景分析有重要的技术要求,所以,这个领域是现在国际研究中重要的、有代表性的领域。其中,重要的应用范围是声源识别和声源定位系统。特别是在多声源、噪声或混响等不利声学环境下,例如,基于声学上的监视和导航,还有分离同时存在多个声源的系统,即通常所说的“鸡尾酒会处理器”,它作为助听器或鲁棒的语音识别器的前端是很重要的。对于听觉识别和评价任务的建模,开始时用一个听觉场景分析器是可取的,甚至是很必要的。例如,在建筑声学中,或者在语音和产品声音的评价系统中,听觉场景分析器用作分析系统。在这方面,通常所说的“内容滤波器”也值得一提。这些滤波器很适用于音像节目材料的自动存档和检索任务。在这些任务中,可用来分析这些材料的内容和进行编码,与ISO/IEC481建议的MPEG-7编码有许多相同之处。就ASA系统用人的听觉信号处理作为原型而言,它们的结构或多或少依据了图1.3中给出的结构。还必须注意到:有些方法并不是直接由生物类推法而来的,如由电子学控制的传声器阵列或盲源分离算法。下面的讨论限于双耳信号处理的基本思想(参见文献[13)。双耳系统有两个前置端口,它从人或假人头的左右耳获取信号作为输人,有关信号处理步骤如下,在模拟中耳某些不规则带通滤波器之后,两路耳信号送到内耳模型,也就是耳蜗模型。在这里执行下面的操作:首先信号分解为适合耳的频谱分量,称为临界频带分量。然后跟着一个消费电子学上被称为“自动音量控制”的部件,换句话说,就是类似压缩的处理。通过带通滤波器和压缩后的信号,最后由内耳转换为表示神经活动性的信号。人们称这一过程为一种特殊的AD转换。这种第1章听觉场景的分析和合成5双耳活性显示单耳耳间声级差估计单耳处理器处理器耳间到达时差估计耳蜗模块耳蜗模块中耳模块中耳模块外耳模块图1.3双耳信号处理模型的基本结构(请注意,处理严格地由信号驱动,是自下而上的方向)转换是针对于两个耳蜗中的每一个临界频带进行的,也就是对于左右两只耳朵都要分别执行的。这组输出信号由于模型的概念不同在特性上也有所差别。例如,它可以是一组离散的脉冲串,也就是具有可变速率的神经放电时间序列,也可以是描述这些序列的时间函数。在下一步中,两组耳蜗输出信号馈送到双耳接收信号的模块中。这个“双耳”模块分析内耳之间到达的时间差别,即在每一个临界频带内左耳和右耳信号之间的差别。这些计算所用的算法,通常是在每一频谱区域估计内耳之间的互相关函数,如把内耳间的一致性作为内耳之间到达时间差的函数32。在互相关函数中,从不相关声源获得的多个声信号将引起多个峰值。这些峰值能够由对比增强程序得以加强,如通常所说的“对侧抑制”4。除了别的特征以外,需要相关函数峰值的位置和形式所给出的信息,以识别个别声源和它们在空间的侧向位置。除了分析内耳到达时间的差值外,通常也要做内耳声级差的分析。例如,这种分析结果能够使用一个有效方法去修正互相关分析的结果,以便得到更精确的声源定位。当然,也必须考虑我们只用一只耳去听的情况,所以附加的单耳模块经常要加到这个模块中。
文档评分
    请如实的对该文档进行评分
  • 0
发表评论