智能手机中的音频设计

分享到:

当手机不断地整合包括照相、游戏、数据、视频等各种功能于一身时,它已摇身变成一个多媒体应用的播放平台,可说是朝细致而微的随身型迷你计算机发展。在定位上,这样的手机有别于既有的纯粹语音的手机(Voice phone)或具备某些功能的手机(Feature phone),而当属于智能型手机(Smart phone)。

智能型手机除了具有较强的数据编辑管理能力,更能提供音、视频、游戏等多媒体应用服务,也能同时处理多项工作。更进一步来看,它的功能面涵盖了通信、信息与多媒体功能,即:

1. 通信功能:语音、讯息(messaging)、认证(Authentication)、计费(Billing)等等通信处理功能;

2. 信息功能:Email、行事历、信息管理、Sync、安全性等信息处理功能;

3. 多媒体功能:视频、照相、游戏、TV、串流、音乐、DRM等多媒体应用功能;

除了信息功能外,在通信与多媒体的应用上,音频是必要的处理任务。在过去,手机只需要处理单纯的语音通话信号,但今日的智能型手机中得处理的音频任务繁重,除了多音调振铃、MP3音乐外,可能还要有FM广播及游戏音效,而且不能只是单声道的效果,现在要求的是立体声的临场感体验。

过去,数字音频的世界是截然两分的:一边是Hi-Fi的世界,另一边则是语音的世界。一般而言,Hi-Fi是指16bit立体声质量、以44.1kHz取样的音频,也就是CD音乐的规格;电话语音则是8bit和8kHz的单声道(mono)、低质量音频。不过,进入智能型手机的时代,两个音频世界开始撞击在一起了,如何将音频子系统完善地与应用及通信处理平台整合在一起,就成了便携式设备工程师开发新产品时的关键性挑战。

音频编码格式与接口

在进入系统架构的探讨前,先来看看音频编码的现状。目前音频编码的格式繁多,针对声音的编码就有PCM、ADPCM、DM、PWM、WMA、OGG、 AMR、ACC、MP3Pro以及MP3等;针对人类语音有LPC、CELP与ACELP等;其它还有MPEG-2、MPEG-4、H.264、VC-1 等视听节目的编码格式。

以下介绍三种常用的音频格式:

AMR格式

AMR为自适应多码率语音传输编译码器(Adpative Multi-Rate Speech Codec),最初版是欧洲电信标准化协会(ETSI)为GMS系统所制定的语音编译码标准,而因频宽又分为两种—AMR-NB(AMR Narrowband)和AMR-WB(AMR Wideband)。以市场最大品牌Nokia来说,其多数手机都支持上述两种格式的音频文件。

MP3格式

MP3是MPEG AudioLayer3的缩写,这是一种音频压缩技术,其编码具有10:1-12:1的高压缩率,可以保持低频部分不失真,但牺牲了音频中12KHz -16KHz的高频部份来降低文件大小,其“.mp3”格式文件一般只有“.wav”的10%。另外,MP3受到欢迎的一大原因,是它并非受到版权保护的技术,所以任何人都可以使用。

MP3格式压缩音乐的取样频率有很多种,可以用64kbps或更低的编码来节省空间,亦可以用到 320kbps达到极高的压缩音质。MP3在编码速率上,又分为"CBR"(固定编码),与及“VBR”(可变码率)技术,有些手机无法播放下载来的音乐,正是因为没有支持“VBR”格式的MP3音乐。

AAC格式

AAC即高级音频编码(Advanced Audio Coding),它采用的运算方式是与MP3不同,AAC可以同时支持多达48个音轨、15个低频音轨、更多种取样率和传输率、具有多种言语的兼容能力,以及更高的解码效率。总结来说,AAC可以在比MP3格式再缩小30%的条件下提供更好的音质,而且声音保真度好,更接近原音,所以被手机界视为是最佳的音频编码格式。AAC是一个大家族,他们是共分为9种规格,以适应不同场合的需要:

(1) MPEG-2AAC LC 低复杂度规格 (Low Complexity)

(2) MPEG-2 AAC Main 主规格

(3) MPEG-2 AAC SSR 可变取样率规格 (Scaleable Sample Rate)

(4) MPEG-4 AAC LC低复杂度规格(LowComplexity),现在的手机比较常见的MP4档中的音频部份就包括了该规格音频文件

(5) MPEG-4AAC Main 主规格

(6) MPEG-4 AAC SSR 可变取样率规格 (Scaleable Sample Rate)

(7) MPEG-4 AAC LTP长时期预测规格(Long Term Prediction)

(8) MPEG-4 AAC LD低延迟规格(Low Delay)

(9) MPEG-4 AAC HE高效率规格(High Efficiency

上述的规格中,主规格(Main)包含了增益控制以外的全部功能,其音质是最好,而低复杂度规格(LC)则是比较简单,没有了增益控制,但提高了编码效率,至于SSR与LC规格大致相同,但是多了增益的控制功能,另外,LTP/LD/HE都是用在低码率下的编码,其中HE采用NeroACC编码器支持,是近来常用的一种编码率方式。不过一般来说,Main规格和LC规格的音质相差不大,因此考虑手机目前的内存仍有限的情况下,目前使用最多的AAC规格是 LC规格。
音频接口

音频接口是智能型手机设计者需考虑的重要议题。数字语音一般采用PCM(Pulse Code Modulation)接口,而Hi-Fi立体声则采用串行I2S(Inter-IC Sound)接口或AC97接口。I2S是飞利浦公司为数字音频设备之间的音频数据传输而制定的一种总线标准,是目前消费性音频产品中常用的接口;AC?7则是英特尔公司用于提升个人计算机音效、降低噪音的规格,由于在1997年制订,因此称为AC97。

因此,为特定应用而量身定制一套整合性的解决方案是较理想的作法。在SoC的技术趋势下,已有一些厂商将立体声数字模拟转换器(DAC)或编译码器(CODEC)整合到特定功能的IC当中。不过,有些功能适合整合在一起,有些则可能得到反效果。

继续阅读
Dialog被苹果抛弃之后有什么新动作,巨额投资能否给其注入新鲜血液

日前,美国科技媒体AppleInsider报道称,苹果公司芯片供应商Dialog Semiconductor今日宣布,随着与苹果收购交易的完成,该公司今年的营收将有所下滑。

连模拟/电源管理部门都要卖,几张图让你看懂恩智浦为什么这么做

恩智浦正在寻求出售其电源管理芯片部门,并再次引起了中国企业的强烈兴趣; 这次出售将帮助恩智浦降低其负债负担,并更好地将精力集中在汽车电子、物联网、网络通信和安全支付/连接领域的机会上; 恩智浦的战略部署和博通/安华高颇有相似之处。 据报道,恩智浦半导体公司正在寻求出售其标准产品部门,该部门针对多个终端市场提供模拟/电源管理器件。去年斥资18亿美金买下恩智浦的RF功率放大器业务的建广资本再次表示了购买的兴趣,这次恩智浦开出的价码至少是20亿美金。当初恩智浦之所以售出RF功率

NXP SSL4120 90W LED照明解决方案

NXP公司的SSL4120是集成了PFC控制器和半桥谐振转换器(HBC)控制器的电源控制器,能以上转换器来驱动分立MOSFET和谐振半桥配置来驱动两个分立功率MOSFET,火线电压从85 V到 305 V(AC),主要用在25 W到400 W之间的电源.本文介绍了SSL4120主要特性和优势,框图和应用电路,以及90W演示板SSL4120DB1123主要特性和优势,技术指标和框图,电路图,材料清单和PCB设计图.

NXP SSL5301T36W LED驱动方案

NXP公司的SSL5301T是可调光LED控制器,支持反激,降压和降压-升压拓扑,可选择低THD或低LED电流波纹模式,模拟IEC60929输入或数字控制输入调光,集成了起动JFET,具有多种保护,LED电流精度在+/-4%,主要用在100 V (AC), 120 V (AC)和230 V (AC) LED照明.本文介绍了SSL5301T主要特性和优势,框图,降压-升压电路,反激应用和降压电路,以及36W LED驱动演示板SSL5301DB1233主要特性和指标,电路图,材料清单和PCB设计图与反激变压器

NXP SSL5257TE11.5 W LED驱动解决方案

NXP公司的SSL5257TE是高集成高精度升压-降压控制器,内部集成了MOSFET,效率高达90%,用来驱动低成本小型可调光的10W LED灯.本文介绍了SSL5257TE主要特性和优势,框图和应用框图,演示板SSL5257DB1291主要指标,电路图,材料清单和PCB设计文件.

精彩活动