技术中心新员工培训教材
发布时间:2024-11-06
发布时间:2024-11-06
DSP工程◆ DSP基本特点 ◆ ADI blackfin DSP介绍 ◆ 可视电话DSP系统介绍
技术中心新员工培训教材
◆ DSP基本特点 ◆ ADI blackfin DSP介绍 ◆ 可视电话DSP系统介绍
技术中心新员工培训教材
DSP特点(1) DSP一般属于Modified Harvard架构,即 它具有两条内部总线:数据总线、程序总线。 程序与数据存储空间分开,各有独立的地址 总线和数据总线,取指和读数可以同时进 行。 传统的冯· 诺曼(Von Neuman)结构取指 令和取数据都访问同一存储空间,需要分时 进行,数据吞吐率低。技术中心新员工培训教材
DSP特点(2) 采用流水作业。每条 指令的执行划分为取 指令、译码、取数、 执行等若干步骤,由 片内多个功能单元分 别完成。相当于多条 指令并行执行,从而 大大提高了运算速度。 BLACKFIN采用了8级 流水线结构
技术中心新员工培训教材
DSP特点(3) 独立的硬件乘法器。乘法指令在单周期内完 成,优化卷积、数字滤波、FFT、相关、矩 阵运算等算法中的大量重复乘法。 DSP除法仍然采用移位减的方法,一般需要 16条指令完成,因此除法要尽量避免。如比 较A/C和B/D可以转换成比较A*D和B*C。 Blackfin包含两个乘法运算单元(MAC), 可以在单周期内完成两次16位×16位运算。
技术中心新员工培训教材
DSP特点(4) 零开销循环:处理器在执行循环时,不用花时 间去检查循环计数器的值,直接跳回到循环的 顶部、并将循环计数器减1。在存在大规模循环 的情况下,显著降低算法复杂度。 P5=0X20; LSETUP(START,END) LC0=P5 START: R5=[P0]; END: P0++; Blackfin支持两级零开销循环。技术中心新员工培训教材
DSP特点(5) 独立的DMA总线和控制器。有一组或多组 独立的DMA总线,与CPU的程序、数据总 线并行工作,提高数据吞吐能力。 Blackfin561处理器片内集成了多条DMA总 线,总线宽度高达32位,总线频率高达 133Mhz。
技术中心新员工培训教材
DSP特点(6) 大多数DSP使用定点计算。虽然浮点运算精 度高,但是对DSP来说,廉价和运算速度更 加重要。 为了不使用浮点机器而又保证数字的准确, DSP处理器在指令集和硬件方面都支持饱和 计算、舍入和移位 。 定点计算增加了DSP算法设计的难度,降低 了代码的可读性。技术中心新员工培训教材
定点小数 在定点DSP中,小数用Qn来表示, 0<=n<=15,n值代表小数点的位置。 例如:B0001,0000,0000,0000,如果是 Q15小数,则值为1/8;如果是Q14小数, 则值为1/4;如果是Q13小数,则值为1/2; 程序员必须时刻了解当前小数点的位置。
技术中心新员工培训教材
定点小数乘法和整数乘法 ◆ 在
DSP中,存在两种乘法,一种是16位整数×16 位整数,一种是16位小数×16位整数 ◆ 如果是16位小数×16位整数,乘法结果必须左移 一位(如果是Q15小数) ◆ blackfin提供小数乘法指令,乘法结果已经硬件左 移一位。 ◆ 简单小数乘法尽量用移位来实现。如a=a*1.25等 效于a+=a>>2。技术中心新员工培训教材
DSP特点(7) DSP的运算能力远远高于普通CPU,DSP的 运算能力通常用MIPS或MMAC来标识。 MIPS:每秒百万条指令。 MMAC:每秒百万次乘加运算。 ADI BF533最高主频756Mhz,则最高运 算能力756MIPS或1512MMACs(BF533 内部集成两个乘加运算单元)
技术中心新员工培训教材
◆ DSP基本特点 ◆ ADI blackfin DSP介绍 ◆ 可视电话DSP系统介绍
技术中心新员工培训教材
Blackfin是ADI公司推出的一类新型的嵌入 式处理器,专为满足目前音频、视频、通信 应用等方面的计算需求和降低功耗而设计。 ADSP-BF533和ADSP-BF561是Blackfin 系列中具有代表性的DSP处理器。具有高处 理能力、低功耗、丰富的片内资源、丰富的 外设接口等特点。
技术中心新员工培训教材
BF561的强大功能 内部集成两个600MHz主频的Blackfin处理器核, 运算能力高达2400MMACs。 328K片内存储器,丰富的片内寄存器资源。 16K程序cache和32K数据cache 专用视频处理指令SAA和SIMD(single instruction multiple data) 两个16通道DMA控制器和1个片内存储器DMA 丰富的外设接口: 2*PPI,2*SPORT,SPI,UART,64*GPIO,JTAG...技术中心新员工培训教材
存储器 片内L1存储器 每个核包含: 32K程序SRAM(其中16K可配置为cache) 64K数据SRAM(其中32K可配置为cache) 4K scratchpad SRAM 共2×100=200K,速度最快,工作在主频 片内L2存储器 共享128K,工作在主频/2 片外SDRAM 最高512M字节,工作在外频技术中心新员工培训教材
CACHE 16K程序cache和32K数据cache 可缓存的内存空间可以灵活配置 异步内存空间(与外部I/O设备交换数据的 内存空间)最好不要设置为可缓存 异步内存空间使用存储器DMA在片外存储 器和片内存储器之间传送数据(和CPU同步 工作)
技术中心新员工培训教材