硬件收藏论坛
标题:
发烧接口:Ultra320 SCSI
[打印本页]
作者:
LEO
时间:
2004-1-19 15:35
标题:
发烧接口:Ultra320 SCSI
转自 Tom's硬件指南http://www.gb.tomshardware.com/storage/03q2/030625/index.html
Ultra320 SCSI:性能测试中首度现身
迄今为止,市面上从来没有一款硬盘可以满足程序的要求,将容量以及优异的性能合而为一。现在的IDE磁盘驱动器勉强达到每秒60 MB,而价格昂贵的SCSI模块说实话也快不到哪里去。目前,串行ATA硬盘提供了一个简易又快速的接口。所以,为什么还要使用昂贵的SCSI技术呢?
实际上,在入门级的应用中,SCSI可以说是大势已去,ATA则是有取而代之的趋势。目前很多地方提供的出租服务器上都配置了经济实惠的IDE硬盘供。因为IDE-RAID(磁盘阵列)控制器(RAID 0,1和10)的迅速流行,几乎没有什么东西可以阻碍人们建立一个“安全的”硬盘阵列。而最新的趋势,即便是RAID 5阵列,也是以ATA硬盘作为架构。串行ATA接口可能会成为领导这波潮流的关键因素;如Western Digital就已经迫不及待推出其猛禽系列产品(10,000转的串行ATA接口)。
但是在企业市场上,情况有点不同。在这个市场中,重要的不只是最大传输速率,优秀的输入/输出性能也是同等重要。典型的如数据库,和文件和网页服务器等必须尽可能多的响应数据请求的应用。在我们的经验中,不管是IDE硬盘或是控制器,在这个领域中还是居于劣势的。
在本篇文章中,我们将会为您深入探讨Ultra320 SCSI的实际性能。为了要找出最大带宽和输入/输出的性能,我们使用了最近由Adaptec的39320D-R和LSI Logic的20320R发表的两款适配卡。同时,我们也使用Adaptec的39160,也就是Ultra160 SCSI接口来作为比较的参照物。
作者:
LEO
时间:
2004-1-19 15:36
Ultra320 SCSI的细节
在SCSI悠久的历史中,第一次作了这么多根本性的改变。新增的封包式SCSI有助于减少我们通称的执行时间(overhead)。一直到现在,Ultra320中指令和状态的信息仍然以异步的方式来作传送(并因此拖慢了开机速度),但是这些数据都以全带宽作为传送封包的一部份。
另外一项革新是,封包式的SCSI加入了一项串流程序,这项程序照理说可以简化并加速数据封包的传递。这是一项简化版本的请求/接受的过程(两个设备互相联机的时候交换信号的核心),而直到数据封包传递结束时,整个接受过程才告一段落,而不是发生在数据的每个区块之后。
虽然串行ATA的传输线允许长度已经超过1公尺,但是Ultra320总线可以连接任何25公尺内的单一设备。但是与串行ATA不同的是,使用Ultra320时,所有的设备都必须在同一个通道下操作,并将总带宽分布在所有的设备之中。串行ATA仅允许每个连接埠一台设备,所以全部的每秒150 MB带宽都可以为其所用。也因为这个理由,在决定性能的设置上,不允许超过5台至7台的设备在同一个SCSI通道下操作。当单一磁盘驱动器在高容量下工作的时候,才会使用到带宽。
其它的技术细节都跟之前的SCSI标准类似:总线的每个终点都要用终端器,包括适配卡在内,对所有已知的设备分配SSCSI Ids,经由SCSI适配卡上的BIOS来自动检测所有设备,经由SCSI连接外部设备等。
对于那些想对SCSI标准了解的更详细的读者,我们建议您可以阅读有关SCSI的标准,这些标准的说明在很多网站上都可以看到,或者是您可以去一些知名的制造商网站也可以找到。
Ultra 320适配卡制造商:Adaptec和LSI Logic
无庸置疑,Adaptec和LSI Logic(巨积)两家厂商一直致力开拓于SCSI领域的市场。我们收到Adaptec最新的39320D-R模块,这个模块可以提供一个内部的SCSI通道,另外还有一个外部通道。在模块型号上的“R”字样代表的是基本的RAID性能。所支持的模式是0和1,虽然前者可以连接的磁盘不超过4台磁盘驱动器。Adaptec同时提供了3款其它的Ultra320适配卡,这3款适配卡在技术上都是相同的架构。
我们收到来自LSI Logic的两款产品,分别是20320-R和21320。前者所提供的是整合镜像(RAID 1);后者有2个内部通道可用。
在我们的比较测试中,我们选用了LSI Logic的20320-R模块,因为其RAID的性能是属于早期开发的型号,比较适合拿来和Adaptec 39320D-R作比较。
作者:
LEO
时间:
2004-1-19 15:37
Adaptec 39320D-R
BIOS/硬件版本:4.10.1.
这款Adaptec控制器格外令人瞩目,因为包装很用心。另外还有不可或缺的驱动程序光盘。在整个包装中还包括了一份简短的使用说明,以及一条6端口的连接线。Adaptec在制作连接线时使用了最好的材料,用的是双绞线的形式,这种双绞方式不太容易制做,不过对屏蔽电磁串扰(Shielding Effect)的效果却相当好。
两片驱动程序光盘中包含如下内容:一片是让你可以使用集成的适配卡RAID功能(RAID 0和1);另外一片则是给“正常操作模式”的适配卡使用的。另外还有DOS版本的驱动程序、Caldera、Netware和Windows–包含了Windows XP以及64位 Windows XP。
同时还附上了大家熟知的Adaptec的EZ SCSI软件(6.0版),这个软件可以对SCSI总线作简单的管理,并提供一些性能测试工具。
作者:
LEO
时间:
2004-1-19 15:38
LSI Logic 20320R
BIOS/硬件版本:5.02.00.
LSI Logic的控制器提供了一个Adaptec所没有的优点–因为体积比较小,所以可以应用在比较小的空间中。我们使用的是LSI Logic的53C1020,配备比较好的版本所使用的都是53C1030,而且可以设置为双通道操作。被称为Fusion MPT的架构支持超过每秒100,000的输入/输出,而测试中20320R的最大每秒50,000的输入/输出已经可以满足我们的需求。
这个包装内部只有附上一片光盘,光盘的内容是各个系统所需要的驱动程序,包括了DOS、Caldera Unix、RedHat和SuSe Linux,Solaris以及Windows NT、XP和2000。Windows Server 2003则是已经内置了相应的驱动程序。
作者:
LEO
时间:
2004-1-19 15:39
测试系统:请用PCI-X!
在发表这篇文章之前,我们必须提出一个适当的基础,来作为判断现有SCSI接口的标准。问题出在一般的消费者和商用计算机使用的是32位PCI总线,而大多数的频率都在33 MHz。这使得总线的数据传输率到达每秒132 MB(32位x 33 MHz / 8)。
对大多数的应用程序来说,这样的速度已经足够,前提是不接任何其它设备。所有装在PCI总线上的设备对每秒132 MB的总线作存取,如音频系统、网络控制器、电视卡等等,这些设备都将占用整体的资源。
Ultra320 SCSI已经告诉你最大的传输率是多少。从标签上可以很清楚的看出,Ultra320可以处理的数据流超过每秒320 MB。由于双通道设置很少见,因此达到每秒640 MB也是有可能的,在此假设连接了适当数目的硬盘。目前只有PCI-X可以用64位,并以133 MHz(每秒1,064 MB)的频率来工作,这个速度已经足够快了。几乎所有可以找到的适配卡都包含了PCI内存接口。这个接口最主要的优点是可以向下兼容PCI 2.x接口。
PCI-X的很多相关技术都还是一团谜,不过知道一些简单的事实应该就能够满足你的需求:
这种总线可以处理66或是133 MHz–视使用的适配卡而定。某些适配卡可以在其最大速度下操作。
一个PCI-X的插槽也可以用33或64 MHz的速度和任何PCI适配卡工作。要达到这种要求,这个插槽必须符合PCI标准2.1或是更高的标准,并且具备第二个插座(请参看下面的图)。
PCI-X的适配卡同时也和PCI 2.x兼容。例如,如果一块64位的PCI适配卡插在一个32位的插槽上,它的工作情形会完全一样,但是带宽变得比较小。
上图:64位PCI-X插槽。下图:PCI 2.2.
较老旧的PCI适配卡可以由一项标准来判定...
…那就是插槽上没有第二个插座。这在PCI 2.1上可以找到,并且保证与64位插槽兼容。这两块网卡都是由3COM所生产,并且都与原先的3C905TX型兼容。较晚的版本使用的是3C920型的控制器。
最后,这是PCI-X插槽的样子。由于接触点的数目比较多(64位的总线比32位的宽),因此,插槽也比较长。
作者:
LEO
时间:
2004-1-19 15:41
测试系统:双Pentium 4 Xeon 2.8 GHz
我们从美国生产商Supermicro那里收到一个最近发布的服务器,当中配备了我们需要的PCI-X插槽。主板是X5DL8型,并以Intel(英特尔)的Pentium 4 Xeon为架构。其它的系统特点如下:
ServerWorks大奖冠军LE芯片组;
可安装一颗或是两颗Pentium 4 Xeon移动式中央处理器,FSB频率为400或是533 MHz;
最大16 GB的ECC RAM(随机存取内存);
双通道DDR;
6组PCI-X插槽:完全插满的时候,速度为100-MHz,目前只有3片适配卡,速度超过133 MHz;
整合式Adaptec 7902W Ultra320控制器,配备0通道RAID选项(Adaptec 2010S);
两个千兆位以太网控制器(Broadcom 5703和Intel 84540EM)。
我们在服务器中安装了两颗2.8 GHz Pentium 4 Xeon移动式处理器,以及两条Samsung(三星)生产的512 MB ECC内存模块(DDR266、ECC、已注册)。
我们的测试系统可以提供7条插槽让配备SCA接口的SCSI硬盘使用。这可将电源和数据传输连接器整合在一个插槽上。
因为尺寸的关系(标准ATX电源比较宽),因此多余的电源可以用在大多数的ATX机箱中。它包含了3个电源–其中一组可以随时关闭而不会影响操作,如果使用的容量不太多的时候,第二组也可以关闭。
配备ServerWorks大奖冠军LE芯片组的Supermicro X5DL8。
Socket 604装上Pentium 4 Xeon移动式处理器,FSB频率为533 MHz。
我们使用了两颗Xeon中央处理器,每一颗的频率皆为2.8 GHz.。目前最顶级的处理器频率为3.06 GHz。
我们的测试系统只安装了两组512 MB PC266 DDR-SDRAM。由于使用的都是高品质的电路板,X5DL8要求使用注册过的内存,同时需要ECC。同时可以在图片上右边看到两个中央处理器的冷却器。
作者:
LEO
时间:
2004-1-19 15:42
昂贵的SCSI连接线
这条Ultra160/320 SCSI连接线提供了8个接头。一个已经用来连接适配卡,另外一个位在逻辑总线末端的接头必须装上一个Terminator(终端器)。
有关SCSI连接线的讨论一直都很热门。当IDE的排线或是串行连接线的价格仅仅数美元,比较起来Ultra160/ 320 SCSI的连接线(同时适合两项标准)则是高达30美元以上。在特定的商店中,这种具有8个接头的连接线更高达50美元以上。
左边是Adaptec的Ultra320连接线,在所有适配卡的零售版中都附有这条连接线(6个接头,可以连接4台磁盘驱动器)。右边是标准的连接线。
操作系统:对Windows Server 2003来说还太早了
原先我们希望可以在Windows Server 2003运行测试,因为Microsoft(微软)的新操作系统可以很正确的检测到这两个控制器(包括所需的驱动程序)。但是其性能水平与Windows 2000 Server比起来还是差太多。
Adaptec和LSI Logic都可以在2003的驱动程序下工作;但是也许要花一点时间取得这些驱动程序,因为RAID控制器似乎有优先权–在这个区域内,驱动程序通常都已经可以取得。
作者:
LEO
时间:
2004-1-19 15:42
测试设置
测试系统
中央处理器 2x Intel Pentium 4 Xeon、2.8 GHz
主板 Supermicro X5DL8
ServerWorks GC-LE
RAM 2组512 MB PC2100/DDR266
已注册、ECC、三星制造
IDE控制器 SB7440 UltraATA/100控制器
系统硬盘 IBM Deskstar 60 GXP、IC35040、40 GB、7,200转
测试硬盘 6x Seagate Barracuda 10K.4(ST 3146807LW)、147 GB、10,000转、Ultra320 SCSI
显卡 nVIDIA GeForce4 MX440、PCI、64 MB
网卡 Broadcom BCM5703、1 Gb/s、内建在主板上
操作系统 Windows 2000 Server SP3
性能测试
存取时间 ZD WinBench 99 2.0
性能测试 英特尔IOMeter 2003.02.15
输入/输出性能 英特尔IOMeter 2003.02.15
驱动程序和设置
显卡驱动程序 nVIDIA 44.03
驱动程序 Windows 2000 Server默认芯片组驱动程序
DirectX版本 9.0
因为我们不是很常用英特尔的IOMeter来作测试,所以我们在这里简单说明一下测试程序。
IOMeter允许对一个或是多个磁盘驱动器进行模拟访问,所以可以重现一个典型的系统需求。在这篇文章中,我们使用了4个测试程序:
最大数据传输率,单位为MB/s
总计 区块大小 读取存取比例 随机存取比例
100% 64 KB 100% 0%(连续的)
不用说,这项测试是非常理论化的,而且只有用来测试最大传输率。我们省略了写入存取和随机存取–只有要求连续读取的部分。
最大输入/输出性能,每秒的输入/输出
总计 区块大小 读取存取比例 随机存取比例
100% 512 Byte 100% 0%(连续的)
在这个部分,我们测量了每个磁盘存取的1、4、8、16、64和256的输入/输出,因为这会跟着控制器改变。再一次提醒,这个测试只代表了理论上的结果,因为一个512 bytes的区块大小几乎不会在实际情形中使用。
文件服务器存取模式(由英特尔建议测试)
总计 区块大小 读取存取比例 随机存取比例
10% 512 Byte 80% 100%
5% 1 KB 80% 100%
5% 2 KB 80% 100%
60% 4 KB 80% 100%
2% 8 KB 80% 100%
4% 16 KB 80% 100%
4% 32 KB 80% 100%
10% 64 KB 80% 100%
在这个部分,我们为每个存取测量了4、16、64和256个输入/输出。所需区块大小的分布等于英特尔建议的大小,并且有效模仿了一个典型文件服务器的环境。我们使用了总共6个磁盘驱动器,以确保控制器的高使用率。
数据库存取模式
总计 区块大小 读取存取比例 随机存取比例
100% 8 KB 67% 100%
最后的存取模式曾经被其它网上杂志使用过:8 KB大小的区块。它反映了其它的数据库应用程序。
作者:
LEO
时间:
2004-1-19 15:44
性能测试结果
存取时间
一如预期,关于存取时间所造成的控制器差异是可以忽略的。
数据传输率
在一个或是两个区块的Queue Depth(队列深度)中(也就是典型的数据库应用程序),LSI Logic控制器只以毫发之差领先。但是当Queue Depth增加的时候,则适配卡多了约每秒15 MB的速率可供使用。
在区块大小为128 KB时,测试结果看起来是相同的:Adaptec的39320D-R在执行较长查询的区块比较快。
如果查询的是256 KB区块,差异就会减少。但是Adaptec几乎在所有的Queue Depth中保持领先。
512 KB Blocks则不是LSI Logic 20320R的强项。在这个部分,Adaptec的工作时间只快了一点。
输入/输出性能测试
在比较小的区块中,传输率就比较没有意义。输入/输出性能的意义在图中可以看出。
LSI Logic的20320R于Queue Depth在16区块以内可以保持微幅领先。但是从32区块开始,Adaptec 39320D-R就开始逐渐领先,反观LSI Logici的性能反而有点开始变慢。
在4 KB的区块时,图形也是很近似的。唯一改变的是LSI Logic的速度有点变慢。
在8 KB的区块时,除了值比较小,测试结果跟4 KB相同。
网络服务器性能测试
基本上,网络服务器的性能测试就像在I/O Meter中组合许多存取模块一样。就如测试设置所说,小尺寸区块有比较高的优先权,所以结果会与输入/输出性能测试一样。
文件服务器性能测试
文件服务器的性能测试也显示,Adaptec在大的Queue Depth上明显占优势
作者:
LEO
时间:
2004-1-19 15:44
结论:Adaptec在高负载的情况下胜出
我们的性能测试结果证明了,这两台测试设备有着相似的高性能水平。虽然LSI Logic 20320R在执行短查询上稍微领先,但Adaptec 39320D-R在执行区块数较高(Queue Depth 64或是更高)的频繁查询上则予以反击。但是,问题在于这些测试结果的内容对于日常的使用状况有着什么决定性的结论呢?
同时,Adaptec的产品很清楚的表明,比较利于处理大数据量:如果一个高Queue Depth的大量查询直接进入控制器,那么Adaptec事实上可以取得明显的领先,而且可以用比较快的速度来执行。也就是说,在高负载的情形下,一个使用Adaptec的39320D-R文件服务器可以用比较快的速度,同时与多个硬盘协同工作。
不过,如果要根据测试结果,来判定一个控制器是特别好或特别坏,是很不明智的,因为专为特殊应用程序所作,可能的性能设置数目还是太高。在这个测试中,LSI Logic的控制器在每台磁盘1和4个连续输入/输入上,取得最大的输入/输出性能,因此取得小小的领先。如果是连续多个输入/输出的话,则Adaptec领先。
因此,以下是我们的建议:如果不需要最大操作性能的话,那么这两款适配卡都可以将工作处理得很快,而且结果值得信赖;在这里如果要指出它们的差异是一点也没有道理的。价格和附加配件也许会在购买的时候具有决定性的因素–Adaptec在这方面很明显占有优势,因为附件中有一条Ultra320连接线,使用这条连接线可以连接最高4台硬盘。另外两家厂商都提供五年保固期。
一旦需要使用适配卡来执行一些以性能为主的应用程序,那么你应该在选择适配卡时小心谨慎,并将候选设备(不管是Adaptec、LSI Logic或是其它厂商的产品)作一个广泛全面的测试,以找出你所需要的设置。想要找出最适合你需求的适配卡,这个方法肯定最保险。
欢迎光临 硬件收藏论坛 (http://bbs.yjfy.com/)
Powered by Discuz! X1