磁盘读写和数据库读写哪个比较好？磁盘读写与数据库的关系

admin 2024-12-26 12:04 www.jiaxuemao.com

磁盘读写速度测试2.77 汉化单文件版种类：磁盘工具大小：572KB语言：中文评分：6.6标签：立即下载

假定在程序效率和重点过程相当且不计入缓存等手段的条件下，读写任何种类的数据都没直接操作文件来的快，不论MSYQL过程怎么样，最后都要到磁盘上去读这个“文件”（记录存储区等效），所以当然这所有的首要条件是只读内容，无关任何排序或查找操作。

动态网站通常都是用数据库来存储信息，假如信息的准时性需要不高可以加入缓存来降低频繁读写数据库。

两种方法一般都支持，但绕过操作系统直接操作磁盘的性能较高，而且安全性也较高，数据库系中的磁盘性能一直都是瓶颈，大型数据库一般基于unix系统，当然win下也有，不常用应为win的不靠谱性，unix下，用的是裸设施raw设施，就是没加工过的设施（unix下的磁盘分区是特殊设施，以文件形式统一管理），由dbms直接管理，不通过操作系统，效率非常高，靠谱性也高，由于磁盘，cache和内存都是自己管理的，大型数据库系统db2，oracal，informix（不太时尚了），mssql算不上大型数据库系统。

1、直接读文件相比数据库查看效率更胜一筹，而且文中还没有算上连接和断开的时间。2、一次读取的内容越大，直接读文件的优势会越明显（读文件时间都是小幅增长，这跟文件存储的连续性和簇大小等有关系），这个结果恰恰跟书生预料的相反，说明MYSQL对更大文件读取可能又附加了某些操作（两次时间增长了近30%），假如只不过单纯的赋值转换应该是差异偏小才对。3、写文件和INSERT几乎不需要测试就能推断出，数据库效率只能更差。

4、非常小的配置文件假如无需用到数据库特质，愈加合适放到独立文件里存取，不需要单独创建数据表或记录，非常大的文件譬如图片、音乐等使用文件存储更为便捷，只把路径或缩略图等索引信息放到数据库里更合理一些。

5、PHP上假如只不过读文件，file_get_contents比fopen、fclose更有效率，不包含判断存在这个函数时间会少3秒左右。

6、fetch_row和fetch_object应该是从fetch_array转换而来的，书生没看过PHP的网站源码，单从实行上就能说明fetch_array效率更高，这跟网上的说法好像相反。

磁盘读写与数据库的关系：

一磁盘物理结构

盘片：硬盘的盘体由多个盘片叠在一块构成。

在硬盘出厂时，由硬盘生产厂家完成了低级格式化，用途是将空白的盘片划分为一个个同圆心、不同半径的磁道，还将磁道划分为若干个扇区，每一个扇区可存储128×2的N次方（N=0.1.2.3）字节信息，默认每一个扇区的大小为512字节。一般用户不需要再进行低级格式化操作。

磁头：每张盘片的正反两面各有一个磁头。

磁盘读写和数据库读写哪个比较好？磁盘读写与数据库的关系

主轴：所有磁片都由主轴电机带动旋转。

磁盘读写和数据库读写哪个比较好？磁盘读写与数据库的关系

控制集成电路板：复杂！上面还有ROM（内有软件系统）、Cache等。

磁盘读写和数据库读写哪个比较好？磁盘读写与数据库的关系

二磁盘怎么样完成单次IO操作

寻道

当控制器对磁盘发出一个IO操作命令的时候，磁盘的驱动臂带动磁头离开着陆区，移动到要操作的初始数据块所在的磁道的正上方，这个过程被叫做寻道，对应消耗的时间被叫做寻道时间；

旋转延迟

找到对应磁道还不可以立刻读取数据，这个时候磁头要等到磁盘盘片旋转到初始数据块所在的扇区落在读写磁头正下方之后才能开始读取数据，在这个等待盘片旋转到可操作扇区的过程中消耗的时间称为旋转延时；

数据传送

下面就伴随盘片的旋转，磁头持续的读/写相应的数据块，直到完成这次IO所需要操作的全部数据，这个过程称为数据传送，对应的时间称为传送时间。完成这三个步骤之后单次IO操作也就完成了。

依据磁盘单次IO操作的过程，可以发现：

单次IO时间 = 寻道时间 + 旋转延迟 + 传送时间

进而推算每秒的输入输出量的公式为：

每秒的输入输出量 = 1000ms/单次IO时间

三磁盘每秒的输入输出量计算

不同磁盘，它的寻道时间，旋转延迟，数据传送所需的时间各是多少？

1. 寻道时间

考虑到被读写的数据可能在磁盘的任意一个磁道，既大概在磁盘的最内圈（寻道时间最短），也会在磁盘的最外圈（寻道时间最长），所以在计算中大家只考虑平均寻道时间。

在购买磁盘时，该参数都有标明，现在的SATA/SAS磁盘，按转速不同，寻道时间不同，不过一般都在10ms以下：

磁盘读写和数据库读写哪个比较好？磁盘读写与数据库的关系

3. 传送时间2. 旋转延时

和寻道一样，当磁头定位到磁道之后大概正好在要读写扇区之上，这个时候是无需额外的延时就能立刻读写到数据，但最坏的状况确实要磁盘旋转整整一圈之后磁头才能读取到数据，所以这里也考虑的是平均旋转延时，对于15000rpm的磁盘就是* = 2ms。

磁盘传输速率

磁盘传输速率分两种：内部传输速率，外部传输速率。

内部传输速率，是指磁头与硬盘缓存之间的数据传输速率，简单的说就是硬盘磁头将数据从盘片上读取出来，然后存储在缓存内的速度。

理想的内部传输速率没有寻道，旋转延时，就一直在同一个磁道上读数据并传到缓存，显然这是不可能的，由于单个磁道的存储空间是有限的；

实质的内部传输速率包括了寻道和旋转延时，现在家用磁盘，稳定的内部传输速率一般在30MB/s到45MB/s之间。

外部传输速率，是指硬盘缓存和系统总线之间的数据传输速率，也就是计算机通过硬盘接口从缓存中将数据读出交给相应的硬盘控制器的速率。

硬盘厂家在硬盘参数中，一般也会给出一个最大传输速率，譬如目前SATA3.0的6Gbit/s，换算一下就是6*1024/8，768MB/s，一般指的是硬盘接口对外的最大传输速率，当然实质用中是达不到这个值的。

这里计算每秒的输入输出量，守旧选择实质内部传输速率，以40M/s为例。

单次IO操作的大小

有了传送速率，还要了解单次IO操作的大小，才能算出单次IO的传送时间。那样磁盘单次IO的大小是多少？答案是：不确定。

操作系统为了提升 IO的性能而引入了文件系统缓存，系统会依据请求数据的状况将多个来自IO的请求先放在缓存里面，然后再一次性的提交给磁盘，也就是说对于数据库发出的多个8K数据块的读操作大概放在一个磁盘读IO里就处置了。

还有，有的存储系统也是提供了缓存（Cache），接收到操作系统的IO请求之后也是会将多个操作系统的 IO请求合并成一个来处置。

无论是操作系统层面的缓存还是磁盘控制器层面的缓存，目的都只有一个，提升数据读写的效率。因此每次单独的IO操作大小都是不同的，它主要取决于系统对于数据读写效率的判断。这里以SQL Server数据库的数据页大小为例：8K。

传送时间

传送时间 = IO Chunk Size/Internal Transfer Rate = 8k/40M/s = 0.2ms

可以发现：

假如IO Chunk Size大的话，传送时间会变大，从而致使每秒的输入输出量变小；

机械磁盘的主要读写本钱，都花在了寻址时间上，即：寻道时间 + 旋转延迟，也就是磁盘臂的摆动，和磁盘的旋转延迟。

假如粗略的计算每秒的输入输出量，可以忽视传送时间，1000ms/即可。

4. 每秒的输入输出量计算示例

以15000rpm为例：

单次IO时间

单次IO时间 = 寻道时间 + 旋转延迟 + 传送时间 = 3ms + 2ms + 0.2 ms = 5.2 ms

每秒的输入输出量

每秒的输入输出量 = 1000ms/单次IO时间 = 1000ms/5.2ms = 192

这里计算的是单块磁盘的随机访问每秒的输入输出量。

考虑一种极端的状况，假如磁盘全部为顺序访问，那样就能忽视：寻道时间 + 旋转延迟的时长，每秒的输入输出量的计算公式就变为：每秒的输入输出量 = 1000ms/传送时间

每秒的输入输出量 = 1000ms/传送时间= 1000ms/0.2ms = 5000

显然这种极端的状况太过理想，毕竟每一个磁道的空间是有限的，寻道时间 + 旋转延迟时长确实可以降低，不过是没办法完全防止的。

四数据库中的磁盘读写

1. 随机访问和连续访问

随机访问

指的是本次IO所给出的扇区地址和上次IO给出扇区地址相差比较大，如此的话磁头在两次IO操作之间需要作比较大的移动动作才能重新开始读/写数据。

连续访问

相反的，假如当次IO给出的扇区地址与上次IO结束的扇区地址一致或者是接近的话，那磁头就能非常快的开始这次IO操作，如此的多个IO操作称为连续访问。

以SQL Server数据库为例

数据文件，SQL Server统一区上的对象，是以extent为单位进行空间分配的，数据存放是非常随机的，什么数据页有空间，就写在哪儿，除非通过文件组给每一个表预分配足够大的、单独用的文件，不然不可以保证数据的连续性，一般为随机访问。

另外就算聚集索引表，也只不过逻辑上的连续，并非物理上。

日志文件，因为有VLF的存在，日志的读写理论上为连续访问，但假如日志文件设置为自动增长，且增量不大，VLF就会不少非常小，那样就也并非严格的连续访问了。

2. 顺序IO和并发IO

顺序IO模式

磁盘控制器或许会一次对磁盘组发出一连串的IO命令，假如磁盘组一次只能实行一个IO命令，称为顺序IO；

并发IO模式

当磁盘组能同时实行多个IO命令时，称为并发IO。并发IO只能发生在由多个磁盘组成的磁盘组上，单块磁盘只能一次处置一个IO命令。

以SQL Server数据库为例

有些时候，尽管磁盘的每秒的输入输出量还没太大，但发现数据库出现IO等待，为何？一般是由于有了磁盘请求队列，有过多的IO请求堆积。

磁盘的请求队列和繁忙程度，通过以下性能计数器查询：

LogicalDisk/Avg.Disk Queue Length

LogicalDisk/Current Disk Queue Length

LogicalDisk/%Disk Time

这样的情况下，可以做的是：

简化业务逻辑，降低IO请求数；

同一个实例下，多个数据库迁移的不同实例下；

同一个数据库的日志，数据文件离别到不一样的存储单元；

借用HA方案，做读写操作的离别。

3. 每秒的输入输出量和吞吐量

每秒的输入输出量

每秒的输入输出量即每秒进行读写（I/O）操作的次数。在计算传送时间时，有提到，假如IO Chunk Size大的话，那样每秒的输入输出量会变小，假设以100M为单位读写数据，那样每秒的输入输出量就会非常小。

吞吐量

吞吐量指每秒可以读写的字节数。同样假设以100M为单位读写数据，尽管每秒的输入输出量非常小，但每秒读写了N*100M的数据，吞吐量并不小。

以SQL Server数据库为例

对于OLTP的系统，常常读写小块数据，多为随机访问，用每秒的输入输出量来衡量读写性能；

对于数据仓库，日志文件，常常读写大块数据，多为顺序访问，用吞吐量来衡量读写性能。

磁盘目前的每秒的输入输出量，通过以下性能计数器查询：

LogicalDisk/Disk Transfers/sec

LogicalDisk/Disk Reads/sec

LogicalDisk/Disk Writes/sec

磁盘目前的吞吐量，通过以下性能计数器查询：

LogicalDisk/Disk Bytes/sec

LogicalDisk/Disk Read Bytes/sec

LogicalDisk/Disk Write Bytes/sec

TAG标签：磁盘读写(1)

转载请说明来源于谷普下载站（https://www.muerya.com）

本文地址：https://www.muerya.com/news/2676.html

郑重声明：文章来源于网络作为参考，本站仅用于分享不存储任何下载资源,如果网站中图片和文字侵犯了您的版权，请联系我们处理！邮箱3450399331@qq.com

上一篇：安装搜狐影音看好声音直播搜狐影音直播加速功能介绍

下一篇：没有了

其他版本

游戏攻略

推荐阅读阅读排行

一周评论排行

推荐下载下载排行

磁盘读写和数据库读写哪个比较好？磁盘读写与数据库的关系

相关游戏

其他版本

相关文章