高级Java开发——深入剖析Buffer

82 阅读6分钟

在谈到缓冲区时,我们说缓冲区对象本质上是一个数组,但它其实是一个特殊的数组,缓冲区对象内置了一些机制,能够跟踪和记录缓冲区的状态变化情况,如果我们使用get()方法从缓冲区获取数据或者使用put()方法把数据写入缓冲区,都会引起缓冲区状态的变化。

在缓冲区中,最重要的属性有下面三个,它们一起合作完成对缓冲区内部状态的变化跟踪:

position:指定了下一个将要被写入或者读取的元素索引,它的值由get()/put()方法自动更新,在新创建一个Buffer对象时,position被初始化为0。

limit:指定还有多少数据需要取出(在从缓冲区写入通道时),或者还有多少空间可以放入数据(在从通道读入缓冲区时)。

capacity:指定了可以存储在缓冲区中的最大数据容量,实际上,它指定了底层数组的大小,或者至少是指定了准许我们使用的底层数组的容量。

以上三个属性值之间有一些相对大小的关系:0 <= position <= limit <= capacity。如果我们创建一个新的容量大小为10的ByteBuffer对象,在初始化的时候,position设置为0,limit和 capacity被设置为10,在以后使用ByteBuffer对象过程中,capacity的值不会再发生变化,而其它两个个将会随着使用而变化。四个属性值分别如图所示:

现在我们可以从通道中读取一些数据到缓冲区中,注意从通道读取数据,相当于往缓冲区中写入数据。如果读取4个自己的数据,则此时position的值为4,即下一个将要被写入的字节索引为4,而limit仍然是10,如下图所示:

下一步把读取的数据写入到输出通道中,相当于从缓冲区中读取数据,在此之前,必须调用flip()方法,该方法将会完成两件事情:

  1. 把limit设置为当前的position值

  2. 把position设置为0

由于position被设置为0,所以可以保证在下一步输出时读取到的是缓冲区中的第一个字节,而limit被设置为当前的position,可以保证读取的数据正好是之前写入到缓冲区中的数据,如下图所示:

现在调用get()方法从缓冲区中读取数据写入到输出通道,这会导致position的增加而limit保持不变,但position不会超过limit的值,所以在读取我们之前写入到缓冲区中的4个自己之后,position和limit的值都为4,如下图所示:

在从缓冲区中读取数据完毕后,limit的值仍然保持在我们调用flip()方法时的值,调用clear()方法能够把所有的状态变化设置为初始化时的值,如下图所示:

最后我们用一段代码来验证这个过程,如下所示:

package com.gupaoedu.nio.buffer;

import java.io.FileInputStream;

import java.nio.*;

import java.nio.channels.*;

public class BufferProgram {

public static void main(String args[]) throws Exception {

FileInputStream fin = new FileInputStream("e:\test.txt");

FileChannel fc = fin.getChannel();

ByteBuffer buffer = ByteBuffer. allocate (10);

output ("初始化", buffer);

fc.read(buffer);

output ("调用read()", buffer);

buffer.flip();

output ("调用flip()", buffer);

while (buffer.remaining() > 0) {

byte b= buffer.get();

// System.out.print(((char)b));

}

output ("调用get()", buffer);

buffer.clear();

output ("调用clear()", buffer);

fin.close();

}

public static void output(String step, Buffer buffer) {

System. out .println(step + " : ");

System. out .print("capacity: " + buffer.capacity() + ", ");

System. out .print("position: " + buffer.position() + ", ");

System. out .println("limit: " + buffer.limit());

System. out .println();

}

}

完成的输出结果为:

缓冲区的分配

在前面的几个例子中,我们已经看过了,在创建一个缓冲区对象时,会调用静态方法allocate()来指定缓冲区的容量,其实调用 allocate()相当于创建了一个指定大小的数组,并把它包装为缓冲区对象。或者我们也可以直接将一个现有的数组,包装为缓冲区对象,如下示例代码所示:

package com.gupaoedu.nio.buffer;

import java.nio.ByteBuffer;

public class BufferWrap {

public void myMethod()

{

// 分配指定大小的缓冲区

ByteBufferbuffer1= ByteBuffer. allocate (10);

// 包装一个现有的数组

byte array[] = new byte [10];

ByteBufferbuffer2= ByteBuffer. wrap ( array );

}

}

缓冲区分片

在NIO中,除了可以分配或者包装一个缓冲区对象外,还可以根据现有的缓冲区对象来创建一个子缓冲区,即在现有缓冲区上切出一片来作为一个新的缓冲区,但现有的缓冲区与创建的子缓冲区在底层数组层面上是数据共享的,也就是说,子缓冲区相当于是现有缓冲区的一个视图窗口。调用slice()方法可以创建一个子缓冲区,让我们通过例子来看一下:

package com.gupaoedu.nio.buffer;

import java.nio.ByteBuffer;

public class BufferSlice {

static public void main( String args[] ) throws Exception {

ByteBuffer buffer = ByteBuffer. allocate ( 10 );

// 缓冲区中的数据0-9

for ( int i=0; i

buffer.put( ( byte )i );

}

// 创建子缓冲区

buffer.position( 3 );

buffer.limit( 7 );

ByteBuffer slice = buffer.slice();

// 改变子缓冲区的内容

for ( int i=0; i

byte b = slice.get( i );

b *= 10;

slice.put( i, b );

}

buffer.position( 0 );

buffer.limit( buffer.capacity() );

while (buffer.remaining()>0) {

System. out .println( buffer.get() );

}

}

}

在该示例中,分配了一个容量大小为

10的缓冲区,并在其中放入了数据0-9,而在该缓冲区基础之上又创建了一个子缓冲区,并改变子缓冲区中的内容,从最后输出的结果来看,只有子缓冲区“可见的”那部分数据发生了变化,并且说明子缓冲区与原缓冲区是数据共享的,输出结果如下所示:

只读缓冲区

只读缓冲区非常简单,可以读取它们,但是不能向它们写入数据。可以通过调用缓冲区的

asReadOnlyBuffer()方法,将任何常规缓冲区转 换为只读缓冲区,这个方法返回一个与原缓冲区完全相同的缓冲区,并与原缓冲区共享数据,只不过它是只读的。如果原缓冲区的内容发生了变化,只读缓冲区的内容也随之发生变化:

package com.gupaoedu.nio.buffer;

import java.nio.*;

public class ReadAbleBuffer {

static public void main( String args[] ) throws Exception {

ByteBuffer buffer = ByteBuffer. allocate ( 10 );

// 缓冲区中的数据0-9

for ( int i=0; i

buffer.put( ( byte )i );

}

// 创建只读缓冲区

ByteBuffer readonly = buffer.asReadOnlyBuffer();

// 改变原缓冲区的内容

for ( int i=0; i

byte b = buffer.get( i );

b *= 10;

buffer.put( i, b );

}

readonly.position(0);

readonly.limit(buffer.capacity());

// 只读缓冲区的内容也随之改变

while (readonly.remaining()>0) {

System. out .println( readonly.get());

}

}

}

如果尝试修改只读缓冲区的内容,则会报

ReadOnlyBufferException异常。只读缓冲区对于保护数据很有用。在将缓冲区传递给某个 对象的方法时,无法知道这个方法是否会修改缓冲区中的数据。创建一个只读的缓冲区可以保证该缓冲区不会被修改。只可以把常规缓冲区转换为只读缓冲区,而不能将只读的缓冲区转换为可写的缓冲区。

直接缓冲区

直接缓冲区是为加快

I/O速度,使用一种特殊方式为其分配内存的缓冲区,JDK文档中的描述为:给定一个直接字节缓冲区,Java虚拟机将尽最大努力直接对它执行本机I/O操作。也就是说,它会在每一次调用底层操作系统的本机I/O操作之前(或之后),尝试避免将缓冲区的内容拷贝到一个中间缓冲区中或者从一个中间缓冲区中拷贝数据。要分配直接缓冲区,需要调用allocateDirect()方法,而不是allocate()方法,使用方式与普通缓冲区并无区别,如下面的拷贝文件示例:

import java.io.*;

import java.nio.*;

import java.nio.channels.*;

public class DirectBuffer {

static public void main( String args[] ) throws Exception {

String infile = "e:\test.txt";

FileInputStreamfin= new FileInputStream( infile );

FileChannel fcin = fin.getChannel();

String outfile = String. format ("e:\testcopy.txt");

FileOutputStreamfout= new FileOutputStream( outfile );

FileChannel fcout = fout.getChannel();

// 使用allocateDirect,而不是allocate

ByteBuffer buffer = ByteBuffer. allocateDirect ( 1024 );

while ( true ) {

buffer.clear();

int r = fcin.read( buffer );

if (r==-1) {

break ;

}

buffer.flip();

fcout.write( buffer );

}

}

}

内存映射文件内存映射文件I/O

I/O是一种读和写文件数据的方法,它可以比常规的基于流或者基于通道的I/O快的多。内存映射文件I/O是通过使文件中的数据出现为 内存数组的内容来完成的,这其初听起来似乎不过就是将整个文件读到内存中,但是事实上并不是这样。一般来说,只有文件中实际读取或者写入的部分才会映射到内存中。如下面的示例代码:

package com.gupaoedu.nio.buffer;

import java.io.*;

import java.nio.*;

import java.nio.channels.*;

public class MappedBuffer {

static private final int start = 0;

static private final int size = 1024;

static public void main( String args[] ) throws Exception {

RandomAccessFile raf = new RandomAccessFile( "e:\test.txt", "rw" );

FileChannel fc = raf.getChannel();

MappedByteBuffer mbb = fc.map( FileChannel.MapMode. READ_WRITE ,

startsize );

mbb.put( 0, ( byte )97 );

mbb.put( 1023, ( byte )122 );

raf.close();

}

}