明輝手游網(wǎng)中心:是一個(gè)免費(fèi)提供流行視頻軟件教程、在線學(xué)習(xí)分享的學(xué)習(xí)平臺(tái)!

調(diào)整JavaTM 的I/O性能(3)(zt)

[摘要]壓縮 Java提供了對(duì)字節(jié)流進(jìn)行壓縮和解壓縮的類。它們可以在java.util.zip包中被找到,同時(shí)也作為Jar文件的基 礎(chǔ)(Jar文件是具有一個(gè)清單的Zip文件)。 以下的程序采用一個(gè)單一的輸入文件,并且生成一個(gè)壓縮了的Zip輸出文件,該程序帶有一個(gè)表示輸入文件的 入口項(xiàng)。 import ja...
壓縮


Java提供了對(duì)字節(jié)流進(jìn)行壓縮和解壓縮的類。它們可以在java.util.zip包中被找到,同時(shí)也作為Jar文件的基 礎(chǔ)(Jar文件是具有一個(gè)清單的Zip文件)。


以下的程序采用一個(gè)單一的輸入文件,并且生成一個(gè)壓縮了的Zip輸出文件,該程序帶有一個(gè)表示輸入文件的 入口項(xiàng)。


import java.io.*;

import java.util.zip.*;



public class compress {

public static void doit(String filein, String fileout) {

FileInputStream fis = null;

FileOutputStream fos = null;

try {

fis = new FileInputStream(filein);

fos = new FileOutputStream(fileout);

ZipOutputStream zos = new ZipOutputStream(fos);

ZipEntry ze = new ZipEntry(filein);

zos.putNextEntry(ze);

final int BUFSIZ = 4096;

byte inbuf[] = new byte[BUFSIZ];

int n;

while ((n = fis.read(inbuf)) != -1)

zos.write(inbuf, 0, n);

fis.close();

fis = null;

zos.close();

fos = null;

}

catch (IOException e) {

System.err.println(e);

}

finally {

try {

if (fis != null)

fis.close();

if (fos != null)

fos.close();

}

catch (IOException e) {

}

}

}



public static void main(String args[]) {

if (args.length != 2) {

System.err.println("missing filenames");

System.exit(1);

}

if (args[0].equals(args[1])) {

System.err.println("filenames are identical");

System.exit(1);

}

doit(args[0], args[1]);

}

}

下一個(gè)程序正好相反,采用假定只有一個(gè)入口項(xiàng)的Zip輸入文件,并且將該項(xiàng)解壓到指定的輸出文件:


import java.io.*;

import java.util.zip.*;



public class uncompress {

public static void doit(String filein, String fileout) {

FileInputStream fis = null;

FileOutputStream fos = null;

try {

fis = new FileInputStream(filein);

fos = new FileOutputStream(fileout);

ZipInputStream zis = new ZipInputStream(fis);

ZipEntry ze = zis.getNextEntry();

final int BUFSIZ = 4096;

byte inbuf[] = new byte[BUFSIZ];

int n;

while ((n = zis.read(inbuf, 0, BUFSIZ)) != -1)

fos.write(inbuf, 0, n);

zis.close();

fis = null;

fos.close();

fos = null;

}

catch (IOException e) {

System.err.println(e);

}

finally {

try {

if (fis != null)

fis.close();

if (fos != null)

fos.close();

}

catch (IOException e) {

}

}

}



public static void main(String args[]) {

if (args.length != 2) {

System.err.println("missing filenames");

System.exit(1);

}

if (args[0].equals(args[1])) {

System.err.println("filenames are identical");

System.exit(1);

}

doit(args[0], args[1]);

}

}

壓縮是有助還是損害I/O性能很大程度上依賴于本地硬件設(shè)置;尤其是處理器和磁盤驅(qū)動(dòng)器的相對(duì)速度。采用 Zip技術(shù)進(jìn)行壓縮,典型地將數(shù)據(jù)量減少50%,但是有一些壓縮和解壓的時(shí)間開銷。在帶IDE磁盤驅(qū)動(dòng)器的 300-MHz Pentium PC上,對(duì)一個(gè)大的壓縮文本文件(5-10MB)的實(shí)驗(yàn)表明,從磁盤讀取壓縮文件比非壓縮文件 快將近1/3。


充分展現(xiàn)壓縮優(yōu)越性的一個(gè)例子是在寫入象軟盤這樣的低速介質(zhì)。使用高速處理器 (300 MHz Pentium)和低 速軟盤(PC上常用的軟盤驅(qū)動(dòng)器)進(jìn)行的測(cè)試顯示,壓縮一個(gè)大文本文件,然后寫入軟盤,比直接將文件拷 貝到軟盤快50%。


高速緩存


關(guān)于硬件的高速緩存的詳細(xì)討論超出了本文的范圍。但是,有時(shí)軟件高速緩存 能夠加速I/O?紤]這樣一個(gè) 例子,需要以隨機(jī)的方式讀取文本文件的某些行。完成的方法之一是讀入所有的行,并且把它們存儲(chǔ)在 ArrayList(一個(gè)與Vector相似的collection類)中:


import java.io.*;

import java.util.ArrayList;



public class LineCache {

private ArrayList list = new ArrayList();



public LineCache(String fn) throws IOException {

FileReader fr = new FileReader(fn);

BufferedReader br = new BufferedReader(fr);

String ln;

while ((ln = br.readLine()) != null)

list.add(ln);

br.close();

}



public String getLine(int n) {

if (n < 0)

throw new IllegalArgumentException();



return (n < list.size() ?

(String)list.get(n) : null);

}



public static void main(String args[]) {

if (args.length != 1) {

System.err.println("missing filename");

System.exit(1);

}

try {

LineCache lc = new LineCache(args[0]);

int i = 0;

String ln;

while ((ln = lc.getLine(i++)) != null)

System.out.println(ln);

}

catch (IOException e) {

System.err.println(e);

}

}

}

getLine方法被用來檢索任意的一行。這項(xiàng)技術(shù)非常有用,但對(duì)于大文件而言,顯然需要使用了大量的內(nèi)存, 因此具有局限性。一個(gè)替代方法是僅僅記住最近被請(qǐng)求的100行,必要時(shí)從磁盤上讀取其他行。在存在行的存 儲(chǔ)局部性這種情況下,這個(gè)方案運(yùn)行良好,但是需要真正的隨機(jī)存儲(chǔ)時(shí)就沒有這么好了。


標(biāo)志化(Tokenization)


標(biāo)志化(Tokenization)指將字節(jié)或者字符序列拆散成象詞一樣的邏輯塊的過程。Java提供了StreamTokenizer 類,可以進(jìn)行如下的操作:


import java.io.*;



public class token1 {

public static void main(String args[]) {

if (args.length != 1) {

System.err.println("missing filename");

System.exit(1);

}

try {

FileReader fr = new FileReader(args[0]);

BufferedReader br = new BufferedReader(fr);

StreamTokenizer st = new StreamTokenizer(br);

st.resetSyntax();

st.wordChars('a', 'z');

int tok;

while ((tok = st.nextToken()) !=

StreamTokenizer.TT_EOF) {

if (tok == StreamTokenizer.TT_WORD)

; // st.sval has token

}

br.close();

}

catch (IOException e) {

System.err.println(e);

}

}

}

本例根據(jù)小寫字母(字母a-z)進(jìn)行標(biāo)記。如果由您自己實(shí)現(xiàn)了其等效程序,可能看上去象這樣:


import java.io.*;



public class token2 {

public static void main(String args[]) {

if (args.length != 1) {

System.err.println("missing filename");

System.exit(1);

}

try {



FileReader fr = new FileReader(args[0]);

BufferedReader br = new BufferedReader(fr);

int maxlen = 256;

int currlen = 0;

char wordbuf[] = new char[maxlen];

int c;

do {

c = br.read();

if (c >= 'a' && c <= 'z') {

if (currlen == maxlen) {

maxlen *= 1.5;

char xbuf[] =

new char[maxlen];

System.arraycopy( wordbuf, 0,

xbuf, 0, currlen);

wordbuf = xbuf;

}

wordbuf[currlen++] = (char)c;

}

else

if (currlen > 0) {

String s = new String(wordbuf, 0,

currlen);

// do something with s

currlen = 0;

}

} while (c != -1);

br.close();

}

catch (IOException e) {

System.err.println(e);

}

}

}