您的位置:

JavaCSV文件读取详解

一、JavaCSV是什么

JavaCSV是一个Java编程语言的程序库,提供了一种简单、快速、可靠的方式读取和写入CSV文件。CSV是一种通用的文件格式,用于在不同的应用程序之间传递数据。JavaCSV支持自定义分隔符、文本引用符等,并提供了各种API,以满足各种读取和写入需求。

JavaCSV的特点包括:轻量级、稳定性高、容错性强、易于使用。开发人员只需要简单的配置即可快速开始使用JavaCSV进行CSV文件读取和写入操作。

二、JavaCSV文件的读取

1. 环境准备

JavaCSV的读取需要先下载jar包并导入项目,例如在maven项目中可以在pom.xml文件中添加以下依赖:

    <dependency>
        <groupId>com.googlecode.jcsv</groupId>
        <artifactId>jcsv</artifactId>
        <version>1.4</version>
    </dependency>

2. CSV文件格式

CSV文件格式以逗号分隔字段,在读取前要先确认好文件格式。JavaCSV支持读取自定义分隔符、自定义文本引号的CSV文件。例如下面是一个以逗号分隔的CSV文件:

    name,gender,age
    Tom,male,20
    Lily,female,18
    Mike,male,22

3. 创建CSVReader对象

在读取CSV文件前,需要创建CSVReader对象,CSVReader对象是JavaCSV文件读取的核心类,它负责将CSV文件中的内容读取到内存中,提供了各种读取CSV文件的方法。

例如下面的代码就是创建一个CSVReader对象:

    CSVReader<Person> csvReader = new CSVReaderBuilder<Person>(new FileReader("person.csv"))
            .strategy(new CsvToBeanStrategyBuilder<Person>().withType(Person.class).build())
            .build();

4. CSV文件读取

在创建好CSVReader对象后,接下来就可以开始读取CSV文件了。JavaCSV提供了多种读取CSV文件的方法,例如读取整个CSV文件,读取CSV文件的指定字段,按行读取CSV文件等等。以下是一个按行读取CSV文件的示例代码:

    String[] line;
    while ((line = csvReader.readNext()) != null) {
        System.out.println("Name: " + line[0] + ", Gender: " + line[1] + ", Age: " + line[2]);
    }

上述代码中,readNext()方法会读取CSV文件的下一行,返回一个字符串数组形式的行数据。将行数据解析后可以得到CSV文件中的各个字段。

三、JavaCSV文件的写入

1. 环境准备

JavaCSV的文件写入也需要先下载jar包并导入项目,同样可以在pom.xml文件中添加以下依赖:

    <dependency>
        <groupId>com.googlecode.jcsv</groupId>
        <artifactId>jcsv</artifactId>
        <version>1.4</version>
    </dependency>

2. CSV文件的写入

在写入CSV文件前,需要创建CSVWriter对象,CSVWriter对象是JavaCSV文件写入的核心类,它负责将一个Java对象写入到CSV文件中。

例如下面的代码就是创建一个CSVWriter对象:

    CSVWriter<Person> csvWriter = new CSVWriterBuilder<Person>(new FileWriter("person.csv"))
            .strategy(new BeanToCsvStrategyBuilder<Person>().build())
            .build();

上述代码中,CSVWriter负责将Person对象写入到person.csv文件中,使用BeanToCsvStrategyBuilder指定写入CSV文件的策略。

3. Java对象的写入

在创建好CSVWriter对象后,接下来就可以开始将Java对象写入CSV文件了。JavaCSV提供了两种写入Java对象的方式:一种是使用List,将多个Java对象一次性写入到CSV文件中;另一种是使用Java2CSVConverter,逐个将Java对象写入到CSV文件中。

这是一个将多个Java对象一次性写入CSV文件的示例代码:

    List<Person> persons = new ArrayList<>();
    persons.add(new Person("Tom", "male", 20));
    persons.add(new Person("Lily", "female", 18));
    persons.add(new Person("Mike", "male", 22));
    
    csvWriter.writeAll(persons);

上述代码中,createCsvWriter()方法返回一个CSVWriter实例,writeAll()方法用于将List中的全部Java对象写入到CSV文件中。

四、JavaCSV的其他功能

1. 支持自定义分隔符

JavaCSV默认使用逗号作为CSV文件的字段分隔符,但是开发人员可以根据具体需求,自定义分隔符。例如下面的代码将分隔符设置为竖线“|”:

    CSVParser parser = new CSVParserBuilder().withSeparator('|').build();
    CSVReader<Person> csvReader = new CSVReaderBuilder<Person>(new FileReader("person.csv"))
            .withParser(parser)
            .strategy(new CsvToBeanStrategyBuilder<Person>().withType(Person.class).build())
            .build();

2. 支持自定义文本引用符

当CSV文件中存在文本字段包含分隔符时,需要将文本引用起来,以避免分隔符被误认为是字段分隔符。JavaCSV默认使用双引号作为文本引用符,但开发人员也可以根据实际需求自定义文本引用符。以下是一个自定义文本引用符的示例代码:

    CSVParser parser = new CSVParserBuilder().withQuoteChar('\'').build();
    CSVReader<Person> csvReader = new CSVReaderBuilder<Person>(new FileReader("person.csv"))
            .withParser(parser)
            .strategy(new CsvToBeanStrategyBuilder<Person>().withType(Person.class).build())
            .build();

3. 支持自定义字符集

JavaCSV默认使用UTF-8编码读取和写入CSV文件,但开发人员也可以根据具体需求,自定义CSV文件的字符集。以下是一个自定义字符集的示例代码:

    CSVReader<Person> csvReader = new CSVReaderBuilder<Person>(new InputStreamReader(new FileInputStream(file), "GBK"))
            .build();

四、小结

JavaCSV是一个稳定、简单易用的Java编程库,提供了丰富的API,支持自定义分隔符、文本引用符、字符集等,满足各种CSV文件读取和写入的需求。通过本篇文章的介绍,读者应该对JavaCSV文件读取的基本原理及操作有了初步的了解。