在Java里如何开发简易成绩分析工具_Java数据分析项目解析

Java成绩分析应使用ArrayList而非double[],配合stream过滤null/NaN,用Collectors.summarizingDouble获取统计值,partitioningBy计算及格率,CSV导出需转义双引号并指定UTF-8编码。

Java 本身不内置统计分析能力,但用标准库 + 少量数学逻辑就能完成简易成绩分析——关键不在“用什么框架”,而在“怎么组织数据结构和计算逻辑”。

ArrayList 存成绩,别用原始数组

原始数组(double[])无法直接调用 stream()、没有动态增删能力,处理缺考、补录等场景容易出错。用 ArrayList 更灵活,且能自然过滤 nullNaN

实操建议:

  • 初始化时用 new ArrayList(),避免指定初始容量导致误判有效数据量
  • 录入成绩前做基础校验:if (score >= 0 && score ,允许空值但拒绝负分或超100分
  • 计算前统一过滤:list.stream().filter(Objects::nonNull).filter(d -> !d.isNaN()).collect(Collectors.toList())

Collectors.summarizingDouble() 一行搞定基础统计

不用手写循环求平均、最大、最小、计数——Collectors.summarizingDouble() 返回的 DoubleSummaryStatistics 对象自带全部常用指标,且是单次遍历完成,性能好、代码干净。

DoubleSummaryStatistics stats = scores.stream()
    .filter(Objects::nonNull)
    .filter(d -> !d.isNaN())
    .collect(Collectors.summarizingDouble(Double::doubleValue));

之后可直接取:stats.getAverage()stats.getMax()stats.getCount() 等。注意:如果列表为空,getAverage() 返回 0.0,不是 NaN,需按业务判断是否要抛异常或提示“无有效成绩”。

及格率、优秀率用 partitioningBy()filter().count() 更清晰

统计“≥60”和“≥90”的人数占比时,用 partitioningBy() 一次分流,语义明确,也方便后续扩展多档分级(如良、中、差)。

Map passMap = scores.stream()
    .filter(Objects::nonNull)
    .filter(d -> !d.isNaN())
    .collect(Collectors.partitioningBy(s -> s >= 60, Collectors.counting()));
long total = passMap.values().stream().mapToLong(Long::longValue).sum();
double passRate = total == 0 ? 0.0 : (double) passMap.getOrDefault(true, 0L) / total;

常见错误:

  • 漏掉 filter 步骤,把 nullNaN

    成 0 参与统计
  • passMap.get(true) 而不加 getOrDefault,空列表时触发 NullPointerException
  • 除法用 int 运算(如 passCount / totalCount),结果恒为 0

导出为 CSV 时小心逗号、换行和引号

成绩字段本身一般不含特殊字符,但学生姓名可能含逗号(如“张三,男”)或换行符。直接拼接会破坏 CSV 结构。最简方案是:所有字段用双引号包裹,内部双引号转义为两个双引号。

实操建议:

  • 别自己写字符串拼接,用 String.format("\"%s\"", name.replace("\"", "\"\""))
  • 文件写入用 Files.write(path, lines, StandardCharsets.UTF_8),显式指定编码,避免 Windows 记事本乱码
  • 首行写列名:"学号,姓名,成绩,等级",不要漏掉 BOM 头(UTF-8 不需要 BOM)

真正难的不是算平均分,而是让数据进得准、出得稳、读得懂——尤其当 Excel 双击打开 CSV 时自动识别错列,往往是因为某一行少了一个引号。