在Java里如何开发简易成绩分析工具_Java数据分析项目解析_技术教程

Java成绩分析应使用ArrayList而非double[]，配合stream过滤null/NaN，用Collectors.summarizingDouble获取统计值，partitioningBy计算及格率，CSV导出需转义双引号并指定UTF-8编码。

Java 本身不内置统计分析能力，但用标准库 + 少量数学逻辑就能完成简易成绩分析——关键不在“用什么框架”，而在“怎么组织数据结构和计算逻辑”。

用 `ArrayList` 存成绩，别用原始数组

原始数组（double[]）无法直接调用 stream()、没有动态增删能力，处理缺考、补录等场景容易出错。用 ArrayList 更灵活，且能自然过滤 null 或 NaN。

实操建议：

初始化时用 new ArrayList()，避免指定初始容量导致误判有效数据量
录入成绩前做基础校验：if (score >= 0 && score ，允许空值但拒绝负分或超100分
计算前统一过滤：list.stream().filter(Objects::nonNull).filter(d -> !d.isNaN()).collect(Collectors.toList())

`Collectors.summarizingDouble()` 一行搞定基础统计

不用手写循环求平均、最大、最小、计数——Collectors.summarizingDouble() 返回的 DoubleSummaryStatistics 对象自带全部常用指标，且是单次遍历完成，性能好、代码干净。

DoubleSummaryStatistics stats = scores.stream()
    .filter(Objects::nonNull)
    .filter(d -> !d.isNaN())
    .collect(Collectors.summarizingDouble(Double::doubleValue));

之后可直接取：stats.getAverage()、stats.getMax()、stats.getCount() 等。注意：如果列表为空，getAverage() 返回 0.0，不是 NaN，需按业务判断是否要抛异常或提示“无有效成绩”。

及格率、优秀率用 `partitioningBy()` 比 `filter().count()` 更清晰

统计“≥60”和“≥90”的人数占比时，用 partitioningBy() 一次分流，语义明确，也方便后续扩展多档分级（如良、中、差）。

Map passMap = scores.stream()
    .filter(Objects::nonNull)
    .filter(d -> !d.isNaN())
    .collect(Collectors.partitioningBy(s -> s >= 60, Collectors.counting()));
long total = passMap.values().stream().mapToLong(Long::longValue).sum();
double passRate = total == 0 ? 0.0 : (double) passMap.getOrDefault(true, 0L) / total;

常见错误：

漏掉 filter 步骤，把 null 或 NaN 当
成 0 参与统计
用 passMap.get(true) 而不加 getOrDefault，空列表时触发 NullPointerException
除法用 int 运算（如 passCount / totalCount），结果恒为 0

导出为 CSV 时小心逗号、换行和引号

成绩字段本身一般不含特殊字符，但学生姓名可能含逗号（如“张三,男”）或换行符。直接拼接会破坏 CSV 结构。最简方案是：所有字段用双引号包裹，内部双引号转义为两个双引号。

实操建议：

别自己写字符串拼接，用 String.format("\"%s\"", name.replace("\"", "\"\""))
文件写入用 Files.write(path, lines, StandardCharsets.UTF_8)，显式指定编码，避免 Windows 记事本乱码
首行写列名："学号,姓名,成绩,等级"，不要漏掉 BOM 头（UTF-8 不需要 BOM）

真正难的不是算平均分，而是让数据进得准、出得稳、读得懂——尤其当 Excel 双击打开 CSV 时自动识别错列，往往是因为某一行少了一个引号。