Java环境搭建完成后乱码问题如何解决_Java字符集配置解析

根本原因是 JVM 启动参数未指定 UTF-8 编码,需在 Help → Edit Custom VM Options 添加 -Dfile.encoding=UTF-8,并在 File Encodings 中统一设为 UTF-8,同时确保源文件无 BOM、编译和终端编码一致。

IDEA 启动时控制台输出中文乱码

根本原因是 JVM 启动参数未指定正确的文件编码,导致 System.out 使用平台默认编码(Windows 上常为 GBK),而源文件实际是 UTF-8。IDEA 默认不继承系统环境编码,需显式配置。

  • 打开 Help → Edit Custom VM Options…,添加:
    -Dfile.encoding=UTF-8
  • 同时在 Settings → Editor → File Encodings 中确认:
    Global EncodingProject Encoding 均设为 UTF-8
    Default encoding for properties files 也勾选 UTF-8
  • 重启 IDEA,再运行含中文的 System.out.println("你好") 即可正常显示

Java 编译时报错“非法字符:'\uFFFD'”

这是源文件保存编码与 javac 解析编码不一致的典型表现,\uFFFD 是 Unicode 替换字符,说明编译器读到了无法识别的字节序列。

  • 确保 .java 文件以 UTF-8 无 BOM 格式保存(用 VS Code 或 Notepad++ 可验证并转换)
  • 手动编译时显式指定编码:
    javac -encoding UTF-8 Main.java
  • 若用 Maven,必须在 pom.xml 中声明:
    
      UTF-8
    
    否则 maven-compiler-plugin 会按平台默认编码读取源码

Spring Boot 控制台日志中文乱码(Windows CMD/PowerShell)

即使 Java 层面编码正确,Windows 终端本身默认使用 GBK,而 Spring Boot 日志框架(如 Logback)输出的是 UTF-8 字节流,终端无法自动识别。

  • 临时解决:启动前在 CMD 中执行
    chcp 65001
    (切换为 UTF-8 代码页)
  • 根治方法:在 application.properties 中强制 Logback 使用平台编码:
    logging.pattern.console=%d{HH:mm:ss.SSS} [%thread] %-5level %logger{36} - %msg%npattern
    但更可靠的是在 logback-spring.xml 内加:
    UTF-8
  • 注意:IntelliJ 内置 Terminal 默认支持 UTF-8,乱码多出现在外部 CMD 窗口,此时不要依赖 IDE 设置,必须改终端或日志配置

Tomcat 8+ 中文请求参数乱码(GET/POST 都失效)

Tomcat 8.0+ 默认对 GET 请求使用 ISO-8859-1 解码,POST 则依赖 request.setCharacterEncoding(),两者都需干预。

  • 对 POST 请求:在 Filter 或 Controller 开头调用
    request.setCharacterEncoding("UTF-8");
    (必须在 getParameter() 前)
  • 对 GET 请求:修改 conf/server.xml,在 标签中添加:
    URIEncoding="UTF-8"
    例如:
  • 若用 Spring Boot 内嵌 Tomcat,等效配置为:
    server.tomcat.uri-encoding=UTF-8
    写入 application.properties

Java 字符集问题从来不是单点配置能彻底解决的,从源码保存、编译参数、JVM 启动、Web 容器解码到终端渲染,每个环节都可能断裂。最容易被忽略的是 Windows 下 CMD 的代码页和 Tomcat 的 URIEncoding —— 这两个不配,前端传过来的中文参数在后端永远是乱码。