Java项目中如何构建站点访问统计_访问统计模块说明

Java站点访问统计模块可基于Spring Boot+Redis+MySQL自建,通过Filter/Interceptor采集IP、URL、Referer等维度数据,Redis实时计数与UV去重,MySQL每日汇总持久化,提供PV/UV接口及ECharts可视化。

Java项目中构建站点访问统计模块,核心是采集、存储、分析和展示用户访问行为数据。不依赖第三方服务时,可基于Spring Boot + Redis + MySQL自建轻量级统计系统,兼顾实时性与持久化。

一、统计维度设计

明确要记录的关键指标,避免过度采集增加系统负担:

  • 基础维度:IP地址、访问时间、请求URL、HTTP状态码、User-Agent(用于识别设备/浏览器)
  • 会话维度:使用Session ID或Cookie标识用户会话,区分独立访客(UV)与总访问次数(PV)
  • 来源维度:Referer字段提取来源页面,判断是否来自搜索引擎、外部链接或站内跳转
  • 地理维度(可选):通过IP库(如ip2region)解析省市,需注意隐私合规(GDPR/个保法)

二、数据采集方式

推荐在Web层统一拦截,避免业务代码侵入:

  • Filter拦截:编写`VisitCountFilter`,对非静态资源(如/js/、/css/、/img/)和健康检查路径(/actuator/**)做排除
  • Spring Interceptor:更灵活,可结合`HandlerMethod`获取控制器信息,适合需要关联业务动作的场景
  • 异步落库:采集逻辑不阻塞主流程,用线程池或Spring的`@Async`将日志写入Redis缓存队列

三、存储与聚合策略

兼顾性能与查询效率,分层存储:

  • 实时层(Redis):用Hash结构按天存储,如`visit:20250520` → `{"/home":120, "/user/profile":87}`;用Set记录当日UV(IP去重)
  • 持久层(MySQL):每日凌晨定时任务将Redis数据汇总入库,表结构示例:stat_daily(date, url, pv, uv, ip_list_json)
  • 冷数据归档:超过90天的数据可转入历史表或导出为Parquet文件供离线分析

四、查询与可视化

对外提供简单REST接口,前端用ECharts渲染图表:

  • 常用接口GET /api/stat/pv-uv?start=20250501&end=20250520 返回折线图数据
  • 热门页面排行GET /api/stat/top-url?date=20250520&limit=10
  • 实时看板(可选):用WebSocket推送秒级PV变化,适合运营监控大屏

基本上就这些。不需要复杂组件,关键在采集轻量、存储分层、查询聚焦——既满足日常运营看数需求,又不会拖慢主线业务。