建筑数据异常智能检测

Data Anomaly Detector

收藏 15.7k
下载 3.7k
版本 2.1.0

建筑数据异常检测工具,基于IQR/Z-Score等统计方法识别成本超支、进度偏差和生产率异常,纯本地处理无网络风险

基本信息

  • 技能名称?Data Anomaly Detector
  • 中文名称?建筑数据异常智能检测
  • 作者?datadrivenconstruction
  • 分类?专业技能
  • 版本?2.1.0
  • 标签?construction, anomaly-detection, statistical-analysis, cost-control, schedule-management, data-quality, pandas, local-processing

使用方法

使用说明
核心用法
Data Anomaly Detector 是一款面向建筑行业的数据质量监控工具,通过统计学和机器学习方法自动识别项目数据中的异常模式。用户加载 Excel/CSV 数据后,配置检测参数(成本列、日期列、关键字段等),即可执行全量异常扫描。核心检测模块包括:成本异常(基于IQR四分位距和分组Z-Score识别统计离群值)、进度异常(检测负工期、超长任务、零工期非里程碑)、生产率异常(Modified Z-Score识别效率异常)、时序异常(滚动窗口趋势偏差)、重复记录检测、序列断号检测。
显著优点

  1. 行业定制化 :内置建筑专业阈值(混凝土$200-800/立方码、钢材$1500-4000/吨、管理费率5-25%等),无需用户自行设定基准
  2. 多维度检测 :覆盖成本、进度、生产率、数据质量四大业务场景,支持单次批量扫描
  3. 统计方法成熟 :采用IQR、Z-Score、Modified Z-Score等经典算法,结果可解释性强
  4. 风险分级明确 :Critical/High/Medium/Low四级 severity,自动推荐处置动作
  5. 完全离线运行 :零网络依赖,敏感项目数据不出本地
    潜在缺点与局限性
  6. 阈值刚性 :内置COST_THRESHOLDS和SCHEDULE_THRESHOLDS基于北美市场,海外或特殊项目可能误报/漏报
  7. 无自适应学习 :无法根据历史数据自动优化阈值,需人工调整config
  8. 时序检测简单 :仅支持固定窗口滚动平均,无ARIMA/LSTM等高级时序模型
  9. 大表性能未验证 :代码未针对百万级以上记录做向量化优化或分块处理
  10. 输出格式单一 :仅支持Markdown报告,无JSON/API格式便于系统集成
    适合人群
    建筑公司成本控制部门:快速审核月度成本报表
    项目计划工程师:检查P6/MS Project导出数据的逻辑错误
    审计与合规团队:识别潜在的估算错误或数据造假迹象
    小型开发商:无预算购买Primavera P6完整模块时的轻量替代
    常规风险
    输入数据质量 :GIGO原则,脏数据(混合单位、错误日期格式)会导致检测失效
    阈值误配风险 :国际项目或通胀极端时期,固定阈值可能产生大量假阳性
    统计方法局限 :IQR对长尾分布敏感,Modified Z-Score依赖MAD稳健性,极端异常值可能污染中位数估计
    业务误判 :检测出的统计异常未必代表业务问题(如紧急抢工导致的高生产率),需人工复核
    隐私合规 :虽然工具本身不上传数据,但用户导出的Markdown报告可能通过邮件/云盘泄露敏感项目信息

标签

专业技能

💬 评论 (0)

发表评论

支持 Markdown

📭 还没有评论,快来抢沙发吧!