客户背景

一家年产值 3 亿+ 的包装印刷企业,服务快消品和电子产品客户,SKU 超过 2000 个。他们带着一个困扰多年的问题找到了我们。
他们的整个生产排程都活在两名资深计划员的脑子里。当这两个人休假或请假时,顶班的人排产误差高达 30-40%。紧急插单靠"拍脑袋猜"。新订单的成本估算基于粗略的经验法则,结果是要么丢了本来能赚钱的单,要么接了亏本的活。
CEO 说得很直接:"如果我们两个计划员中任何一个明天辞职,我们都不知道工厂怎么运转。"
这不是什么罕见故事。在很多中型制造企业里,最有价值的流程知识只存在于少数几个人脑子里。当这些人离职——或者甚至只是请一天假——业务就会受到影响。
数据评估阶段我们发现了什么

我们总是从数据开始。客户分享了 ERP 系统中 14 个月的历史工单记录。经过初步数据清洗(基于四分位数的异常值剔除加上孤立森林过滤明显不良样本),我们得到了约 8000 条已完成工单的训练集。
每条记录包含:
- 订单元数据:SKU、数量、交期、客户等级
- 工艺细节:设备分配、操作员、材料类型、复杂度评分
- 实际结果:开始时间、结束时间、质量检验结果、返工记录
三个模式立刻显现出来:
1. 计划员不错,但不稳定。 正常情况下,排产与最优方案偏差在 10-15% 以内。但在忙碌的日子、节假日期间或互相顶班时,误差飙升到 30-40%。
2. 某些 SKU-工艺组合被系统性低估。 一类定制礼盒的工时总是被少估 20-30%,因为计划员用了一个通用的"盒子"模板来处理实际上是多道复杂工序的订单。
3. 质量异常有可预测的前兆。 当某些材料-参数组合同时出现时,质量问题的概率会提升 3-5 倍。但只有在事后才能看到——没人实时监控。
我们做了什么

私有化工时预测模型
我们基于 14 个月的工单历史训练了一个梯度提升模型(XGBoost)。模型接收新订单的特征——SKU 复杂度、材料类型、当前产线负荷、操作员技能水平——并预测期望的加工时间及置信区间。
关键设计决策:
- 本地化部署:模型作为 FastAPI 接口运行在客户自己的服务器上。数据不出厂。客户拥有模型权重、数据和 API 的全部所有权。
- 每月再训练:每月模型用最新 3 个月的数据自动再训练,确保适应变化——新设备、新 SKU、季节性波动。
- 无缝集成:我们没有替换计划员的现有工具,而是将模型嵌入他们的工作流中。计划员仍然做最终决策,但现在有了数据支撑的基线,而不是猜。
质量异常早期预警
我们构建了第二个专注于质量预测的模型。通过分析历史缺陷记录与工艺参数的关联,我们识别了最可能导致质量问题的参数组合。
系统实时监控生产过程,当异常概率超过阈值时发送告警。这意味着团队可以在数百个次品产生之前就介入——在 50 个的时候就发现问题,而不是等到 500 个。
智能成本估算
工时预测数据输入到成本估算模块,与材料成本、设备折旧、能耗数据融合。对于任何新订单,销售团队在 10 秒内就能得到一个成本区间——替代了过去的"凭经验猜"。
实施时间线

第 1-2 个月:数据基础
清洗 14 个月的 ERP 数据,建立工时、质量、成本的基线指标,定义训练集。
第 3-4 个月:模型部署
工时预测模型训练完毕并部署为 FastAPI 接口。质量预警模块同步上线。计划员开始在原有流程中使用新系统。
第 5-6 个月:成本估算与优化
成本估算模块上线。模型再训练流程自动化。利用新的数据可见性开展全厂 OEE 提升专项。
量化成果

|------|--------|--------|
| 每日排产时间 | 4 小时 | 2.5 小时(-50%) |
|---|---|---|
| 交期达成率 | 78% | 94% |
| 计划员不在岗时的排程误差 | 30-40% | <10% |
| 来料不良率 | 基线 | -42% |
但最重要的成果不在表格里:工厂不再依赖两个特定的人。 曾经活在他们脑子里的知识现在编码在一个每天都在运行的模型里,每月自动再训练,每新增一条工单就变得更聪明。
这对你的企业意味着什么

如果你的生产排程、成本估算或质量控制高度依赖几个关键人员,同样的方法对你也有效。要求很简单:
- 至少 3 个月的历史工单数据(越多越好)
- 愿意提供有代表性的样本做初步评估
- 一个可以让模型本地化部署的生产环境
多数项目 7 天内交付分析报告。生产部署的模型一般需要 4-6 周。
你的数据就是你的竞争优势。 基于它训练的模型是独一无二的——别人无法复制,因为别人没有你的数据。这就是护城河。
