![CleanShot 2025-04-13 at [email protected]|1000](https://imagehosting4picgo.oss-cn-beijing.aliyuncs.com/imagehosting/fix-dir%2Fmedia%2Fmedia_qZhatjbmNx%2F2025%2F04%2F13%2F01-54-23-a4dfc8501dc1fadfabd20a45cb60c7eb-CleanShot%202025-04-13%20at%2001.53.49-2x-a6400c.png) 做完/接手任何数分项目,用三问自检: 1. 我能不能在 30 秒内找到某个分析用的源数据? 2. 我能不能说明白某个结果是怎么一步步算出来的? 3. 下周重做一遍,能不能得到同样结果? 三个里答不上两个 → 流程失控,按前述章节重构。 | 层 | 作用 | 铁律 | |:-------- |:--------------------------------------------------- |:--------------------------------- | | raw | 所有外部拿到的原始数据(BI 导出、接口返回、截图等) | 只进不改。任何修改都要落到 clean/ | | clean | 字段对齐、去重、时间格式统一、主键统一后的中间表 | 不做分析、不做聚合 | | analysis | 围绕具体问题组织的专题数据集(不是按来源) | 可以多份,每份对应一个分析主题 | | output | 图表、结论 md、汇报 PPT、最终交付表格 | 所有对外物都从这里拿 | | | | |