CRISP-DM分为六个阶段,该方法是一个迭代和循环的过程

Learn, share, and connect around europe dataset solutions.
Post Reply
suchona.kani.z
Posts: 258
Joined: Sat Dec 21, 2024 5:42 am

CRISP-DM分为六个阶段,该方法是一个迭代和循环的过程

Post by suchona.kani.z »

数据分析应理解为数据分析的一个子类别,包括对各个数据集进行分析,以便从中获得见解。数据分析和数据分析之间的区别在它们的目标上变得很明显。在数据分析领域,洞察是从历史数据中获得的,并对这些数据进行解释和可视化,而数据分析更多的是预测未来事件并得出行动建议。

了解 DS 方法
数据科学需要一种系统的方法和一个清晰的流程,其中任务是结构化的,各个阶段彼此明确分开。这样的过程对于为数据科学家和其他参与者提供行动框架是必要的,以便构建数据分析任务并解决潜在的挑战。 CRISP-DM 和 CRISP-ML(Q) 是数据科学领域常用的过程模型。

数据挖掘的跨行业标准流程 – CRISP-DM
为了从大量数据中开发模式和模型,以便从数据中提取知识,需要一个分为多个阶段的系统过程。数据科学项目使用最广泛的模型是 CRISP-DM。

数据挖掘(即数据模式识别)被视为数据科学的一个分支,包括从数据中 厄瓜多尔 whatsapp 数据​ 提取见解的统计方法和算法。 CRISP-DM 方法为数据科学项目中建立迭代和敏捷方法做出了重大贡献。


业务理解:在此阶段,创建技术理解并确定当前状态和项目目标。
数据理解:这是关于识别和理解数据和数据源。这包括进行探索性数据分析。
数据准备:为了使用数据训练模型,数据准备很重要。
建模:在建模阶段,模型使用数据挖掘算法进行学习,例如分类、聚类或回归分析。
评估:在此阶段评估模型的结果。
部署:这涉及对结果进行操作并监控操作条件。
机器学习的跨行业标准流程 – CRISP-ML(Q)
CRISP-ML(Q) 可以被视为 CRISP-DM 方法的扩展,并确保机器学习操作 (MLOps) 原则得到遵守和实施。 MLOps 是一个迭代过程,被认为是数据科学项目成功的重要组成部分。借助 MLOps,可以在数据科学、人工智能和机器学习项目中产生价值,并将潜在风险降至最低。目标是标准化机器学习模型的生命周期。 CRISP-ML(Q) 方法专为开发使用机器学习模型的机器应用程序而设计。 CRISP-ML(Q) 与 CRISP-DM 一样,是一个由多个阶段组成的迭代模型。

软件程序和机器学习模型的部署必须以不同的方式看待,因为软件程序很大程度上是静态的,而机器学习模型不断变化并且必须学习新数据。模型环境更加复杂,期望通过使用 MLOps 进行风险评估和降低。
Post Reply