第11章:机器学习分类

机器学习 (Machine Learning) 主要分为 监督学习 (Supervised Learning)无监督学习 (Unsupervised Learning)

什么是监督学习?

监督学习 就像 有老师指导的学习方法,你可以把它想象成学生做练习题:

  • 每道题(输入数据)都有一个 正确答案(标签)

  • 通过不断练习,学生(模型)学会如何解题

  • 在遇到新题目时,能够 给出合理的答案


监督学习主要分为两种类型

1. 回归 (Regression) —— 预测数值

目标:预测一个连续的 数值,例如:

  • 预测某天能卖出多少支冰淇淋(根据温度、降雨量、风速)。

  • 预测一套房子的售价(根据面积、卧室数量、地段)。

  • 预测汽车的油耗(根据发动机大小、车身重量等)。

简单理解预测一个具体的数字(如 明天的温度是多少?房价是多少?


2. 分类 (Classification) —— 预测类别

目标:预测一个 东西属于哪一类,例如:

  • 预测一个人是否会得糖尿病( 是 / 否)。

  • 预测银行客户是否会违约贷款(是 / 否)。

  • 预测某封邮件的客户是否会购买产品(是 / 否)。

分类任务的不同类型

  • 二元分类 (Binary Classification):只有 两种可能结果(如 是 / 否)。

  • 多类别分类 (Multiclass Classification):多个分类结果,例如:

    • 企鹅的种类(阿德利企鹅 / 巴布亚企鹅 / 帽带企鹅)。

    • 电影的类型(喜剧 / 恐怖片 / 科幻片)。

  • 多标签分类 (Multi-label Classification):一个数据点 可能属于多个类别,如:

    • 一部电影 既是科幻片,也是喜剧片

简单理解预测一个类别,而不是数值(如 这个动物是猫还是狗?用户是否会购买商品?


什么是无监督学习?

无监督学习 就像 自己摸索规律,没有正确答案,AI 需要 自主发现数据中的模式和结构


** 无监督学习主要类型**

1. 聚类 (Clustering) —— 把相似的东西归类

目标找出数据中的模式 & 进行分类,例如:

  • 根据 身高、体重 等数据,把人群分成不同类型(如 儿童 / 成年人 / 老人)。

  • 根据 购物习惯,把客户分成不同类型(如 高消费客户 / 日用品客户 / 电子产品客户)。

简单理解自己找规律,把相似的东西放在一组


监督学习 vs. 无监督学习

类型

特点

应用场景

监督学习

有正确答案,模型从标注数据中学习

贷款审批、图像分类、语音识别

回归

预测一个数值

房价预测、销量预测、温度预测

分类

预测一个类别

是否患病、邮件分类、客户行为预测

无监督学习

没有正确答案,AI 自己发现数据规律

推荐系统、客户分群

聚类

把相似的数据归类

用户分群、市场营销分析


总结

监督学习 = 老师教你怎么做(数据里有 正确答案回归 = 预测 一个数值(如 房价、销量分类 = 预测 一个类别(如 是否会买东西,是什么动物

无监督学习 = 自己摸索规律(数据里 没有正确答案聚类 = 把相似的东西归类(如 客户分群,市场分析

进一步学习机器学习

📢 欢迎 Star ⭐ 本仓库,获取更多 AI 资源!

Last updated