吴恩达机器学习可以说是最受推崇的机器学习基础课程。网络上有很多关于这方面的资源,其中比较推荐的是海洋大学黄海广的【斯坦福大学2014机器学习教程个人笔记】。黄博士的笔记很全,几乎是一字不差,把视频中原话搬下来。看完之后想要得到一份更凝练的笔记,并且加上自己的一些思考。
1 引言Introduction
1.1欢迎
这一集不是重点,如果对于ML有一点了解的话,那就溜了。
1.2机器学习是什么?What is Machine Leaning?
一个程序被认为从经验E中学习,解决任务T,达到性能度量值P,当且仅当,有经验E之后,经过P评判,程序在处理T时性能提升。
主要类型:监督学习 无监督学习。
1.3监督学习 Supervised Learning
这里涉及到两种情况: 回归:尝试推出一系列连续的属性值。 这里的一个例子是预测房价。房价的走势一般不会是简单的线性关系,但是大致趋势是从下往上增长的。可以用直线拟合,也可以用二次方程拟合。当然也可以用更高阶方程去表达。监督学习指的就是我们给学习算法一个数据集。这个数据集由“正确答案”组成。在房价的例子中,我们给了一系列房子的数据,我们给定数据集中每个样本的正确价格, 即它们实际的售价然后运用学习算法,算出更多的正确答案。
分类:尝试推出离散的输出值。 这一个例子是肿瘤预测。我有 5 个良性肿瘤样本,在 1 的位置有 5 个恶性肿瘤样本。现在我们有一个朋友很不幸 检查出乳腺肿瘤。假设说她的肿瘤大概这么大,那么机器学习的问题就在于,你能否估算出 肿瘤是恶性的或是良性的概率。用术语来讲,这是一个分类问题。 分类指的是,我们试着推测出离散的输出值:0 或 1 良性或恶性,而事实上在分类问题 中,输出可能不止两个值。比如说可能有三种乳腺癌,所以你希望预测离散输出 0、1、2、 3。0 代表良性,1 表示第 1 类乳腺癌,2 表示第 2 类癌症,3 表示第 3 类,但这也是分类问题。
1.4无监督学习 Unsupervised Learning
无监督学习与监督学习最主要的区别就是数据是没有Label值或者label值全是一样的。 需要机器自己去分类。 典型的例子:垃圾邮件,新闻事件分类etc.