机器学习介绍-李宏毅机器学习

img

一、Artificial Intelligence

  • hand-crafted rules

这些规则我们通常称hand-crafted rules,叫做人设定的规则。非常的僵化,而用hand-crafted rules创造出来的machine,它永远没有办法超过它的创造者人类。人类想不到东西,就没办法写规则,没有写规则,机器就不知道要怎么办。所以如果一个机器,它只能够按照人类所设定好的hand-crafted rules,它整个行为都是被规定好的,没有办法freestyle。

img

  • machine learning

Machine Learning = Looking for a Function

img

二、machine learning framework

img

第一个步骤就是找一个function,第二个步骤让machine可以衡量一个function是好还是不好,第三个步骤是让machine有一个自动的方法,有一个好演算法可以挑出最好的function。

img

三、机器学习相关的技术

img

1.监督学习

supervised learning(监督学习),监督学习的问题是我们需要大量的training data。training data告诉我们要找的function的input和output之间的关系。如果我们在监督学习下进行学习,我们需要告诉机器function的input和output是什么。这个output往往没有办法用很自然的方式取得,需要人工的力量把它标注出来,这些function的output叫做label。

  • Task

    img

    • Regression(回归)

      Regression中机器输出的是一个数值,regression时的意思是,machine找到的function,它的输出是一个scalar,这个叫做regression。eg:预测股票价格

    • Classification(分类)

      在Classification里面机器输出的是类别。Classification问题分成两种,一种叫做二分类(Binary-class);另一类叫做多分类(Multi-class)。eg:二分类:垃圾邮件拦截;多分类:新闻类别分类;

      img

    • structured learning(结构化学习)

      img

  • Function

选不同的function set就是选不同的model。Model有很多种,最简单的就是线性模型,但我们会花很多时间在非线性的模型上。在非线性的模型中最耳熟能详的就是Deep learning。当然还有SVM,决策树等很多machine learning的model。

2.非监督学习

非监督学习(Semi-supervised Learning),有少量的labelled data,但是同时又有大量的Unlabeled data。

3.迁移学习

迁移学习(Transfer Learning),同样只有少量的有label的data,但是我们现在有大量的data,这些大量的data中可能有label也可能没有label。

4.无监督学习

无监督学习(Unsupervised Learning),更加进阶的就是无监督学习,我们希望机器可以学到无师自通。在完全没有任何label的情况下,机器可以学到什么样的事情。

5.强化学习

强化学习(Reinforcement learning),在reinforcement learning里面,我们没有告诉机器正确的答案是什么,机器所拥有的只有一个分数,就是他做的好还是不好。reinforcement learning也是比较符合我们人类真正的学习的情景,这是你在学校里面的学习老师会告诉你答案,但在真实社会中没人回告诉你正确答案。eg:Alpha Go原理:先用棋谱做监督学习,然后在做reinforcement learning,但是reinforcement learning需要一个对手,如果使用人当对手就会很让费时间,所以机器的对手是另外一个机器。

参考


机器学习介绍-李宏毅机器学习
https://blog.baixf.tk/2022/07/11/Machine Learning/李宏毅机器学习(含深度学习)/第一章 机器学习介绍/
作者
白小飞
发布于
2022年7月11日
许可协议