机器学习之聚类算法(1)
1. 聚类的概念(Clustering)
1.1 聚类的概念
机器学习按照学习形式可以分为“监督学习”与“无监督学习”,在无监督学习中,训练样本的标记信息未知,即没有“标签”,需要通过对无标记训练样本的学习来揭示数据的内在性质与规律,无监督学习任务中研究最多、应用最广的是聚类。
Always be Brave and Enthusiastic
学期初,在自己的“对于知识的向往”和高中校友茅信的杜铭枢同学的鼓动下,报名了学校为茅院辅修大数据专业同学们开设的课程——机器学习与模式识别。课程鼓励对成果进行分享,因此在初期阶段我们进行了多次报告、课堂展示,而在课程中期,这一展示形式推广到了博客的方式。作为一个初学者,对于一些概念的掌握还十分浅显,再加之初期的doc格式报告不易转换成markdown文件,因此,此处选择转为pdf文件的形式对课程的前6次报告进行上传。过程中还有很多需要改进的地方,我也找到了进一步努力的方向。愿通过这门“戏很多”的课程,能够在数据分析、算法理解、报告撰写、课堂展示等方面有所收获。
下面按照课程要求,发布学习报告。
主讲人:曹新宇教授 (美国明尼苏达大学)
讲座时间地点:2018.5.15交运楼417会议室
主讲人及讲座介绍链接:http://ctt.swjtu.edu.cn/info/1041/2604.htm