设为首页 加入收藏

TOP

约翰霍普金斯大学数据科学系列课程――导论
2015-07-24 11:16:18 】 浏览:1396
Tags:约翰 霍普 金斯 大学 数据 科学 系列 课程 导论

这几个月我以斯坦福大学Andrew Ng(中文译作吴恩达,他也是Coursera网站的创始人)的机器学习讲义为参考,在CSDN博客上写了一些机器学习和数据挖掘相关的总结笔记(还有独立成分分析和强化学习两章没有完成),通过学习和总结,对以前学过的统计学和数据挖掘等有了一些新的认识(很多公式最好自己去推导,这样能够真正的加深认识、记忆深刻)。但在学习时,也感觉自己主要有两大不足:1、理论不够扎实。如在前几天总结贝叶斯机器学习的相关概念,才发现自己根本没吃透贝叶斯学派的本质思想,而仅仅是知道个贝叶斯公式而已;2、缺乏实际应用的经验。在面对实际问题,设计具体方案时就会纠结于各种方法的选择,数据挖掘不仅是理论科学,更是一种经验科学。

前几天在著名的免费公开课网站Coursera新出炉了一系列的专项课程,其中有一门就是约翰霍普金斯大学布隆伯格公共卫生学院开设的数据科学(Data Science)系列课程。惊叹老外将全世界最好的教育无私分享给大家之余,更加不解为何国内很多专家教授连讲座的PPT都不肯与学员分享(相信大家都有听过讲座后索要PPT被拒的经历)。

既然有这么好的课程,希望能够通过对课程的学习,提高自己的能力,弥补不足,下面我就根据该课程的官网,将这门课的目的和内容进行一个简要的介绍:

一、 您将学到什么?

(1)制定与研究背景相关的问题和假设,以驱动数据科学的研究;

(2)识别、获取以及转换数据,形成统计学证据,使其适合书面交流;

(3)基于新的数据类型、实验设计和统计推断建立模型。

二、 课程内容

这个系列课程以R语言为工具,共分为9个部分:

(1) 数据科学家的工具箱(The Data Scientists’ Toolbox)

(2) R语言编程(R Programming)

(3) 获取和清理数据(Getting and Cleaning Data)

(4) 探索性数据分析(Exploratory Data Analysis)

(5) 可重复性研究(Reproducible Research)

(6) 推断统计(Statistical Inference)

(7) 回归模型(Regression Models)

(8) 实用机器学习(Practical Machine Learning)

(9) 开发数据产品(Developing Data Products)

三、 总体要求

\

<http://www.2cto.com/kf/ware/vc/" target="_blank" class="keylink">vcD4KPHA+yc/NvMrHv86zzL2y0uW4+LP2tcTK/b7dv8bRp9Do0qq+37G4tcTE3MGmo6y/ydLUv7Sz9qO6s8nOqtK7uPbK/b7d0OjSqs2syrG8xsvju/q8vMTcoaLK/cDtzbO8xtaqyrbS1Lyw16jStcTcwaahozwvcD4KPHA+1+6689TZuL3Jz9K7uPazyc6q0ru49sr9vt2/xtGnvNK1xLPJs6TCt8/fzbyjrM/CzbyyorK7yvTT2tXiuPa/zrPMtcS9stLlo6y1q8rHuPiz9sHL0ru49sr9vt2/xtGnvNLQ6NKq1cbO1bXEvt/M5daqyra6zby8xNyho7TT1eK49s28v8nS1L+0s/ajrLPJzqrSu7j2yv2+3b/G0ae80qOswrfC/sL+xuTQ3tS22eKhozwvcD4KPHA+PGltZyBzcmM9"https://www.cppentry.com/upload_files/article/57/1_zk1a7__.jpg" alt="">

既然希望进步,就需要坚持,我会以这个课程为基础,坚持学习,坚持记录。


】【打印繁体】【投稿】【收藏】 【推荐】【举报】【评论】 【关闭】 【返回顶部
上一篇解决“无法连接到WMI提供程序,您.. 下一篇PHPCMSV9管理员密码忘记如何修改

最新文章

热门文章

Hot 文章

Python

C 语言

C++基础

大数据基础

linux编程基础

C/C++面试题目