中国人民大学论坛

 找回密码
 注册[30秒完成]
搜索
查看: 43761|回复: 0

【数据科学职业发展】data science, machine learning, data mining, business an...

[复制链接]
发表于 2017-7-31 10:45:30 | 显示全部楼层 |阅读模式

如今做公司,言必称大数据,否则就显得很out,那么data  science, machine learning, data mining, business analytics, applied statistics, operations research这些时髦词,到底有什么联系和区别呢?从就业的角度,小伙伴们该如何选择?下面蟹老板来简单讲讲:

最近Data Science这个专业非常火,申请竞争也越来越激烈,好在越来越多的学校正在努力开设这个专业,满足小伙伴们日益高涨的学习热情~~有同学可能会担心,过两年这个专业是否会变得人才饱和然后不好找工作?

我认为是不会的:
首先,各行各业都需要data science的人才:市场营销需要分析数据,金融投资需要数据分析,风险管理需要数据分析,医疗系统需要数据分析,电商 、媒体、政府、能源等等,几乎所有重要的领域都越来越离不开数据分析,因此数据科学人才的需求将在未来很长的一段时间持续增长。

再者,数据科学是偏理工的实践类专业,对逻辑能力和动手能力都有较高要求,不是大家都能学明白的,因此人才数量的增长有限,算是门槛较高的专业,不像一些做app、做前端的职业,学习门槛低,人才容易过剩。

最后,数据科学将慢慢发展成一种高级人才的必备工具,无论从事哪个行业,都需要具备一定的数据分析能力,即使不读专门的学位,也建议大家通过上网课来学习这方面的知识和技能,尤其是对于在国内读书的同学,由于我国教育在这方面比较落后,因此要多利用互联网资源,比如youtbue上就有很多免费的教程非常不错。

下面谈谈小白们常有的一些疑问和误区:
1. “我喜欢跟人沟通,不喜欢编程,因此不适合学数据科学。”
实际上从事数据科学工作,往往需要很强的沟通能力和business acumen,而编程只是辅助技能,不是决定性的,在职业生涯中后期,能脱颖而出的data scientist都是具备很强的沟通能力、解决问题的能力,而且一般都有自己深钻的领域,比如金融行业、医疗行业、电商平台等等。从漫长的职业发展道路来看,编程只是一座小小的山丘,后面还有连绵不绝的高山等着大家去征服。此外,据我观察,大部分声称“我擅长跟人沟通,不喜欢搞技术的”人,只是因为喜欢跟人聊天而产生了自己擅长跟人沟通的幻觉,实际情况往往是既没有一技之长,也不擅长跟人沟通,请大家注意“话痨”和“商务谈判能力”、“营销能力”的区别,前者是毛病,后者才是技能,不要加错了属性点。

2. 常见名词解释:
Machine Learning(机器学习):听起来比较高级的前沿技术,实际上机器学习的核心算法就那么几个,也不是什么新发明,有编程基础的同学花上一两月就基本搞懂了,而且实际工作中,一般不会让你自己去实现某个算法的,有很多开源的库可以直接用,关键之处往往是获取和筛选出高质量的数据,有了好数据,具体用哪个算法其实差别都不大。

Data Mining(数据挖掘):主要是用模式识别和特征识别技术,从海量数据中找出有价值的信息或信息之间的联系,比如我们浏览亚马逊的网站时会留下很多记录,在某个页面的停留时间、购买特定产品的频率等等,有了这些原始数据,我们就可以对用户的访问和消费数据进行模式匹配,筛选出各类优质客户,为其推荐定制化的产品和服务。在实际工作中,需要用到一些基本的统计学知识,然后有不少现成的工具可以使用,比如Rapid Miner。

Predictive Modeling(预测建模):基于统计学的实际应用,主要是设计统计模型,根据过去的数据预测未来的数据,比如根据过去的销量预测未来的销量,从而优化原材料的采购、运输线路的部署等等。

Applied Statistics(应用统计学):所谓“应用”,在实际工作中,一般是使用STATA, SAS,R这样的统计分析工具和编程语言分析数据,听起来没有data science, machine learning那么酷,实际学的东西有很多交叉的地方,从留学申请的角度,applied statistics一般设置在统计学院下面,学的东西相对窄一点,不如data science综合性强。

Quantitative Investment(量化投资):简单来说,就是通过编写计算机程序辅助投资决策,比如通过分析公司的价格、财务报表信息,选出符合指标的股票,不一定要使用程序自动交易才算量化投资,可以用计算机程序分析,然后人工买卖,也属于量化投资。另外听起来比较高级的高频交易,实际上是量化投资中非常小众的一个分支,资金量一大就不好使了,因此发展空间其实不大。

Business Analytics(商业分析):商学院开出来的专业,没有data science技术性那么强,适合商科出身没有编程经验的小伙伴,就业面比data science窄一些,也就是说data science出来的人可以胜任BA的工作,BA的不一定能干data science的工作。

Operations Research(运筹学):从统计学演化出来的一个专业,最早哥大的data science项目发的是operations research的学位,可见联系紧密,相对来说,OR更侧重大型企业的decision-making和process optimization,比data science更传统一些。

3. 自学资源推荐:
小象学院:
国内最好的数据科学网课平台,团购一节课400左右,质量很高

Python学习(英文网站,视频+文字教程):pythonprogramming.net
一个自由职业者做的Python教学网站,内容很全,从Python基础到机器学习到量化投资都有涉及,强烈推荐,一节课10多分钟左右,适合每天看一点

蟹老板书单(量化投资+数据科学):


需要留学申请服务的小伙伴请加微信(xieqiao1218)预约咨询,预约请注明“留学申请”,本人是布朗大学CS系2010年毕业的校友,仅限数据科学、商业分析、量化金融、CS等相关专业。
您需要登录后才可以回帖 登录 | 注册[30秒完成]

本版积分规则

全国大学论坛友情链接
北京 上海 天津 重庆 广东 江苏 山东 浙江 河南 河北 辽宁 四川 湖北 福建 湖南 黑龙江 安徽
江西 广西 吉林 云南 陕西 山西 内蒙古 新疆 贵州 甘肃 海南 青海 宁夏 西藏 香港 澳门 台湾
手机访问本页请
扫描左边二维码
         本网站声明
本网站所有内容为网友上传,若存在版权问题或是相关责任请联系站长!
站长电话:0898-66661599    站长联系QQ:7123767   myubbs.com
         站长微信:7123767
请扫描右边二维码
www.myubbs.com

手机版|小黑屋|中国人民大学论坛 ( 琼ICP备12002442号 )

GMT+8, 2018-11-18 07:14 , Processed in 0.148105 second(s), 16 queries .

Powered by 高考信息网 X3.3

© 2001-2013 大学排名

快速回复 返回顶部 返回列表