资源行业动态哪个才是数据科学第一块敲门砖?数学还是编程?

哪个才是数据科学第一块敲门砖?数学还是编程?

2019-11-26 | |  88 |   0

原标题:哪个才是数据科学第一块敲门砖?数学还是编程? 

来源:AI 研习社         链接:https://www.yanxishe.com/TextTranslation/2217


如果我理解机器学习中的全部数学逻辑,但是我不会编程,那么我还有机会涉猎数据科学领域吗?


如果我对机器学习背后的数学理论知之甚少,但是我编程很厉害,那么我有足够的资格成为一个数据科学家吗?


我希望在我大学毕业之前,我努力尝试进入数据科学领域的时候就知道这个答案。


首先介绍一下我的教育背景,我具有数学背景但是在大学时并未修太多编程课程,在我大学时,我学习的编程语言包括R,C++,以及Matlab。


Matlab并不是一个开源语言,主要是用于研究行业。R不像Python具有很大的社区,python社区的人员在其中贡献数据科学相关的包。C++(C家族)仍然是编程的基础,因此如果你准备学习编程,我仍会建议你去学习C族语言。


在我实习的时候,Python是业内最广泛使用的语言。因此,我不得不自学Python。另外,我只学习了一门机器学习相关的数学课程。


我感到不知所措,因为不仅要学习数学,与此同时还要提升我的编程技能。因此,在那时候,我在踌躇是放更多的精力在编程上还是在学习数学基础上。



数学还是编程?



 我将分享我的观点,即在当前行业中哪些实际上更受欢迎。


我问你一个问题。如果你是数据科学领域的技术负责人,并且有很多博士为你工作,同时,你想去扩大你的团队。你有两个候选人,一个擅长编程而另一个在数学概念上更具优势,你会倾向于哪个候选人?


这个问题的答案没有绝对的对错之分,但是据我观察,通常情况下,他们更喜欢编程能力更好的人。


你可能会想,为什么?


原因很简单,因为数据科学项目的大多数方向将由博士学位的人提供,他们应该更具有学识。因此,能够更快实施多种方法的人将是能笑到最后的人。


你可能会问,数据科学的根源是统计,但你告诉我只有学习如何很好的编程才能进入数据科学领域?


不,在数据科学领域数学一直是非常重要的。一个能够更好地理解数学的人将将是那些能够提出新想法以改善机器学习模型的人。


目前市场上有大量的机器学习模型。因此,知道在什么样的场景下用什么样的模型绝对会节省大量的时间。另外,一个前期表现良好的模型突然性能下降时,你将能够找出可能的原因。


然而,如果你只是想进入数据科学领域,那么你无须在数学部分做过多的深入研究。数据科学不仅涉及了解如何推导或求解数学方程式。 更重要的是,要知道如何定义和解决业务问题。


例如,你在一家电商公司工作。你分配到的一项任务是自动分类列表。可能,你第一步要做的是定义问题,也许说明需要实现的时间表和准确性。 下一步,将考虑模型可能面临的一些需要澄清的问题。


比方说,如果列表名称和图片归属不同的类别,那么应该怎样划分列表?是应该根据图片还是根据列表名称对列表进行分类?


在理解了团队公认的标准操作流程(SOP)之后,下面你要做的就是启动项目。


回到主题,数据科学最需要的一项技能就是能够分叉GitHub代码并且在你的数据集中进行尝试实现。因此,如果你擅长编码,无论哪种编程语言,你都能够尝试不同的方法。


例如,你正在用一个给定的数据集训练一个NER(名称实体识别)模型。现在试想一下,Python目前还没有写好的NER代码,唯一可用的是斯坦福大学提供的用Java写成的代码。因此,具有不同编程语言知识绝对是一个加分项,这可以节省用Python编写代码的时间,以训练这个模型。


另一方面,如果你在机器学习的数学部分研究更多,你将会更敏感于应该处理哪些指标,并且会遇到不同的问题。假设你正在从事信用欺诈项目。 您应该关注的指标不再是准确性,而应该是f1得分。你的目标不仅是要能够识别尽可能多的欺诈案件,而且还要保持准确性。


最后的想法

image.png


数学和编码在数据科学领域同等重要,但是如果你正在考虑转行或开始你的数据科学职业生涯,我想说对于不同的机器学习模型,拥有编码或编程技能比你深入研究数学要更重要。


开始进行更多的实际项目,并且能够在面试过程中清晰地陈述和回答问题,无疑会增加你进入数据科学领域的机会。


进入数据科学很困难,但请记住不要放弃并继续努力。


所有的努力都会有回报,无论付出多大的努力,坚持你所做的一切。


关于作者

Low Wei Hong是一位在 Shopee工作的数据科学家。他的经验更多涉及爬网网站,创建数据管道以及实现机器学习模型以解决业务问题。


他提供了爬网服务,可以为你提供所需的准确和干净的数据。 你可以访问此网站以查看他的材料,也可以联系他获取爬网服务。


你可以通过LinkedIn和Medium与他联系。

THE END

免责声明:本文来自互联网新闻客户端自媒体,不代表本网的观点和立场。

合作及投稿邮箱:E-mail:editor@tusaishared.com

上一篇:计算机视觉不是智能,只是记忆:CVPR 2019程序主席开炮

下一篇:ROS(机器人操作系统)核心概念

用户评价
全部评价

热门资源

  • 国内人才报告:机...

    近日,BOSS 直聘职业科学实验室 &BOSS 直聘研究院...

  • AI使物联网更智能...

    看到微软对物联网和人工智能的结合感兴趣是一个明...

  • 推荐一批学习自然...

    这里推荐一批学习自然语言处理相关的书籍,当然,...

  • 安防智能化大势下...

    大部分传统安防设备不仅拍摄视野有限,而且无法事...

  • 20亿创业基金、10...

    近日,杭州举办了建设国家新一代人工智能创新发展...