R
学术界和统计学家已经发展了二十多年的R。R现在是执行数据分析的最丰富的生态系统之一。CRAN(开源存储库)中有大约12000个软件包。无论您要执行哪种分析,都可以找到一个库。丰富的图书馆使R成为统计分析的首选,特别是对于专业分析工作。
R和其他统计产品之间的前沿差异是输出。R有很棒的工具来传达结果。Rstudio附带图书馆编织器。谢毅辉写了这个包。他的报道琐碎而优雅。通过演示文稿或文档传达调查结果很容易。
Python
Python几乎可以执行与R相同的任务:数据争用,工程,功能选择Web报废,应用程序等。Python是一种大规模部署和实现机器学习的工具。Python代码比R代码更容易维护和更强大。多年前; Python没有很多数据分析和机器学习库。最近,Python正在迎头赶上并为机器学习或人工智能提供最先进的API。大多数数据科学工作都可以通过五个Python库完成:Numpy,Pandas,Scipy,Scikit-learn和Seaborn。
另一方面,Python比R更容易实现可复制性和可访问性。事实上,如果您需要在应用程序或网站中使用分析结果,Python是最佳选择。
人气指数
IEEE Spectrum排名是量化编程语言流行度的指标。左栏显示2017年的排名和2016年的右栏。2017年,Python排在第一位,而一年前排名第三。R排在第 6 位。
image.png
工作机会
下图显示了编程语言与数据科学相关的工作数量。SQL遥遥领先,其次是Python和Java。R排名第 5 。
image.png
如果我们关注Python(黄色)和R(蓝色)之间的长期趋势,我们可以看到Python在作业描述中比R更经常被引用。
R或Python用法
Python由大约1991年的计算机家Guido van Rossum开发.Python有数学,统计和人工智能的有影响力的库。您可以将Python视为机器学习中的纯粹玩家。但是,对于计量经济学和通信而言,Python尚未完全成熟。Python是机器学习集成和部署的最佳工具,但不适用于业务分析。
好消息是R由学者和科学家开发。它旨在回答统计问题,机器学习和数据科学。由于其强大的通信库,R是数据科学的正确工具。此外,R还配备了许多软件包来执行时间序列分析,面板数据和数据挖掘。最重要的是,与R相比,没有更好的工具。
我们认为,如果您是具有必要统计基础的数据科学初学者,您需要问自己以下两个问题:
我想学习算法的工作原理吗?
我想部署模型吗?
如果你对这两个问题的答案都是肯定的,你可能会先开始学习Python。一方面,Python包含很好的库来操作矩阵或编码算法。作为初学者,可以更容易地学习如何从头开始构建模型,然后从机器学习库切换到函数。另一方面,您已经知道算法或想立即进入数据分析,然后R和Python都可以开始。如果你要专注于统计方法,R的一个优点。
其次,如果你想做的不仅仅是统计数据,让我们说部署和可重复性,Python是一个更好的选择。如果您需要编写报告并创建仪表板,则R更适合您的工作。
简而言之,R和Python之间的统计差距越来越小。大部分工作都可以通过两种语言完成。您最好选择适合您需求的产品,也可以选择同事使用的工具。当你们所有人说同一种语言时,这样会更好。在了解了第一种编程语言之后,学习第二种编程语言就更简单了。
结论
最后,R或Python之间的选择取决于:
您的目标:统计分析或部署
您可以投入的时间
您公司/行业最常用的工具
作者:Liam_ml
链接:https://www.jianshu.com/p/6e66eb10832d