resource _最受欢迎的机器学习r语言包是什么? 最有名的企业

resource _最受欢迎的机器学习r语言包是什么? 最有名的企业

resource _最受欢迎的机器学习r语言包是什么? 最有名的企业

庄伯空发表于 奥特朗网赚论坛_国内最大的手机网络赚钱项目资源分享平台
data incubator有最新的数据科学课程。这些课程大部分是根据企业和政府合作伙伴的需求建立的。他们现在想开发一种以数据为中心的方法,以了解数据科学企业的教育,以及希望进入行业数据科学领域的硕士博士博士所教的内容。结果如下: 最受欢迎的机器学习包是什么?让我们看一下基于包下载量和社交网络站点活跃度的排名。 此排名是cran(comprehensive r archive network,3359 cran . r-project . org/)下载和stack overflow的活动平均排名(总排名[CSV](3359 github . com/The data incubator/data) 其中cran的下载是过去一年的数据。stack overflow根据问题正文中下载包的名称,根据标记为“r”的结果数进行排名。 git hub的排名由存储库中的星星数决定。有关方法的详细信息,请参阅以下内容 caret获得第一名可能并不奇怪。用于创建机器学习工作流的通用包,与某些算法特定的包(排名后)集成得很好。 排名描述r包社区的碎片程度。一些父软件包(如rpart和tree)通过比较python的scikit-learn的一致性和宽度来部署相同的算法。 但是,如果您喜欢r的数据操作功能(如tidy verse),则无需转换到python,您可以使用这些软件包来创建一些功能强大的模型。此外,随着modelr(https://github . com/Hadley/modelr)中添加了更多功能,您将很快在此列表中看到tidy tool。 caret是用于创建机器学习工作流的常规包,已经在此等级的第一个位置。接下来是几个实施特定机器学习算法的软件包,包括随机林、支持向量机(e 1071)、分类和回归树(rpart)、一般回归模型(glm net)。 nnet实现神经网络,tree软件包实现树功能。party用于二叉树的递归分割和可视化,a rules用于关联挖掘。支持向量机(SVMs)和其他内核方法部署在kern lab中。H2O软件包用于可扩展的机器学习,是较大H2O项目的一部分。rocr用于模型评估,包括roc曲线(接收者操作特征曲线,receiver operating character istic curve),GBM实现拔模推进。可以在数据挖掘中使用r的图形用户界面(GUI)r WEKA访问更多的分区算法(partitioning algorithms)。 某些软件包仅在github中具有强大的功能3360 MLR和super learner是另外两个元包(meta-package),在插入符号中提供类似的符号插入功能,ranger提供random forests的c实现。 最后,oner在stack overflow中名列第一,但so API会自动将其修改为“one”,因此结果不可靠。 最初,我们设想了排名,包括软件包下载、stack overflow、github活动。我们知道已经有API可以为我们提供这些指标 但是获得机器学习所有r包的初始列表是一项更加困难的任务。我们需要彻底、客观、最新的目录。错误的初始化列表会严重影响我们的排名。 寻求帮助。一个朋友写了一篇文章“cran task view:machine learning and static learning”(机器学习和统计学习)
发表于
;