kaggle数据分析案例初学者如何玩转数据科学社区kaggle的竞赛？

浏览量：1412 时间：2021-03-14 16:11:07 作者：admin

初学者如何玩转数据科学社区kaggle的竞赛？

看看赢家的套路。你不必为第一名而战。我不知道卡格尔的比赛最终变成了所有球队的团队比赛。。。这种不择手段、不计代价取得高分的方法在工业上行不通。如果我有足够的资源和时间运行多个模型，为什么不运行更多的数据并找到更多的特性呢？同样的投资，回报更高。在大多数任务优化特性的级别上，还不是组装模型的时候。

人工智能这么火，数据挖掘和机器学习有什么区别？

工作之后，我知道的第一个概念是数据挖掘，而不是机器学习。因此，我认为数据挖掘的概念比较广泛，属于工程应用范畴。五年前，我们公司谈论数据挖掘并举办了这样的比赛。掌握了数据挖掘的应用软件和标准流程，如SAS、Clementine等数据挖掘平台。这些平台大多基于图形化操作，应用门槛较低。直到最近两年，我们才开始谈论机器学习、深度学习和人工智能。根据我的工作经验，数据挖掘是一个流行的概念。所有的业务部门都知道这个概念，而机器学习属于专业化。现在业务部门仍然不知道什么是机器学习。事实上，很难严格区分两者的关系。如果你看看最权威的数据挖掘和机器学习教材，你会发现其中大部分都是重复的。因为他们是两个名字，他们的重点应该是不同的。我的理解是，数据挖掘的后端与机器学习的前端重复，机器学习的后端与深度学习的前端重复。数据挖掘的前端是数据的收集、清理和处理，与大数据相关，涉及到数据仓库，而机器学习并不关心这些。也就是说，要为机器学习提前准备好数据的原材料。机器学习更加关注学习问题，努力学习知识，像人类一样理解世界。它们最大的区别在于：数据挖掘关注数据中的规则和知识，而不关心数据为什么产生这些规则和知识，也就是说，你只看到表象，却不知道本质原因。相反，机器学习更关注学习数据的生成机制，即数据是从什么概率模型生成的。有时机器学习也被称为统计学习，这就是原因。当数据生成机制出现时，数据中的规则将被自然地知道。正是因为机器学习注重数据生成机制的学习，产生了大量的研究内容，发展了核机器、极大似然估计、最大熵模型、最大后验估计、期望最大化算法、高斯过程、概率图模型等，变分推理和其他工具。数据挖掘教科书通常没有这些高级内容。

传统的机器学习一般对数据生成机制做一些先验假设，比如假设数据是高斯分布生成的，然后学习高斯分布的参数。此外，如果没有这样的假设，应该怎么做？一般采用非参数密度估计技术，如核估计，最近流行的与深度学习相结合的方法，如生成对抗网络（Gans），变分自编码器等，因为算法工程师比开发工程师更好：1。在技能方面，算法工程师可以做开发，但是开发工程师不能做算法。

2. 从专业角度看，算法工程师对数学能力的要求很高，而开发工程师的编程水平很高。

3. 在工作需求方面，算法工程师需要创新，而开发工程师需要编写代码。

4. 就职业前景而言，算法工程师的前景要比开发工程师广阔得多。

目前，深度学习、神经网络、机器学习、人工智能、python是企业招聘算法工程师的关键词。

这里有一条建议：如果你是数学或计算机专业毕业的，改变算法和学习仍然为时已晚，明年你就不会着急了。

kaggle数据分析案例 kaggle数据集 kaggle数据集汇总

上一篇 stream格式文件怎么打开 cad图纸文件类型怎么修改

下一篇苹果什么时候出全面屏拍照第一的手机

kaggle数据分析案例初学者如何玩转数据科学社区kaggle的竞赛？

初学者如何玩转数据科学社区kaggle的竞赛？

人工智能这么火，数据挖掘和机器学习有什么区别？

猜你喜欢

最新资讯

资讯排行

资讯分类

微信公众号

微信小程序

kaggle数据分析案例 初学者如何玩转数据科学社区kaggle的竞赛？

初学者如何玩转数据科学社区kaggle的竞赛？

人工智能这么火，数据挖掘和机器学习有什么区别？

猜你喜欢

最新资讯

资讯排行

资讯分类

微信公众号

微信小程序

kaggle数据分析案例初学者如何玩转数据科学社区kaggle的竞赛？