python数据分析 如何进行数据的归一化处理?
如何进行数据的归一化处理?
第一个问题,测试集的归一化的均值和标准偏差应该来源于训练集。如果你熟悉Python的sklearn的话,你就应该知道应该先对训练集数据fit,得到包含均值和标准偏差的scaler,然后再分别对训练集和验证集transform。这个问题其实很好,很多人不注意,最容易犯的错误就是先归一化,再划分训练测试集。
第二个问题,是均值方差归一化,最大最小归一化等不同归一化的选择问题。归一化的目的无非调整各个字段之间的数量级差异。均值方差归一化可能更适合你不知道数据的边界在哪里,最大最小归一化相当于整合到01之间,这相当于你是知道这个字段的边界在哪里。所以我个人更倾向于均值方差归一化。这个问题我只是经验之谈,不一定对。
我不是一个IT行业人,我想了解人工智能究竟是怎么实现的,或者说实现的方向,怎么做最接近?
人工智能就是模拟人类的。所以主要还是通过视频,图像和音频输入。像小度那样的机器人,肯定是装有摄像头来识别人脸,有拾音器来辨别声音。具体的,本质上是人脸的半结构化特征的提取,和声纹的半结构化特征提取,然后在后台的特征数据集进行比对的结果。在这之前,分别需要对千万级的人脸和声纹数据进行模型训练,“教会”机器人怎么去检测人脸和声纹,怎么去提取特征,这个过程可以就是基于深度学习网络的训练过程,而深度学习网络是模拟人脑的一种神经网络。现在比较流行的深度学习网络的训练框架有caffe,TensorFlow等,流行的语言有python,c ,c等。想学的话,先百度一下我上面提到的所有不太理解的那些名词吧,弄懂概念后才能继续。
python数据分析 python自动化测试面试题 python测试
版权声明:本文内容由互联网用户自发贡献,本站不承担相关法律责任.如有侵权/违法内容,本站将立刻删除。