卷积以后图像大小计算公式 卷积神经网络如何进行图像识别?
卷积神经网络如何进行图像识别?
可见这是更高级的互联网技术的问题!有些专业知识需要特别说明。
首先,我们需要知道什么是卷积神经网络?下面是我在网上搜索整理的一些粗浅的知识!
卷积神经网络(CNN)是一种具有深度结构的前馈神经网络,包含卷积计算,是深度学习的代表性算法之一。卷积神经网络具有表示学习的能力,可以根据其层次结构对输入信息进行平移不变的分类,因此也被称为 "平移不变人工神经网络 "。具体解释可以自己搜索。
那么卷积神经网络是如何实现图像识别的呢?他有几个台阶。
1、图像识别数据收集
MNIST手写识别数据集的求解是一个相对简单的问题,但是对于更复杂的类别,可以使用CIFAR数据集。例如,CIFAR10数据集收集了来自10个不同类别的60,000张图片,每张图片的像素为32x32,如下所示。
CIFAR10数据集类似于MNIST,每张图片的大小是固定的,每张图片只包含一个类别。不同的是CIFAR10中的图片都是彩色的,分类难度比MNIST高,人工标注的正确率在94%左右。
在现实生活中,图片的格式并不总是一成不变的,种类远不止10种。每张图片还包含多个元素,所以需要更强大的数据集。由斯坦福大学的李菲菲开发的ImageNet拥有近1500万张图片,这些图片与大约2万个类别相关。
ImageNet每年都会举办图像识别大赛ILSVRC(现已关闭),每年比赛都会提供不同的数据集。下图是Imag
倍积运算?
卷积运算是指从图像的左上角打开一个与模板大小相同的活动窗口。将窗口图像和模板像素进行相应的相乘和相加,用计算结果代替窗口中心像素的亮度值。然后,活动窗口向右移动一列,并执行相同的操作。以此类推,从左到右,从上到下,可以得到一个新的图像。
空间滤波:是一种基于像素和相邻像素的空间关系,通过卷积运算实现图像滤波的方法。频域中的:滤波对图像执行傅立叶变换。
版权声明:本文内容由互联网用户自发贡献,本站不承担相关法律责任.如有侵权/违法内容,本站将立刻删除。