2017-08-12
1.图片分类是很多CV任务的基础;
2.图片分类要面临很多的问题,比如图片被遮挡,同一种动物有很多种颜色,形状等等,算法需要足够强壮;
3.所以很难直接写出程序来进行图片分类,常用的方法是数据的驱动的方法:
4.KNN: 重点在于选取K的数值,可以采取交叉验证的方式,找到最佳的K值;
同时,距离的表示也有集中方法,比如欧氏距离,曼哈顿距离:
5.然后从KNN出发, 讲了通用的函数模型,即把一张图片映射为几个类别的可能数值得分,最高的就是图片所属的类别:
备注:这里的X是一个3072维度的向量,函数F就是把3072维度映射成10维度的函数,10代表最后可能的类别有10种;当然,有时候需要考虑偏移量b,bias;
例子:
6.下次就要集中在损失函数loss function, 还有优化过程,即找到使得损失函数最小的 参数值 W, 最后扩展到其他的分类器, 神经网络, 卷积神经网络;