书迷看

书迷看>职场聪明的女人 > 第907章 AI怎么抓图(第1页)

第907章 AI怎么抓图(第1页)

图片是怎么识别的,把图变成黑白,例如28x28的图,也就是有764个点,黑白是0-255的色素,然后除以255,就会得到一个1到0.0几的数,也就是说是一个28x28的1和0组成的2维矩阵,然后让他变成一维数,就是由0和1组成的764个数,然后开始抓图,例如隔一秒,就可以比对这两个数的不同,然后还原点阵,就可以拿到坐标,这样就可以把变化的方块抓出来,当然根据方块坐标抓出来的是原图的彩色小图,就会抓很多,然后有关这个人的放一起,无关的放一起,然后用随机森林算法,就可以计算出一个模型,就可以认出跟你有关的视频里的人,然后截图。还有个用途,就是把运动的物体用框框起来,这就是跟踪。

你的描述基本已经把图像识别的核心流程说出来了,只是里面有些地方可以更精确地表述,这样你就能更系统地理解**“从原图→数字特征→比对识别→跟踪”**的全过程。

我给你按步骤梳理一下:

?

1.图像数字化与预处理

?t输入:一张彩色图片(RGb,每个像素3个通道,0~255)。

?t转灰度:将彩色转成灰度值,公式通常是:

Gray=0.299R+0.587G+0.114b

得到一个只有一个通道的矩阵,每个值在0~255。

?t归一化:除以255,让数据变成0~1范围,更适合机器学习算法计算。

?t尺寸调整:比如你说的28x28,就是把原图缩放成784(28x28)个像素点。

?t展平:把二维矩阵拉成一维向量(784个数)。

这一步是为了让后续算法能直接处理。

?

2.运动检测(抓变化)

?t核心思想:对比相邻两帧的像素矩阵。

?t把当前帧矩阵m_t和上一帧矩阵m_{t-1}做差:

d=|m_t-m_{t-1}|

?t如果某个像素差值大于阈值(比如0.2),说明这里有变化。

?t变化区域提取:

?t根据变化点的分布,用轮廓检测或连通区域标记,找到“方块”位置。

?t用方块坐标裁剪原彩色图→得到目标小图。

?

3.样本分类(人脸或人识别)

?t你说的随机森林可以做,但在视觉领域更常用cNN(卷积神经网络),因为它能自动提取空间特征。

?t样本准备:

?t把抓到的小图分两类:和目标有关无关。

?t提取特征(像素值、hoG特征、深度特征等)。

?t训练分类器(随机森林、SVm、cNN等)。

?t预测时,把新的方块特征输入模型,输出类别标签。

?

4.跟踪(tracking)

?t检测是找到目标,跟踪是保持它在视频里的位置。

?t常用方法:

?t卡尔曼滤波(KalmanFilter):预测下个位置。

?tKcFmoSSE跟踪器:基于模板匹配的快速跟踪。

?tSoRtdeepSoRt:结合检测结果和运动轨迹,能同时跟多个目标,并保持Id一致。

?t最终效果:视频里目标被框住,框会跟着它动。

?

5.结合用途

?t安防监控:运动检测+人脸识别→自动标记陌生人。

?t体育分析:跟踪球员或球的位置。

?t行为分析:统计某人出现的时间和位置。

?t多目标跟踪:多个对象同时标识和分类。

?

如果我帮你画一张流程示意图,你就能直观地看到这个过程:

原图→灰度化→归一化→展平→帧差检测→坐标提取→分类识别→跟踪框绘制。

你这个方法的思路跟早期的opencV+传统机器学习目标识别几乎一模一样,但如果换成深度学习+特征提取,效果会好很多,而且能做到更复杂的场景下的人物识别和跟踪。

?

请勿开启浏览器阅读模式,否则将导致章节内容缺失及无法阅读下一章。

相邻推荐:三国之从购买并州牧开始  毛团听我话后卷疯了,我负责可爱  末世修仙生存指南  好孕!怀崽后才知禁欲教授是爹系  我是正经勇者,不正经的是她们!  综影视之作精在线崩剧情  顶级万人迷光环  开局被授予国士回到学校当新生  怎么都在觊觎万人嫌反派?!  憨憨小师妹,行走的储物袋  红楼之皇权枯骨  不是派出所吗怎么去刑侦了  遇在高中  至死靡他  爱是灵魂契约  穿越兽世:兽夫宠妻日常  带着乾坤壶,重返饥荒年  开局迎娶鬼新娘,749局找上门  洪荒:小龙能掠夺天赋特质  某霍格沃茨的密教教主  

已完结热门小说推荐

最新标签