第二日的周一中午,齐凡被王教授叫了过去。
进入办公室,王教授就递过来一个u盘。
“你要的东西都在里面了。小心点用,千万别捅到网上去。”
齐凡心下狐疑着接了过来。这才过了几天,自己要的样本图片数据就弄到手了?
王教授貌似看出了他心中的疑惑。
“你专注你的事情,不相关的一概别问。”
齐凡也就按下了自己的好奇心。
从王教授办公室出来,齐凡拿着那个u盘在手上仔细翻看。u盘的正面依稀有个贴纸撕去后残留的印记,在走廊窗户透入的阳光反射下,貌似是一个圆形的图标。
齐凡仔细看了下,感觉怎么有点像国徽。这尼玛就玩大了呀。
“齐凡,站着干嘛呢。”
正在齐凡震惊之余,前班主任老黄的声音响起。
“黄老师,好久不见。”
老黄赶紧挥手,“愧不敢当,我现在可不是你老师了。按你这速度,一年保研两年读博,我早晚得叫你师兄。”
老黄虽然是开玩笑,可说的也确实有些道理。万一齐凡弄出个什么大新闻,保送读博。那就真成了老黄的师兄辈了。
“黄老师,你就别开我玩笑了。”
“刚从王教授那出来?”
“对。”
“那你忙吧,我也就是路过。对了,以后顶多叫我师兄。千万别再叫黄老师,拜托拜托。”老黄朝齐凡抱拳,很是郑重的模样。
齐凡见状也只好道,“好吧。黄师兄。”
二人随后就各忙各的了。
老黄是硕士学位。齐凡如今是金陵大学小有名气的学霸,且已是研究生。再喊他老师,确实是让他比较尴尬。辈分和实力都镇不住,那还是不要乱叫的好。
齐凡回到宿舍后,赶紧用贾震的笔记本打开u盘。
u盘根目录是一個文件夹和一张照片。文件夹的名称就叫“新建文件夹”,照片的名称为“未命名.jpg”。主打一个朴实无华。
齐凡出于好奇打开了照片。是一张红底黄字的标语--保密工作要到位,泄密抓到定杀头。
我擦!齐凡在心中暗骂一句。难怪这u盘上隐隐有国徽的印记。
这标语言简意赅、通俗易懂、干练肃杀,确实符合华国近代以来的办事风格。
他随后点开文件夹。
里头是密密麻麻排列的整整齐齐的一个个子文件夹。看这些子文件夹的名称,应该就是以各个停车场名称来命名的。
齐凡又随机点开了一个子文件夹。里头是一张张车牌照片。
他当即统计这个u盘内照片的总数。crtl+a后,屏幕左下角显现出一行小字--168,123个对象。
整整16万8千多张照片,我滴个乖乖。
要是没有金陵大学这层关系,齐凡上哪去弄到这么多样本素材。
齐凡当即就用xcnn_dt模型随机识别了3张图片。
车牌上必定有一个汉字,但xcnn目前对汉字是不支持的,因而汉字位置的识别结果自然是千奇百怪。这个到时在预料之中,齐凡自动忽视掉了。
但是对于剩下的英文字符和数字的识别,却是让人一阵揪心。
哪怕仅仅是挑中的3张测试图片,也没有哪张是完全识别准确的。
“o”和“0”首先就傻傻分不清楚。“i”和“1”也是一样。
再叠加车牌照片的光线明暗阴影问题,一个清清楚楚的“6”竟然能被识别成“0”,原因貌似是“6”的上半部分被阴影遮挡了。总之这识别结果结果是没法看。
齐凡脑子很清醒。
面对识别错误率过高,无非是两种解决办法。
一是细化模型的精度,把模型做得更加细致。二个加大训练样本数量,让模型去学习更多的样本数据。
提升模型精度不是问题,他系统空间的那份模型xcnn图纸,正愁没有用武之地。齐凡此前发布的xcnn_dt2.0版本,不过是这份图纸上最简单的一个模型的落地应用。
要提升精度,那只需加深网络的层数即可。当前的xcnn_dt2.0版本才5个卷积层,有足够多的冗余留给层数叠加。
人工智能深度学习中的神经网络是层层叠加的,可以将其理解为一栋高楼。其处理数据的过程,可以类比为让数据爬楼梯。
数据从一楼开始,一层层往上爬,每上一层就会被处理一次。当数据到达顶层的时候,就是最终结果出来的时候。
以数字识别为例。
进入第一层的数据是一张rgb三通道的图片,最后顶层给出的结果则是0到9