第13章 手搓录取通知书2
色号的问题通过爬虫采集大量图片数据,再做个统计排列就能解决。
但另外的问题--尺寸问题,却并非那么容易。
尺寸问题初看是最容易解决的,但实则并非如此。
因为林远总不能打电话到紫金航校的招生办,让对方把录取通知书的长宽,以及上头每张图片的位置和大小,还有每个字的位置和大小,以电子版的形式提供过来。
尺寸不仅仅是录取通知书本身的大小,而是包含了上头每一个图案和字体的大小和位置。
如果对数字图像稍微有所了解,就会知道:不可能光凭网上搜到的实物图片去复刻一张一模一样的实物。
因为任何针对实物的拍摄都会存在一个问题--视角和景深。
简单来说,人类是三维生物。可图片是二维空间。拍照就是把三维空间投射到二维空间。所以必然存在失真。
要获取一张图片本来的样子,就需要对图片做几何转换。而几何转换的关键在于参照物。
因为你不可能知道拍摄这张照片的时候,拍摄者站的位置以及摄像头各项角度参数。因而就只能从图片中寻找锚定参照物。
最普通常见的参照物一般是桌子。因为几乎所有的桌子横竖两条边都是垂直的。
不管是直角还是圆角的桌子,其横竖两条边一般都是垂直的。但是投射到照片上却几乎不可能是垂直的。
获取二维平面上这两根线条的角度,就可以推算出几何变换的参数。因为不同的拍摄视角必然导致不同的角度参数。
而现今的诸如halcon、OpenCV等数字图像处理工具,都已经封装好了这类常见的图片处理功能。因而林远只需设定参数后调用即可。
但是眼下的麻烦在于--万恶的美颜。
在这个照片不再是照片,满地都是照骗的年代。很多时候手机在拍摄者不知情的情况下就自动开启了美颜功能。
这就导致拍到的图像包含的数据不再是原始的。比方说:线条被拉伸过,更恶心的是被扭曲之后又被拉伸平整过。
以至于林远恢复出来的照片总是带这些失真。不是边角歪扭,就是上头的某些字体不真实。
无奈之下,他只得求助于算力系统。
林远祭出算力系统来对图片进行修正。
图片修正属于算力系统的常规功能。因为其训练素材随处可见。但凡是林远观看笔记本屏幕,再或者是手机屏幕的时候,他看到的都是二维图像。
这些二维图像就是算力系统最好的训练素材。
甚至可以说,只要林远刷手机,那算力系统就在收集二维图片素材。
所以,让算力系统完成最终的图片美化,那简直是小菜一碟。
那林远为何不干脆直接让算力系统一键生成一张录取通知书得了呢。一来是林远不愿意浪费宝贵的累积算力,以及不想承担大量运算之后的副作用。最终的图片美化,可比直接一键生成需要计算量小得多。自然而然的算力消耗和副作用也就小得多。
二来是林远不喜欢事事求助于算力系统,否则自己不就成了系统的傀儡了。这会让他产生一种不适感--万一自己成了寄居蟹的壳呢。
林远心念微动之下。
【设定算力功率:50T/S。】
按照惯例,他设定了一个很保守的数值。
三秒钟不到,他的眼前就浮现出了一张美化修饰完毕的,映着他的头像的录取通知书。
【紫金航空航天大学】
【研究生录取通知书】
【姓名:林远】
【专业:计算机科学与技术】
。
。
系统还很贴心地将图片的数字格式转为了印刷格式--CMYK。
图片一共正反两面共两张,2K分辨率。总体不大,也才将近10M。
但接下来的事情就麻烦了,因为算力系统可以通过林远的眼睛采集输入,但是目前没有什么途径输出数据。因而哪怕最终生成的图片就在眼前,但是林远却无法下载下来。
‘系统,能不能在我脑子里生成一个WIFI,以后我们用无线交流。’
系统没有任何回应。
‘蓝牙也行啊,虽然速度慢一点。’
‘实在不行,摩斯码电波也行啊。’
‘天啊,我不想手输啊!’
最终,林远无奈接受了唯一的可行方案--手输。
因为计算机世界的所有数据都是数字,而图片不过就是一堆8位字节组成的数字罢了。
10M,也就约等于是10的7次方个字节。
一千万个字节!!!
每个字节是类似这样的:1A、2B。由0~9、A~F组成的两位字符。
林远要把一千万个这样的字符输入进计算机。
如果一秒钟输入两个字节,那一分钟就是120个,一小时就是7200个。一天24小时就是172,800个。
林远大致需要不眠不休连续输入两个月。
不得不说。计算机世界的一片小小雪花,落在现实世界就是一座大山。
所有这一切的起因,都在于人脑和肢体在面对以G为单位的CPU时的无力。
‘哎,碳基生命果然渺小!’林远只得自嘲。
‘但是,我是一个智慧的碳基生命。’
‘系统。对通知书的非重点区域进行模糊化处理,仅仅保证重要区域的分辨率。’
一份通知书上大部分的区域都是颜色变化很小的,这些区域直接模糊处理。然后再做个逆向的锐化处理即可。
但是对于内容比较丰富,比如:有文字的地方、有签章和印鉴的地方、有照片的地方,那就是必须要保证分辨率。
其实,一张通知书上需要保证分辨率的区域也就是20%左右。
林远再将图片的分辨率降到1080P,反正就是拿着这张证书去混一份家教而已,又不是去和有关部门打交道,那1080P分辨率肯定足够了。
由于1080P整体数据量只有2K的四分之三,进而再将砍掉80%的可忽略区域。
林远的数据手输时间缩减到了200多个小时。
这个时间依然太长。林远恨不得有一双镭射眼,直接能把数据打进笔记本。
为了缩减时间,林远舍弃了封面。因为每个人的录取通知书封面都是一样的,并且封面上没有太多文字,图片也并非很清晰。于是林远干脆就自己生成了一个封面,仅仅是通知书的正文部分采用系统生成。
于是手输时间又砍掉一半,来到了100个小时。
一周后,一张如假包换的紫金航院研究生录取通知书终于出炉了。