-
较大规模图片phash去重
起因先说下为什么要做这个事。做的图片站的图片来源为很多美女图片站,自然地,会有很多重复的图片,而我的目标就是要把重复的图片找出来,剔除掉或者是做其他处理。什么样的图片属于相同图片呢?因为会存在一些有水印的图片(如下图),或者是略微变形的图片(如1024 * 720 与1020 * 720的图片)phashphash全称是感知哈希算法(Perceptual hash algorithm),使用这玩意儿可以对每个图片生成一个值,如上面两个图分别是2582314446007581403 与 25...…
-
PIL处理背景图
起因起因是这样的,最近做图片站,搬运了一个别人的站点布局以及css啥的,其中遇到了一个问题。有这么一个图片就是这个美女图,做为背景是极好的,网站有几千个tag,准备每个tag都搞一张独一无二的背景图,那么问题来了,这种周边虚化的效果怎么搞?.png首先有个问题,那种虚化的东西是什么?一般的.jpg图片有三种色彩空间,即RGB,而.png不同,它有一个alpha通道,即不透明度,如果一个像素的alpha通道数值为0%,那它就是完全透明的,100%则意味着完全不透明。而上面那么png,在某些地...…