有人说,马赛克的发明是人类文明史上的一次重大“逆转”。
也有人说马赛克是人类进步的绊脚石。
从功能上来说,马赛克是一种遮盖原图的手段,有优点也有缺点。
从技术上来说,马赛克的原理就是将某一像素的颜色扩散到整个范围,导致原画信息的丢失。
因此,这个过程是不可逆的。
在个人隐私极易泄露的网络时代,每个人都可能利用马赛克来掩盖图片上的敏感信息。
例如身份证号码、姓名、住址等,可以通过马赛克覆盖,有效保护信息安全。
但同样的,在电影、电视剧、漫画里,每当出现不适合儿童观看,或者血腥暴力的场景时,很有可能会伴随着厚重的马赛克。
哪怕是一幅严肃的画,一旦加上马赛克,风格也会变得奇怪。
虽然老司机们早已达到“心里没代码,自然高清”的最高境界,但看带代码的电影总有隔着鞋子挠痒痒的感觉,如鱼刺卡在喉咙里。
俗话说XX是第一科技生产力去马赛克日软件,自从人类世界出现马赛克以来,自然就有人把目光聚焦在如何去除马赛克上。
一直以来,号称可以去马赛克的软件层出不穷,但大多数都是打着卖狗肉幌子的恶意病毒软件。
然而近日,Github上出现了一款号称可以擦除马赛克、恢复原图的工具,引发国内外热议。
请朋友们支持我们!
并送给流光一只鸡腿
,太感谢了
这款工具名叫 Depix,上线几天之内就在 GitHub 上收获了超过 10000 颗星,至今已有超过 1.3k 个分支。
让它受欢迎的原因是下面的渲染:
如图所示,第一行是被厚厚的马赛克覆盖后已经完全像素化的文字内容,看不到原文的痕迹。
第二行是经过AI修复后的内容,可以看到内容基本已经修复完毕,而且准确率还是比较高的。
第三行是根据第二行稍加推理得到的原始密码。
是的,最难恢复,甚至理论上不可能恢复的文本,被Depix重度编码后恢复了!
这意味着,即使你把自己的姓名/身份证号码/电话号码等敏感个人信息模糊化后发布到网上,仍有可能被他人彻底曝光。
那么,这项令人难以置信的AI修复技术是如何实现的呢?
据项目作者介绍,使用 Depix 将马赛克文字恢复到原始状态只需四个简单的步骤:
python depix.py -p[pixelated rectangle image] -s [search sequence image] -o output.png
br
我们知道,编码是一种图像像素化处理的手段,通过降低色彩层次细节、打乱图像特定区域色块的分布,达到模糊图像的效果。
线性盒滤波器是比较常见的处理算法之一。
如下图所示,一张表情图片经过编码之后,其实被分成了四个色块,每个色块由色块的平均值进行覆盖,最终形成一个像素化的表情。
由于原始信息丢失,因此无法直接反转过滤器。
Depix的算法利用线性盒滤波器的特点,对每个颜色块分别进行处理,并对搜索图像中的每个块进行像素化以找到直接匹配。
简单来说,Depix的技术原理就是将马赛克区域的内容分成很多个小块,然后用某种算法计算各个小块内容的平均值并进行覆盖。
目前Depix还是一个针对特定领域的工具,只适合使用线性框过滤器创建的像素化图像,主要支持英文字母、数字以及英文半角符号。
经过测试,Depix可以正确识别大部分英文字母、数字和符号。
但在研究过程中,开发人员发现有些连续字符无法正确识别,因此还需要进行改进。
Depix算法输出的结果虽然并不完美,但相对于之前的其他技术来说已经相当不错了。
有关Depix的消息在网上传开后,立即引发了热议,很多网友对这项技术表示深深的担忧。
开发人员强调,开发该AI项目的目的不是为了窃取信息,而是利用ECB和明文攻击模式来完善信息保护技术。
他还在博客里劝大家,出于安全考虑,最好不要使用马赛克,最好的做法是直接用黑条或者白条遮住需要遮挡的区域,这些区域是无法通过算法还原的。
当然,除了Depix之外,还有许多开源项目尝试恢复马赛克内容。
此前,流光还介绍了一种名为PULSE的算法,该算法可以根据模糊的马赛克像素“绘制”出一张新脸,并在几秒钟内将原图分辨率放大64倍,任何较差的图像质量都可以在几秒钟内转化为高清逼真的图像。
甚至连眉毛、睫毛、毛孔、皱纹和头发都能完美恢复。
网上对此类项目是否值得热捧存在不少质疑,这些AI技术难免会被一些人用于不良或非法的用途。
可以预见的是,AI马赛克修复技术会越来越成熟,未来有关马赛克去除的伦理和法律问题也会越来越复杂。(来源:EXTFANS)
我坚信随着技术的发展和大数据的成熟去马赛克日软件,一定能够达到如下的完美效果。
↓ #加工前#↓
↓ #处理后#↓
想要学习交流此开源软件的朋友可以在后台发送关键字“647”获取开源地址。