这事一些图库公司一直在做,摄影师把版权卖给图库后,由图库出售。图库为了保护版权,会爬大量网页,识别出网页中未经授权的图片,然后告使用者侵权,获得赔偿。
这事墙内平台不一直在做吗?
做图床的话可以用文件哈希值查重,如果有人上传了一张和已有文件哈希相同的图片,那么不会上传两份,而是直接调去现有的图片显示。百度网盘就是这么降低储存成本的。不用复杂的AI技术,非常简单。
如果要给图片打上隐水印我觉得你不告知用户就是侵犯他人隐私了,更别提追踪图片了,这种事被查出来要罚不少款。除非你是政府部门,能够以保护国安名义进行大型监控。
我觉得传播过程不太可能会加水印,因为这个很容易验证,当然,如果传播过程加以压缩(比如微信和一些网站),这个就不是那么容易验证了,也确实有发生的可能。
我觉得比较现实的是,如果用手机拍摄照片的话,里面会有一些隐藏信息,不是exif这种,是隐藏的更深的那种。当然我也没证据,只是瞎猜而已。
图片的附加信息在上传至社交媒体时会被移除,因为压缩的原因。同样,隐水印也会因为多次压缩导致失效。最好的办法就是哈希值+深度学习识别。哈希值的好处省事,但如果原图遭到压缩、裁剪、涂抹就无法识别。这时候深度学习就很实用了,就算有涂抹污损也能成功识别。
从头搭建一个爬虫和深度学习系统非常麻烦,可以使用现有的Google识图API。(如果我没记错应该有API)
如果是美国政府或中国政府要搞图片溯源,直接和社交媒体要一个内部API就行,棱镜门事件后各国政府都更加谨慎了,收集的信息也是更多了。
像是腾讯微信这种伪加密的聊天数据簇,当局和第三方嗨客能比较容易地通过图像识别技术找出符合要求的记录都是哪些用户在发。
如果是红迪豆瓣小飞机这样的半公开平台,没有直接的对接权限的话就只能买机器爬虫或是用生活费安插线人,但平台主动投入精力封禁API的话就只能请人找漏洞了。
再厉害一些如果平台做了非常严格的验证机制,那就只能绕路放弃作罢。
所以想找出网络图片的所有传播人员是根本不可能的,一张图的根本来源也不好说除非你能和他当面询问而且相互信任。
至于水印万一有个人私底下不经意间撸个屏隐藏的水印连着被嗨客截了下来冒充身份发到内联网上到底谁是来源真的不好说,要是发现打错人或打了不该打的人也只有无能狂怒的分巴。
不过如果图床是你家开的做好权限控制和访问记录,哪个人更可能把你的图传出去应该是不难找的,至于外面都是谁在传你怕是永远都不会知道了,没人想做最终亏本的买卖。