用跳板机用跳板机
上海公安那次的数据格式像json,来自Elastic Search,应该有某个接口是暴露了,程序员把api key写在博客里,然后黑客获取了权限。
这个接口没有速率限制,也没有风险控制,写一个Python脚本,用几个代理池下载数据,睡一觉数据就下到本地了。各位如果能搞到那个黑客的论坛原帖和数据样本,应该能知道更多信息。
—-TABLES—-
person_address_label_info_slave QFpD25bKTJ2eQBxcbe2Aaw 90 0 546148916 0 172.2gb 172.2gb
nb_theme_address_merge_tracks_slave -bUMVB1uRRusUbbqZepEpA 300 0 37483779369 4 22.4tb 22.4tb
nb_theme_address_case_dwd_test 7COIWTt7QU-YPwWub8z_SQ 150 0 22375506 1749307 25.2gb 25.2gb
nb_theme_address_company_dwd-total fpnmEYB9SI6WevHnZIEwIA 150 0 1842856 0 2.8gb 2.8gb
nb_theme_address_case_dwd-total 7X8oNqULQnWFLpzHDaUTbg 150 0 1214119253 0 1tb 1tb
nb_theme_address_company_dwd_test g5f6l4LGQcGL3oQ6ON2Bbw 150 0 2017931 0 4.3gb 4.3gb
person_address_label_info_master t64pp9WnS3maY9jBjzTtiw 90 0 969830088 0 282.8gb 282.8gb
公安数据库黑客估计是用了漏洞搜索引擎,或是用了某个扫描器。在发现这个巨型金库后,花了不少的时间下数据,下完就删库,勒索10BTC。随后发到了论坛
这种数量的数据用代理链得慢死,套一层代理最多了,不然太慢了。
即使是分批次下载也是有點难处理