用跳板机用跳板机
@user667ead57daebd 我从archive.org找到了样本文件。
{ "_index": "person_address_label_info_master", "_type": "a", "_id": "已匿名化", "_score": null, "_source": { "AGE": 48, "BIRTHDAY": "1973", "BPLACE": "吉林省吉林市磐石县", "IDNO": "220223已匿名化", "IDTYPE": "01", "QUERY_STRING": " 吉林省吉林市磐石县 48 73 1973 ", "RNAME": "已匿名化", "SEX": "女" }, "sort": [6754190] }
这是某个文件的其中一行。是一个标准的Elasticsearch文档格式,使用JSON表示。
_index
: 文档所属的索引名称._type
: 文档类型._id
: 文档在索引中的唯一标识 ._score
: Elasticsearch的搜索相关性分数,此处为null
,通常用于搜索结果排序._source
: 实际的文档内容,包含具体的字段和它们的值.AGE
: 年龄,整数类型.BIRTHDAY
: 出生年份.BPLACE
: 出生地.IDNO
: 身份证号.IDTYPE
: 身份证类型.QUERY_STRING
: 查询字符串,可能是用于全文搜索的文本内容.RNAME
: 姓名.SEX
: 性别.
sort
: 可能用于排序的一个额外字段,数组形式.
这种格式通常用于存储和检索数据,并且允许Elasticsearch进行高效的全文搜索和分析操作。
有信安咨询商受访介绍,上海公安所泄数据库的Kibana操作面板一直暴露在公网地址且未设密码。受访专家说,这类错误配置很常见,但未设防的数据规模竟达26.4TB还是令人震惊。 Shadowbyte负责人Vinny Troia受访说今年1月扫描到该面板入口。SecurityDiscovery负责人Bob Diachenko说4月27日扫描到面板入口,又说估计面板去年4月起即一直暴露;6月中旬数据突然被抹除、仅留下几条字据说“您的数据一切安全、但需用10BTC提取”。论坛兜售帖文是6月30日发表;7月1日再去检视发现勒索字据已消失,面板仍对公网开放、但数据量减少到了7GB;周末事件在公众发酵,面板才下线。 至于网友发现2020年一篇CSDN博客不慎泄露疑同属上海公安的DataHub服务访问密钥,受访专家认为与本次泄露无关。 (华尔街日报 ,CNN )
即使是分批次下载也是有點难处理