27 億電子郵件地址外洩!ElasticSearch資料庫再次中招

2020-12-17 ITPUB

數據洩露事件近年來時有發生,哪怕是大體量的Facebook也未能倖免。可以說數據洩露無論是對用戶還是對企業來講都造成了一定的損失和影響。針對頻頻發生的數據洩露事件,不少企業都加大網絡安全建設力度,也起到了一定的成效,但數據洩露事件依舊屢禁不止。

近日,基於Lucene的搜索伺服器ElasticSearch被曝數據洩露,而此次數據洩露的體量之大令人咋舌,其中包括有27 億個電子郵件地址, 10 億個電子郵件帳戶密碼以及一個裝載了近 80 萬份出生證明副本的應用程式。

根據資料顯示,本次被盜的27億個電子郵箱地址中,有10億個密碼都是簡單明文進行存儲。最令人擔憂的是,大部分被盜的郵件域名都來自於中國的郵件提供商,其中不乏騰訊、新浪、搜狐和網易等郵件提供商。當然,諸如雅虎、Gmail以及俄羅斯的郵件域名也未能「倖免於難」。

而這也不是ElasticSearch資料庫遭到洩露,早在2018年12月份,ElasticSearch就曾被曝在沒有密碼開放的狀態下洩露了將近5700萬美國民眾的個人信息,數據量超過73GB。而在這一年間,ElasticSearch資料庫的數據洩露事件也接二連三發生,不少用戶對ElasticSearch 伺服器的安全性表示質疑。而本次數據洩露事件的爆發再次將ElasticSearch 推到了風口浪尖。

有研究人員表示,過去一年企業無意識得讓他們的 Amazon Web 服務 S3 和基於雲計算的 ElasticSearch 存儲桶暴露出來。它們沒有任何適當的安全措施,也沒有被試圖鎖定的跡象。

研究人員表示,本次遭到洩露的 27 億個電子郵件地址尚無法證實是否有效。但違規屬於違規已成定局。被洩露的 27 億個電子郵件地址目前無法證實是否為有效地址,但其來源確屬違規。

根據消息顯示,除了電子郵件地址和密碼,本次洩露的數據還包括有電子郵件地址的 MD5,SHA1以及SHA256 散列。哈希加密的電子郵件地址文本具有固定的長度,因為存儲文本數據風險太大,所以往往會用來安全存儲數據,洩露資料庫的所有者用每個地址的 MD5、SHA1以及SHA256 散列對電子郵件地址進行了操作,很大可能是用來簡化關係資料庫的搜索。

對於本次數據洩露事件,尚不清楚是如何被洩露,究竟是內鬼所為還是黑客滲透還無法進行相關驗證。但足以說明ElasticSearch伺服器的安全性還無法達到令人滿意的效果。

相關焦點

  • ElasticSearch-hard插件及IK分詞器安裝
    分詞:即把一段中文或者別的劃分成一個個的關鍵字,我們在搜索時候會把自己的信息進行詞,會把資料庫中或者索引庫中的數據進行分詞,然後進行一個匹配操作,默認的中文分詞是將每個字看成一個詞,比如"中國的花"會被分為"中","國","的","花",這顯然是不符合要求的,所以我們需要安裝中文分詞器ik來解決這個問題。
  • 深入淺出 spring-data-elasticsearch 之 ElasticSearch 架構初探(一)
    和關係型資料庫 MySQL 做個類比:Document 類似於 RecordType 類似於 TableIndex 類似於 Database1.2 集群(Cluster)、節點(Node)、分片(Shard)分布式三要素集群(Cluster)伺服器集群大家都知道,這裡 ES 也是類似的。
  • ElasticSearch
    1.倒排索引就是將各個文檔中的內容進行分詞,形成詞條,然後記錄詞條和數據的唯一標識(id)的對應關係,形成的產物 2.通俗來講,正向索引就是通過key找value,而倒排索引是通過value找key1.5 ES核心概念 • 索引(index) ElasticSearch存儲數據的地方,可以理解成關係型資料庫中的資料庫概念
  • 萬豪酒店宣稱資料庫被入侵,5億用戶私密信息或外洩!
    ,五億用戶信息或已經外洩。這可能會成為僅次於去年雅虎30億用戶信息洩露後,歷史上第二大公司用戶洩露事件。從萬豪酒店向美國監管機構提交的聲明中我們得知,在9月10日或之前,就已經檢測到有未經許可就訪問資料庫的行為,具體來說,洩露行為可以追溯到2014年。
  • 全文搜尋引擎ElasticSearch入門教程
    $ wget https://artifacts.elastic.co/downloads/elasticsearch/elasticsearch-5.5.1.zip  $ unzip elasticsearch-5.5.1.zip  $ cd elasticsearch-5.5.1/  接著,進入解壓後的目錄,運行下面的命令,啟動 Elastic。
  • 《Elasticsearch 權威指南》中文版
    在幾十位社區同學的共同努力下,《Elasticsearch 權威指南》的翻譯工作接近尾聲,在線訪問連結如下:
  • 讓Elasticsearch飛起來!百億級實時查詢優化實戰
    經過對 Elasticsearch 多方調研和超過幾百億條數據的插入和聚合查詢的驗證之後,我們總結出以下幾種能夠有效提升性能和解決這一問題的方案:本文所使用的 Elasticsearch 版本為 5.3.3。
  • Elasticsearch實現原理分析
    本文介紹了Elasticsearch的以下原理:是Master/Slave架構,還是Master-less架構?Elasticsearch介紹Elasticsearch的索引(index)是用於組織數據的邏輯命名空間(如資料庫)。Elasticsearch的索引有一個或多個分片(shard)(默認為5)。分片是實際存儲數據的Lucene索引,它本身就是一個搜尋引擎。
  • Elasticsearch Analyzer
    2.2.3 Structured Text TokenizerStructured Text Tokenizer主要針對結構化文本進行分詞,比如:ID、郵箱地址和路徑等。https://www.elastic.co/guide/en/elasticsearch/reference/current/analysis-overview.htmlhttps://www.elastic.co/guide/en/elasticsearch/reference/current/analysis-analyzers.html
  • 慢霧預警:有人洩露近27億電子郵件地址和密碼文件
    慢霧預警:有人洩露近27億電子郵件地址和密碼文件 圖片來源圖蟲:已授站長之家使用今日塊訊(ChinaZ.com) 1 月 23 日消息:根據慢霧區情報,近日有人洩露了近 27 億電子郵件地址和密碼等組合的文件
  • 2021-Java後端工程師面試指南-(Elasticsearch)
    https://www.processon.com/view/link/600ed9e9637689349038b0e4上面的是腦圖地址叨絮今天來看看Elasticsearch然後下面是前面的文章匯總2021-Java後端工程師面試指南-(Java基礎篇)2021
  • elasticsearch Discovery 發現模塊學習
    一、基於單播的方式發現可以在 elasticsearch.yml 配置文件中使用discovery.zen.ping.unicast.hosts靜態設置設置主機列表。discovery.zen.ping.unicast.hosts: ["host1", "host2"]具體的值是一個主機數組或逗號分隔的字符串。
  • 在elasticsearch中使用function_score查詢
    再次抱歉!!!前端時間一直在研究kubernets+.net core相關,本打算寫幾篇k8s的文章,但在公司聽到同事遇到個需求一直沒有搞定,於是出於程式設計師的本能了解了一下,就是需要根據左上角,右下角的經緯度坐標查詢一批在地圖上均勻分布!
  • 電子郵件營銷公司Verifications.io資料庫洩露,8.09億份用戶數據遭...
    上周,信息安全研究人員Bob Diachenko和Vinny Troia發現了一個不受保護的、可公開訪問的MongoDB資料庫,其中包含了150 GB的詳細營銷數據,以及7.63億個不同的電子郵箱地址。到今天,這對夥伴將他們的發現公之於眾。
  • 8 億郵件地址遭洩露,源於郵件驗證服務
    這個資料庫在2月25日曝光在網上,洩露的電子郵件地址數量超過了 8 億。被洩露的資料庫「Emailrecords」的結構包括 IP、用戶名、電話和地址等。在這個資料庫中,標記「綁定電話」的數據有 400 多萬條,標記為「商業線索」的數據有 620 萬條,任何人都可以通過網絡連接到這個資料庫。
  • ElasticSearch 億級數據檢索案例實戰!
    三、elasticsearch檢索原理3.1 關於ES和Lucene基礎結構談到優化必須能了解組件的基本原理,才容易找到瓶頸所在,以免走多種彎路,先從ES的基礎結構說起(如下圖):一些基本概念:提高索引與檢索的性能建議,可參考官方文檔https://www.elastic.co/guide/en/elasticsearch/reference/current/tune-for-indexing-speed.html
  • 為什麼Elasticsearch查詢變得這麼慢了?
    默認情況下,所有版本的Elasticsearch都會關閉慢速日誌,因此您必須對群集設置和索引設置進行一些更新。這些示例適用於使用elasticsearch 6.2,但您可以在此處找到所有以前的版本。 只需將$ES_version替換為您正在使用的版本,例如5.5版本設置官網參考:http://t.cn/E7Hq2NG。
  • Open Distro for Elasticsearch 1.1.0 發布,Elasticsearch 發行版
    Open Distro for Elasticsearch 是 AWS 開源的 Elasticsearch 發行版。可以 GitHub 存儲庫中的發行說明中找到有關增強、bug 修復和更多信息的詳細信息:https://github.com/opendistro-for-elasticsearch新特性此版本中提供一些新的插件,以便集成到開發者的應用程式中,雖然這些插件屬於 alpha 版本。
  • 萬豪酒店資料庫被黑,5億用戶開房信息或外洩
    11月30日,萬豪國際集團發布聲明稱,公司旗下喜達屋酒店的一個客房預訂資料庫被黑客入侵,在2018年9月10日或之前曾在該酒店預定的最多約5億名客人的信息或被洩露。受上述消息影響,截至發稿,萬豪國際跌近5%,報115.96美元。
  • Hadoop 讀寫 Elasticsearch
    使用Hadoop操作Elasticsearch的方法,關鍵是指定InputFormatClass : EsInputFormat.classOutputFormatClass: EsOutputFormat.class,這個好像是ES官方提供的集成包。網上查了相關資料貌似挺少的。