科學家得到基於機器學習的深層碳酸鹽巖的測井相劃分模型

2020-11-08 今日科學

隨著大數據時代的到來,數據挖掘算法被廣泛使用,其優勢可概括為:識別數據中的隱藏模式;捕獲複雜的非線性關係;自動學習模型;無需定義完整的輸入和輸出變量之間基於物理的數學關係。在勘探地球物理學中,巖石物理響應多解性使地球物理數據與地質分類間存在複雜的非線性關係。例如,深層碳酸鹽巖縫洞型儲層由於巖性多變、易發生的成巖作用和隨機裂縫,導致存在較強非均質性。此時,單一屬性的地球物理數據難以準確識別儲層,需通過結合地質-地球物理的手段進行研究,機器學習方法是處理複雜數據問題的工具,有利於解決該類問題。然而,巖性識別是一個多元分類問題,現在的算法大多針對二元分類問題而開發,且每種算法存在固有局限性,因此,將多元分類轉化為二元分類並非易事。

針對上述問題,中國科學院地質與地球物理研究所碩士研究生鄭文浩及其導師、高級工程師田飛和研究員底青雲等以塔河油田為例,利用深層碳酸鹽巖縫洞型儲層的常規測井信息,結合巖心和電成像測井(FMI)資料,應用主成分分析(PCA)、K-means、線性判別分析(LDA)3種算法進行測井相綜合預測。

具體方法是:(1)數據預處理,採用箱形圖去除異常數據及深度不匹配的數據,進行Z-score標準化處理;(2)通過PCA對測井參數降維,將7維數據轉化成2個互相獨立的變量,簡化數據結構。然而,一次PCA處理後,各種測井相數據點之間仍存在較多重疊。為進一步簡化數據結構,研究人員將洞穴數據點和非洞穴數據點做二次PCA處理;(3)對得到的數據集進行K-means聚類,根據測井相的種類及複雜程度選擇合適的k值,並以巖心約束下的FMI圖像,確定測井相的標籤,實現結合地球物理數據的半定量解釋與地質信息的定性解釋,從而建立測井相-巖相資料庫,在測井相-巖相圖版標定每個測井相的區域範圍;(4)為實現測井相的自動化定量預測,使用LDA算法獲得6種測井相的判別函數,將某一深度點測量的測井信息代入上述判別函數,函數值最大者作為該點的測井相類型歸屬。該測井相預測模型的正確率達到92%,並且能夠快速獲得測井相預測結果,有利於提高勘探效率、節約勘探成本。

該研究的底層邏輯是運用地質信息約束多屬性的地球物理響應,並通過機器學習算法對多參數的地球物理數據進行數據挖掘,以實現利用地球物理數據自動預測地質信息的效果。目前,研究人員正在探索一條結合地質-地球物理-數據分析的綜合解決方案。相關研究成果以Electrofacies classification of deeply buried carbonate strata using machine learning methods: A case study on ordovician paleokarst reservoirs in Tarim Basin為題,發表在Marine and Petroleum Geology(MPG)上。

相關焦點

  • 地質地球所得到基於機器學習的深層碳酸鹽巖的測井相劃分模型
    隨著大數據時代的到來,數據挖掘算法被廣泛使用,其優勢可概括為:識別數據中的隱藏模式;捕獲複雜的非線性關係;自動學習模型;無需定義完整的輸入和輸出變量之間基於物理的數學關係。在勘探地球物理學中,巖石物理響應多解性使地球物理數據與地質分類間存在複雜的非線性關係。
  • 徐明華等:四川盆地西北部超深層碳酸鹽巖孔縫帶地震檢測
    研究結果表明:①川西北地區茅三段超深層碳酸鹽巖儲層主要為巖溶裂縫型儲層,構造裂縫及溶蝕孔縫發育,易形成較大規模的裂縫發育帶;②該區超深層原始地震資料主頻介於25 ~ 30 Hz,對裂縫帶響應不明顯,採用疊前道集優化處理技術和頻譜恢復技術組合,可以保護裂縫帶的微弱信號,使地震資料主頻達到45 Hz,有效地提升了地震資料的頻譜,地質現象表現明顯;③採用照明對稱體、導向似然體、分頻混沌體可以從不同角度反映地震資料表達的地質信息
  • 趙路子等:深層複雜地質構造帶地震勘探關鍵技術 ——以四川盆地龍門山斷褶帶北段為例
    斷裂等信息,結合地震資料精細解釋,落實構造細節和斷裂特徵;④基於模型正演和單井儲層地震精細標定,優選屬性預測儲層分布。3.2.1 微測井約束層析靜校正技術針對地表地勢特徵以及出露巖性不同造成的高速層頂界速度差異,充分發揮該區微測井資料的作用,採用聯合約束層析反演方法[8],在通過大炮初至反演中,將表層調查資料解釋的速度作為約束條件,得到更精確的近地錶速度結構,從而計算得到更精確的靜校正量。微測井約束層析靜校正技術較好地解決了近地表低、降速帶靜校正問題。
  • 百度AAAI 2018錄用論文:基於注意力機制的多通道機器翻譯模型
    在中英翻譯方面,相較開源的 DL4MT 系統有 6.25 BLEU 的提升;在 WMT14 英法翻譯數據集上 BLEU=38.8,領先於目前最新算法。基於注意力的神經翻譯系統目前,很多研究工作者提出了許多基於注意力的神經翻譯系統(NMT,Neural Machine Translation)的改進方法,其中效果最優的是基於注意力架構的編解碼系統。圖 1. 提供了基於注意力 NMT 模型的結構原理,共包括三個部分:編碼、解碼層,及中間級聯的引入注意力機制的結構。
  • 看穿黑暗的眼睛——地球物理測井
    為了得到地下詳細的地質情況,找到油氣層的具體位置,地球物理測井不可或缺。簡單說,在高溫、高壓、潮溼、黑暗的井下世界裡,有一雙「明亮而智慧的眼睛」,可以去觀察地層、看清地層及其地質特徵等,這就是測井!沿著井軸測量記錄自然電位變化曲線,可以用來劃分巖性。一般地,地層水和泥漿含鹽濃度不同會引起擴散電動勢和吸附電動勢;地層壓力與泥漿柱壓力不同會引起過濾電動勢。這些是油氣井井內自然電位產生的主要原因。測量自然電位的方法很簡單,我們只需要在井內放置一個測量電極M,地面放置一個電極N,將M電極沿著井壁移動,即可測量出井內自然電位變化的曲線。
  • 中國陸上深層油氣資源勘探開發現狀及展望
    通過深入分析,概括了深層油氣資源5點基本特徵:①氣多油少,相態類型複雜;②高溫高壓普遍,不同盆地或層系差異大;③多元供烴,多源複合;④儲層相對緻密,但發育規模中高效儲層;⑤成藏過程複雜,多期成藏改造.梳理了深層油氣勘探開發的過程,認為中國深層油氣勘探開發目前處於「規模發現階段」,在深層碳酸鹽巖、碎屑巖、火山巖三大領域都取得了重大進展,但仍面臨4方面挑戰,主要表現為:①生烴、成儲、成藏過程複雜,制約了勘探方向與目標選擇
  • Alink:基於Flink的機器學習平臺
    分享嘉賓:楊旭 阿里巴巴 資深算法專家編輯整理:朱榮導讀:Alink是基於Flink流批一體的機器學習平臺,提供一系列算法,可以幫助處理各種機器學習任務,比如統計分析、機器學習、實時預測、個性化推薦和異常檢測。
  • 古巖溶作用不是塔北哈拉哈塘地區奧陶系碳酸鹽巖儲層的主控因素?——細看如何辨別碳酸鹽巖古巖溶角礫巖和假角礫巖
    編者的話 近期我閱讀了一篇《Sedimentary Geology》發表的研究論文,作者是德克薩斯大學奧斯丁分校的研究科學家傅啟龍教授。
  • 深埋碳酸鹽巖儲層成因被揭示
  • 科學網—揭示碳酸鹽巖風化碳匯受雙重影響
    本報訊(見習記者高雅麗)
  • 機器不學習:基於深度學習CNN的短文本相似度計算方案
    機器學習深度學習乾貨棧 www.jqbxx.com基於CNN模型的短文本相似度的計算方法可以大致分為兩類:一類是基於Siamese結構的神經網絡模型,先分別學習輸入的文本對兒的句子向量表達,再基於句子向量計算相似度;另一類是直接以詞語粒度的相似度矩陣作為輸入,學習並計算文本相似度。
  • 基於機器學習的入侵檢測系統
    根據他們發現的地方,可以分為:IDS也可以根據它的行為進行分類:在列出IDS的一般限制之後,我們將討論使用機器學習的混合入侵系統。幾次真正的攻擊遠遠少於虛假警報的數量,這導致真正的威脅經常被忽視。主要目的是讓計算機在沒有人工協助的情況下學習,並相應的進行調整。機器學習算法可大致分為:監督機器學習算法:可以應用過去學到的東西來使用標記示例預測未來事件。算法分析稱為訓練數據集,用於生成推斷函數以對輸出值進行預測。經過充分的訓練,系統可以為新的輸入提供目標。
  • 80後勇闖柴達木——記青海油田勘探開發研究院測井地質研究所夏曉敏
    6年來,他打破勘探開發技術局限,專啃硬骨頭,先後推動了柴西南扎哈泉灘壩緻密油、柴西北大風山—南翼山—小梁山混積型碳酸鹽巖緻密油兩個億噸級油田的勘探開發。  近期,青海油田勘探開發研究院測井地質研究所工程師夏曉敏主持的關於十三五緻密油國家重大專項階段成果匯報工作已經完成主體部分。  2014年,他碩士研究生畢業,來到了青海油田。
  • 雲南大學團隊在Natural Product Reports發表基於機器學習的天然產物活性研究進展
    未來網高校頻道9月11日訊(記者 楊子健 通訊員 李哲)近日,雲南大學教育部自然資源藥物化學重點實驗室肖偉烈課題組在天然產物權威評述期刊Natural Product Reports上發表文章,對基於
  • 經典地質圖集,徹底搞明白碳酸鹽巖
    碳酸鹽巖碳酸鹽巖碳酸鹽巖碳酸鹽巖有哪些種類?又具有什麼特徵?藻粒泥泥是指泥級的碳酸鹽質點,是與顆粒相對應的另一種結構組分。根據其成分,可分為灰泥和雲泥。方解石成分泥灰泥是方解石成分的泥,也稱微晶方解石泥;雲泥是白雲石成分的泥。
  • 機器學習-話題模型
    分詞就是我們把整個文檔集中的文檔劃分成一個個的詞語,形成我們的語料庫。然後使用不同的詞來描述不同的文檔。 去除停用詞。分詞完成後,有些詞是無意義的,我們稱之為停用詞,在處理中我們將其去掉。 使用詞標籤(id)來表示文檔。
  • Quora是如何使用機器學習的?
    從那時起,在Quora上使用機器學習發展的越來越快,我們不僅為現有的機器學習應用程式開發了更大更好的模型,而且還擴展了我們使用機器學習的領域。在這個答案中,我將給出一個藍圖,來描繪出在2017年Quora是如何使用機器學習的。機器學習使用實例我將介紹產品的各個不同組成部分,並討論如何在其中使用機器學習。1.
  • 深度學習 vs. 概率圖模型 vs. 邏輯學
    很多早期的人工智慧方法是基於邏輯,並且從基於邏輯到數據驅動方法的轉變過程受到了概率論思想的深度影響,接下來我們就談談這個過程。本文按時間順序展開,先回顧邏輯學和概率圖方法,然後就人工智慧和機器學習的未來走向做出一些預測。圖片來源:Coursera的概率圖模型課1.