《自然-通訊》:新的計算方法可驗證缺乏真實性的圖像

2020-12-13 量子認知

如果網上購物,所看到的物品圖像如果不是真實的?或如果是一個很小很小的東西,例如蛋白質怎麼辦?沒有專用的設備就無法驗證它,因為沒有專門的「真實性」來判斷圖像。

現在,科學家開發出了一種計算方法,可以確定科學家在任何給定點對測量的準確性有多大的信心,給定用於建立起它們的模型。該研究於發表在這一期的《自然通訊》上。

研究人員說:「從根本上講,這是一種取證工具,可以告訴是否正確。」這不僅僅是獲得清晰圖像的一種方法。 「這是一種驗證科學圖像中每個細節的可信度的全新方法。

該計算方法,被稱為瓦瑟斯坦感應通量,英語:Wasserstein-induced flux ,縮寫:WIF。該方法來自於一個名叫瓦瑟斯坦的俄國數學家在1969年提出的Wasserstein metric的概念。在數學中,這個概念是在給定度量空間上的概率分布之間定義的距離函數。

研究人員開發出的這種計算方法,該方法可讓他們根據模型中內置的假設,確定整個成像圖片是否準確,但是否可以確定圖像上的任何給定點。如圖所示應用這種方法前後的澱粉樣蛋白原纖維圖像。

科學家用來「觀察」非常小的單分子定位顯微鏡(single-molecule localization microscopes,縮寫SMLM)的過程依賴於從被成像物體中捕獲大量信息。然後,該信息由計算機模型解釋,該模型最終會剝離掉大部分數據,重建表面上準確的圖像,即真實的生物結構圖片,例如澱粉樣蛋白或細胞膜。

一般來說,已經有幾種方法可用來幫助確定圖像是否很好地表示了要成像的事物。但是,這些方法無法確定圖像中任何單個數據點準確的可能性。

研究人員表示:「我們想看看是否有一種方法可以在沒有事實根據的情況下對這種情況做些事情。」 「如果我們可以使用建模和算法分析來量化我們的測量結果是否真實或足夠準確。」

研究人員利用了成像設備收集的大量信息,這些信息通常會作為噪聲被丟棄。研究人員可以將噪聲的分布用作真實性背景,因為它符合特定的物理定律。

如下圖所示這種方法刪除放錯位置的數據點的方式。去噪後,從水果的紅色主體中還原綠色的「葉子」。

研究人員表示說:「他們回到了實際科學測量中嘈雜的、不完善的領域。」 「人們會丟棄並忽略真實的數據。」研究人員沒有忽略它,而是看了模型對噪聲的預測效果如何,給定了最終圖像和創建該噪聲的模型。

分析這麼多的數據點類似於一次又一次地運行成像設備,執行多次測試運行以對其進行校準。「所有這些測量結果給我們提供了統計上的信心。」

該方法允許不是基於模型來確定整個圖像是否可能,而是在考慮圖像的情況下,基於模型中內置的假設來確定圖像上的任何給定點是否可能。

最終,研究人員開發了一種方法,該方法可以很強的統計信心說出最終圖像中的任何給定數據點都應該或不應該位於特定位置。

最後,分析得出每個數據點的單一數字,介於-1和1之間。距離越近,科學家對圖像上的一個點實際上就能準確表示要成像的物體的信心就越大。

這個過程也可以幫助科學家改善他們的模型。「如果可以量化性能,那麼也可以通過使用分數來改進模型。」

這種方法的潛在用途是深遠的。使用它來驗證機器學習,其中偏向的數據集可能會產生不準確的輸出。在這種情況下,如何知道數據有偏差? 「使用該模型,將能夠在沒有事實依據的數據上進行測試,而不知道神經網絡是否經過了與真實世界數據相似的數據訓練。」

參考:Quantifying accuracy and heterogeneity in single-molecule super-resolution microscopy,Nature Communications (2020).https://www.nature.com/articles/s41467-020-20056-9

#圖像處理器#

相關焦點

  • 檢驗方法的驗證、確認步驟及計算方法
    本文對檢驗方法的驗證和確認步驟及詳細計算方法進行整理,供各位同仁學習參考。一、檢驗方法驗證的基本內容檢驗方法驗證的基本內容包括方案的起草及審批,檢測儀器的確認。適用性驗證(包括準確度試驗、精密度測定、線性範圍試驗、專屬性試驗等)和結果評價及批准四個的方面。
  • CVPR2020 | 讓合成圖像更真實,上交大提出基於域驗證的圖像和諧化
    圖像和諧化 (image harmonization) 旨在調整合成圖中的前景,使其與背景和諧。傳統的圖像和諧化方法一般是從背景或者其他圖片轉移顏色信息到前景上,但這樣無法保證調整之後的前景看起來真實並且與背景和諧。近年來,已經有少量的工作嘗試用深度學習做圖像和諧化,但成對的合成圖和真實圖極難獲得。
  • 數據治理技術探索:可驗證憑證
    它是一種標準化的數字憑證的表達方法,從使用場景、核心模型設計均參照了現實世界中的物理憑證,目的是將物理憑證的優勢引入到數字世界中。可驗證憑證的典型特徵是密碼學安全、隱私保護和機器可讀。物理憑證包括證件、執照、證明、回執等各種可用於身份或資質驗證的有效物件,如護照、醫師執照、銀行開具的收入流水證明、計程車小票等等。
  • CVPR 2020|合成圖像更真實,上交大提出基於域驗證的圖像和諧化
    圖像和諧化 (image harmonization) 旨在調整合成圖中的前景,使其與背景和諧。傳統的圖像和諧化方法一般是從背景或者其他圖片轉移顏色信息到前景上,但這樣無法保證調整之後的前景看起來真實並且與背景和諧。近年來,已經有少量的工作嘗試用深度學習做圖像和諧化,但成對的合成圖和真實圖極難獲得。
  • 一文探討可解釋深度學習技術在醫療圖像診斷中的應用
    但是,這些方法都沒有在醫學領域中得以廣泛推廣,除了計算成本高、訓練樣本數據缺乏等因素外,深度學習方法本身的黑盒特性是阻礙其應用的主要原因。儘管深度學習方法有著比較完備的數學統計原理,但對於給定任務的知識表徵學習尚缺乏明確解釋。深度學習的黑盒特性以及檢查黑盒模型行為工具的缺乏影響了其在眾多領域中的應用,比如醫學領域以及金融領域、自動駕駛領域等。
  • 掌握Verilog FPGA設計和驗證方法是AI時代系統設計師的生命線
    掌握 Verilog FPGA設計和驗證方法是AI時代系統設計師的生命線 胡薇 發表於 2018-04-17 16:12:18 在嵌入式系統研發領域,隨著產品AI化升級進程
  • 谷歌和DeepMind研究人員合作提出新的強化學習方法Dreamer 可利用...
    谷歌和DeepMind研究人員合作提出新的強化學習方法Dreamer 可利用世界模型實現高效的行為學習 將門創投 發表於 2020-03-26 11:41:12 近年來隨著強化學習的發展
  • UVM驗證方法
    採用SystemVerilog語言構建測試場景可以有效的解決該問題,SystemVerilog語言為驗證提供了多種特色,包括:1. 完全兼容Verilog語言,並提供了DPI的仿真接口,可以有效的調用各種C程序或者C++程序。2. 增加了新的數據類型:動態數組,隊列,關聯數組等,並提供了相應的方法來實現搜索、排序等功能。 3.
  • Python-OpenCV獲取圖像輪廓的圖像處理方法
    圖像閾值化操作中,我們更關心的是從二值化圖像中分離目標區域和背景區域,僅僅通過固定閾值很難達到理想的分割效果。在圖片中的灰度是不均勻的,所以通常情況下圖片中不同區域的閾值是不一樣的。這樣就需要一種方法根據圖像不同區域亮度或灰度分布,計算其局部閾值來進行閾值處理。
  • 了解一下可驗證憑證
    它是一種標準化的數字憑證的表達方法,從使用場景、核心模型設計均參照了現實世界中的物理憑證,目的是將物理憑證的優勢引入到數字世界中。可驗證憑證的典型特徵是密碼學安全、隱私保護和機器可讀。 物理憑證包括證件、執照、證明、回執等各種可用於身份或資質驗證的有效物件,如護照、醫師執照、銀行開具的收入流水證明、計程車小票等等。
  • ...不用跨界也能從文本生成圖像,OpenAI新模型打破自然語言與視覺...
    第一個神經網絡 DALL·E 可以將以自然語言形式表達的大量概念轉換為恰當的圖像。值得注意的是,DALL·E 使用了 GPT-3 同樣的方法,只不過 DALL·E 將其應用於文本 - 圖像對。CLIP 旨在解決深度學習方法在計算機視覺領域中所面臨的的一些主要問題,如創建視覺數據集的人力和成本問題、數據集涵蓋的視覺概念過於狹窄、標準視覺模型只擅長一種任務且需要很多努力才能適應新任務、基準測試中表現良好的模型在壓力測試中表現糟糕等等。為此,CLIP 模型在多種多樣的圖像上進行訓練,這些圖像具備多種自然語言監督,並且很容易在網絡上獲得。
  • 深度圖像識別ISDA-深層網絡的隱式語義數據擴增方法
    算法一直是最基礎和底層的,而深度圖像識別算法在當今的AI中更是被不斷的研究,本文是清華大學&北京航空航天大學的作者提出的ISDA:隱式語義數據增廣新方法,漲點明顯!可提高分類、目標檢測、實例分割等任務性能,代碼現已開源!
  • 新算法可檢測文獻中重複圖像—新聞—科學網
    而它們的重複圖像可能出現在科學文獻中。 圖片來源:Mikhail Tereshchenko/TASS/Getty 3名科學家日前表示,計算機軟體現在能快速檢測到大量研究文獻中的重複圖像。 在一項日前發表於預印本伺服器bioRxiv的論文中,一個由美國紐約雪城大學機器學習研究人員Daniel Acuna領導的團隊報告稱,其成功利用一種可處理上萬篇生物醫學論文的算法尋找重複圖像。如果期刊編輯採用類似方法,他們或許能更加簡單地在論文發表前檢查圖像——此事目前需要大量努力並且只有少部分出版物在做。 Acuna 表示,最新成果表明,利用技術檢測重複圖像是可能的。
  • 深度圖像識別-深層網絡的隱式語義數據擴增 ISDA 方法
    雖然這些方法是有效的,但由於需要預先訓練生成模型並在訓練過程中進行推斷,這些方法實現起來並不容易,而且計算成本也很高。vZVEETC-電子工程專輯魯棒損失函數。如文中所示,ISDA 相當於最小化一個新的魯棒損失函數。因此,我們就這一課題的相關工作作一簡要回顧。近年來,人們提出了幾種用於深度學習的魯棒損失函數。
  • 圖像識別解釋方法的視覺演變
    在以上因素的推動下,在過去的十年中,研究人員開發了許多不同的方法來打開深度學習的「黑匣子」,旨在使基礎模型更具可解釋性。有些方法對於某些種類的算法是特定的,而有些則是通用的。有些是快的,有些是慢的。在本文中,我們概述了一些為圖像識別而發明的解釋方法,討論了它們之間的權衡,並提供了一些示例和代碼,您可以自己使用Gradio來嘗試這些方法。
  • 乾貨丨實驗室方法驗證方法及實例
    方法驗證全知識點解讀!(點擊可以閱讀原文)如何做方法驗證,國家標準是這樣規定的!(點擊可以閱讀原文)你知道「實驗室比對」和「能力驗證」到底有什麼不一樣嗎?!2.方法驗證應有文件規定和相應記錄,當方法變化後,應重新進行驗證。確定檢出限,按方法操作步驟及流程進行分析操作,計算結果的平均值、標準偏差、相對標準偏差、檢出限等各項參數。最終的方法檢出限為各驗證實驗室所得數據的最高值。
  • 先融合再填充,上海交大提出少樣本圖像生成新方法F2GAN
    機器之心專欄作者:牛力(上海交通大學仿腦計算與機器智能研究中心)少樣本圖像生成是很有挑戰性的任務,可用的方法也很少。少樣本圖像生成(few-shot image generation)任務是指用已知類別(seen category)的大量圖片訓練出一個生成模型,然後給定某個未知類別(unseen category)的少量圖片,即可為該未知類別生成大量真實且多樣的圖片。少樣本圖像生成屬於圖像數據增廣的範疇,可用來輔助很多下遊任務,如少樣本圖像分類等。
  • 分析方法驗證中的統計指標
    轉換成我們熟悉的分析方法驗證的科學名詞就是「檢測限、定量限、線性」,「準確性」和「精密度」,以及包裹在內核中的「專屬性」。在新的USP1200 Requirments for compendial validation中,「檢測限、定量限、線性」已經被新的「可檢測性」的概念所取代。
  • 《自然·通訊》發表費鵬團隊高通量光學成像研究新成果
    光電信息學院費鵬教授,武漢國家光電研究中心朱䒟教授和附屬同濟醫院梅偉教授為論文共同通訊作者。論文提出一種自監督的三維壓縮感知算法,結合大視場貝塞爾光片顯微鏡技術,實現高通量的全組織整體三維成像。在圖像處理方面,該研究提出了一種根據螢光信號局部稀疏特性自動調整約束參數的壓縮感知算法(content aware compressive sensing, CACS),可對大規模、高動態範圍圖像進行三維解析度增強。將兩者結合後,大視場貝塞爾光片顯微鏡可在較低倍率下僅需數分鐘即獲取組織的整體三維圖像,再經CACS算法復原,快速重建出全組織的高分辨版本圖像。
  • ECCV 2020 | 人臉識別的可解釋性
    自然深度學習中的很重要領域人臉識別的可解釋性也是一個很大的挑戰,當前在這方面探索的方法有網絡注意力、網絡解剖或綜合語言解釋,然而,缺乏網絡比較和量化可解釋結果的真相,尤其是在人臉識別中近親或近親之間的差異很微妙,解釋並不明顯。