GitHub 上又一開源力作!中國小夥開發最新舊照片修復技術

2020-12-13 SegmentFault思否

歲月流逝帶走了時光卻帶不走回憶,從 1839 年法國畫家達蓋爾將「攝影術」帶到世人面前,世界上就多了一種使用影像記錄回憶的方式。那些我們想要留在心底或未曾經歷過的從前,都可以通過翻看老照片找回來。

為了不讓心底的溫暖消逝,也為了能把歷史的真容留住,各種圖像修復工具層出不窮。我們看到了百年前的北京,看到了民國時的摩登女郎,還有被重新修復的母親的老照片。

最近,幾個中國小夥組成的微軟研究團隊開發了一種全新的修復舊照片的工具,目前已在 GitHub 上開源。

AI 是如何修復舊照片的

如今,我們用手機就能拍出上億像素的照片,有了美顏相機、智能算法,無論是景色還是人物都能留下最美的瞬間。但拍照技術不是一開始就那麼先進,不能把所有畫面完全真實地呈現出來,比如沒有彩色照片的時候能留下的只有黑白照片。而隨著時光的流逝,那些老照片的細節也不再清晰。

幾個中國小夥組成的微軟研究團隊提出了一種修復效果優於目前最先進方法的照片修複方法。這個團隊由來自香港城市大學計算機科學系的二年級博士生萬紫宇和 Microsoft Research Asia 視覺計算小組的張波等人組成。

他們提出的方法與可以通過監督學習解決的常規還原任務不同,因為真實照片的降級很複雜,並且合成圖像和真實舊照片之間的域間隙使網絡無法推廣。

因此,他們通過利用真實照片和大量合成圖像提出了一種新穎的三重態域翻譯網絡。他們訓練了兩個變體自動編碼器(VAE),分別將舊照片和清晰的照片轉換為兩個潛在空間,並使用合成配對數據學習這兩個潛在空間之間的轉換。

此外,為了解決一張舊照片中混合的多種退化問題,研究團隊還設計了一個全局分支和局部非全局分支。全局分支針對結構化缺陷(例如劃痕和灰塵斑點)進行修復,局部非全局分支針對非結構化缺陷的局部分支,例如噪音和模糊性。他們利用這種方法在潛在空間中融合了兩個分支,從而提高了從多個缺陷還原舊照片的能力。

如何安裝照片還原工具

目前,這種照片還原工具的代碼已經在裝有 Nvidia GPU 和 CUDA 的 Ubuntu 上進行了測試,需要 Python> = 3.6 才能運行代碼。

下載安裝預訓練模型後,可以使用一個簡單的命令輕鬆恢復舊照片。

沒有劃痕的圖像可以選擇以下命令:

有劃痕的圖像可以選擇以下命令:

需要注意的是,請嘗試使用絕對路徑,圖像的修復結果將最終保存在 ./output_path/final_output/ 中。

研究團隊表示,他們不打算直接發布帶有標籤的有劃痕的舊照片數據集,如果需要獲取配對數據,可以使用他們的預訓練模型來測試收集圖像以獲得標籤。

前文提到的新穎的三重態域翻譯網絡可以用來解決結構化退化和非結構化退化問題,做到舊照片的全局還原。

以下圖為例:

對於面部的修復,研究團隊使用了漸進式生成器來完善舊照片的臉部區域。

影像技術和 AI 的發展讓我們有機會「穿越回」百年前去看那時的人們是如何生活的,也能讓我們一睹父母年輕時的風採。

我們看多有越來越多的工具和技術可以幫我們恢復正在逐漸消失的記憶。看著百年前北京百姓的生活景象,我們能更切實地體會到文化的進步和歷史的變遷,看到革命先輩浴血奮戰的影像我們能親眼見證整個國家和社會的變革,更加珍惜今天來之不易的幸福生活。

科技的進步讓人類的物質文明和精神文明都得到了高度的發展,成為了我們獲得更好的生活,感受到更大的精神滿足的推動力。

GitHub 地址:https://github.com/microsoft/Bringing-Old-Photos-Back-to-Life

論文連結:https://arxiv.org/pdf/2009.07047v1.pdf

技術編輯:芒果果 | 發自:思否編輯部

相關焦點

  • GitHub開源力作!最新舊照片修復技術:細緻到面部毛孔
    最近,幾個中國小夥組成的微軟研究團隊開發了一種全新的修復舊照片的工具,那些我們想要留在心底或未曾經歷過的從前,都可以通過翻看老照片找回來,目前已在 GitHub 上開源。
  • 10月份Github上熱門的開源項目
    10月份GitHub上最熱門的Java開源項目排行已經出爐啦,一起來看看上榜詳情吧:1. base-adminhttps://github.com/huanzi-qch/base-adminStar 1499Base Admin一套簡單通用的後臺管理系統
  • Github高贊:給文字打馬賽克=形同虛設,AI看透你一切小心思,已開源
    近日,名為Depix的Github項目火爆全網,一切故意而為之的「文字密碼」,在這一AI技術的處理下,瞬間就「暴露於光天之下」。「來P個圖吧!」 「好呀,不過這段話得打碼,不然就麻煩了!」如果現在告訴你,」打碼「已經不再安全,你所想保護的信息,已然如」皇帝的新衣「,你會作何想?
  • GitHub年度報告:Python首次擊敗Java,中國成第二大開源貢獻國
    去年有1000萬的新開發者加入了GitHub社區,80%的repo貢獻來自於美國本土之外,中國對開源的貢獻僅次於美國。報告還發現,以「深度學習」、「自然語言處理」和「機器學習」為主題的repo在過去的一年中越發受歡迎。貢獻最多的開源項目來自微軟的VS Code (19.1K)、Azure Docs (14K)和Flutter (13K)。
  • Amazing 亞馬遜又一開源力作!
    今天要推薦的是亞馬遜(Amazon)開源的流程圖製作工具庫:Diagram Maker。Diagram Marker 是一個支持全面定製化的開源流程圖框架,且支持目前所有的前端框架(React、Vue 等),它同時提供了聲明式的接口從而降低將Diagram Marker 集成到其他工具中的代碼成本。在此之外,還提供了很多內建的交互式功能。
  • GitHub移除色情應用DeepNude的相關倉庫
    文 /  局長DeepNude 是一款付費應用程式,官方對其描述是「AI X 光。雖然團隊下架了此項目,但有人根據已下載的程序進行了逆向工程,並開發出 DeepNude 的開源版本,還將這些可用副本上傳到 GitHub。
  • Github高贊:給文字打馬賽克=形同虛設,AI看透你一切小心思
    【新智元導讀】繼修復塗鴉圖片之後,厚碼文字也不再安全了?近日,名為Depix的Github項目火爆全網,一切故意而為之的「文字密碼」,在這一AI技術的處理下,瞬間就「暴露於光天之下」。「來P個圖吧!」 「好呀,不過這段話得打碼,不然就麻煩了!」
  • 不到1000行代碼,GitHub 1400星,天才黑客開源深度學習框架tinygrad
    不久前,天才黑客 George Hotz(喬治 · 霍茲)開源了一個小型 Autograd Tensor 庫 tinygrad,它介於 PyTorch 和 micrograd 之間,能夠滿足做深度學習的大部分要求。上線不到一個月,該項目在 GitHub 上已經獲得 1400 星。
  • 升米恩鬥米仇,駁「開源侵略論」
    2、劉利說開源「使一些國家可以通過隱藏最新技術或版權,限制甚至阻礙我國科技發展」,這似乎是該文的文眼,但同時也是最沒有邏輯的地方,一個國家對你隱藏技術,那就直接出口管制好了,比如美國的EAR,直接限制某些產品不許出口某些實體。但開源卻明目張胆地把最新的、最完整的技術,用最直接最徹底的方式,即代碼,一字不差地給了我國任何一個實體使用和學習,卻被說是對我國隱藏技術?
  • 音視頻技術開發周刊
    每周一期,縱覽音視頻技術領域的乾貨和新聞投稿:contribute@livevideostack.com。在主要發布之間,發布會添加重要的bug修復,但沒有新特性。注意,這些版本是為分銷商和系統集成商準備的。強烈建議希望自己從原始碼編譯的用戶考慮使用開發分支,這是FFmpeg開發人員工作的唯一版本。發布分支只從開發分支中挑選選中的更改,因此開發分支會得到更多更快的bug修復,比如附加特性和安全補丁。
  • GitHub重新上架星標7.2萬熱門開源項目YouTube-dl,是...
    在訴訟文件中,它具體指出了兩點:一、反規避法規,明確要求任何人都不得規避對受版權保護作品進行有效控制的技術措施;二、在YouTube-dl的開源文件中,GitHub描述了多款付費音樂作品的盜用流程和方法。針對以上兩點,EFF在審查結果中作出了明確回應。
  • GitHub被黑!不明人士冒充CEO洩露其機密原始碼
    同時,GitHub已託管超過1億個存儲庫,為4000萬開發人員提供資源支持。因此,此洩露事件一出便迅速衝上了Hacker News熱搜,不少開發者表示為GitHub平臺的安全性感到擔憂。對此,GitHub CEO Friedman本人則第一時間在熱帖下做出了解釋。
  • ...Star 全球疫情數據可視化系統,超輕量級中文 OCR……GitHub 一...
    增長數:4700+隨著國外 nCoV 進入爆發式增長,GitHub 上關於 nCoV 的項目也跟著「水漲船高」,COVID-19 是 Johns Hopkins 大學系統科學與工程中心開源的 COVID-19 全球疫情數據可視化圖,該項目已在 GitHub Trending 榜上呆過一周,且可實時查看到最新數據。
  • 億景智聯宣布成立Spatial-Go開源組織,發布首個開源項目GEOOS
    當前,國內外發展形勢越來越深刻而複雜,即使隨著5G、人工智慧、時空數據科學等前沿技術的快速發展,傳統的技術創新模式依然無法適應快速的創新需求,現代企業或組織對於技術的創新越來越需要整合優質資源協同共生。  十九屆四中全會首次提出「構建社會主義市場經濟條件下關鍵核心技術攻關新型舉國體制」。
  • GitHub 開源官方命令行工具登頂 TOP1,5 分鐘極速上手!
    官方版的 GitHub CLI 終於問世了,一經開源便火速衝上了 GitHub Trending 榜 TOP1,接下來,就讓我們一起來看,如何在短短 5 分鐘便可迅速上手玩轉 CLI!雖然,這個工具還沒有正式發布,但鑑於開發人員和 GitHub 的高度關注,我不得不說 beta 版的發行指日可待。下面就讓我們來了解一下這個工具以及如何在日常工作中使用。安裝Github CLI 的安裝非常簡單明了。
  • 國內首發,騰訊開源Serverless 雲原生一體化部署工具:雲開發 Cloud...
    12 月 19 日,騰訊在 2020 Techo Park 開發者大會上集中發布了三大開源項目。其中, 雲開發CloudBase Framework 作為騰訊開源的國內首個基於 Serverless 架構的雲原生一體化部署工具,引起了眾多開發者的關注。
  • 17種GAN變體的Keras實現請收好 | GitHub熱門開原始碼
    這項「造假神技」的創作範圍,已經從最初的手寫數字和幾百像素小渣圖,拓展到了壁紙級高清照片、明星臉,甚至藝術畫作。心癢難耐想趕快入門?通過自己動手、探索模型代碼來學習,當然是墜吼的~如果用簡單易上手的Keras框架,那就更贊了。
  • 適合Go 新手學習的開源項目——在 GitHub 學編程
    經過十多年的發展,截止北京時間:2020 年 11 月 17 日定稿時 Go 的最新版本已經到了 1.15.5。同時國外的 Twitter、Google、Netflix 等大廠和國內的字節跳動、騰訊、B 站等公司都在用 Go 開發他們的主要業務,諸如 PingCAP 這一新興 NewSQL 資料庫廠商的主產品 TiDB 更是使用 Go 進行開發,並成為了 GitHub 上知名的 Go 語言開源項目。可見 Go 在網際網路公司的開發地位日漸重要,在開源社區也十分活躍。
  • Github爆火!21歲理工男開源的十六進位編輯器爆贊
    開源最前線(ID:OpenSourceTop) 猿妹整編
  • 核心功能全部開源,雖霸榜GitHub,但怎麼賺錢?|陶建輝
    TDengine分布式集群功能開源後,在GitHub全球趨勢排行榜上,又是連續幾天排名第一,引起很大的反響。大家都在好奇,這麼核心的功能都開源了,公司怎麼生存?現將去年10月我在公司內部的一篇博客分享出來,希望濤思數據的開源策略能給中國2B軟體行業以及開源社區一點啟發。