潮科技行業入門指南 | 深度學習理論與實戰:提高篇(13)——Faster...

2020-12-05 36氪

編者按:本文節選自《深度學習理論與實戰:提高篇 》一書,原文連結http://fancyerii.github.io/2019/03/14/dl-book/。作者李理,環信人工智慧研發中心vp,有十多年自然語言處理和人工智慧研發經驗,主持研發過多款智能硬體的問答和對話系統,負責環信中文語義分析開放平臺和環信智慧機器人的設計與研發。

以下為正文。

目錄

安裝數據準備訓練測試預測

Faster R-CNN有很多開源的版本,我們這裡介紹PyTorch實現的用法。前面介紹過原理,這裡就不分析原始碼了,有興趣的讀者開源自己閱讀原始碼。

安裝

建議使用virtualenv安裝。

# 獲取代碼git clone https://github.com/jwyang/faster-rcnn.pytorch.git#或者使用作者fork的版本,保證代碼和作者使用的一致# git clone https://github.com/fancyerii/faster-rcnn.pytorch.git# 安裝virtualenvvirtualenv -p /usr/bin/python3.6 venvsource venv/bin/activate# 安裝pytorch 0.4.0(注意這個實現只支持0.4.0,不能安裝0.4.1或者更新版本)# whl包需要去PyTorch的官網下載,更加自己的Python版本,GPU進行選擇合適的下載安裝# 這裡有老的版本下載: https://pytorch.org/get-started/previous-versions/# 安裝其它依賴pip install -r requirements.txt

數據準備

有很多數據集可以選擇,我們這裡使用PASCAL VOC數據集,這是官網。

cd faster-rcnn.pytorchwget http://host.robots.ox.ac.uk/pascal/VOC/voc2007/VOCtrainval_06-Nov-2007.tarwget http://host.robots.ox.ac.uk/pascal/VOC/voc2007/VOCtest_06-Nov-2007.tarwget http://host.robots.ox.ac.uk/pascal/VOC/voc2007/VOCdevkit_08-Jun-2007.tar

解壓這3個tar包,創建data目錄並且建立符號連結。

tar xvf VOCtrainval_06-Nov-2007.tartar xvf VOCtest_06-Nov-2007.tartar xvf VOCdevkit_08-Jun-2007.tar# mkdir data && cd dataln -s ../VOCdevkit VOCdevkit2007

訓練

使用如下腳本進行訓練,比較重要的參數是lr,如果太大可能會出現nan/inf,作者使用這個參數是可以收斂的。

python trainval_net.py --dataset pascal_voc --net res101 --bs 1 --nw 1 \--lr 0.0004 --lr_decay_step 8 --cuda

測試

接下來是用測試集合進行測試,作者訓練後得到的mAP在73.5%左右。讀者可以多調調超參數,原始碼作者得出的mAP是在75.2%左右。

python test_net.py --dataset pascal_voc --net res101 \--checksession 1 --checkepoch 20 --checkpoint 10021 \--cudaSaving cached annotations to /bigdata/lili/faster-rcnn.pytorch/data/VOCdevkit2007/VOC2007/ImageSets/Main/test.txt_annots.pklAP for aeroplane = 0.7534AP for bicycle = 0.8044AP for bird = 0.7760AP for boat = 0.6076AP for bottle = 0.5756AP for bus = 0.8021AP for car = 0.8283AP for cat = 0.8664AP for chair = 0.5332AP for cow = 0.8147AP for diningtable = 0.6709AP for dog = 0.8700AP for horse = 0.8561AP for motorbike = 0.7939AP for person = 0.7834AP for pottedplant = 0.4588AP for sheep = 0.7238AP for sofa = 0.7499AP for train = 0.7524AP for tvmonitor = 0.6907Mean AP = 0.7356python demo.py --net res101 \--checksession 1 --checkepoch 20 --checkpoint 10021 \--cuda --load_dir models --image_dir testimgs

預測

我們創建一個測試目錄testimgs,在裡面放幾張圖片,看看實際檢測的效果。

python demo.py --net res101 --checksession 1 --checkepoch 20 --checkpoint 10021 \--cuda --load_dir models --image_dir testimgs

下圖是上面命令檢測的實際效果,汽車都被正確的檢測出來了。

圖:Faster R-CNN檢測效果

相關焦點

  • 潮科技行業入門指南 | 深度學習理論與實戰:提高篇(3)——基於HMM...
    編者按:本文節選自《深度學習理論與實戰:提高篇 》一書,原文連結http://fancyerii.github.io/2019/03/14/dl-book/。作者李理,環信人工智慧研發中心vp,有十多年自然語言處理和人工智慧研發經驗,主持研發過多款智能硬體的問答和對話系統,負責環信中文語義分析開放平臺和環信智慧機器人的設計與研發。以下為正文。
  • 潮科技行業入門指南 | 深度學習理論與實戰:提高篇(4)——基於HMM...
    編者按:本文節選自《深度學習理論與實戰:提高篇 》一書,原文連結http://fancyerii.github.io/2019/03/14/dl-book/。作者李理,環信人工智慧研發中心vp,有十多年自然語言處理和人工智慧研發經驗,主持研發過多款智能硬體的問答和對話系統,負責環信中文語義分析開放平臺和環信智慧機器人的設計與研發。
  • 潮科技行業入門指南 | 深度學習理論與實戰:提高篇(14)——Mask R...
    編者按:本文節選自《深度學習理論與實戰:提高篇 》一書,原文連結http://fancyerii.github.io/2019/03/14/dl-book/。作者李理,環信人工智慧研發中心vp,有十多年自然語言處理和人工智慧研發經驗,主持研發過多款智能硬體的問答和對話系統,負責環信中文語義分析開放平臺和環信智慧機器人的設計與研發。
  • .| 深度學習理論與實戰:提高篇(5)——深度學習在語音識別中的應用
    編者按:本文節選自《深度學習理論與實戰:提高篇 》一書,原文連結http://fancyerii.github.io/2019/03/14/dl-book/。提起深度學習的再次興起,大家首先可能會想到2012年AlexNet在圖像分類上的突破,但是最早深度學習的大規模應用發生在語音識別領域。自從2006年Geoffrey Hinton提出逐層的Pretraining之後,神經網絡再次進入大家的視野。
  • 推薦算法系統/人臉識別/深度學習對話機器人高級實戰課
    包含了推薦算法系統實戰、深度學習人臉識別實戰、深度學習對話機器人實戰等高級前沿的精品課程,下面分別介紹下各個實戰項目:1、推薦算法系統實戰首先推薦系統不等於推薦算法,更不等於協同過濾。下面我們就從人臉識別原理、人臉識別應用場景、人臉檢測與對齊、人臉識別比對、人臉年齡識別、人臉性別識別幾個方向,從理論到源碼實戰、再到伺服器操作給大家深度講解。
  • 實踐入門NLP:基於深度學習的自然語言處理
    特別是最近兩年,基於深度學習的自然語言處理逐漸取得了一定進展,在人機對話、問答系統、語言翻譯等方向的應用也一直是自然語言處理中的熱門話題,而這些應用的實現,基本依賴於底層技術和模型的進步,再加上自然語言處理領域也算是一個多學科交叉的行業,自然語言處理的未來發展對於很多相關學科和方向都具有深遠的影響力。
  • 最熱門的深度學習框架TensorFlow入門必備書籍
    於是,很多開發者就問了,TensorFlow如此受歡迎,如果想入門學習它,要選擇哪本書呢?今天就和大家推薦一本TensorFlow入門書籍之《Tensorflow:實戰Google深度學習框架》在了解這本書之前,不妨先來了解一下什麼是TensorFlow,TensorFlow 是谷歌的第二代機器學習系統, 是一個採用數據流圖,用於數值計算的開源軟體庫
  • 【PPT下載】深度學習入門指南!六步構建深度神經網絡
    7月5日,智東西公開課推出的超級公開課NVIDIA專場進行完第九講,由NVIDIA中國GPU應用市場總監侯宇濤主講,主題為《揭秘深度學習》。侯宇濤老師對深度學習的定義、特點、應用以及新入門深度學習開發者的學習路徑進行了深入淺出的介紹。本文是侯宇濤的主講實錄,共計10672字,預計13分鐘讀完。
  • 關於AI學習方法的思考——產品經理入門人工智慧
    也許你已經嘗試的找過書籍資料、網上課程或培訓機構,是不是並沒有發現成熟的AI產品經理入門學習方法?好了,今天這篇文章我將向您分享我(作為產品經理)對入門人工智慧學習方法上的一些思考。我是一名網際網路產品經理,也希望進入AI領域。目前為止,我已經用了2個月的業餘時間學習入門知識,但還不能算是入門,原因就是人工智慧領域的概念過於寬泛,技術門檻較高。
  • 數據分析入門學習指南,零基礎小白都能輕鬆看懂
    當你知道AB兩組的差異用平均值看是多傻的事情,你的分析技巧也會顯著提高。這裡我們需要從基礎的統計理論(描述性統計、區間估計、假設檢驗等)出發,到基本的統計分析(T 檢驗、方差分析等),最後到商業常用的模型(回歸分析、方差分析等),學習數據分析背後的邏輯,掌握實用統計學的概念和會利用統計的思維去思考問題。
  • 潮科技行業入門指南 | 半導體測試設備行業研究分析報告
    圖3:2007-2017年中國集成電路市場規模及增速 數據來源:中國半導體行業協會(CSIA)其中,長電科技聯合產業基金、芯電半導體收購新加坡封測廠星科金朋;華天科技收購美國FCI;通富微電聯合大基金收購AMD蘇州和檳城封測廠;晶方科技則購入英飛凌智瑞達部分資產。國內封測廠商藉助併購潮進入了實力顯著提升的快車道,實現了遠超同行增長率的快速壯大,已經成為了全球半導體封測行業的重要力量。全球前十大封測廠臺灣佔據5家、中國3家(長電科技、華天科技、通富微電)、美國以及新加坡各1家。
  • PyTorch 深度學習官方入門中文教程 pdf 下載|PyTorchChina
    PyTorch提供了兩個高級功能: 1.具有強大的GPU加速的張量計算(如Numpy) 2.包含自動求導系統的深度神經網絡 除了Facebook之外,Twitter、GMU和Salesforce等機構都採用了PyTorch。
  • 如何快速學會Python爬蟲(入門篇)
    Python爬蟲入門二之爬蟲基礎了解3. Python爬蟲入門三之Urllib庫的基本使用4. Python爬蟲入門四之Urllib庫的高級用法5. Python爬蟲入門五之URLError異常處理6.
  • ...蘋果Airplay技術入門篇(全文)_蘋果 The new iPad_音頻新聞...
    打造家庭無線 蘋果Airplay技術入門篇    相信對於許多果粉雖然擁有iPhone,但是卻對    從今天開始,我們將為了大家深度剖析蘋果Airplay的技術特點,組建技巧以及它的優勢與不足。在這些之前,我們先為大家蘋果Airplay是什麼,它能幫我們實現什麼。如果你想讓家裡的線纜都消失,不妨多關注一下Airplay技術。
  • 潮科技入門指南 | 半導體測試設備行業研究分析報告
    其中,長電科技聯合產業基金、芯電半導體收購新加坡封測廠星科金朋;華天科技收購美國FCI;通富微電聯合大基金收購AMD蘇州和檳城封測廠;晶方科技則購入英飛凌智瑞達部分資產。國內封測廠商藉助併購潮進入了實力顯著提升的快車道,實現了遠超同行增長率的快速壯大,已經成為了全球半導體封測行業的重要力量。全球前十大封測廠臺灣佔據5家、中國3家(長電科技、華天科技、通富微電)、美國以及新加坡各1家。
  • PyTorch版《動手學深度學習》開源了,最美DL書遇上最贊DL框架
    機器之心報導項目作者:ShusenTang參與:思想要入門最前沿的深度學習,想要玩最常見的深度學習框架?那就用 PyTorch 版的《動手學深度學習》吧,零基礎也能入門 DL。李沐等人的開源中文書《動手學深度學習》現在有 PyTorch 版實現了。不論是原書中的示例代碼,還是實戰項目,原來的 MXNet 都可以無縫轉化到 PyTorch 代碼。項目作者在保持原書內容基本不變的情況下,將 MXNet 代碼都轉換為了 PyTorch,想要學習 DL 和 PyTorch 的小夥伴們可以試試啊。
  • .| 深度學習理論與實戰:提高篇(14)——​Mask R-CNN代碼簡介
    編者按:本文節選自《深度學習理論與實戰:提高篇 》一書,原文連結http://fancyerii.github.io/2019/03/14/dl-book/ 。作者李理,環信人工智慧研發中心vp,有十多年自然語言處理和人工智慧研發經驗,主持研發過多款智能硬體的問答和對話系統,負責環信中文語義分析開放平臺和環信智慧機器人的設計與研發。 以下為正文。
  • TensorFlow官方推薦 國內首本教程:《TensorFlow實戰》預售(免費送書)
    本書結合了大量實例代碼,深入淺出地介紹了如何使用TensorFlow創建各種深度學習模型,是初學者入門的最佳書籍。本書希望能幫讀者快速入門TensorFlow和深度學習,在工業界或者研究中快速地將想法落地為可實踐的模型。希望快速上手TensorFlow、了解深度學習技術及其應用實踐的人士,以及機器學習、分布式計算領域的學生、從業者。特別是對正在學習深度學習技術,立志從事AI相關行業,成為數據科學家的人來說,本書更是非常實用的工具書。
  • 「深度學習與統計學理論」研討會成功舉辦
    作為近年來人工智慧發展最迅猛的領域之一,深度學習通過分層網絡獲取分層次的特徵信息,除了在圖像、語音等領域裡獲得了比較成功的應用之外,也為統計學理論的研究創新打開了新的契口。2020年11月19日上午,由北京大學光華管理學院商務統計與經濟計量系主辦的「深度學習與統計學理論」研討會在北大光華成功舉辦。