AI簡報:內存256KB設備也能人臉檢測!

2021-01-15 電子發燒友
AI簡報:內存256KB設備也能人臉檢測!

RTThread物聯網操作 發表於 2021-01-13 16:49:27

1. 內存256KB設備也能人臉檢測!微軟提出用RNN代替CNN | NeurIPS 2020

Github:
https://github.com/microsoft/EdgeML/blob/master/pytorch/edgeml_pytorch/graph/rnnpool.py

https://github.com/microsoft/EdgeML/tree/master/examples/pytorch/vision

Paper:
https://www.microsoft.com/en-us/research/publication/rnnpool-efficient-non-linear-pooling-for-ram-constrained-inference/

為了讓更多IoT設備用上AI,在條件「簡陋」的單片機上跑圖像識別模型也成為一種需求。

但是圖像識別對內存有較高的要求,一般搭載MCU的設備內存都不高,怎樣才能解決這個問題呢?

最近,微軟提出了一種RNNPool方法,甚至可在內存只有256 KB的STM32開發板上運行人臉檢測模型。它可以在不損失準確度的情況下大幅降低激活圖的採樣率。

RNNPool在語法上等效於池化算子,可以快速減小中間圖的大小。它的模型層數更少,對內存要求更低,可以在內存受限的小型設備上分析圖像。

RNNPool由兩個學習遞歸神經網絡(RNN)組成,它們以每個模塊為單個向量,在水平和垂直方向上掃過激活圖的每個模塊。

RNNPool獲取一個激活圖的模塊並將其匯總為1×1體素,然後逐步執行下採樣步驟。RNNPool可以支持8×8,甚至16×16的模塊大小,並且可以以步長s = 4或s = 8採樣,而不會顯著降低精度。

2. 1瓦功耗,5GHz頻率:全球最快Risc-V晶片出世,效率超越蘋果M1

根據全球半導體行業知名媒體 EE Times 的報導,前些天,一家位於加州森尼維爾的小型電子設計公司 Micro Magic 宣稱:他們設計、生產出了全世界最快的 64 位 RISC-V 內核,比蘋果的 M1 晶片和 Arm Cortex-A9 表現還要出色。

Micro Magic 的聲明中提到,這款原型 CPU 在 1.1v 電壓下可以達到 5GHz 的時鐘速度,遠高於運行速度為 3.2GHz 的英特爾 Xeon 伺服器晶片 E7,CoreMarks 跑分達到 13000 分。而 1.1 伏時,該晶片只需要消耗 1 瓦的功率,不到英特爾 Xeon 功率的 1%。此外,單個 Micro Magic 核心在 0.8V 下可以達到 4.25GHz,CoreMarks 跑分達到 11000 分,但消耗的功率僅為 200mW。

這款 RISC-V 晶片的速度和能效也超過了 Exynos 4。Exynos 4 是三星電子為其智慧型手機生產的頂級部件,基於 ARM Holdings Plc 提供的計算核心,是英特爾的主要競爭對手。

這款晶片不僅在低功耗下速度更快,在基準得分上也趕超英特爾和三星的晶片。在 CoreMark 基準測試中,這款 RISC-V 晶片的得分為 13000 分,是基於 ARM 的 Exynos 單核性能得分的兩倍多。雖然英特爾 Xeon 名義上單核性能更高,達到 26009 分,但 Xeon 需要更多線程,120 個線程才能達到上述結果。

圖靈獎獲得者,計算機體系結構先驅 David Patterson:「這真是太神奇了。」

3. VS Code竟然能約會!找對象不看臉,看編程水平

VS Code現在居然可以用來談戀愛了。

為了用最硬核的方式找到男(女)朋友,23歲的程式設計師Ben Awad在VS Code裡打造一個約會軟體VSinder。

顧名思義,VSinder = VS Code + Tinder,就是把約會軟體集成到了代碼編輯器裡,簡直太對程式設計師胃口了。

VSinder和Tinder的操作邏輯一樣,左滑把不喜歡的人pass掉,右滑收藏喜歡的人。

這款插件一上線,就快速贏得程式設計師們的認可,GitHub上已收穫800 Star,3天的下載量超過9000次。

既然是面向程式設計師的約會軟體,自然不能和其他約會App一樣,一定要有特色。

VSinder的特點就是,可以根據程式語言和代碼風格篩選對象。

比如你用的是Python,她用的是C,那麼你們之間可能沒有共同語言。(以免將來為哪種語言最好吵架。)

4. AI把川普變成了dancer,跟著蔡徐坤跳起了『雞你太美』

「好傢夥!」

「現在的Paper也是越來越皮了」。正在開心摸魚的同事,邊說邊給我發過來一段Demo。

原來『寶藏男孩』川普又被玩壞了。

『被逼著』跟蔡徐坤跳起了「雞你太美」(諧音梗)。

逼著川寶大秀舞姿的是上海科技大學研究團隊的最新AI,這篇AI論文名:

《Liquid Warping GAN with Attention:A Unified Frame work for Human Images Synthesis》

簡單理解就是,基於特定框架的AI,能夠完成運動仿真、外觀轉換以及新視圖合成等人體圖像處理任務。上面川普的舞蹈Demo是AI合成的最終演示效果。

5. 57.3 AP!刷新COCO目標檢測和實例分割新記錄!谷歌提出 Copy-Paste 大法

Paper:https://arxiv.org/abs/2012.07177

上個月,Scaled-YOLOv4剛剛刷新COCO 目標檢測的新記錄:55.8% AP!

昨天該數據又雙叒叕被打破了!

谷歌拿下COCO目標檢測和實例分割雙項第一名!其中:

目標檢測數據刷到57.3 AP;

實例分割數據刷到49.1 AP!

本文主要創新點:

1. Blending Pasted Objects

公式:I1 × α + I2 × (1 - α)

2. Large Scale Jittering

3. Self-training Copy-Paste

這三點其實很容易理解(不用翻譯,直接看懂),沒有花哨的處理,但實驗證明漲點明顯!

6. Github Star 7.2K,超級好用的OCR數據合成與半自動標註工具,強烈推薦!

Github:

https://github.com/PaddlePaddle/PaddleOCR

OCR 方向的工程師,一定需要知道這個 OCR 開源項目:PaddleOCR。短短幾個月,累計 Star 數量已超過 7.2K,頻頻登上 Github Trending 日榜月榜,稱它為 OCR 方向目前最火的 repo 絕對不為過。

10 月,發布 PP-OCR 算法,開源 3.5M 超超輕量模型,再下 Paperswithcode 趨勢榜第一

12 月,它又帶來四大新發布與升級,核心內容先睹為快:

全新發布數據合成工具 Style-Text:可以批量合成大量與目標場景類似的圖像,在多個場景驗證,效果均提升 15% 以上。

全新發布半自動數據標註工具 PPOCRLabel:有了它數據標註工作事半功倍,相比 labelimg 標註效率提升 60% 以上,社區小規模測試,好評如潮。

多語言識別模型效果升級:中文、英文、韓語、法語、德語、日文識別效果均優於 EasyOCR。

PP-OCR 開發體驗再升級:支持動態圖開發(訓練調試更方便),靜態圖部署(預測效率更高),魚與熊掌可以兼得。

7. TensorFlow 2.4 正式發布!提供GPU支持的新功能,推出 tf.experimental.numpy

TensorFlow 2.4 正式發布!隨著對分布式訓練和混合精度提供更多支持,加入新的 Numpy 前端及用於監控和診斷性能瓶頸的工具,這個版本的亮點在於推出新功能,以及對性能和擴展方面的增強。

TensorFlow 2.4 以 tf.experimental.numpy 形式,實驗性引入了對 NumPy API 子集的支持。您可藉此模塊,運行由 TensorFlow 加速的 NumPy 代碼。由於此 API 基於 TensorFlow 構建而成,因此可支持訪問所有 TensorFlow API,與 TensorFlow 實現無縫互操作,並會通過編譯和自動矢量化開展優化。例如,TensorFlow ND 數組可以與 NumPy 函數進行交互,同樣地,TensorFlow NumPy 函數也可以接受包括 tf.Tensor 和 np.ndarray 在內的不同類型的輸入。

8. 保姆級教程: 個人深度學習工作站配置指南 | 稚暉@知乎

本文記錄了組裝深度學習工作站過程中的超詳細操作流程,文章分為

硬體篇
1.1 工作站配置選型

1.2 電腦組裝

系統篇 - Ubuntu20.04

DL開發環境配置篇

工作站的維護

供有類似需求的同學作為參考。

責任編輯:lq

 

打開APP閱讀更多精彩內容

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容圖片侵權或者其他問題,請聯繫本站作侵刪。 侵權投訴

相關焦點

  • 256G內存 微軟 Surface Pro 7報6099
    圖為:微軟 Surface Pro 7(i5 1035G4/8GB/256GB/核顯)  微軟 Surface Pro 7(i5 1035G4/8GB/256GB/核顯)與前代相比並無明顯區別,依舊使用了鋁鎂合金材質
  • 高品質微軟Pro7 i5-8GB-256GB現貨超值
    同時也能做到長達10.5小時的長效電池續航,具有Instant On功能,顯卡的性能也有增強。Sunny Cove製程工藝10nm功耗15W商用技術Intel 博銳技術內存容量8GB內存類型DDR4x硬碟容量256GB硬碟描述SSD固態硬碟光碟機類型
  • 我國探月工程的玉兔號,登月900多天,內存僅256M夠用嗎?
    我國探月工程的玉兔號,登月900多天,內存僅256M,夠用嗎?作為咱們國家第一個登陸月球的登陸器,玉兔號在2013年的時候成為了各大新聞平臺的寵兒,也成為了科教系統最喜歡使用的創意元素。但是你知道嗎,這個"小兔子"作為一個電子產品,運行的物理內存只有256MB。
  • 我國探月工程的玉兔號,登月900多天,內存僅256M,夠用嗎?
    我國探月工程的玉兔號,登月900多天,內存僅256M,夠用嗎?作為咱們國家第一個登陸月球的登陸器,玉兔號在2013年的時候成為了各大新聞平臺的寵兒,也成為了科教系統最喜歡使用的創意元素。但是你知道嗎,這個"小兔子"作為一個電子產品,運行的物理內存只有256MB。256MB對很多人來說都是一個古老的數字,曾經電腦剛剛推出的時候256MB算得上是強悍,但是現在就算是最爛的手機估計運行內存都在1GB以上。很顯然,運行內存的大小並不存在所謂技術上的難度,但是為什麼給人感覺高精尖的航空航天卻採用了如此低的配置呢?
  • 人臉識別主要依靠了基於圖像的空間邊緣檢測技術
    ai換臉技術引起很多人的擔憂,怕外貌損害。這次任性哥帶你回歸本源,用人臉識別,再現青澀年華,你也可以擁有金融界鼻祖級的辨識力。最近我們也在研究人臉識別這個方向,今天就針對這個做個簡單的介紹。什麼是人臉識別?
  • 微軟Surface Pro X(SQ2/16GB/256GB)新品-微軟 Surface Pro X_西安...
    目前微軟Surface Pro X(SQ2/16GB/256GB)筆記本在商家「陝西唯玩(微軟專賣)」報價11500元。16GB內存類型LPDDR4X硬碟容量256GB硬碟描述SSD固態硬碟音頻接口3.5mm耳機接口其它接口Surface Connect,Surface專業鍵盤蓋埠讀卡器Nano SIM卡指取設備
  • 從人臉識別到文本分析,50+超實用的 API 推薦清單
    Betafacehttps://www.betaface.com/wpa/面部識別和檢測 Web 服務。其特點包括多人臉檢測、人臉裁剪、123 個人臉特徵點檢測、人臉驗證與識別、以及在大規模資料庫中進行相似性搜索。3.
  • 人臉檢測器:對DSFD的理解
    SOTA人臉檢測是許多應用的基礎步驟,從識別到圖像處理。帶有256個3x3濾波器的卷積層在feature map的每個位置輸出一個256維向量。然後用後者將對應的感受野分類為k個可能的參考框的目標或背景,稱為錨,並預測每一個錨點的坐標偏移量。cls是一個分類層。reg是一個回歸層。Faster R-CNN架構中的一個關鍵概念是錨框的使用。錨是具有各種形狀和尺度的參考框,它將參數化feature map上每一點的「k」的建議區域。
  • 捷宇人臉識別一體機_人證指紋比對設備
    以前說到人臉識別,想必大家覺得離自己很遠,是遙不可及的先進科技,但是誰能想得到,近幾年人臉識別已經貼近了我們,在我們的出行、  捷宇雙目身份核驗終端是一款自帶Android系統的身份核驗終端,它專用於人員指紋、人臉識別、活體檢測與證件內信息進行實名制核驗的產品。
  • 夏日專刊AI產品上新升級集錦,50餘項軟硬能力加速場景落地
    企業服務領域方案 乘風平臺(人臉通行考勤平臺)正式上線依託百度大腦人臉識別能力,提供端到端的一站式通行考勤的解決方案,可以滿足企業對智慧通行、無感考勤等場景的管理需求,實現跨地域、跨環境的人臉設備在線管理,適配多模態設備接入,實現端雲數據同步。
  • 人臉檢測之Retina FaceNet
    retinaface 人臉檢測算法甜點最近一直了解人臉檢測的算法,所以也嘗試學多人臉檢測框架。所以這裡將拿出來和大家分享一下Retinaface 與普通的目標檢測算法類似,在圖片上預先設定好一些先驗框,這些先驗框會分布在整個圖片上,網絡內部結構會對這些先驗框進行判斷看是否包含人臉,同時也會調整位置進行調整並且給每一個先驗框的一個置信度。
  • 7 papers|多人德撲AI、手機GPU上的亞毫秒級人臉識別
    此外,谷歌博客、arXiv 上均有較受關注的全新論文,例如行動裝置 GPU 上運行的亞毫秒級人臉檢測模型 BlazeFace。為了獲得更清晰的感知影像,大多數自動駕駛檢測系統配備有雷射雷達或普通雷達(無線電探測與測距)設備,這些設備能夠藉助於雷射束直接探查周圍 3D 環境。這就提出了一個疑問:貼圖幹擾是否會影響雷射雷達掃描的點雲?
  • 人臉識別技術原理與實現方式
    接下來對人臉識別算法各技術點逐一進行詳細介紹,包括人臉檢測、人臉定位、人臉校準、人臉比對、人臉反欺詐以及算法優化等。人臉檢測   人臉檢測算法繁多,我們採用由粗到精的高效方式,即先用計算量小的特徵快速過濾大量非人臉窗口圖像,然後用複雜特徵篩選人臉。這種方式能快速且高精度的檢測出正臉(人臉旋轉不超過45度)。該步驟旨在選取最佳候選框,減小非人臉區域的處理,從而減小後續人臉校準及比對的計算量。
  • 人臉識別測溫儀_讓體溫檢測更高效
    1、熱成像實時溫度測量,高溫報警,並上傳管理平臺2、基於深度學習的人臉識別算法,極大提高了人臉抓拍率3、採用一體化的設計,確保了設備的安全、可靠性,更為身份驗證和溫度測量準確率提供保障4、非接觸式識別,支持戴口罩識別,無需特意配合體驗感強支持測溫、測溫+人臉識別、測溫+門禁、門禁等多種工作方式,滿足多樣需求5、提供測溫記錄、通行記錄導出功能
  • 人臉識別:AI產品經理需要了解的CV通識
    希望大家能從這個系列收穫到更多的CV乾貨:)人臉識別(Face Recognition):對圖像中的人臉進行檢測、識別和跟蹤。最近人臉檢測算法模型的流派包括三類及其之間的組合:viola-jones框架(性能一般速度尚可,適合移動端、嵌入式上使用),dpm(速度較慢),cnn(性能不錯)。人臉檢測關注以下指標:檢測率:識別正確的人臉/圖中所有的人臉。檢測率越高,代表檢測模型效果越好。
  • 百度開源業內首個口罩人臉檢測及分類模型
    如判斷工區員工是否佩戴口罩、人流密集的關口運輸中心如何識別戴口罩的人臉並測溫、佩戴口罩是否也能完成日常刷臉打卡等等……都是新冠肺炎疫情下需要解決的真實痛點。此次宣布免費開源的自研口罩人臉檢測及分類模型,是基於2018年百度收錄於國際頂級計算機視覺會議ECCV的論文PyramidBox研發,可以在人流密集的公共場景檢測海量人臉的同時,將佩戴口罩和未佩戴口罩的人臉快速識別標註。
  • 每周AI應用精選:虹膜識別解決方案;基於深度學習人臉識別方案等
    1.對於國際上其它單位的核心算法,中科虹霸的核心算法速度更快,佔用的內存空間更小,整體性能更加優異。在虹膜檢測、活體虹膜判別、圖像質量評價、虹膜區域定位、歸一化、圖像增強、特徵表達和抽取、特徵匹配與分類器設計等各個環節也都進行了自主創新,突破了一批關鍵技術,建立了比較系統和完整的虹膜識別理論、技術和方法。中科虹霸的虹膜圖像資料庫已成為國際上最大規模的虹膜共享庫。
  • 產品知識中心:Chipkill內存
    內存糾錯技術的發展過程    90年代初,內存體系採用奇偶性校驗(Parity Verifying)技術。奇偶校驗內存在每一字節(8位)外又額外增加了一位作為錯誤檢測之用,BIOS中的監控程序會將存入內存中的數據位相加,並將結果存於校驗位中。
  • 32Kb內存1Kb顯卡的蘋果電腦 起價33萬!
    這款設備的當前狀態評估為8.0分,起拍價約合人民幣33萬元,這款Apple-1還包括所有必要的配件,原裝的包裝盒上還有蘋果聯合創始人史蒂夫·沃茲尼亞克(Steve Wozniak)的籤名。Apple I是蘋果電腦的第一臺原型機,1975年6月29日,由斯蒂夫·沃茲尼亞克在惠普公司辦公室手工打造而成,模樣像打字機配置上,Apple I搭載的CPU為MOStek 6502,處理器速度為1 MHz,最大的內存為32Kb,顯卡為1Kb,最大的解析度是40×24字符。那麼對於收藏家來說,33萬人民幣的價格如何呢?
  • 人臉識別有什麼漏洞,活體檢測又是怎麼防偽?
    隨著人臉識別技術日益成熟,商業化應用越來越廣泛,人臉登錄、人臉支付、人臉乘梯、人臉閘機等等,在安防、金融、教育、醫療等領域廣泛應用,人臉識別技術的智能快捷在國內得到迅速發展,但人臉識別極其容易被照片、視頻、仿真模具等方式矇混過關,網上也頻頻傳出各種破解方法,因此人臉識別系統具備活體檢測功能成為必然