一位缺覺的父親記錄了他雙胞胎寶寶的睡眠數據 並交給機器學習,結果……

2021-02-14 大數據文摘


大數據文摘作品,轉載具體要求見文末

作者| Aileen 翻譯|任傑  校對|霍靜

 

◆ ◆ ◆

導讀

初為人父人母,最大的體會必須是:缺覺!餵奶換尿布,孩子一夜醒來好幾次,沒把小寶寶哄睡,卻把自己哄睡了,那時候你的內心一定是崩潰的。

國外一個缺覺的父親實在受夠了他的雙胞胎寶寶,聯合他的妻子,統計了兩個娃的睡眠及餵養時間數據等,用機器學習分析預測,總結並掌握兩個孩子的作息規律,科學的育兒方法讓他們伺候好孩子的同時,又將孩子對自己的睡眠影響降到最低,真是太機智了。技術咖拯救睡眠啊!

接下來就讓我們看看這對夫妻是如何收集數據、並利用機器學習分析數據的,或許年輕的我們可以學一手。

這樣看來機器學習和數據決策其實並沒有那麼高高在上,可能也可以幫我們解決一些生活中的有趣問題。


◆ ◆ ◆

前言

 

一個月前,我試著用A / B測試我們那對雙胞胎,看看怎樣不同的「治療」或輸入參數會造成較久的睡眠,當然這由我們自己來完成。我發現睡眠模式相當不穩定,並沒有找到促進睡眠相關的東西。隨著時間的推移,他們更大程度上傾向於自然醒。然而,現在他們已經四個月大了,他們已經開始普遍但是很少討論的睡眠顛倒(Sleep Regression)。我又一次發現自己渴望獲得更多的睡眠。我先前投的文章中確實有一個評論說,「無論多麼渴望睡更多,我都會努力去找,我能找到對於睡眠有用的東西嗎」?嘿嘿,我找到了。從此,我轉而關注另一項計算機科技:機器學習。

機器學習是一個計算機科學的領域,提供 「教」計算機或程序的方式,而不需要給他們一些分散的指令集。在正常編程中,我會讓計算機按順序執行一列命令,按邏輯基於輸入的方法來做決策,不過這些程序永遠都不會離開已定義好的軌跡。儘管這聽起來比它實際上運行的方式更像終結者(Terminator),但是機器學習可以接受人拿給的用於「學習」的數據,以此作為預測的基礎。雖然這在整個科技行業變得越來越流行,而AI主要被用於瀏覽購買行為和推薦,也許最有趣的是,分類和識別照片和畫作,這大多是谷歌在做。我沒有找到什麼例子用於做家長帶小孩。

多虧我的妻子是會計背景,還有我們的A型人格,我們詳細記錄了兩個男孩的進食和睡眠行為。還記得這個表格嗎?

◆ ◆ ◆

「大數據」,毫不誇張的講

使用這些數據,我開始尋找輸入參數的最優組合,在這個例子中,我關注食物總消耗、最後餵食時間和最後餵量,來決定什麼情況會導致男孩的最久時間睡眠。最重要的是我可以讓計算機做艱苦的工作。另外,我們這組模式有兩倍的數據,因為很明顯我們有兩個男孩。

有幾個可用的巨大機器學習庫,他們跨程式語言。雖然我主要使用Java和Javascript工作,我選擇了Python庫sklearn,因為我熟悉Python以及這個靈活的腳本語言可以說是近乎完美的應用。有許多對這個庫和文檔極好的教程。

如果感興趣,你可以在github上找到我的代碼。

把我們從電子表格收集的數據導出來,我提取了過去一個月的數據點。因為嬰兒正經歷快速的成長發育變化,我覺得一個月的數據乘以2個嬰兒,是一種對近因效應較好的平衡,而且數據足夠用於做預測了。



◆ ◆ ◆

放在一起進行編碼

我也得到了一些有趣的統計值,包括:平均每天我們餵食兩男孩(各)27.5盎司,通常讓他們在睡覺在7:25睡覺,睡前餵他們5.22盎司,它們平均睡9個小時。結果發現男孩75%的情況睡超過10小時。不賴的發現。但我知道我們還有一些工作可以改進。

 


總餵食

最後餵食時間

最後餵食量

睡眠時間(小時)

次數

62

62

62

62

均值

27.491935

7.455645

5.225806

9.084677

標準差

2.001008

0.331181

0.857357

1.726092

最小值

24.000000

6.750000

2.000000

3.500000

25%

26.000000

7.250000

5.000000

8.000000

50%

27.000000

7.375000

5.000000

9.000000

75%

29.000000

7.687500

6.000000

10.187500

最大值

32.000000

8.500000

7.000000

13.500000

採用這些數據,我能夠畫出對於睡眠時間的每個參數。

你可以看出數據間已經沒有很強的相關性,至少多數不存在線性關係。最具線性特徵的關係,還有很多離群點的,要屬總進食量和睡眠小時之間的關係了。奇怪的是嬰兒吃得多反而睡得少了。

有許多不同類型的機器學習算法。這些主要分為線性和非線性兩種類型。我用了六種使用相當廣泛的算法運行這組數據,看看每個能到的準確程度。以下是結果。

 

Logistic Regression: 0.303333 (0.211056)

Linear Discriminant Analysis: 0.376667 (0.157797)

K Neighbors Classifier: 0.286667 (0.073333)

Decision Tree Classifier: 0.356667 (0.196667)

GaussianNB: 0.183333 (0.076376)

Support Vector  Machine: 0.410000 (0.200028)

註:每種算法的準確程度,括號中的為標準差,或者採用一個形象的圖表


在這裡你可以看到,支持向量機算法在這些數據上完成的明顯最好,雖然變化範圍較寬,均值並不比其他的算法強很多。這些方法用於預測甚至沒有一個超過50%的(均值)。這完全是由於數據的偽隨機性質。即使有這樣的結果,我決定繼續嘗試,希望能深入有更多新奇的發現。

採用支持向量機,我用輸入的數據訓練算法。用了這個,當我們哄孩子們上床,基於一天的食物量,以及睡前前最後一餐的量,我現在就可以預測出他們能睡多久。例如,給他們28盎司,哄他們7點上床,最後一餐餵6盎司,將造成一個比較差的8小時的睡眠。


◆ ◆ ◆

結論

用目前訓練出的算法,某種程度上,我可以預測將會得到多久的睡眠。更重要的是,我可以從箱型圖(Box Plot)中,6種流行的算法性能趨線,看出他們的表現。並且試著優化,明白怎樣類型的行為可以造成更久的睡眠。一種反常規的現象是,早些躺下,吃更少的食物,實際上一整天的睡眠時間卻增加了。這可能是由於很多因素導致的,但我的理論是,吃得少那補充的就少,胃收縮的也就減少,因此睡眠也就更安穩。有多少次你是狼吞虎咽,然後奇怪的是在半夜餓醒了?

很不幸,正如用A/B測試一樣,沒有一種個體輸入對睡眠似乎是直接的。我想如果真的有人已經發現了,能掙數百萬。綜上所述,機器學習可以找到變量之間一些像這些的趨勢和關聯,從而得到比A/B測驗或者「試誤法」(trial and error)更好、更準確的結果,仍然結果還差得很遠呢。從這組數據集,最多可以得到41%的預測準確率。這意味著結果往往是錯誤的。由於頻繁的發育變化,還有男孩之間的差異,很難在他們之間應用數據。再次申明,樣本量大一點是有幫助的,但我們不打算很快要三胞胎。

儘管如此,這些結果總比沒有好,幫助論證了機器學習和數據科學領域的許諾。比起依據直覺,我更喜歡靠數據來決策,和這些證實我猜測的數據,只會讓我對我們的育兒方法感覺更好。

原文連結:https://medium.com/dad-on-the-run/hacking-my-infant-twins-sleep-with-machine-learning-and-data-science-6c1e38a71677



如需轉載,請在開篇顯著位置註明作者和出處(轉自:大數據文摘|bigdatadigest),並在文章結尾放置大數據文摘醒目二維碼。無原創標識文章請按照轉載要求編輯,可直接轉載,轉載後請將轉載連結發送給我們;有原創標識文章,請發送【文章名稱-待授權公眾號名稱及ID】給我們申請白名單授權。未經許可的轉載以及改編者,我們將依法追究其法律責任。聯繫郵箱:zz@bigdatadigest.cn。

◆ ◆ ◆
志願者介紹

大數據文摘後臺回復「志願者」,了解如何加入我們




◆ ◆ ◆往期精彩文章推薦,點擊圖片可閱讀

首次!海豚間像人類一樣的交談被水下麥克風記錄

相關焦點

  • 12歲內兒童睡眠標準出爐,若孩子出現這幾個信號,多半就是缺覺了
    具體的睡眠時間可以根據他們的睡眠規律而定,一般建議白天睡2個小時左右,晚上睡10個小時。這個時間段的寶寶最是容易白天玩的興奮,導致晚上睡不著,導致睡眠時長減少,影響了其大腦和身體的發育。2、口齒不清孩子如果缺覺,往往會出現自發性的複雜話語,更容易出現口齒不清、口吃和說話單調等現象。
  • 亞馬遜雲服務(AWS)為機器學習擴圈 觸及每一位AI工作者
    Amazon Lookout for Equipment面向已經擁有傳感器、但不希望自己構建機器學習模型的客戶,由AWS為其構建模型並返回預測結果,檢測異常設備行為。 打造包羅萬象的工具箱,賦能每一位AI工作者 擴圈舉措之二,是打造全面豐富的工具集,用顧凡的話說, right tool for the right job(為每一項工作都提供一個趁手的工具)。AWS提供的機器學習工具集包括三個層面。
  • 亞馬遜雲服務(AWS) 為機器學習擴圈 觸及每一位AI工作者
    資料庫開發者發起資料庫查詢(SQL)時,只要選擇一個機器學習模型,就會喚醒機器學習服務,Aurora ML自動將查詢結果交給機器學習模型進行推理,返回結果。例如,要查詢一個客戶評價是正面還是負面,資料庫開發者只管做資料庫查詢、選擇這個模型,返回來的查詢結果就會自動附加正面或負面判斷。
  • 寶寶很精神意味不困?睡醒了就要馬上玩?嬰兒睡眠的誤區被你踩了
    然而,絕大多數民眾對睡眠的了解很膚淺,尤其是嬰幼兒睡眠方面,大家更是知之甚少。就比如最簡單的一個問題,孩子到底缺不缺覺?看似有些「弱智」的問題,真要往下細細追究,人們好像還真的說不出個所以然來。可能有人會說,孩子打哈欠、想睡覺不就是困嗎?反過來,不困就是不缺覺。
  • 寶寶睡眠不好,全憑一口仙氣的寶媽應該怎麼辦?謹記三要三不要
    長期缺覺是一種什麼體驗?睡渣的媽媽最常說的就是:「活到現在全靠一口仙氣吊著!」長期缺覺的媽媽可能每個人都有這種感覺:頭痛、精神不振、脾氣不好,有研究表明,長期缺覺的人情緒的處理能力會更差。這也直接導致家庭關係的不和諧。美國抗癌調查顯示,每晚平均睡7~8小時的人壽命最長;每晚平均睡4小時以下的人中80%壽命比較短!
  • 睡眠不足長期缺覺,身體會有這五個變化,希望對熬夜的你有幫助!
    長時間的缺覺,對於健康影響真的是太大了。在網絡上有這樣一張圖片,同樣的一個人,一張圖片是睡眠時間在8個小時,另外一張圖片,睡眠時間在6個小時,可以明顯的看出,睡眠時間在6個小時的人,更顯得蒼老。例如,會引起肥胖症的出現,長時間的缺覺,會改變人們的正常食慾,打破了正常的進食慾望,可能會讓人過多的飲食,伴隨肥胖症的出現。在研究中發現,當一個人睡眠時間太少,罹患糖尿病的風險也會增高很多,這是因為睡眠時間少,會降低了胰島素的敏感性,增加了糖尿病的危險。
  • 雙胞胎的父親可能不是同一個人.關於雙胞胎,你不知道的太多了!
    2.雙胞胎的父親可能不是同一個人。是的,有這種可能性,但是同母異父雙胞胎出生的概率是1:400,醫學上稱之為同期復孕。3.吃乳製品多的女性更容易懷上雙胞胎。野山芋也能提高懷雙胞胎的機率。9.22%的雙胞胎兩個都是左撇子,還有10%是雙胞胎其中一個是左撇子。有一種理論說雙胞胎的左撇子是寶寶還在媽媽肚子裡的時候就形成了。10.Ernest Hemingway(歐內斯特·海明威)的母親經常讓他穿著他姐姐的衣服來滿足她對雙胞胎的幻想。Hemingway有個姐姐叫Marcelline,他媽媽喜歡叫他「Ernestine」。
  • 2020年 Top 20 機器學習和數據科學網站
    每天我都能看到瘋狂的信息流,不幸的是,有很多虛假或毫無價值的東西,尤其是在數據科學和ML上。哪裡可以找到所有相關和有用的材料?-這就是問題所在。和大家分享我整理的機器學習和數據科學網站。#11 DataRobot Blog這是一家令人興奮的公司,它正在進行數據機器人轉換,並通過自動機器學習加速預測分析。最棒的是,這家公司不僅做了出色的工作,而且還提供了自動化機器學習和數據科學領域的最新進展。
  • 寶寶的睡眠引導到底是什麼?
    夜奶會導致脹氣,消化不良,這都會影響孩子的睡眠。最後,我們可能得出一個結論就是,頻繁夜奶並不是孩子的需要,而只是媽媽無意識給孩子養成的習慣。摸清楚孩子夜奶的真實需求後,在寶寶夜醒後,我們就開始去了解孩子為什麼醒來,而不是一味的餵夜奶。
  • 「缺覺」帶來災難性影響,3個表現說明睡眠變「老」了
    睡眠不足的問題很普遍,美國加州大學伯克利分校心理學教授、人類睡眠科學中心創始人兼主任馬特·沃克說:「睡眠不足是個悄然無聲的『疫情』,正迅速成為人們在21世紀面臨的公共衛生方面的最大挑戰之一」。缺覺已影響人類健康,甚至對我們後代的安全和教育都產生了災難性影響。
  • 比Keras更好用的機器學習「模型包」:無需預處理,0代碼上手做模型
    又或者覺得,數據預處理就是在「浪費時間」?一位畢業於哥廷根大學、做機器學習的小哥也發現了這個問題:原本只是想設計個模型,結果「實現比設計還麻煩」。於是他自己動手做了個項目igel(德語中意為「刺蝟」,但也是Init、Generate、EvaluateMachineLearning的縮寫),無需編寫任何多餘代碼,就能設計出想要的模型。
  • 這五個數據科學家和機器學習工程師油管博主,你必須關注
    2.肯恩·傑他是最有趣的數據科學油管人物之一,有五年數據科學領域工作經驗。大多數數據科學家可能已經很熟悉肯恩·傑了,也許你看過他簡歷和作品集中的一個視頻,也許你看過他的「從零開始的數據科學項目」系列視頻。
  • 算法應用|機器學習python應用,簡單機器學習項目實踐
    導入數據,並通過描述性分析、可視化等對數據進行分析。創建六個模型,並從中選擇準確度最高的模型。可以說這並不是一個正式的項目,只是用來做一個簡單的展示,用於給初次接觸機器學習的讀者快速了解機器學習的過程和結果。
  • 缺覺的媽媽們,娃睡了為什麼還捨不得睡?媽媽們都懂……
    小檸的寶寶剛4個多月,在談到最近的生活狀態時,她在群裡吐槽說:「自從有了娃,我從此便告別了想睡就睡的人生了。娃醒著的時候,自己必須是醒著的,而娃睡了自己也未必能睡得了。所以做生了娃後,媽媽的狀態基本只有兩種:缺覺和更加缺覺。」
  • 寶寶頻繁夜醒,金牌月嫂給你總結7大原因,寶寶睡眠問題逐個破解!
    3、不知怎地我們便都笑了起來,是互相的嘲笑和悲哀。他眼睛還是那樣,然而奇怪,只這幾年,頭上卻有了白髮了,但也許本來就有,我先前沒有留心到。他穿著很舊的布馬褂,破布鞋,顯得很寒素。談起自己的經歷來,他說他後來沒有了學費,不能再留學,便回來了。回
  • 李沐:從頭開始介紹機器學習,眼花繚亂的機器學習應用
    最常見的描述這些問題的方法是通過數學,但不像其他機器學習和神經網絡的書那樣,我們會主要關注真實數據和代碼。下面我們來看點數據和代碼。用代碼編程和用數據編程這個例子靈感來自 Joel Grus 的一次 應聘面試. 面試官讓他寫個程序來玩Fizz Buzz. 這是一個小孩子遊戲。
  • 當iPhoneX的Face ID面部識別遭遇雙胞胎,結果…
    還記得發布會那會兒,就有網友調侃,Face ID該不會不能識別雙胞胎吧?帶著這樣的疑問,在發售以後,真的有好幾家媒體找來了雙胞胎,看能不能騙過Face ID,結果…從視頻可以看出,有的雙胞胎刷臉就可以解鎖兄弟姐妹的iPhone X,有的卻不能,這是為什麼呢
  • 奶奶給寶寶蓋被子,竟導致6天大雙胞胎死亡!月嫂看見一定要勸阻!
    一位奶奶晚上給剛出生6天的雙胞胎孫子蓋被子,結果第二天早上卻發現兩個寶寶早已停止呼吸、身子都涼了!有的姐妹看到這可能會認為,兩位寶寶應該是窒息致死,但是事情的真相卻並不是大家想像中的那麼簡單。小雨媽媽(化名)產下一對雙胞胎後,家人都趕來照顧寶媽和寶寶。
  • REM睡眠與皮質酮調節、細胞凋亡途徑和慢性應激行為的獨特關聯
    因為實在是太缺覺了。現如今,睡眠對於很多人來說都已是奢侈品。據《2019年中國睡眠指數報告》顯示,50後最快入睡,60最愛午休,70後最愛睡前看書,80後最愛失眠,90後睡得最晚,00後賴床最久。眾所周知,壓力會讓人失眠,失眠會導致情緒暴躁,但這一過程期間,大腦發生了什麼?
  • 一個人就是一對雙胞胎,她不是精神分裂而是……
    結果顯示,媽媽是小寶寶的親生母親,但爸爸並不是親生父親。而後又做了一次更全面的基因測試。結果顯示,孩子是這個爸爸的兄弟的。原來孩子的爸爸有一個跟他一起的受精的雙胞胎親兄弟。但是隨著孕育的推進,兩個受精胚胎裡發育得比較弱的那個,可能會死去消失。另一個強一點的胚胎就有可能過來把弱的那個吞噬吸收掉,最終兩個胚胎嵌合成一個胚胎。