Numpy學習打卡task05

2020-12-15 學習其實很有趣

今天帶來的是Datawhal自主學習Numpy下學習打卡筆記第五部分—大作業。本文是基於iris數據的numpy代碼實踐。本文素材來自網絡及Datawhale。

習題解答

數據集屬性預覽

輸出

數據轉置儲存

輸出

1. 導入鳶尾屬植物數據集,保持文本不變。

輸出

2. 求出鳶尾屬植物萼片長度的平均值、中位數和標準差(第1列,sepallength)

輸出

3. 創建一種標準化形式的鳶尾屬植物萼片長度,其值正好介於0和1之間,這樣最小值為0,最大值為1(第1列,sepallength)。

4. 找到鳶尾屬植物萼片長度的第5和第95百分位數(第1列,sepallength)。

5.把iris_data數據集中的20個隨機位置修改為np.nan值。

6. 在iris_data的sepallength中查找缺失值的個數和位置(第1列)。

7. 篩選具有 sepallength(第1列)< 5.0 並且 petallength(第3列)> 1.5 的 iris_data行。

8. 選擇沒有任何 nan 值的 iris_data行。

9. 計算 iris_data 中sepalLength(第1列)和petalLength(第3列)之間的相關係數。

10. 找出iris_data是否有任何缺失值。

11.在numpy數組中將所有出現的nan替換為0。

12. 找出鳶尾屬植物物種中的唯一值和唯一值出現的數量。

13. 將 iris_data 的花瓣長度(第3列)以形成分類變量的形式顯示。定義:Less than 3 --> 『small』;3-5 --> 『medium』;』>=5 --> 『large』。

14. 在 iris_data 中創建一個新列,其中 volume 是(pi x petallength x sepallength ^ 2)/ 3。

15. 隨機抽鳶尾屬植物的種類,使得Iris-setosa的數量是Iris-versicolor和Iris-virginica數量的兩倍。

16. 根據 sepallength 列對數據集進行排序。

17. 在鳶尾屬植物數據集中找到最常見的花瓣長度值(第3列)。

18. 在鳶尾花數據集的 petalwidth(第4列)中查找第一次出現的值大於1.0的位置。

相關焦點

  • Numpy學習打卡task01
    今天帶來的是Datawhale自主學習Numpy下學習打卡筆記第一部分—輸入輸出(為什麼沒有上,別問,問就是numpy.tan(90))。本文大致介紹了numpy的相關背景知識。本文素材來自網絡及datawhale,糾錯指正、深入探討,咱們評論區見。
  • Numpy學習打卡task02
    今天帶來的是Datawhale零基礎入門Numpy的學習打卡筆記第二部分—隨機抽樣。本文大致介紹了隨機數的相關背景知識。本文素材來自網絡及datawhale。highlight=numpy%20random#module-numpy.random不同數據類別rand(d0, d1, ..., dn) 給定形狀的隨機值。randn(d0, d1, ..., dn) 從 "標準正態分布 "中返回一個(或多個)樣本。
  • Numpy學習打卡task03
    今天帶來的是Datawhal自主學習Numpy下學習打卡筆記第三部分—統計相關。本文大致介紹了數理統計的相關背景知識,以及神奇的本福特定律。本文素材來自網絡及Datawhale。統計學統計學是一門與數據的收集、組織、分析、解釋和呈現有關的學科。
  • Datawhale十二月Pandas組學習打卡--Task01.預備知識2:NumPy第一部分
    編號112打卡這一部分介紹一下NumPy的基礎知識。
  • Datawhale十二月Pandas組學習打卡--Task01.預備知識2:NumPy第三部分
    ●形式:  numpy.where(condition[, x, y])●參數●condition array_like, bool  Where True, yield x, otherwise yield y.
  • Python的武器庫05:numpy模塊(下)
    上一篇文章主要講述了numpy的數學函數,這節課主要講一下numpy如何創建矩陣,以及對矩陣的一些運算。如果要使用numpy模塊,首先輸入"import numpy as np",引入numpy模塊並將它重命名為np。
  • numpy庫學習總結(基礎知識)
    最近在學習Python中OpenCV庫,學習花了很多時間,發現基礎知識很重要,尤其是numpy這個庫,在進行程序開發時,處理大量類似數組這種數據結構時,它的重要性等同於Python中的列表,像前篇我們寫的《使用Python中OpenCV庫創建一幅圖片的RGB通道圖片》中,對於圖片的處理
  • Datawhale十二月Pandas組學習打卡--Task01.預備知識練習題
    編號112打卡預備知識的練習題,也可以通過幕布來查看思維導圖模式:https://share.mubu.com
  • AI學習準備工作以及numpy學習
    使用《利用python進行數據分析》(第二版)進行學習,僅需要學習資料的小夥伴可直接跳轉至文章最下方。
  • Python之numpy數組學習(一)
    作者  Airy本文轉自AiryData,轉載需授權前面已經安裝並學習了Python中的科學計算庫,今天主要學習下numpy數組。Python本身支持整型、浮點型和複數型,為了科學計算,numpy提供了更加豐富的數據類型,注意:numpy跟數學運算有關的數據類型的名稱都以數字結尾。這個數字指示了該類型的變量所佔用的二進位位數。Numpy的各種數值類型如下圖所示:
  • Python之numpy數組學習(三)
    作者  Airy本文轉自AiryData,轉載需授權前面我們學習了numpy庫的簡單應用和數組的處理,今天來學習下比較重要的如何拆分數組。對於numpy來說,複數用j表示。real屬性將返回數組的實部,當數組元素全為實數時,就返回數組本身。如果數組有複數,那麼它的數據類型將自動變為複數類型。flat屬性可返回一個numpy.flatiter對象,這是獲得flatiter對象的唯一方法。給flat屬性賦值時,這個值會覆蓋整個數組內所有的值,所以建議不要賦值。
  • Multi-task Learning(Review)多任務學習概述
    ,或者訓練樣本不足,維度高,模型可能無法有效學習,甚至無法無法學習到相關特徵某些特徵可能在主任務不好學習(比如只存在很高階的相關性,或被其他因素抑制),但在輔助任務上好學習。重疊部分控制共享程度 [18]學習一小撮shared hypotheses,之後map each task to a single hypothesis [19]Deep Relation Network [20]計算機視覺中,一般共享卷積層,之後是任務特定的DNN層。通過對任務層設定先驗,使模型學習任務之間的關係。
  • Python學習第119課——numpy中的broadcasting
    這節課我們學習numpy中的數據的一個多變的特性--broadcasting,broadcasting的官方的說明比較麻煩,我們這裡把它簡化一下,就把它當做「腦補」的意思。我們舉例來說明。例:運行結果:從上例中,我們看到,x的「形狀」是3行2列,y的「形狀」是1行2列,之前我們學習numpy中的四則運算,所舉的例子中,兩個數組都是相同的「形狀」,在相加的時候每個數組對應位置上的元素分別相加,形成新的數組。
  • Python學習第114課——numpy中ndarray的四則運算
    我們為什麼要學習numpy?numpy其實就是number+Python的簡寫,意思就是通過Python對數據進行處理。要對數據進行處理,就少不了最基本的加減乘除等操作。這節我們學習numpy中數組的一些基本的四則運算。
  • Python數據分析之Numpy學習 2——NumPy 基礎 ndarray對象
    Python數據分析之Numpy學習 2 —— NumPy 基礎學習NumPy(Numerical Python)是高性能科學計算和數據分析的基礎包。約定:import numpy as npndarray對象的常用屬性創建ndarray函數說明
  • numpy入門
    1.一個強大的N維數組對象 ndarray         2.廣播功能函數         3.線性代數、傅立葉變換、隨機數生成等功能二.NumPy安裝方式1:pip install numpy
  • 天池新聞推薦入門賽學習打卡task01
    今天帶來的是對阿里雲天池&Datawhale零基礎入門新聞推薦算法賽事的學習打卡筆記第一部分—賽題理解+baseline。本文大致介紹了推薦算法的相關背景知識,以及賽事的基本分析。本文素材來自網絡及datawhale,糾錯指正、深入探討,咱們評論區見。
  • 再見Numpy,Pandas!又一個數據分析神器橫空出現!
    但是面對大數據的處理時,像是numpy和pandas的在加載數據時,會看到內存用量的飆升,而dask卻可以將這些大的數據進行並行計算。今天小編就帶領大家學習一個並行的計算庫——dask。dask可以幫助我們並行化處理pandas的DataFrame和numpy的計算,甚至是並行化處理機器學習算法。01.dask庫的使用介紹dask庫可以很好的兼容pandas的DataFrame數據和numpy的array數據,此外,像是Sklearn、XGBoost等機器學習庫,dask也能夠支持。
  • Python之numpy數組學習(四)——索引和視圖
    作者   Airy本文轉自 AiryData,轉載需授權前面我們學習了numpy庫的簡單應用和數組的處理,今天來學習下數組的視圖和索引。所以,要記住:numpy中,視圖不是只讀的。1、花式索引花式索引是一種傳統的索引方法,它不使用整數或者切片。這裡,我們將利用花式索引來把動物圖片(face)對角線上的值全部置0,相當於沿著兩條交叉的對角線畫兩條黑線。看一下完整代碼和效果。
  • Python數據分析基礎之NumPy學習 (上)
    數組計算之 NumPy (上)數組計算之 NumPy (下)科學計算之 SciPy數據結構之 Pandas基本可視化之 Matplotlib統計可視化之 Seaborn交互可視化之 Bokeh炫酷可視化之 PyEcharts機器學習之 Sklearn