不能錯過!超全Anaconda(Python整合包)導修(圖文詳解)

2021-01-11 讀芯術

全文共2653字,預計學習時長10分鐘

圖源:Pexels

Anaconda是一個供數據科學家、IT專家,和商業領袖使用的數據科學平臺,是Python、R語言等的一個發行版。針對數據科學,它有超過300個軟體包,因此它迅速攀升為最好的數據平臺之一。本篇導修將會探討如何運用Anaconda幫助Python編程。以下是本文要探討的主題:

Anaconda介紹安裝和啟動如何將Python庫導入AnacondaAnacondaNavigator使用場景:

○ Python基礎

○ 數據分析

○ 機器學習和人工智慧

*CDH:Cloudera’s Distribution Including Apache Hadoop.

Cloudera包括Apache Hadoop的發行版本。

Anaconda介紹

Anaconda是Python和R的開源發行版本。它能夠用於數據科學,機器學習,深度學習等領域。它能夠讓用戶接觸到超過300個資料庫,因此對於任何程式設計師而言,Anaconda都是數據科學研究的上選。

Anaconda能夠幫助簡化軟體包的管理和部署,它還匹配了多種工具,可以使用各種機器學習和人工智慧算法輕鬆地從不同的來源收集數據。Anaconda還可以使用戶獲得一個易於管理的環境設置——用戶只需點擊按鈕就可以部署任何項目。

相信你們對Anaconda已經有了一個基本概念,接下來了解如何安裝它,並設置一個能夠在系統上工作的環境。

安裝和啟動

想要安裝Anaconda,可以進入這個網站。

下載頁面

選擇一個適合的版本然後點擊下載。完成下載後,打開啟動頁面。

Anaconda啟動

遵循啟動頁中的指令,記得點擊添加Anaconda到路徑環境變量裡。安裝完成後,你會看到一個和下圖一樣的窗口:

安裝完成

安裝完成後,打開Anaconda prompt並輸入jupyternotebook*。

*Jupyter Notebook: 是一個基於Web的交互式計算環境,用於創建jupyter notebook文檔。

Anaconda prompt

你會看到一個和下圖一樣的窗口:

Jupyter Notebook文件查找器

現在,已經知道如何將anaconda應用到python裡了,繼續研究如何在anaconda裡為不同的項目導入資料庫。

導入Python庫至Anaconda

打開Anaconda prompt,檢查資料庫是否已經安裝。

檢查NumPy*是否安裝

*NumPy是Python語言的一個擴展程序庫,支持高端大量的維度數組與矩陣運算,此外也針對數組運算提供大量的數學函數庫。

因為沒有名為numpy的模塊存在,我們要運行以下指令來安裝numpy。

安裝NumPy中

安裝完成,就會出現這樣一個窗口:

NumPy安裝完成

安裝完一個資料庫後,儘量再次導入模塊以驗證安裝是否成功。

導入NumPy

如上圖所示,這一步沒有出現錯誤。這就是在Anaconda中安裝不同資料庫的方法。

Anaconda Navigator

Anaconda Navigator

Anaconda Navigator是Anaconda發行版附帶的桌面圖形用戶界面(GUI),它能夠讓用戶在不使用命令行的情況下啟動應用程式,並管理conda軟體包和環境。

Python基礎

變量和數據類型

變量和數據類型是所有程式語言的基本組成部分。基於不同數據的屬性,Python共有六種數據類型。其中,列表(list),字典(dictionary),集合(set),還有元組(tuple)是Python中的集合數據類型。

下面是變量和數據類型在Python中應用的例子:

#variable declaration

name = "Edureka"

f = 1991

print("python wasfounded in" , f)

#data types

a = [1,2,3,4,5,6,7]

b = {1 : 'edureka' , 2: 'python'}

c = (1,2,3,4,5)

d = {1,2,3,4,5}

print("the listis" , a)

print("thedictionary is" ,b)

print("the tupleis" , c)

print("the set is" , d)

操作符(Operators)

Python 中的操作符用於值或變量之間的操作。Python中有七種類型的操作符:

賦值操作符(AssignmentOperator)。算術運算符(ArithmeticOperator)。邏輯運算符(LogicalOperator)。比較操作符(ComparisonOperator)。位操作符(Bit-wiseOperator)。會員操作符(MembershipOperator)。身份識別操作符(Identity Operator)。

下面是在Python中使用操作符的一個例子:

a = 10

b = 15

#arithmetic operator

print(a + b)

print(a - b)

print(a * b)

#assignment operator

a += 10

print(a)

#comparison operator

#a != 10

#b == a

#logical operator

a > b and a > 10

#this will return true if both the statements are true.

控制語句

諸如使用if, else, break和continue等的語句被用作控制語句,以獲得對執行過程的控制,從而取得最佳結果。可以在 Python 的循環中使用這些語句來控制結果。下面的示例演示如何使用控制(control)條件(conditional)語句。

name = 'edureka'

for i in name:

if i == 'a':

break

else:

print(i)

函數

Python函數以一種高效的方式使代碼的重複使用性提高,為問題語句編寫邏輯,並運行一些參數以獲得最佳解決方案。下面是如何在python中使用函數的示例。

deffunc(a):

return a ** a

res = func(10)

print(res)

類以及對象

因為Python支持面向對象的程序設計,所以也可以使用類和對象。下面是如何使用python中的類和對象的示例。

classParent:

deffunc(self):

print('this is parent')

classChild(Parent):

deffunc1(self):

print('this is child')

ob = new Child()

ob.func()

以上Python的一些基本概念。接下來,看看Anaconda更大的軟體包支持,我們可以從許多庫中獲得資料。現在來探究如何使用 python anaconda進行數據分析。

分析

數據挖掘和分析工作流

上面是數據分析中涉及的某些步驟。來看看在anaconda中數據分析是如何進行數據分析的,以及其中可以使用的各種庫。

收集數據

數據的收集就像在程序中加載 CSV 文件一樣簡單。可以利用相關數據來分析數據中的特定實例或條目。下面是加載程序中CSV數據的代碼:

import pandas as pd

import numpy as np

import matplotlib.pyplot as plt

import seaborn as sns

df = pd.read_csv('filename.csv')

print(df.head(5))

前五行數據組

交叉分析

在加載程序中的數據集之後,還需要對數據進行一些更改過濾,即消除空值和可能造成分析不確定性的不必要欄位。

下面是如何根據需求篩選數據的示例:

print(df.isnull().sum())

#this will give the sum of all the null values in thedataset.

df1 = df.dropna(axis=0 , how= 'any')

#this will drop rows with null values

找到每列空值的總數

當然也可以刪除空值。

刪除空值的所在行

箱線圖(box plot)

sns.boxplot(x=df['Salary Range From'])

sns.boxplot(x=df['Salary Range To'])

薪資範圍箱線圖
薪資範圍箱線圖

散點圖(scatter plot)

import matplotlib.pyplot as plt

fig, ax = plt.subplots(figsize=(16,8))

ax.scatter(df['Salary Range From'] , df['Salary Range To'])

ax.set_xlabel('Salary Range From')

ax.set_ylabel('Salary Range TO')

plt.show()

薪資範圍散點圖

可視化

一旦根據需求改變了數據,就有必要分析這些數據,方式之一就是將結果可視化。更好的可視化表示有助於對數據投影進行最優分析。

下面是一個數據可視化的例子:

全職&兼職工作者的柱狀圖
全職&兼職工作者及工資結算方式柱狀圖
薪資範圍直方圖
薪資範圍直方圖

import matplotlib.pyplot as plt

fig = plt.figure(figsize = (10,10))

ax = fig.gca()

sns.heatmap(df1.corr(), annot=True, fmt=".2f")

plt.title("Correlation",fontsize=5)

plt.show()

用matplotlib繪製的熱圖

分析

完成可視化後,可以藉助各種圖表來進行分析。假設我們正在處理作業數據,通過查看某個區域中特定作業的可視化表示,便可以確定特定域中作業的數量。

根據上文的分析,可以假設下列結果:

和全職工作相比,數據集裡兼職工作的數量非常少。兼職工作只有不到500個,但全職工作的總數超過了2500個。基於這一分析,可以建立一個預測模型。

如果還有其他問題,在評論區裡踴躍發言喲,小芯將第一時間與你聯繫。

留言點讚關注

我們一起分享AI學習與發展的乾貨

如轉載,請後臺留言,遵守轉載規範

相關焦點

  • Pytorch框架安裝方法(基於Anaconda環境和Pycharm IDE)
    1.6 單擊啟動Anaconda Prompt 創建虛擬「房間」通過conda創建一個名為:pytorch的虛擬「房間」,可以方便未來對不同版本的PyTorch進行管理,具體方法如下:conda create -n pytorch python=3.61.7 查看創建的「房間」方法:conda info --envs
  • 《方舟生存進化》私服建立圖文教程詳解
    導 讀 方舟:生存進化私服怎麼建立?
  • python環境配置簡要流程
    1、下載並安裝anaconda 教程網上很多,路徑最好放在c盤,而且最好在安裝過程中勾選添加PATH。/cloud/msys2/ conda config --add channels http://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/conda-forge/ conda config --add channels http://mirrors.tuna.tsinghua.edu.cn
  • 用R也可以跑Python了
    通過安裝包,你現在可以在R上運行Python的安裝包和函數了~今天文摘菌就來教教你咋用這個reticulate包。通過使用repl_python()函數,可以使Python和R交互。summary(py$t)在這種情況下,我會用R的summary()函數並訪問在python中創建的數據集T。此外,您可以使用ggplot2軟體包繪製折線圖。
  • 《流放者柯南》管理員面板使用圖文詳解
    導 讀 流放者柯南管理員面板翻譯是什麼,流放者柯南管理員面板怎麼用?
  • 《刺客信條:起源》獅身人面像隱藏服裝圖文詳解 獅身人面像怎麼進?
    導 讀 遊戲中有一個名叫獅身人面像的建築,在這個建築內容藏著一件遊戲裡的隱藏服裝,那麼我們要如何進入這個建築呢
  • 《輻射76》核彈怎麼使用 核彈使用技巧圖文詳解
    導 讀 核彈是輻射76中的一個大殺傷性武器,使用前需要玩家滿足一系列條件,很家還不清楚整個發射核彈的流程
  • 數據科學的Python軟體包
    巨大的社區支持Python具有廣泛的社區支持之一,在dev op社區上存在各種活躍的論壇,python開發人員在該論壇上發布他們的錯誤,而社區則試圖幫助他們。各種用於數據科學的Python庫到目前為止,我們已經介紹了什麼是數據科學以及為什麼要使用Python,現在讓我們討論可用於數據科學的各種python庫。1.
  • 學習筆記,從NumPy到Scrapy,學習Python不能錯過這些庫
    在網絡上看到幾位前輩寫了關於python深度學習庫的文章,對於小小白來說,因為我剛開始學python,我得承認自己看完後依然覺得雲裡霧裡的,不知道這些庫到底對我有什麼用處。所以我到網絡上搜集補充關於這些庫的說明內容,感覺在這個整理資料的過程中,對於這些python程序庫了解了更多,以下是我整理的學習筆記。
  • 《輻射4》庇護山丘大型精美建造圖文詳解 庇護山丘建造賞析
    導 讀 《輻射4》庇護山丘這個地方可是非常棒的,很多玩家都喜歡在這裡建造,今天就為大家帶來了輻射4庇護山丘大型精美建造圖文詳解
  • python包管理之pip,其實很簡單!
    前言pip 是一個Python包管理工具,主要是用於安裝 PyPI 上的軟體包,可以替代 easy_install 工具。官方地址:https://pypi.python.org/pypi/pip下載解壓後,進入目錄直接運行python安裝就可以了python setup.py install(PS:Python3編譯安裝就默認帶了pip了)2、使用包管理軟體安裝Linux系統一般都是有自帶Python,如果只需要系統自帶的Python,直接從系統的包管理器安裝可以了
  • 尼爾機械紀元Pod技能效果及獲得方法圖文詳解
    導 讀 大家知道尼爾:機械紀元Pod技能有哪些嗎?Pod技能怎麼獲得呢?
  • 古森林飛龍蛋任務路線圖文詳解
    導 讀 怪物獵人世界飛龍蛋怎麼搬運?前面一個草食龍的搬蛋挺簡單的,搬起來跑就行。不過第二個古代林飛龍蛋的任務有點麻煩,很家都沒有完成。
  • 《戰錘:末世鼠疫2》3月9日更新內容圖文介紹 更新了哪些內容?
    導 讀 戰錘末世鼠疫2官方於3月9日對遊戲進行了大幅度更新,這次更新有哪些改動想必很家都十分關心。
  • 缺氧怎麼冷卻熱汙水 缺氧自動化熱汙水冷卻系統圖文詳解
    導 讀 《缺氧》遊戲中熱汙水怎麼冷卻?
  • python:pop函數詳解 - 二進位01
    pop函數詳解今天我為大家講解python中pop函數的使用。#python#簡介——pop()函數是python解釋器的內置方法,可作用於列表,字典。popitem喜歡python的小夥伴關注我吧
  • 代碼詳解:Python虛擬環境的原理及使用
    · 通過捕獲需求文件中的所有包依賴項,使項目自包含且可重現。· 在沒有管理員權限的主機上安裝軟體包。· 只需要一個項目,無需在系統範圍內安裝軟體包,就能保持全局site-packages /目錄整潔。聽起來很方便,不是嗎?開始構建更複雜的項目並與其他人協作時,虛擬環境的重要性會凸顯出來。
  • 無法獲取獎勵原因詳解
    導 讀 刺客信條起源社區每周挑戰怎麼領取獎勵?許多新人玩家可能對這個不大了解,總是無法得到發放的獎勵。