spss計算變量:不用記公式,一鍵輕鬆得到新變量!

2020-12-05 SPSSAU

計算和轉化變量是數據處理分析過程中一個非常重要的過程,針對一些分析方法,原變量可能並不適合分析,此時就需要對原變量進行轉化,以利於後續分析。

針對這一需求,SPSSAU提供多種計算變量的方法,三步即可生成變量,不需要再單獨輸入函數。

操作步驟

Step1:點擊 [數據處理] 下的 [生成變量]。

Step2:點擊選擇具體分析題項,下拉複選框選擇計算功能(如平均值、乘積等)。

Step3:填寫新變量名(部分功能不需要填寫),點擊確認處理。

生成變量的一系列功能包括:常用函數、量綱處理、科學計算、匯總處理、其它。下面具體說明。

常用功能

常用功能

l 平均值

平均值是最常使用的,作用是將多個變量值的取平均,生成新的變量。適用場景:量表題中,將多個題目合併為一個維度進行分析等。

例如,計算每個學生各科成績的平均值或將「我願意向朋友推薦SPSSAU」,「我有需要會再來使用SPSSAU」,合併為「忠誠度」一個整體維度。

l 求和

求和多用於計算多個題項的總體得分,如量表總分等。

適用場景:計算每個學生各科成績的總和(總成績)。

l 乘積(交互項)

用於計算兩個變量或多個變量的乘積值。

適用場景:計算權重與指標的乘積,或計算調節作用交互項等。

l 虛擬(啞)變量

用於將分類變量納入模型。具體理論說明可查看spssau文章:《啞變量是什麼?怎麼設置?》

適用場景:研究回歸分析,逐步回歸,分層回歸,Logistic回歸,PLS回歸、調節作用等這類影響關係研究的方法時,需要將分類變量作為研究變量加入模型中,需要做啞變量處理。

l 標準化(S)

標準化用於數據無量綱化處理。在多數模型研究中,都需要先對數據進行標準化處理,以消除量綱影響。

l 中心化(C)

中心化也是無量綱化處理方法之一。與標準化的區別是,標準化需要除以標準差,而中心化則沒有要求。

適用場景:數據無量綱化處理,即如果原始數據不是統一量綱的,需要先進行數據標準化處理,以消除量綱(單位)不同對結果造成的影響。

l 自然對數(Ln)

l 10為底對數(Log10)

取對數是常見的數據變換處理。取對數可以縮小數據的絕對數值,方便計算。在計量研究中,經常先取對數再做回歸。

適用場景:數據的數值過大不方便計算;數據呈偏態時可以通過取對數調整數據分布。(數值必須大於0)

其他常用的數據變換方式:

(1)對數變換(2)平方根變換(3)倒數變換(4)冪變換

量綱處理

量綱處理

除了上面介紹的標準化、中心化。spssau還提供了其他多種量綱處理方法,大致可分為三種類型:

①極值化方法

歸一化——每個變量值與變量最小值之差除以該變量取值的全距(最大值減最小值)。標準化後使各變量的取值範圍限於0~1。

區間化——標準化後使各變量取值範圍限於固定的區間範圍內。

最大值化——每個變量值除以該變量取值的最大值。標準化後使各變量的最大取值為1。

最小值化——標準化後使各變量的最小取值為1。

極值化方法在無量綱化過程中僅與變量的最大值和最小值有關,使得該方法過分依賴極端這兩個極端值。因而,最大值和最小值這兩個值會對結果產生很大影響。

②標準化方法

標準化——無量綱化後個變量的平均值為0,標準差為1。標準化的不足之處在於轉換後消除了各變量在變異程度上的差異,如果後續分析中需要比較變量變異程度上的差異,則不適合使用標準化方法。

③均值化方法

均值化——每一變量除以該變量的平均值。均值化後各變量的平均值都為1,標準差為原始變量的變異係數。均值化保留了各變量取值差異程度上的信息。

對於一般用戶而言,不需要掌握這麼多量綱處理方法,大多數情況下選擇標準化或歸一化即可。

l 正向化(MMS)

l 逆向化(NMMS)

在綜合評價中,可能同時存在正向指標(數值越大評價越好)和逆向指標(數值越小評價越好)。兩種指標數據方向不一致,分析時必須先將所有指標統一成一個方向。此時,可以對數據進行正向化或逆向化處理。

正向指標:(X-Min)/(Max-Min) (生成變量-正向化MMS)

逆向指標:(Max-X)/(Max-Min) (生成變量-逆向化NMMS)

除此之外,還可以通過取倒數、取負數等方式使指標一致化。

除了以上常用的計算變量方法,還有一些其它的變量處理功能。具體整理在下面表格裡。

如果以上生成變量功能無法滿足計算需求,可使用自主性更強的[高級公式]進行操作。

當前公式支持sin、cos、tan、exp、ln、log、sqrt、abs等函數。

其他說明

生成變量功能,標題都是直接選中即可,不需要拖拽操作。配合ctrl或者shift鍵同時選擇多項,批量一次性操作處理。

相關焦點

  • 職場SPSS:計算變量數字表達式及操作演示
    很多時候我們需要創造新的變量,或者說是衍生變量,這個時候用到SPSS軟體的【計算變量】功能。整個菜單的主界面還是非常容易理解的,左上角輸出新衍生變量的名稱,「=」符號的右側則輸入的是衍生變量的具體計算表達式,很明顯新變量的計算是基於原有變量。比如轉化率=目標訂單數/總訂單數。
  • 基本數據統計分析--spss
    而這些功能操作在spss中是可以直接使用的。當然我們也需要理解相關定義。spss描述統計分析一、定義:其中均值、中位數、眾數將不再介紹;方差是所有變量值與平均數偏差平方的平均值,它表示了一組數據分布的離散程度的平均值。
  • SPSSAU一眾新功能上線:高級公式、綜合得分一鍵計算!
    標識無效樣本0202 生成變量高級公式「生成變量」功能中,添加了【高級公式】的按鈕,支持更多複雜的變量計算。在做量表研究時,有時需要計算量表總分。而不同的量表計算得分的方式不同。有的量表是不同條目計分方式不同,有的量表需要在原有得分上進行換算,得到最終評分。此時就可以使用【高級公式】功能。
  • spss多變量回歸分析 - CSDN
    因此,一個變量需要回答兩個問題,最好的辦法是把這個變量分為兩個子變量,分別計算b值和OR值,這個子變量便是啞變量。對線性回歸,沒有現成的簡易的軟體自動設置的方法,需要首先進行計算產生啞變量,再進行回歸分析。(1)啞變量設置SPSS軟體啞變量設置有人工法和軟體法,常見的是軟體法:首先,點擊轉換--創建虛變量,接著①選擇X4進行啞變量設置,②設置啞變量的名稱X4( 系統將產生X4_1,X4_2,X4_3三個變量)
  • 考研數學概率與統計公式大全之隨機變量及其分布
    (4)分布函數 設 為隨機變量,  是任意實數,則函數   稱為隨機變量X的分布函數,本質上是一個累積函數。   可以得到X落入區間 的概率。
  • 回歸分析兩個因變量 - CSDN
    SPSS操作示例幾個需要注意的問題:樣本量、啞變量、模型擬合效果和擬合優度檢驗、多重共線【1】兩個概念RR(Relative Risk):相對危險度,也稱危險比(Risk Ratio)或率比(Rate Ratio),在前瞻性研究中用以表示暴露與疾病發生的關聯強度,說明暴露組發病危險是非暴露組發病危險的多少倍,是兩組發病率之比,計算公式為
  • 隨機變量與數據分析——隨機變量與概率
    如果假定每一個球被摸到的可能性都是一樣大,容易得到P{y=1}=4/5,P{y=2}=1/5這樣,我們可以給出計算概率的公式:P{y=1}=白球的個數/所有球的個數P{y=2}=紅球的個數/所有球的個數顯然有:0≤P{y=k}≤1,k=1,2;P{y=1}+P{y=2}=1這兩條是概率必須滿足的基本性質
  • 數據分析基礎相關性分析,SPSS實操
    (2)其次,計算相應的統計量,並得到對應的相伴概率值。如果相伴概率值小於或等於指定的顯著性水平,則拒絕H0,認為兩總體存在顯著的線性相關關係;如果相伴概率值大於指定的顯著性水平,則不能拒絕H0,認為兩總體不存在顯著的線性相關關係。
  • spss如何把多個指標合併成一個變量?
    SPSSAU更新了這麼多篇教程,本以為大家會對以往很難理解的分析方法說明更感興趣,沒想到得到的反饋竟然是「老師,請問怎樣把好幾個問題合併成一個變量進行分析?」
  • SPSS因子分析案例
    所以,有必要確定綜合評價指標,便於對比。因子分析是一個不錯的選擇,5 個指標即為我們分析的對象,我們希望從這5個可觀測指標中尋找出潛在的因素,用這些具有綜合信息的因素對各地區進行評價。下圖是spss因子分析的操作界面,主要包括5方面的選項,變量區只能選擇數值型變量,分類型變量不能進入該模型。
  • 單變量回歸分析spss - CSDN
    簡單線性回歸模型用於分析1個自變量對1個因變量的影響,或者說是由1個自變量預測1個因變量。但是事物間的聯繫往往是多方面的,因變量的變化往往不是由單個自變量的變化造成的。探索多個自變量對1個因變量的影響時,可以採用:多重線性回歸分析。
  • spss怎麼分析因子?spss因子分析法詳細步驟
    spss不僅可以分析主成分 ,還可以分析因子哦,但是很多朋友不知道spss怎麼分析因子?小編下面有一個spss因子分析法詳細步驟哦,只要大家按照spss因子分析法詳細步驟一步步操作就知道spss怎麼分析因子了哦,下面就和小編一起來看看吧!
  • 關於SPSS因子分析的幾點總結
    在這種變換中,保持變量的總方差(方差之和)不變。同時具有最大方差,稱為第一主成分;具有次大方差,稱為第二主成分。在主成分分析中,最終確定成分是原始變量的線性組合。每個主成分都是由原有p個變量線性組合得到。在諸多主成分Z i中,Z 1在方差中佔的比重最大,說明它綜合原有變量的能力最強,越往後主成分在方差中的比重也小,綜合原信息的能力越弱。
  • spss 非線性回歸 - CSDN
    可以看到這4個變量都為分組分類變量,不能直接作為自變量進行回歸分析,必須先進行虛擬化,下面就來講解如何虛擬化的spss操作步驟。①點擊「轉換」--「重新編碼為不同變量」(圖2),將「身體」選入右側數字變量框中,再填入新生成的變量名,這裡就為第一類「身體差」,寫好後,點擊變化量,表示將原來的「身體」變量重新轉碼為「身體差」變量(圖3)
  • R中計算變量全距的方法
    全距就是變量的最大值(Xmax)與最小值(Xmin)之差,也叫極差,表明變量的最大變動範圍或絕對幅度。全距通常用R表示,即:R = Xmax - Xmin全距一般只根據未分組數據或單項式數列計算。全距是測定變量分布離中趨勢最簡單的方法,在實際中有較多的應用。
  • 數據分析之主成分分析,spss主成分分析實例
    主成分分析方法能夠解決以上問題,主成分分析法是一種降維的統計方法,是考察多個變量間相關性一種多元統計方法。二、spss主成分分析操作流程導入數據。將已有數據整理後導入spss導入數據主成分分析操作流程。
  • spss主成分怎麼進行分析?spss主成分分析法步驟
    spss 這款軟體功能非常多哦,還可以分析主成分哦,但是很多朋友不知道spss主成分怎麼進行分析?小編下面準備了spss主成分分析法詳細步驟,大家安裝 詳細步驟一步步操作就知道spss主成分怎麼進行分析?
  • spss線性回歸自變量因變量專題及常見問題 - CSDN
    數據分析值得注意的是,多元線性回歸分析需要數據滿足以下4個假設:(1)需要至少2個自變量,且自變量之間互相獨立(本次6個);(2)因變量為為連續變量(本案例產量為連續變量);(3)數據具有方差齊性、無異常值和正態分布的特點(檢驗方法);(4)自變量間不存在多重共線性。
  • spss聚類分析功能怎麼使用?spss聚類分析教程
    spss 是一個非常好用的統計分析軟體,spss有一個聚類分析的功能哦,但是很多人不知道spss聚類分析功能怎麼使用?spss聚類分析是一個將case分析的數據的功能哦,下面小編就來告訴大家spss聚類分析使用教程吧!
  • Tensorflow學習筆記: 變量及共享變量
    ,如果被訓練,將加入到tf.GraphKeys.TRAINABLE_VARIABLES集合中,TensorFlow將計算其梯度的變量  collections 表示一個graph collections keys的集合,這個創建的變量將被添加到這些集合中,默認集合是[GraphKeys.GLOBAL_VARIABLES].