打開易侕軟體自帶的練習項目Demo並運行研究人群描述模塊。
操作:分析項目 - 打開現有項目 - (左下角)練習用的項目,選第二行(後綴是demo)的練習數據。點數據分析-研究人群描述模塊,放入分析變量為年齡(age)
大部分是數據格式與文件路徑問題。
1. 數據文件格式要求
Excel (.xls, xlsx)文件,建議把數據全選-複製粘貼到Excel的新表中,右下角的粘貼選項選擇「只有值」,再另存為「文本文件(制表符分隔)」,目的是消除各種格式;
SPSS (.sav)、SAS (.sas7bdat, .xpt)、R (.Rdata)文件,可直接讀取。如果讀取不了,建議保存為Excel格式,再按上面過程操作,清除格式。
2. 文件路徑與文件名要求
路徑由英文字母、數字或下劃線組成(不能有中文、運算符、空格等)
如果是蘋果電腦用虛擬機,文件夾需要放在C盤。不要直接放在windows Desktop下,可在Desktop下建一個子目錄。
C:\Users\用戶\Desktop\論文\數據.txt (錯誤:有中文)
C:\Users\mark\Desktop\my-paper\data.txt (錯誤:有減號)
C:\Users\mark\Desktop\my paper\data.txt(錯誤:有空格)
C:\Users\mark\Desktop\data.txt (不要把數據直接放桌面)
C:\Users\mark\Documents\mydata.txt (正確)
3. 變量名要求
數據第一行的變量名不要用中文、小數點和空格等。推薦用X1,X2,……做變量名,不要用Na做變量名,不用數字開頭,不用空格、加減乘除符合做變量名。可以加變量註解文件,註解可以是中文。
之前可以用易侕分析的數據,如果目前分析不了,大部分是變量名問題。易侕調用的R程序經常更新,變量名一定要符合規範,否則運行不了。
操作技巧:1分鐘批量改變量名,操作視頻:
全選「複製」第一行變量名,打開新的excel表,在第一列第二行點右鍵選「粘貼選項」,勾選「轉置」。變量名就變成豎列了。在第二列第二行輸入「X1」,滑鼠放在右下角,變成十字後雙擊,就自動填充好了X1,X2,X3……。
複製-轉置粘貼回原來的變量名,原表變量名就批量改好了。
再把變量註解文件做好。第一行寫:變量名、取值編碼、註解。數據和註解文件均另存為文本文件(制表符分隔)。
做科研不能怕麻煩。因為省了一步,後面可能要更麻煩。
變量名和註解文件一定要分開。為什麼要單獨做註解?
(1)因為論文中的變量,有單位,有符號等。如果不做註解,後期的圖表需要手工一個個改,每次更新數據後都要改。這個時間就被浪費了。
(2)上面看似是變量名問題,其實根源是資料庫問題。建庫不規範,裡面有各種字符、空格、tab鍵等。如果只分析一次還好。如果長期做科研,隨訪,這樣的庫肯定不好用。需要浪費更多時間清理數據。每次數據更新後,都要再清理。這個時間也被浪費了。
(3)變量不需要一個個注釋,按上面的視頻操作,複製-粘貼-轉置,1分鐘內就可以做好變量註解文件。
如果是用易侕DataWeb數據採集管理系統,會自動生成符合要求的數據和變量註解。可能浪費時間的誤區,都被系統提前自動解決了。
問:路徑是什麼?答:存放數據的文件夾所在的位置就是路徑,如圖中放在C盤Users文件夾T530用戶的桌面(Desktop)的文件夾4裡。分析結果(圖表)和R程序都會保留在這個文件夾中。分析做完後,把整個文件夾放到其它文件夾裡保存,下次分析時再將整個文件夾複製到桌面運行。如果電腦卸載了易侕軟體,只要不刪除文件夾,之前做的分析都在。如果本數據可以運行「數據分析」-「研究人群」模塊,然而某些模塊運行不出結果。主要檢查操作設置。
1) 操作設置由簡單到複雜,逐個增加指標,找找看是加入哪個指標之後導致不運行;
2) 找到問題指標後,查看變量分布,做數據清理:字符、缺失、編碼等問題。常見問題舉例:
編碼問題:回歸分析Y如果是二分類變量,需要編碼為0和1,不能編碼1和2
缺失問題:某指標缺失較多,導致樣本量減少,運行不出結果
事件發生率低:預測模型建模和驗證時,某層樣本量少,事件發生率低,運行不出結果
如出現「下載某文件失敗或解壓縮失敗」 或運行不出結果,如下圖的提示。表明安裝R程序出現問題,通常是電腦殺毒軟體、防火牆或網絡限制導致的。
點擊軟體「我的帳號」菜單,選「關於易侕」,在彈出的頁面中,點擊左下角的「(雙擊這裡重新安裝R)」,等待軟體自動卸載R後,然後重新啟動易侕軟體,軟體啟動時將自動重新安裝R到該目錄下,這需要幾分鐘的時間,請耐心等待。如果還是報錯,需要按方法二手動操作。
注意:如果本機之前有自己安裝過的R,把所有打開的R關閉掉,重啟再打開易侕。使用易侕時不能有R打開。這樣易侕就只有調用自己的R。
如果未解決安裝問題,需要按以下方法操作。
找到EmpowerRCH子目錄,手動刪除,重新啟動易侕軟體,這時會重新下載安裝R,再運行易侕軟體就可以了。
第一步,找到原始安裝路徑下的EmpowerRCH文件夾,具體操作如下。
(1)方法1:如果你電腦操作比較好,可以直接輸入下面路徑,找到EmpowerRCH 文件夾。
每人電腦用戶名不同,路徑均為
C:\Users\xxx\AppData\Roaming\EmpowerRCH
xxx表示用戶名,如果找不到,需要設置顯示隱藏文件夾,具體操作百度一下。
(2)方法2:如果你按方法1找不到,可以在C盤搜索R343,讓電腦幫你找。
搜索後找到如下圖紅框的路徑:
再重新打開一個文件夾,手動輸入
C:\用戶\AppData\Roaming\EmpowerRCH
如下圖:
這樣就找到了EmpowerRCH文件夾,刪除EmpowerRCH文件。重新打開易侕軟體,會自動下載安裝R到EmpowerRCH文件,網速較好通常需要10-20分鐘。
第二步,核對一下。
核對包含如下文件,表明已經安裝好了,重新打開易侕軟體,就可以運行了。
……AppData\Roaming\EmpowerRCH\R343
做科研需要細緻嚴謹的態度和動手實踐的能力。根據多年的經驗,人群中約有5-10%的人,需要花費2周或更長時間解決報錯問題。主要是不認真,不按流程操作,做事打折扣,總想省略一步。然而結果是走了彎路,反而更慢了。希望各位學友靜下心來,按流程和規範操作,少走彎路。
下載的易侕軟體安裝程序後綴為.msi(如EmpowerRCHx64_setup.msi),點擊該文件安裝,安裝結束後,第一次啟動易侕軟體時尚需要下載 R343.zip 並自動安裝R343軟體包。待 R 軟體自動安裝完成後,才能運行易侕。
如要找到具體錯誤出現在何處,右擊左邊調用該模塊生成的.R文件,然後點擊「調用R編改程序」,在新出現的R界面裡,點擊「編輯」菜單下的「運行所有代碼」命令,待R程序運行結束後,從頭開始逐行檢查R運行過程中出現的報錯信息(通常是藍色字體顯示),根據報錯信息做相應的處理。如錯誤提示為:錯誤提示:Error in xxxxxx(): 沒有"xxxxx"這個函數。
請到「易典通」平臺求助:
http://www.empowerstats.com/article
電腦上可添加快捷圖標,操作簡單,詳見:
http://www.empowerstats.com/article?aid=52
實名登記才能發求助/回復,沒有實名登記的需要打開易侕軟體-我的帳號-帳號管理頁面輸入自己姓名和單位的信息。不想輸入實名登記的朋友,可以查看所有帖子,但不能發求助/回復,此設置是希望營造與維護一個更良好的交流/互助平臺,敬請大家諒解與配合。
在「所有文章」處選查找,可以檢索同類問題;
在右上角本人姓名處點滑鼠,可以查看「我的求助」。