後臺有不少人問到關於數據分析工具的問題,就做個統一回復,為想往這方向走的朋友提供一個參考。
基於行情軟體的公交
常見的行情軟體如通達信,大智慧,同花順等,都有編寫公式的功能,使用簡單的腳本語言,可編寫自定義指標,測試交易策略。
這類工具的優點是簡單易上手,數據全,展現起來很直觀。
缺點是,環境封閉,很難引用其他數據,腳本功能較為受限,而且回測準確性存疑。
適合:簡單指標的編寫和觀察,尤其是已有指標的修改或調整。
基於統計軟體
統計類軟體中,spss是最好的可視化通用統計軟體。
優點,簡單,文檔豐富,統計功能很全,還有數據挖掘功能,和常見的機器學習功能,如分類、聚類、回歸。而且都是可視化操作,很容易上手。
缺點,使用不靈活,數據量大了就很慢。
適用場景,萬條以內的數據統計分析和顯示,傳統時間序列分析,數據挖掘。
excel
包含數據展示、計算、統計等常見功能。
優點,簡潔,直觀,輕量,快捷,大家都會用
缺點,數據量大了很慢,使用不夠靈活,功能有限。
python
功能強大,語法簡單,幾乎能覆蓋量化領域能用到的全部功能,數據整理,數據展示,統計分析,策略回測,算法交易,機器學習等。
除了基本語法,還需要掌握常見的功能包,如numpy,pandas,matplotlib等。
理論上,有python就不需要其他工具了,但作為一種腳本語言,上手還是比可視化操作的軟體難,而且對於可視化工具能實現的簡單功能,即便是熟手,編寫語句也相對費時。
還有一些在線或者以客戶端形式存在的量化平臺,集成了數據和一些常用的功能,也大多支持python語言,這裡就不詳述了。
建議
對於想深入做量化的人,考慮直接上python。
如果是偶爾做一點統計分析,處理的數據較少的,可以選擇用excel,或者比excel更專業的spss。
如果做簡單的技術指標,可以先考慮用行情軟體。
如果做機器學習,目前除了python別無選擇。
以上僅供參考,做好量化,工具只是一小部分,更重要的是對市場足夠的理解,需要好的理論功底,還需要豐富的實踐經驗。