本文基於公開資料撰寫,僅作為信息交流之用,不構成任何投資建議。
股票投資這個事情,到了最後,你就會發現,一切都是數學。?
雖然很多人不喜歡這個結論,但我還是要說,一個人在股市的上限,是由他的數學水平決定的。?
那麼下限呢??
顯而易見,現在的我們就是啊。?
股價在某一段時間內的上下波動,就是數學上的時間序列分析,我們每一次的買入賣出,都遵循典型的概率論理論。現在還活躍在市場上的那些老策略分析師,都會經歷一次從信仰到算命再到量化的心靈洗禮,無他,這個市場太反人性了。?
我知道,有那麼一些文章,非常擅長把一些淺顯的道理用很深奧的理論說出來,貌似深刻,實則賣弄風騷。我們當然也有這麼一個嫌疑,但我還是覺得,下面的這個數學原理,對我們提高下限,不再老是被割,有那麼一點點借鑑,值得大家花時間去了解下。?
投資,就是一場貝葉斯。?
貝葉斯定理,大學中的概率論和數理統計這一門課程有講,一般專業只要有數學課,都會有這麼一門課。這個定理,聽上去很高大上,其實蘊含的道理卻很簡單樸實。?
這個公式要解決的問題,是如何評估你新獲得的信息對當前狀態的影響。?
大家可能會覺得有些繞,我這麼說,大家就明白了。你最近關注的一隻股票,突然周末發公告,10送10轉10,現在讓你判斷,周一股價會漲會跌?高送轉這個事件,就是你新得到的信息,貝葉斯定理,可以用來判斷這個信息對股價的影響,或者說周一股價漲跌的概率。?
貝葉斯定理,作為概率論的一個重大理論支柱,是因為提出了逆向概率的解題思路。
所謂的正向概率,邏輯上叫做演繹,就是你自己是上帝,你就是規則,你決定了結果,比如擲色子,你知道只要擲出足夠多的次數,出現其中一個面的概率會是六分之一。
而逆向概率,與正向概率正相反,邏輯上對應的是歸納,就是你知道了其中的一次,或者多次結果,讓你猜規則是什麼。對應到股市就是,當你看到股市漲了或者跌了,就去找有什麼新的信息出現,進而研究這個消息背後的規律,如此反覆不斷豐富這個規律,逐漸就能判斷信息出現後股市的漲跌。?
雖然我們不喜歡公式,但圖窮匕見,最後還是要走到這一步,貝葉斯定理的公式如下:
P是英文probability的簡寫,P(A)代表A事件發生的概率,P(A/H)代表在H發生的情況下A發生的概率。P(A)被稱為先驗概率,P(A/H)則被稱為後驗概率,上面這個公式同樣可以定義成:?
後驗概率?=?先驗概率?*?似然估計?,其中似然估計=P(H/A)/P(H)?
怎麼理解呢??
先驗概率可以理解成當前的狀態,在你得到某個信息之前的狀態。用開頭那個高送轉的案例就是,你關注了一隻股票,你拿不準這隻股票將來是不是要漲,也就是說在你的心裡,這隻股票上漲的概率可能有,但並不足以讓你下注。這個時候的P(A)就可以解釋成當前狀態下,這隻股票上漲的概率。?
後驗概率呢?這是你得到新信息之後對原有狀態的判斷進行更新,這個新的信息可能增強,也可能削弱了你原先的判斷。用剛才的例子來說就是,周末公告了高送轉的信息,這個信息用H代表,按照我們剛才的定義,P(A/H)意思就是在高送轉發生的情況下,這隻股票上漲的概率。?
似然估計代表了信息引進之後,在多大程度上增強還是削弱了原事件發生的概率。在這個例子中,似然估計就是高送轉公告之後,是增強還是弱化了這隻股票可能上漲的概率。?
似然估計是這個公式的核心,也是最容易讓人迷惑的地方,從案例的角度,分子P(H/A)代表的是窮舉所有股票上漲的情況,因為高送轉引起的佔比有多大,分母P(H)代表的是,在所有的股票中,高送轉的比例有多大。
為什麼要這麼設計呢?我們在研究所有股票上漲的例子時,統計這其中高送轉的所佔的比例,這個比例越高,代表似然估計的值越大,也就是支持上漲的概率越大,但這其中可能存在一種情況,那就在總體,也就是所有股票中高送轉的比例就很高,就會造成高送轉這個新的信息支撐上漲的依據不成立。?
那怎麼辦呢?需要我們用分母,也就是P(H)來除一下。這是一個最容易出邏輯錯誤的地方,如果單看公式,似乎是P(H)越低,P(H/A)越高,似然估計的值就越高。這會鼓勵我們去尋找一個較低的P(H),也就是一個小概率出現的信息。顯然這是一個明顯的錯誤,似然估計需要從一個整體來考慮。?
我們用一個圖來表示,在上圖中,整個大正方體方框代表的是整體,橢圓形部分代表的是H,心形這部分是A,中間紅色的代表的是A和H重合的部分。我們的似然估計要的是什麼呢?
是重合部分比例佔A的比例,明顯的比H佔總體的比例要大,這個是似然估計要表達的意義。在上圖中,重合部分佔A的比例明顯要大於二分之一,而H佔到整體的比例顯然小於二分之一,因此似然估計的值必然要大於1。?
換一個角度理解,似然估計的意義是評估H因素在總體的影響力,在A中是不是得到強化了。我們研究A這個心形,發現其中重合部分的H佔到的比例超過二分之一,看上去H非常顯著,但我們怕出現上圖的情況。
上圖中正方體方框依舊代表整體,我們發現H佔總體的比例已經達到四分之三,但與A重合部分在A中佔的比例顯然只有二分之一多一點,並不到四分之三,這說明在A中H的影響力量是相對弱化了,似然估計反而是小於1的,也就是新信息的加入,反而減小了先驗事件發生的可能性。?
通過這兩個圖,我們對似然估計有了一個相對初步的認識,這就足夠了。?
總結一下,在這個案例中,我們想要求出高送轉公告發生之後,這隻股票上漲的概率,也就是後驗概率,可以通過分別估計先驗概率與似然估計的值來得出。先驗概率就是這隻股票在高送轉公告之前上漲的概率,似然估計的值可以用所有股票上漲的原因中高送轉所佔的比例,除以全部股票中發生高送轉的概率來得到。?
貝葉斯定理的描述基本結束,回到我們選股上。?
貝葉斯定理,為我們提供了一個很好的思維框架,這個框架對於東亞做題家是非常友好的,將選股完全轉化為兩個方向的工作。?
具體的說,要想提高勝率,也就是後驗概率,無非兩個方向:
第一個是提高先驗概率P(A),就是在最容易上漲的時機入手,這個好理解,牛市的時候雞犬升天,你在牛市的時候賺錢總是比在熊市的可能性要大很多。
第二個是增大似然估計,重點是P(H/A),也就是研究上漲的股票都有什麼特徵,儘量找共性大的特性。注意避免一個陷阱,就是我們上圖中出現的情況,這個特性在上漲的股票中出現的特別多,但所有的股票也基本都有這個特性,反而意義不大。
比如「股災」期間,很多上市公司都回購,你統計在這一段時間內表現優秀的公司的時候,發現回購的比例非常大,你興衝衝的把這個要素作為選股的一個重要標準,結果發現那段期間基本上所有公司都回購,那這個信息在選股的時候意義就不大了。
反之,如果那段時間,上市公司總體回購的比例很低,但在表現優秀的公司中比例很高,那這個要素的選股價值就真的體現出來了。?
要想提高先驗概率,真的只能是」日拱一卒,功不唐捐「了。雖然判斷是不是牛市,可能成功率比算命還要低,但這個市場已經運行很多年了,總會有一些規律,只要你不斷開拓,總會知道哪些地方容易有魚,在魚多的地方釣魚,你釣到魚的概率總會大一些。
提高先驗概率目前看大致有三個方向。?
方向一:日曆效應?
在我們A股,總有那麼幾個月市場表現要好一點,某些行業,在一年裡也總有某個月表現出色,你在這些月份做多,成功的概率總要大一些。?
上圖是中證1000指數過去10年的月度漲跌幅。中證1000指數是全部A股剔除中證800之後,剩下的市值最大的1000隻股票組成的指數,基本上可以代表市場中位數,或者說散戶喜歡的中小票的走勢。
分月度看,在二月份,中證1000指數在過去10年裡,有8年是上漲的,哪怕是下跌的那兩年,跌幅也不大。真是二月不做多,一年活白幹。?
上圖是申萬銀行指數過去10年的分月度漲跌幅。我們不好解釋為什麼,可在過去10年,10月份有9次是上漲的,肯定是在這個月份發生了什麼,銀行才會漲的吧。?
各個工作日指數的表現也有一些規律。我們列出了從2005年以來,中證1000指數分工作日的上漲概率,非常明顯的是,周二上漲的概率很大,而周三周四下跌的概率則相對較大。也就是說,如果想要調倉,周二賣出,周三四買入,長期看調倉的成本要小一些。?
方向二:協整效應?
還有一種思路在量化上叫協整,就是找兩個歷史上同漲同跌的股票,在走勢出現大的分歧的時候賭他們將來走勢會一致。因為A股不好做空,一般就是其中一個股票漲上去了,而另一隻股票卻沒怎麼動,就買入這隻趴著不動的股票。?
典型的比如隆基股份(601012,股吧)和通威股份(600438,股吧),這兩個光伏的龍頭,自2017年以來,基本上同漲同跌,在今年2月份的時候隆基的漲幅顯然大大跑贏通威股份,但是這個差距只用了一個月的時間就通過通威的暴漲被消滅,當然現在兩隻股票的走勢也出現大的分野,但我們總體上還是認為這種走勢的差別最後會消失。?
方向三:估值的歷史比較?
中國股市的歷史也有快三十年了,市場正常的估值水平大家還有有數的,在一個過高的估值買入,虧錢的概率顯然要比賺錢的概率要大。?
上圖是創業板指當前的歷史估值對應的未來一年收益率統計。從市淨率的角度看,當前創業板指估值已經非常高,歷史上超過這個估值的月份寥寥無幾。創業板市淨率的下限在2.5左右,當創業板指市淨率低到3左右時,未來一年盈利的概率非常大。至於現在,未來一年賺錢的概率相當小吧。想在創業板買到好股票,這個先驗概率,確實不太大。?
至於提高似然估計的值,?當前主要還是要靠發掘牛股的基因,最簡單粗暴的做法是研究十倍股的特徵。?
跟大家印象裡不太一樣的是,十倍股,真的是太稀缺了。從2016年至今,都快5年了,滿打滿算只有4隻10倍股,其中從2016年至今,山西汾酒(600809,股吧)和恆立液壓(601100,股吧)漲幅超過10倍,從2019年至今,又出現了2隻10倍股,英科醫療(300677,股吧)和堅朗五金(002791,股吧),嚴格意義上,今年的10倍股只有一隻,那就是英科醫療。?
從特徵上看,這四隻股票所處的行業並不性感,四隻股票,一隻白酒股,一隻醫藥股,一隻機械,還有一隻是建材。?
這其中,山西汾酒和堅朗五金情況類似,在過去五年裡,業績增長了約三倍,剩下的全靠估值帶動。恆立液壓,過去五年業績漲了20倍,但基數也低,從市淨率的角度,估值確實也提升了三倍左右。
至於英科醫療,一個生產醫用手套的公司,因為疫情原因業績直接原地爆炸,前三季度歸母淨利潤44個億,預計全年至少60個億,而正常年份一年才不過是2個億的樣子,漲10倍也合理,只不過市場認為這種情況不可持續,並沒有給太高的估值,今年的市盈率7倍左右。?
從個股的邏輯上看,山西汾酒講的是混改、以及渠道從省內向省外擴張的故事,山西汾酒的牌子硬,問題不大。恆立液壓,處於液壓賽道,國產替代的動力足,英科醫療業績高增,至于堅朗五金,還是要再想想為什麼。?
如果我們把時間拉長,剔除那些2011年以後才上市的股票,在總共1993隻股票中,過去十年十倍的股票,也只有15隻,這其中漲幅最大的是立訊精密(002475,股吧),接近30倍,這就是為什麼我們說,立訊精密是公募的信仰。
剩下的十倍股還有億緯鋰能(300014,股吧)、通策醫療(600763,股吧)、東方財富(300059,股吧)、愛爾眼科(300015,股吧)、雙林生物、華夏幸福(600340,股吧)、同花順(300033,股吧)、智飛生物(300122,股吧)、貴州茅臺(600519,股吧)、贛鋒鋰業(002460,股吧)、片仔癀(600436,股吧)、長春高新(000661,股吧)、中國中免、聞泰科技(600745,股吧)。各有的原因,其中有些是借殼,嚴格意義上不能算十倍股,這些留待讀者自己去分析。?
有一種說法是,假如一個人在自己領域工作、研究用不到線性代數和微積分,那麼敢肯定,他的工作不夠前沿、不夠出色,甚至不夠專業。?
說到線性代數和微積分,我們可能確實離的有些遠,但概率,確實是投資的主場。貝葉斯定理可能從公式上不太好理解,可他提供的框架,還是給了我們提高勝率指明了方向。?
本文首發於作者同名雪球專欄
本文首發於微信公眾號:錦緞。文章內容屬作者個人觀點,不代表和訊網立場。投資者據此操作,風險請自擔。
(責任編輯:邱利 HN154)