作物優良率與單產相關性分析

2020-12-04 和訊網

  生長狀態對於單產產出的參考作用十分有限,應全面考慮各方面的影響因素

  作物最終單產與優良率之間有沒有直接的關係呢?當我們採用生長指數與大豆最終單產和趨勢單產的差值來考量時,可以發現2012年極端情況下,二者之間的相關性比較明顯。若今年的優良率維持在57%,則意味著單產最終很可能會高於47蒲/英畝,平衡表上美豆的供需結構仍然是非常寬鬆的,從基金的角度來說,並不具備作為多頭配置的條件——也就是說價格仍將繼續在低位振蕩,8月產量明朗前後價格將會再次探底。

  在預估玉米和大豆單產量時,優良率作為重要的考量標準,常常出現於各類模型當中。然而優良率和單產的相關性分析一直存在著較大分歧。這一方面由於樣本採集過程中不可避免會存在偏差,另一方面在於優良率的判斷過程存在較多的主觀性。不難發現,由於影響因素複雜多變,優良率在作物成長的不同階段很難按照一定規律進行調整,這就進一步降低了優良率作為單產指標的準確性。

  在玉米和大豆種植過程中,尤其是前期階段,由於各種幹擾因素尚不明顯,優良率往往無法直接指向單產量。然而隨著種植階段靠近後期,各類因子的作用慢慢成型,不確定因素逐步消失,優良率也調整到一個更加具有說服力的水平。

  我們選取1995年至2016年間優良率和單產數據進行對比,以分析其中是否存在足以說明問題的相關聯繫。

  優良率與單產量回歸對比

  在進行數據處理分析時,我們通常容易陷入一個誤區,對於有著相近走勢的樣本往往判斷其存在較強相關性,而這種估計方式是有失偏頗的。

  我們對1995年至2016年的玉米和大豆的平均優良率和單產數據進行整理分析,以了解兩者之間的整體關係。從趨勢來看,兩者的走勢十分相似,呈現較一致的波動狀態,然而在對兩組數據進行線性回歸後,得出結果顯示,玉米的擬合度僅為37.84%,大豆為38.13%,優良率對於單產產量的說明力度尚不足四成。

  而鑑於2012年的極端天氣,我們在剔除異常值後再次對樣本進行回歸,玉米的擬合度反而出現下滑至33.32%,而大豆的擬合度有較明顯回升至55.61%。剔除異常值並不能明顯提高優良率的說明力度,而異常值的存在,同樣也說明優良率作為指向性指標存在著誤差。

  圖為玉米生產季內平均優良率與單產趨勢對比

  在生長前期的散點圖中不難發現,產品的優良率與單產離散程度非常高,且數據大量聚集於分布的右半部分。我們選取了7月中的數據作為例證,在這段期間,玉米優良率和單產的擬合度僅為20.9%,而大豆的擬合度幾乎為0,說明玉米和大豆前期的優良率完全無法指向單產的高低。

  圖為大豆7月中優良率與單產趨勢對比

  大豆和玉米的生長季一般結束於每年的10月中上旬,這個時候,由於生長期間各種不確定因子(天氣、技術、環境等)逐漸確定下來,數據所受到的幹擾性也開始下降,優良率對於單產水平的指向性逐步突顯出來。通過回歸我們發現優良率水平在一定程度上說明了單產量,玉米的擬合度上升至40.13%,大豆的擬合度更是達到了61.34%。

  圖為玉米生長季末優良率與單產趨勢對比

  然而還需要強調的是,相關性不等同於因果性。並沒有足夠的理論依據證明優良率低將導致單產降低。如前面提到的2012年的異常值,我們發現儘管當年的玉米優良率僅為25%,但單產依舊保持在123.1蒲式耳/英畝的正常範圍內。另一方面,儘管10月優良率與單產之間的擬合度上升,但事實上到10月單產幾乎已經確定,並不需要使用優良率來作為單產高低的參考指標,對行情的影響或者說指導意義就更加微弱。

  優良率各期較期末偏離度問題

  由於生長階段末期優良率與單產產量相關性更高,所以不同階段的優良率相對於末期優良率的偏離度也具有一定的說明性。

  我們選取了玉米和大豆生長階段剛剛開始時的優良率算出其較末期優良率之間的差值以及差值的期望,發現種植初期數據整體來看對於優良率水平有所高估,玉米的平均偏離水平為6.05%,大豆的平均偏離水平為8.91%。而就偏離程度的分布來看,並不存在一定的規律性與相關性,表現為隨機分布。

  圖為大豆生長季初期末期優良率差值

  加入趨勢單產考量後的回歸分析

  隨著科技的發展和種植方式的改變,單產產量整體呈現一個上升的趨勢,而優良率則基本維持在相近的水平上。所以在進行分析預測的過程中,我們將趨勢單產納入考量範圍,剔除掉兩者因為增速不同所帶來的幹擾。另外,在評估作物的生長時,僅僅採用優良率不足以反映產品的整體狀態,所以我們分別給五個級別的生長狀況(非常不好、不好、一般、好、很好)以100—500進行權重賦值,得到一個位於(100,500)區間的綜合評分。相較於優良率,這個評分會更加全面和系統。

  我們用趨勢單產和實際單產的差值作為因變量,來與大豆生長狀態評分重新進行回歸。這裡我們選取了7月第三周和8月初的評分作為參照標準,主要在於這個階段是大豆的開花結莢期,此時的生長狀態有著較強的研究價值。

圖為大豆生長狀態和實際/趨勢單產差值回歸(7月第三周)

圖為大豆生長狀態和實際/趨勢單產差值回歸(8月初)

  通過分析生長指數與實際單產-趨勢單產差值之間相關性,我們觀察到除了2012年的特殊情況外,數據基本都落在了95%的置信區間內,說明這裡回歸出的結果是有效並具有一定參照性的。當然需要提醒的是,這只是在統計上有效,對於實際單產與趨勢單產差值來說,落在置信區間內的任何一個位置都是允許的,這就有可能導致實際單產的可能區間會很大,對行情的影響也就會截然不同了。

  根據7月24日USDA發布的大豆生長狀況數據,我們算出當前大豆評分為386,在假設7月回歸出的模型有效的前提下可得差值為-0.33,已知當前的趨勢單產為48,則預測未來單產會下降至47.67左右。然而今年7月以來,受限於降雨偏少,大豆生長狀態的評分一直呈現下滑趨勢,每周在兩個百分點左右。假設下滑趨勢得不到改善,那麼單產大概率會降至47以下。我們分析了過去20年中和今年前七周走勢相近的幾年的優良率數據,發現基本下降趨勢會在第十周企穩並小幅回升,按照這個趨勢,依照8月的回歸模型,預計今年單產最終會在46.7—47.5蒲式耳/英畝之間。7月31日的優良率已經有所回升,若這一趨勢維持,預計實際單產很可能在47.4±0.4蒲/英畝之間。

  結論

  我們在前文中分析了作物各個階段的優良率和單產的相關關係,並結合了期初期末優良率的偏離量和趨勢單產的影響後,得出的結論均顯示,作物生長狀態對於作物單產產出的參考作用是十分有限的。作物的生長狀態,尤其是前期的數據並不足以反映單產水平,所以在進行分析時不能僅僅依賴當期優良率或作物狀態評分的高低,更應該全面考慮各方面的影響因素。

  加入趨勢單產考量後,發現生長指數與實際單產-趨勢單產差值之間的相關關係基本在95%的置信區間內,結果具有一定參考性。基於大豆當前的生長狀況,預計實際單產很可能在47.4±0.4蒲/英畝之間。

  (作者單位:廣發期貨)

(責任編輯:王雪冰 HF074)

相關焦點

  • 氣候變化對大豆產量的影響分析
    不同生長階段所需的水分和溫度均有所差異A 優良率同單產的關係  作物最終單產和早期優良率之間有沒有直接的聯繫呢?通過分析歷史數據,我們發現7月單產和優良率相關係數只有0.299,8月二者相關係數為0.490,進入9月,隨著大豆生長期間各種不確定因素逐漸明朗,幹擾因素下降,優良率對單產的解釋效果較好,9月相關係數為0.780,10月相關係數達到0.837,優良率指標能較好解釋單產。  對於單產而言,其實5月單產和最終單產從本質上來說沒有較大區別。
  • 【長河資訊8.27】ProFarmer:預計美豆產量為46.83億蒲式耳,單產53.0蒲式耳/英畝
    (圖片來源:中糧期貨)市場動態Profamer:據外外電8月24日消息,美國Pro Farmer中西部作物巡查團周五表示,預計美國2018年大豆產量為46.83億蒲式耳,單產平均每英畝為53.0蒲式耳。
  • 厄爾尼諾及拉尼娜天氣對大豆市場的影響分析
    (原標題:厄爾尼諾及拉尼娜天氣對大豆市場的影響分析)厄爾尼諾-南方濤動(ENSO)是影響農作物生長的關鍵因素之一。
  • 相關性分析
    (二)PMI與工業經濟相關性分析1、PMI與工業增加值從圖4.4 可以看出,從2005年1月到2006年3月,PMI指數與工業增加值環比發展速度,總體走勢基本一致,高點與低點也比較相近,但PMI變化幅度要比工業總產值變化更大一些。
  • 我國玉米單產再破記錄 轉基因玉米和大豆新品種培育成功
    農業農村部玉米專家指導組組織專家,對中國農業科學院作物科學研究所栽培與生理創新團隊的玉米密植高產示範田進行了實收測產。結果顯示,示範田玉米每畝8600穗,單穗粒重192克。綜合測算,單產達到1663.25公斤,再破我國玉米單產記錄。
  • 數據分析基礎相關性分析,SPSS實操
    一、相關性分析定義相關性分析用於描述變量之間線性相關程度的強弱,並用適當的統計指標表示出來的過程。一般根據研究的目的不同、或變量的類型不同,採用不同的相關分析方法。 常用的相關分析方法:二元定距變量的相關分析、二元定序變量的相關分析、偏相關分析和距離相關分析等。
  • 純鹼與玻璃價格的相關性分析
    2019年12月6日純鹼期貨上市後,其與下遊產品玻璃的關係,包括兩者價格的相關性、影響性、套利等分析將成為市場關注的重點。 截至2018年年底,我國純鹼產能在3200萬噸左右,純鹼中的重鹼部分主要用於玻璃生產,2018年重鹼生產佔比達49%,並且有逐步增加的趨勢,所以純鹼價格與玻璃價格有一定的相關性。
  • 從相關性分析到有監督學習,淺談數據挖掘分析
    相關性分析是我們做數據分析時最常用的一種方法。我們在對業務進行分析時,都會思考哪幾個環節是相互影響的,通過層層推理,找到工作中的關鍵問題,從而改進業務,提高工作效率。業務環節相互影響,在數據上的體現就是具有相關性。我們按照數據的類型來說下,在做數據分析時會碰到哪些相關性分析。
  • 國內外農業發展水平對比分析
    本文嘗試從國內外農業發展對比和農業制度歷史發展兩個角度來闡述分析中國農業現狀及可行路徑。 分析框架解釋 以種植業為例,我們評判一個地區種植業優劣往往從五個角度出發綜合評判,這分別是地(自然條件),種(種子),肥(肥料),械(農械水平),制(制度)五個分析角度。
  • 三大主糧相關性分析
    小麥與玉米呈現季節性波動率,2017年以前是此消彼長趨勢,2017作物季節之後,大致表現為同漲同跌,並且價差縮小,直到2020年價差縮小至百元/噸以內。  國內三大主糧價差有收窄趨勢  2020年以來,國內主糧價格上漲預期不斷增強,而由於短期的供需錯配造成的玉米價格連續上漲行情,更是給其他主糧價格(尤其是小麥價格)形成了階段性行情支撐。
  • 如何讓相關性分析看起來更高大上
    BioNews,專注於報導生命科學領域相關新聞,長按下方二維碼即可關注"BioNews"(id : iBioNews)最近看到有人私信小編「相關性分析相信大家在做各種數據分析或者看文獻的過程中都接觸過相關性分析。大到幾個轉錄組樣本的整體相關性分析,小到挑選了一些候選基因看它們在不同樣本中的表達模式相關性。那如何做相關性分析以及對相關性結果做可視化,一個r包corrplot是一個非常不錯的選擇。
  • 詳細分析厄爾尼諾現象對棕櫚油市場的影響
    基本概念分析厄爾尼諾,是太平洋赤道帶大範圍內海洋和大氣相互作用失去平衡後,冷水域海溫異常升高的現象,它會導致太平洋西岸(東南亞)降雨減少,太平洋東岸(南美)降雨偏多,從而引發環赤道太平洋兩岸不同地區的乾旱和洪澇。
  • 厄爾尼諾現象已出現 深度分析其影響
    厄爾尼諾是一種周期性的自然現象,科學家通過對全球氣候進行分析,認為厄爾尼諾不是一個孤立的自然現象,它是全球性氣候異常的一個方面。在南美洲西海岸、南太平洋東部,自南向北流動著一股著名的秘魯寒流,每年的11月至次年的3月正是南半球的夏季,南半球海域水溫普遍升高,向西流動的赤道暖流得到加強。
  • 山東省植被覆蓋度變化與氣候因子相關性分析
    為分析山東省植被覆蓋度變化及其與降水量、溫度等氣候因子變化的相關性,該文採用2005—2015年的NDVI、降水量和溫度數據,利用重心模型和相關係數法,進行了植被覆蓋度與降水、溫度的月動態變化和季度動態變化分析。
  • 【R語言】相關性分析、相關係數的顯著性檢驗及可視化
    本篇文章介紹基於R語言的相關性分析、相關係數的顯著性檢驗及可視化,該教程為個人筆記,大家也可參考學習,不足之處也歡迎大家批評指正!相關性分析用於評估兩個或多個變量之間的關聯,能通過定量指標描述變量之間的強弱、直接或間接聯繫。
  • 「技術」機加工質量數據相關性分析及應用
    大數據時代的到來,如何發掘已有資料庫價值,利用相關性分析為產品加工問題提供理論指導、不斷提升產品質量成為關鍵。本文通過介紹資料庫整合及二次清洗,運用相關性分析、強相關性項目策略,結合實際情況簡要介紹了機加工質量數據相關性分析的過程。在當今大數據時代,人們開始正視現有的大量數據。
  • R與生物專題 | 第七講 R-相關性分析及作圖
    今天的更新,我們會帶您學習用R語言做相關性分析和作圖。相關性分析用於評估兩個或多個變量之間的關聯。例如,如果我們想知道父親和兒子的身高之間是否存在關係,可以計算相關係數來回答這個問題。注意,僅當數據呈正態分布時,才可以使用相關性分析。