2019年第十六屆中國研究生數學建模競賽賽題公布
A題
無線智能傳播模型
01
無線信道建模背景
隨著5G NR技術的發展,5G在全球範圍內的應用也在不斷地擴大。運營商在部署5G網絡的過程中,需要合理地選擇覆蓋區域內的基站站址,進而通過部署基站來滿足用戶的通信需求。在整個無線網絡規劃流程中,高效的網絡估算對於精確的5G網絡部署有著非常重要的意義。無線傳播模型正是通過對目標通信覆蓋區域內的無線電波傳播特性進行預測,使得小區覆蓋範圍、小區間網絡幹擾以及通信速率等指標的估算成為可能。由於無線電波傳播環境複雜,會受到傳播路徑上各種因素的影響,如平原、山體、建築物、湖泊、海洋、森林、大氣、地球自身曲率等,使電磁波不再以單一的方式和路徑傳播而產生複雜的透射、繞射、散射、反射、折射等,所以建立一個準確的模型是一項非常艱巨的任務。
現有的無線傳播模型可以按照研究方法進行區分,一般分為:經驗模型、理論模型和改進型經驗模型。經驗模型的獲得是從經驗數據中獲取固定的擬合公式,典型的模型有Cost 231-Hata、Okumura等。理論模型是根據電磁波傳播理論,考慮電磁波在空間中的反射、繞射、折射等來進行損耗計算,比較有代表性的是Volcano模型。改進型經驗模型是通過在擬合公式中引入更多的參數從而可以為更細的分類場景提供計算模型,典型的有Standard Propagation Model(SPM)。
在實際傳播模型建模中,為了獲得符合目標地區實際環境的傳播模型,需要收集大量額外的實測數據、工程參數以及電子地圖用來對傳播模型進行校正。此外無線LTE網絡已在全球普及,全球幾十億用戶,每時每刻都會產生大量數據。如何合理地運用這些數據來輔助無線網絡建設就成為了一個重要的課題。
近年來,大數據驅動的AI機器學習技術獲得了長足的進步,並且在語言、圖像處理領域獲得了非常成功的運用。伴隨著並行計算架構的發展,機器學習技術也具備了在線運算的能力,其高實時性以及低複雜度使得其與無線通信的緊密結合成為了可能。
在本屆數學建模競賽中,希望參賽者能夠對機器學習的工作方式有一定掌握並站在設備供應商以及無線運營者的角度,通過合理地運用機器學習模型(不限定只使用這種方法)來建立無線傳播模型,並利用模型準確預測在新環境下無線信號覆蓋強度,從而大大減少網絡建設成本,提高網絡建設效率。
02
無線傳播模型建模方法簡介
在傳統的無線傳播模型的建立過程中,往往首先需要對傳播場景進行劃分,每一個場景對應一個傳播經驗模型。然而,經驗模型在實際使用中往往不夠精確,所以仍然需要通過採集大量的工程參數以及實際平均信號接收功率(Reference Signal Receiving Power,RSRP)測量值進行經驗模型公式的修正。從所述過程中可以看到,傳播模型建立本質上是一個函數擬合的過程,即通過調整傳播模型的係數,使得利用傳播模型計算得到的路徑損耗值與實測路徑損耗值誤差最小。所以當工程參數、地理位置信息、特定地理位置測量點的RSRP已知的情況下,該問題可以歸類為一個監督學習問題。
與傳統經驗模型需要額外人力物力進行校正相比,是否可以利用採集的歷史數據並利用機器學習技術,得到一套合適的機器學習模型用以對不同場景下信道傳播路徑損耗進行準確預測,成為一個非常有價值的研究方向。
本題為參賽隊伍提供統一的數據集。各參賽隊伍可以自行將數據集拆分為訓練集、測試集以及驗證集,將其用於AI算法模型的訓練及測試。算法的目的在於通過尋找工程參數、地理環境等因素與平均信號接收功率(RSRP)之間的映射模型(理論與實踐表明RSRP是工程參數、地理環境等因素的隨機函數),從而能夠在新的環境中快速預測特定地理位置的RSRP值。
賽題提供的訓練數據集包含多個小區的工程參數數據、地圖數據和RSRP標籤數據,其格式為csv格式(Comma-Separated Values, 逗號分隔值格式)。數據集的結構以及對應數據的含義將會在下節中詳細闡述。
03
訓練數據集簡介
訓練數據集一共包括了多個文件,每個文件代表一個小區內的數據。文件的命名方式為train_id.csv,其中id為小區的唯一標識,例如train_1003501.csv表示唯一標識為1003501的小區數據。
文件的每一行代表小區內固定大小的測試區域的相關數據,行數不定(根據小區大小不同,面積越大的小區行數越多,反之亦然),列數則固定為18列,其中前9列為站點的工程參數數據;中間8列為地圖數據;最後1列是用於訓練的RSRP標籤數據。下表顯示了其中一行數據作為樣例:
Table 1:訓練數據樣例
下面介紹三部分中每一列的具體含義。
3.1 工程參數數據
工程參數數據記錄了某小區內站點的工程參數信息,共有9個欄位。各欄位對應含義如Table 所示。
Table 2:工程參數數據的欄位含義
為了方便數據處理,地圖進行了柵格化處理,每個柵格代表了5m5m的區域(如下圖Fig.1 所示),其中(CellX,Cell Y)記錄了站點所在柵格的左上角坐標。其他的工程參數(Height, Azimuth, Electrical Downtilt, Mechanical Downtilt)如圖Fig.2所示,其中機械下傾角(Mechanical Downtilt)是通過調整天線面板後面的支架來實現的,是一種物理信號下傾;而電下傾角(Electrical Downtilt)是通過調整天線內部的線圈來實現的,是一種電信號下傾。實際的信號線下傾角是機械下傾角和電下傾角之和。
Fig. 1:柵格化地圖的坐標說明
Fig. 2:工程參數數據含義說明
3.2 地圖數據
地圖數據記錄地形地貌等信息,共有8個欄位,各欄位對應含義如Table 所示。考慮地圖類型的多樣性和複雜性,城區、農村、湖泊等實際地物被抽象為數字,這些數字稱為地物類型名稱編號(Clutter Index),在
Table 中可以看到地物類型名稱編號所對應的實際地物類型。
Table 3:地圖數據的欄位含義
Table 4:地物類型名稱的編號含義
與工程參數數據一樣,地圖數據也進行了柵格化處理,每個柵格代表了5m5m的區域,其中(X,Y)記錄了地圖所在柵格的左上角坐標。
在明確了地圖存儲格式之後,可以針對不同的參數對地圖進行可視化處理。如Fig. 3所示,Fig. 3a-c分別根據柵格坐標以及房屋高度、海拔高度和地物類型索引作為特徵對地圖進行可視化處理。通過可視化處理,可以對地圖數據有一個更為直觀的了解。
a:建築物高度
b:海拔高度
c:地物類型索引
Fig. 3:電子地圖圖像化示例
3.3 RSRP標籤數據
平均信號接收功率(RSRP)標籤數據作為實際測量結果,在監督學習中用於和機器學習模型預測的結果作比較,共有1個欄位,對應含義如Table 所示。
Table 5:RSRP標籤數據表格的欄位含義
如Fig. 4所示,結合電子地圖數據中的坐標和特徵以及標籤數據中的RSRP值,可以清晰地對信號功率分布進行可視化處理,從而明確辨識信號強弱覆蓋區域
Fig. 4:標籤數據的可視化處理
04
無線傳播模型建模賽題
本賽題除在中國研究生數學建模競賽網站上上交論文外,問題三需要在華為雲平臺上提交模型,不提交的隊伍將被視為沒有完成此題而不計入比賽成績。
4.1 特徵工程中的特徵設計
高效的機器學習模型建立依賴於輸入變量與問題目標的強相關性,因此輸入變量也稱為 「特徵」。特徵工程的本質是從原始數據中轉換得到能夠最好表徵目標問題的參數,並使得各個參數的動態範圍在一個相對穩定的範圍內,從而提高機器學習模型訓練的效率。一般特徵工程的典型技術有:
· 剔除失真、低質量數據;數據插值補齊;去除異常點;
· 連續數據離散化;數據去均值;幅度限制;方差限制。
高階的特徵工程需要充分利用與目標問題相關的專業知識。對於信道傳播模型問題,可以如Fig. 5所示根據已知的幾何位置來挑選合理的特徵。例如,通過發射機相對地面的高度、機械下傾角、垂直電下傾角,發射機所在柵格位置與目標柵格位置,可以得到柵格與發射機的距離以及柵格與信號線的相對高度,而就可以作為一個特徵。
Fig. 5:根據目標柵格與發射機的地理位置關係提取特徵
除了幾何位置特徵,傳統經驗信道模型中涉及的參數也可以納入特徵工程的考察範圍。例如城市中的經典模型Cost 231-Hata,其定義如下:
其中PL定義為傳播路徑損耗(dB)、為載波頻率(MHz)、基站天線有效高度(m)、用戶天線有效高度(m)、用戶天線高度糾正項(dB)、鏈路距離(km)以及為場景糾正常數(dB)。RSRP與PL的關係為:
其中是小區發射機發射功率(dBm)(見Table 2)。
問題一
請根據Cost 231-Hata模型以及下述數據集信息設計合適的特徵,並闡述原因。
Table 6:數據集信息
4.2 特徵工程中的特徵選擇
完成特徵設計後,通常需要選擇有意義的特徵輸入機器學習模型進行訓練。對於不同方法構造出來的特徵,需要從多個層面來判斷這個特徵是否合適。通常來說,可以從以下兩個方面來選擇特徵:
· 特徵是否發散:如果一個特徵不發散,例如方差接近於0,也就是說樣本在這個特徵上基本上沒有差異,這個特徵對於樣本的區分並沒有什麼用。
· 特徵與目標的相關性:這點比較顯見,與目標相關性高的特徵,應當優先選擇。
問題二
基於提供的各小區數據集,設計多個合適的特徵,計算這些特徵與目標的相關性,並將結果量化、排序,形成如下的表格,並闡明設計這些特徵的原因和用於排序的量化數值的計算方法。
Table 7:特徵名稱及其與目標的相關性
4.3 RSRP預測
問題三
在設計和選擇了有效的特徵之後,就可以通過建立預測模型來進行RSRP的預測了。請各個參賽隊根據自己建立的特徵集以及賽題提供的訓練數據集,建立基於AI的無線傳播模型來對不同地理位置的RSRP進行預測。為研究生更明白本問題的目標,下面將分別介紹評審數據集、提交內容和線上代碼評分方法。
4.3.1 評審數據集簡介
線上代碼評分系統將使用對參賽隊保密的評審數據集來對模型進行評分,以便公平地測試各參賽隊提交模型的實際泛化能力。評審數據集與訓練數據集一樣,一共包括了多個文件,每個文件代表一個小區內的數據。文件的命名方式為test_id.csv,其中id為小區的唯一標識,例如test_1003501.csv表示唯一標識為1003501的小區數據。
評審數據集的文件中含有除了RSRP之外的前17個欄位,與該17個欄位對應的RSRP欄位需要由研究生提交的模型代碼程序預測生成。
4.3.2 提交內容
論文要以文字形式詳細闡述AI模型的建模過程,包括模型的建立方法,參數的設置和訓練的結果,特別是第三問要闡述清楚。
第三問需要提交完整的模型。針對每一個評審數據集的輸入文件,模型輸出要求也是一個文件,例如輸入數據文件名為test_123456.csv,則輸出文件名必須為test_123456.csv_result.txt。另外,輸出文件的數量與輸入文件必須一致,否則會以全0文件代替輸出文件進行評分。例如,參賽隊伍如果沒有提交針對輸入文件名為test_123456.csv的輸出文件,系統在評分時會自動產生全零的test_123456.csv_result.txt進行評分。
每個輸出文件內容的樣例如下所示
{"RSRP": [[-54.505], [-73.416], [-76.123], [-74.261], [-98.143]]}
其中方括號內的數字表示輸入文件的每一行數據所對應的RSRP預測值,預測值的數量與輸入文件的行數(表頭除外)對應,例如上文的輸出文件對應的輸入文件應該是5行(表頭除外)。如果輸出文件的預測值少於輸入文件的行數,則會以補0的形式將輸出文件填滿後進行評分;如果輸出文件的預測值多餘輸入文件的行數,則會取輸出文件的前N個預測值進行評分,其中N為輸入文件的行數。
4.3.3 線上代碼評分方法
對於提交的預測RSRP值,將根據以下條件進行排序。
模型在評審數據集的評估下,弱覆蓋識別率 (PCRR : Poor coverage recognition rate) 必須大於等於20%。
在PCRR精度達標後,再根據預測均方根誤差(RMSE : Root mean squared error)大小進行各參賽組的名次排序(RMSE小者排名靠前)。
PCRR和RMSE的介紹如下所示:
· 弱覆蓋識別率 (PCRR : Poor coverage recognition rate)
在進行預測的過程中如果可以有效識別弱覆蓋區域,能夠更好地幫助運營商精準規劃和優化網絡從而提升客戶體驗。因此,除RMSE為有效測試目標之外,弱覆蓋識別準確率也是作為一項非常有價值的評價指標。
在本次建模比賽中,弱覆蓋判決門限的值定為-103 dBm。若RSRP預測值或實測值小於則為弱覆蓋並標記為1,若大於等於則為非弱覆蓋並標記為0。根據比較預測值和實測值得到的弱覆蓋以及非弱覆蓋的差別,可以對以下參數進行統計:
· True Positive(TP):真實值為弱覆蓋,預測值也為弱覆蓋;
· False Positive(FP):真實值為非弱覆蓋,預測值為弱覆蓋;
· False Negative(FN):真實值為弱覆蓋,預測值為非弱覆蓋;
· True Negative(TN):真實值為非弱覆蓋,預測值也為非弱覆蓋。
Table 8:TP、FP、FN和TN的定義
PCRR綜合考慮Precision(準確率)和Recall(召回率)的目標,其計算公式如下:
(3)其中Precision可以理解為預測結果為弱覆蓋的柵格實際也是弱覆蓋的概率,其定義如下:
(4)Recall可以理解為真實結果為弱覆蓋的柵格有多少被預測成了弱覆蓋的概率,其定義如下:
(5)PCRR的計算代碼可以參考以下程序
Table 9:PCRR計算方法參考
· 均方根誤差 (RMSE: Root mean squared error)
RMSE是評估預測值和實測值整體偏差的指標,其大小直觀表現了仿真準確性。直接計算待評估數據的RMSE,計算公式如下:
(6)
其中為參賽隊機器學習模型對於第i組評審數據集的RSRP預測值,為第i組評審數據集的RSRP實際測量值。
4.3.4 模型提交與數據獲取
組委會將為參賽隊提供華為雲ModelArts作為AI運算平臺,訓練數據集都存儲在該平臺上。參賽隊伍可以將訓練數據下載到本地展開訓練,同時競賽評審也利用華為雲大賽平臺進行。
本次競賽線上部分的數據集獲取、模型提交、評分與排名系統等詳細內容請訪問本次競賽的華為雲網站:https://developer.huaweicloud.com/competition/competitions/1000013923/introduction
線上作品提交時間:9月21日早上9:00 - 9月23日中午12:00
參賽選手可以多次提交模型,每個隊伍每天提交次數上限為5次。最終以其提交中最優成績為準。
B題
天文導航中的星圖識別
天文導航(Celestial Navigation)是基於天體已知的坐標位置和運動規律,應用觀測天體的天文坐標值來確定航行體的空間位置等導航參數。與其他導航技術相比,天文導航是一種自主式導航,不需要地面設備,不受人工或自然形成的電磁場的幹擾,不向外界輻射能量,隱蔽性好,而且定姿、定向、定位精度高,定位誤差與時間無關,已被廣泛用於衛星、太空梭、遠程彈道飛彈等太空飛行器。天文導航的若干背景知識可參閱附件1。
星敏感器是實現航行體自主姿態測量的核心部件,是通過觀測太空中的恆星來實現高精度姿態測量。恆星是用於天文導航最重要的一類天體。對天文導航而言,恆星可以看成是位於無窮遠處的,近似靜止不動的,具有一定光譜特性的理想點光源。
藉助天球坐標系,可用赤經與赤緯來描述恆星在某一時刻位置信息(相關定義和概念可參考附件1)。恆星在天球球面上的投影點稱為恆星的位置。將星空中恆星的相關數據,按不同的需求編制而成的表冊,稱為星表。星表是星圖識別的主要依據,也是姿態確定的基準。常用的星表中通常列有恆星的位置、自行、星等(亮度)、顏色和距離等豐富的信息。對於天文導航而言,感興趣的信息主要是恆星的位置和星等。附件2提供了一個簡易的星表,提供了部分恆星在天球坐標系下的位置(以赤經、赤緯來標記,單位:角度)和星等信息。
全天自主的星圖識別是星敏感器技術中的一項關鍵技術。星圖識別是將星敏感器當前視場中的恆星(星圖)與導航星庫中的參考星進行對應匹配,以完成視場中恆星的識別。星圖識別一般包括圖像採集及預處理、特徵提取、匹配識別等過程。
圖像預處理包括去除噪聲和星點質心提取。為簡化,本賽題暫不考慮具體的去除噪聲和質心提取等問題,認為所討論的星圖圖像已經完成了圖像預處理。
導航資料庫一般包括兩部分:導航星表和導航星特徵資料庫。導航星表是從基本星表中挑選一定亮度範圍的導航星,利用其位置(赤經、赤緯)和亮度信息編制而成的簡易星表。星敏感器除了需要構建導航星表外,還需要按照特徵提取算法,構造導航星的特徵向量,存儲由特徵向量構成的導航星特徵資料庫。
提取出觀測星的特徵後,就可以尋找特徵類似的導航星。如果找到特徵惟一接近的導航星,即可認為二者匹配。匹配識別過程和提取特徵的方法緊密相關。本賽題暫不考慮後續的航行體定姿定位問題。
在星圖識別的相關工作中需要用到天球坐標系、星敏感器坐標系、星敏感器圖像坐標系等。其簡單定義為:
(1)天球坐標系。以天赤道為基圈,過春分點的時圈為主圈,春分點為主點。天球坐標系採用赤經、赤緯作為坐標量。參見附件1相關敘述。
圖1 星敏感器坐標系、圖像坐標系及前視投影成像示意圖
(2)星敏感器坐標系。以投影中心(光軸上與感光面距離為的點,即光心,參見圖1)為坐標原點,以光軸為軸(後面的討論中,光軸與天球面的交點記為點),過點平行於感光面兩邊的直線作為軸和軸。圖1為星敏感器坐標系、圖像坐標系及前視投影成像示意圖。
(3)圖像坐標系。以感光面的中心(點在該平面上的投影點)為坐標原點,平行於感光面兩邊的直線為軸和軸的平面坐標系,參見圖1。
請你們團隊利用附件提供的相關背景材料和數據,建模分析下面問題:
問題1 、、是3顆已知位置的恆星,即它們在天球坐標系下的赤經和赤緯已知;、、是來自恆星、、的平行光經過星敏感器光學系統成像在感光面上的星像點質心中心位置(參見圖1);記,,,。
(1)建立由,,等參數解算點在天球坐標系的位置信息的數學模型,並給出具體的求解算法;
(2)若不利用值的信息,試建立由,等參數求解點在天球坐標系中的位置信息的數學模型,並給出具體的求解算法;
(3)一般來說,星敏感器視場內的恆星數量多於3顆,請討論如何選擇不同幾何位置的三顆星,提高解算點在天球坐標系中的位置信息的精度,並分析相應的誤差。
問題2 傳統的星圖識別方法主要是以角距(即星與星之間的球心角,可直觀理解為兩顆恆星分別與地心連線之間的夾角)或其衍生的形式為特徵,這類方法比較簡單,但一般需要較大的存儲空間,識別算法實時性不好,且識別率普遍不高。通過對星圖中的星點信息進行更為精細的特徵提取,構建更高層次的特徵,可能會提高星圖識別算法的實時性和降低誤匹配率。基於附件2提供的簡易星表信息,請構建相應的特徵提取模型,設計對應的星圖識別算法,確定出附件3給出的8幅星圖中每一個星像點所對應的恆星編號(對應附件2簡易星表的恆星編號),並對算法的性能進行評估。
附件1 相關背景知識(含對附件2、附件3的說明,請注意!)
附件2 簡易星表
附件3 8幅星圖相關數據
C題
視覺情報信息分析
研究表明,一般人所獲取的信息大約有80%來自視覺。視覺信息的主要載體是圖像和視頻,視覺情報指的是通過圖像或者視頻獲取的情報。
從圖像或視頻中提取物體的大小、距離、速度等信息是視覺情報分析工作的重要內容之一,如在新中國最著名的「照片洩密案」中,日本情報專家就是通過《中國畫報》的一幅封面照片解開了大慶油田的秘密[1]。在當前很熱門的移動機器人、無人駕駛、計算機視覺、無人機偵察等領域,更是存在著大量的應用需求。儘管在對未來智能交通系統的設計等工作中,科研人員正在研究使用雙目[2]或多目視覺系統或者特殊配置的單目視覺系統[3]獲取相關信息,但在某些特定條件下,分析人員所能利用的,只能是普通的圖像或視頻[4,5],其中的信息需要綜合考慮各種因素,通過合適的數學模型來提取。本題從實際需求出發,選擇單幅圖像距離信息分析、平面視頻距離信息分析和立體視頻距離信息分析幾個典型場景,提出如下四項任務:
任務1:測算圖1中紅色車輛A車頭和白色車輛B車頭之間的距離、拍照者距馬路左側邊界的距離;圖2中黑色車輛A車頭和灰色車輛C車尾之間的距離以及拍照者距白色車輛B車頭的距離;圖3中拍照者距崗亭A的距離以及拍照者距離地面的高度;圖4中塔體正面(圖中四邊形ABCD)的尺寸,即AB和CD的長度以及AB和CD之間的距離 (已知地磚尺寸為80cm80cm)。
任務2:附件「車輛.mp4」(右鍵點擊後選擇「保存到文件」可導出視頻文件)是別克英朗2016款車上乘客通過後視鏡拍攝的視頻。
(1)估算該車和後方紅色車輛之間的距離;
(2)估算該車超越第一輛白色車輛時兩車的速度差異。
任務3:附件「水面.mp4」是高鐵乘客拍攝的一塊水面,測算高鐵行駛方向左側第一座橋橋面距水面的高度、距高鐵軌道的距離以及水面寬度,估算拍攝時高鐵的行駛速度。
任務4: 附件「無人機拍莊園.mp4」記錄了某老宅的全景。
(1)估算其中環繞老宅道路的長度、寬度、各建築物的高度、後花園中樹木的最大高度;
(2)估算該老宅的佔地面積;
(3)測算無人機的飛行高度和速度
1.建模過程中,除題中明確限定的條件外,你們可以作任何合理的假設或者補充真實的數據;
2.對題中你們認為有歧義的表述,可以按照你們明確說明的理解解題而不會影響你們的最終成績;
3.論文中用到的非通用程序必須以附錄形式附在文末,所有引用的文獻資料(含電腦程式)都必須明確註明出處。
4.論文主體(含摘要、目錄、正文、參考文獻,不含附錄)不要超過40頁。
參考文獻
1.https://baike.baidu.com/item/%E4%B8%AD%E5%9B%BD%E6%9C%80%E8%91%97%E5%90%8D%E2%80%9C%E7%85%A7%E7%89%87%E6%B3%84%E5%AF%86%E6%A1%88%E2%80%9D/13870540?fr=aladdin
2.https://baike.baidu.com/item/雙目定位/6087810
3. 來佳偉,何玉青,李霄鵬 等:基於單目視覺的機械臂目標定位系統設計[J],《光學技術》,2019.01
4. 劉軍, 後士浩, 張凱,晏曉娟:基於單目視覺車輛姿態角估計和逆透視變換的車距測量[J],《農業工程學報》,Jul. 2018(pp70-76)
5. 劉學軍,王美珍,甄豔等:單幅圖像幾何量測研究進展[J],《武漢大學學報》(信息科學版),36( 8) : pp941 - 947.
D題
汽車行駛工況構建
01
問題背景
汽車行駛工況(Driving Cycle)又稱車輛測試循環,是描述汽車行駛的速度-時間曲線(如圖1、2,一般總時間在1800秒以內,但沒有限制標準,圖1總時間為1180秒,圖2總時間為1800秒),體現汽車道路行駛的運動學特徵,是汽車行業的一項重要的、共性基礎技術,是車輛能耗/排放測試方法和限值標準的基礎,也是汽車各項性能指標標定優化時的主要基準。目前,歐、美、日等汽車發達國家,均採用適應於各自的汽車行駛工況標準進行車輛性能標定優化和能耗/排放認證。
本世紀初,我國直接採用歐洲的NEDC行駛工況(如圖1)對汽車產品能耗/排放的認證,有效促進了汽車節能減排和技術的發展。近年來,隨著汽車保有量的快速增長,我國道路交通狀況發生很大變化,政府、企業和民眾日漸發現以NEDC工況為基準所優化標定的汽車,實際油耗與法規認證結果偏差越來越大,影響了政府的公信力(譬如對某型號汽車,該車標註的工信部油耗6.5升/100公裡,用戶體驗實際油耗可能是8.5-10升/100公裡)。另外,歐洲在多年的實踐中也發現NEDC工況的諸多不足,轉而採用世界輕型車測試循環(WLTC,如圖2)。但該工況怠速時間比和平均速度這兩個最主要的工況特徵,與我國實際汽車行駛工況的差異更大。作為車輛開發、評價的最為基礎的依據,開展深入研究,制定反映我國實際道路行駛狀況的測試工況,顯得越來越重要。
另一方面,我國地域遼廣,各個城市的發展程度、氣候條件及交通狀況的不同,使得各個城市的汽車行駛工況特徵存在明顯的不同。因此,基於城市自身的汽車行駛數據進行城市汽車行駛工況的構建研究也越來越迫切,希望所構建的汽車行駛工況與該市汽車的行駛情況儘量吻合,理想情況下是完全代表該市汽車的行駛情況(也可以理解為對實際行駛情況的濃縮),目前北京、上海、合肥等都已經構建了各城市的汽車行駛工況。
為了更好地理解構建汽車行駛工況曲線的重要性,以某型號汽車油耗為例,簡單說明標註的工信部油耗是如何測試出來?標註的工信部油耗並不是該型號汽車在實際道路上的實測油耗,而是基於國家標準(如《GB27840-2011重型商用車輛燃料消耗量測量方法》),在實驗室裡根據汽車行駛工況曲線,按照一定的標準,經檢測、計算得出。由此可見,標註的工信部油耗是否與實際油耗相吻合,與汽車行駛工況曲線有密切關係。
圖1 歐洲NEDC工況
圖2. 世界WLTC工況
02
目標的提出
在上述背景下,請根據附件(3個數據文件,每個數據文件為同一輛車在不同時間段內所採集的數據)所提供的某城市輕型汽車實際道路行駛採集的數據(採樣頻率1Hz),構建一條能體現參與數據採集汽車行駛特徵的汽車行駛工況曲線(1200-1300秒),該曲線所體現的汽車運動特徵(如平均速度、平均加速度等)能代表所採集數據源的相應特徵,兩者間的誤差越小,說明所構建的汽車行駛工況的代表性越好。
03
解決的問題
1.數據預處理
由汽車行駛數據的採集設備直接記錄的原始採集數據往往會包含一些不良數據值,不良數據主要包括幾個類型:
(1) 由於高層建築覆蓋或過隧道等,GPS信號丟失,造成所提供數據中的時間不連續;
(2) 汽車加、減速度異常的數據(普通轎車一般情況下:0至100km/h的加速時間大於7秒,緊急剎車最大減速度在7.5~8 m/s2);
(3) 長期停車(如停車不熄火等候人、停車熄火了但採集設備仍在運行等)所採集的異常數據。
(4) 長時間堵車、斷斷續續低速行駛情況(最高車速小於10km/h),通常可按怠速情況處理。
(5) 一般認為怠速時間超過180秒為異常情況,怠速最長時間可按180秒處理。
請設計合理的方法將上述不良數據進行預處理,並給出各文件數據經處理後的記錄數。
2.運動學片段的提取
運動學片段是指汽車從怠速狀態開始至下一個怠速狀態開始之間的車速區間,如圖3所示(基於運動學片段構建汽車行駛工況曲線是日前最常用的方法之一,但並不是必須的步驟,有些構建汽車行駛工況曲線的方法並不需要進行運動學片段劃分和提取)。請設計合理的方法,將上述經處理後的數據劃分為多個運動學片段,並給出各數據文件最終得到的運動學片段數量。
圖3 運動學片段的定義
3.汽車行駛工況的構建
請根據上述經處理後的數據,構建一條能體現參與數據採集汽車行駛特徵的汽車行駛工況曲線(1200-1300秒),該曲線的汽車運動特徵能代表所採集數據源(經處理後的數據)的相應特徵,兩者間的誤差越小,說明所構建的汽車行駛工況的代表性越好。要求:
(1)科學、有效的構建方法(數學模型或算法,特別鼓勵創新方法,如果採用已有的方法,必須註明來源);
(2)合理的汽車運動特徵評估體系(至少包含但不限於以下指標:平均速度(km/h)、平均行駛速度(km/h)、平均加速度(m/)、平均減速度(m/)、怠速時間比(%)、加速時間比(%)、減速時間比(%)、速度標準差(km/h)、加速度標準差(m/)等);
(3)按照你們所構建的汽車行駛工況及汽車運動特徵評估體系,分別計算出汽車行駛工況與該城市所採集數據源(經處理後的數據)的各指標(運動特徵)值,並說明你們所構建的汽車行駛工況的合理性。
04
名詞解釋與參考文獻
1. 部分名詞解釋
怠速:汽車停止運動,但發動機保持最低轉速運轉的連續過程。
加速:汽車加速度大於0.1m/s2的連續過程。
減速:汽車加速度小於-0.1m/s2的連續過程。
巡航/勻速:汽車加速度的絕對值小於0.1m/s2非怠速的連續過程。
平均速度:一段時間周期內,汽車速度的算術平均值。
平均行駛速度:汽車在行駛狀態下汽車速度的算術平均值,即不包含汽車怠速狀態。
怠速時間比:一段時間周期內,怠速狀態的累計時間長度佔該時間周期總時間長度的百分比。
平均加速度:汽車在加速狀態下各單位時間(秒)加速度的算術平均值。
平均減速度:汽車在減速狀態下各單位時間(秒)減速度的算術平均值。
加速時間比:一段時間周期內,處在加速狀態的累計時間長度佔該時間周期總時間長度的百分比。
減速時間比:一段時間周期內,處在減速狀態的累計時間長度佔該時間周期總時間長度的百分比。
速度標準差:一段時間周期內,汽車速度的標準差,即包括怠速狀態。
加速度標準差:一段時間周期內,處在加速狀態的汽車加速度的標準差。
2. 參考文獻
【1】 Lin J, Niemeier D A. Exploratory analysis comparing a stochastic driving cycle to California's regulatory cycle[J]. Atmospheric Environment, 2002, 36(38):5759-5770.
【2】 Karande, S., Olson, M., and Saha, B. Development of Representative Vehicle Drive Cycles for Hybrid Applications[J]. SAE Technical Paper 2014-01-1900, 2014, doi:10.4271/2014-01-1900.
【3】 姜平,石琴,陳無畏,黃志鵬. 基於小波分析的城市道路行駛工況構建的研究[J]. 汽車工程, 2011(1):70-73.
【4】 Knez M, Muneer T, Jereb B, et al. The estimation of a driving cycle for Celje and a comparison to other European cities[J]. Sustainable Cities and Society, 2014, 11:56-60.
【5】 Ho, Sze-Hwee, Wong, Yiik-Diew, Chang, Victor Wei-Chung. Developing Singapore Driving Cycle for passenger cars to estimate fuel consumption and vehicular emissions [J]. Atmospheric Environment,2014,97:353-362.
F題
多約束條件下智能飛行器航跡快速規劃
複雜環境下航跡快速規劃是智能飛行器控制的一個重要課題。由於系統結構限制,這類飛行器的定位系統無法對自身進行精準定位,一旦定位誤差積累到一定程度可能導致任務失敗。因此,在飛行過程中對定位誤差進行校正是智能飛行器航跡規劃中一項重要任務。本題目研究智能飛行器在系統定位精度限制下的航跡快速規劃問題。
假設飛行器的飛行區域如圖1所示,出發點為A點,目的地為B點。其航跡約束如下:
(1) 飛行器在空間飛行過程中需要實時定位,其定位誤差包括垂直誤差和水平誤差。飛行器每飛行1m,垂直誤差和水平誤差將各增加個專用單位,,以下簡稱單位。到達終點時垂直誤差和水平誤差均應小於個單位,並且為簡化問題,假設當垂直誤差和水平誤差均小於個單位時,飛行器仍能夠按照規劃路徑飛行。
(2) 飛行器在飛行過程中需要對定位誤差進行校正。飛行區域中存在一些安全位置(稱之為校正點)可用於誤差校正,當飛行器到達校正點即能夠根據該位置的誤差校正類型進行誤差校正。校正垂直和水平誤差的位置可根據地形在航跡規劃前確定(如圖1為某條航跡的示意圖,黃色的點為水平誤差校正點,藍色的點為垂直誤差校正點,出發點為A點,目的地為B點,黑色曲線代表一條航跡)。可校正的飛行區域分布位置依賴於地形,無統一規律。若垂直誤差、水平誤差都能得到及時校正,則飛行器可以按照預定航線飛行,通過若干個校正點進行誤差校正後最終到達目的地。
圖1:飛行器航跡規劃區域示意圖
(3) 在出發地A點,飛行器的垂直和水平誤差均為0。
(4) 飛行器在垂直誤差校正點進行垂直誤差校正後,其垂直誤差將變為0,水平誤差保持不變。
(5) 飛行器在水平誤差校正點進行水平誤差校正後,其水平誤差將變為0,垂直誤差保持不變。
(6) 當飛行器的垂直誤差不大於個單位,水平誤差不大於個單位時才能進行垂直誤差校正。
(7) 當飛行器的垂直誤差不大於個單位,水平誤差不大於個單位時才能進行水平誤差校正。
(8) 飛行器在轉彎時受到結構和控制系統的限制,無法完成即時轉彎(飛行器前進方向無法突然改變),假設飛行器的最小轉彎半徑為200m。
請你們團隊為上述智能飛行器建立從A點飛到B點的航跡規劃一般模型和算法並完成以下問題:
問題1. 針對附件1和附件2中的數據分別規劃滿足條件(1)~(7)時飛行器的航跡,並且綜合考慮以下優化目標:
(A)航跡長度儘可能小;
(B)經過校正區域進行校正的次數儘可能少。
並討論算法的有效性和複雜度。
其中附件1數據的參數為:
附件2中數據的參數為:
請繪出兩個數據集的航跡規劃路徑,並將結果(即飛行器從起點出發經過的誤差校正點編號及校正前誤差)依次填入航跡規劃結果表,放於正文中,同時將兩個數據集的結果填入附件3的Sheet1和Sheet2中。
問題2.針對附件1和附件2中的數據(參數與第一問相同)分別規劃滿足條件(1)~(8)時飛行器的航跡,並且綜合考慮以下優化目標:
(A)航跡長度儘可能小;(B)經過校正區域進行校正的次數儘可能少。
並討論算法的有效性和複雜度。
請繪出兩個數據集的航跡規劃路徑(直線用黑色,圓弧用紅色),並將結果(即飛行器從起點出發經過的誤差校正點編號及校正前誤差)依次填入航跡規劃結果表,放於正文中,同時將兩個數據集的結果填入附件3的Sheet3和Sheet4中。
問題3.飛行器的飛行環境可能隨時間動態變化,雖然校正點在飛行前已經確定,但飛行器在部分校正點進行誤差校正時存在無法達到理想校正的情況(即將某個誤差精確校正為0),例如天氣等不可控因素導致飛行器到達校正點也無法進行理想的誤差校正。現假設飛行器在部分校正點(附件1和附件2中F列標記為「1」的數據)能夠成功將某個誤差校正為0的概率是80%,如果校正失敗,則校正後的剩餘誤差為min(error,5)個單位(其中error為校正前誤差,min為取小函數),並且假設飛行器到達該校正點時即可知道在該點處是否能夠校正成功,但不論校正成功與否,均不能改變規劃路徑。請針對此情況重新規劃問題1所要求的航跡,並要求成功到達終點的概率儘可能大。
請繪出兩個數據集的航跡規劃路徑,並將結果(即飛行器從起點出發經過的誤差校正點編號及校正前誤差)依次填入航跡規劃結果表,放於正文中,同時將兩個數據集的結果填入附件3的Sheet5和Sheet6中。
再次提醒:問題1,問題2和問題3中的結果表格除了需要放在正文中,還需要匯總到附件3的Excel表格文件的6個不同Sheet中,表x的結果放入Sheet x中,最後將匯總的Excel表格命名為:參賽隊號-結果表.xlsx,以附件形式提交。
附錄:航跡規劃結果表(樣式)
航跡規劃結果表x
文章來源:網絡