對於這個問題,我們不僅可以求期望,還甚至可以求概率密度函數——有了概率密度函數,你想幹什麼,不都很簡單了嗎?
對於這個問題完全沒必要硬剛多重積分 ( ),雖然理論上依照這個做法可以做出來。
在概率論中我們有更簡單的方式來計算這個分布:
考慮一個Line-line picking problem. 也即在一條單位線段上,找兩個獨立地服從均勻分布的點,並計算它們距離平方的累計分布函數(Cumulative Distribution Function) 。在此之後對其求導,即可得到概率密度函數(Probability Density Function),也即 。
在解決了一維的問題後,我們可以發現,二維的問題變為計算 的分布了。而這可以由計算 得到,因為兩個獨立的隨機變量之和的概率密度函數等於這兩個隨機變量對應的概率密度函數的卷積。
在更高維的情況,只需要做更多次卷積即可得到 的分布。
計算完距離平方分布的函數,為了計算距離 的分布,只需要運用密度變換公式,也即 就可以得到需要的結果。
具體步驟如下:
1.
然後求導
2. 計算二維情況下的分布:
注意這裡卷積的區域需要分段討論。(如果結論推廣到矩形中,則會有更多的分段點)
這樣,距離分布為
我們可以用matlab編程驗證一下結果:
1,000,000次投點結果
計算得到的結果
把上面兩張圖畫到一起比較一下
至於期望,則直接可以積分這個分布函數得到答案
這是一元微積分學的內容,並不複雜。在此略去相關詳細計算步驟。
也有許多人研究過這個問題,你們如果感興趣可以參考:
[1] D.H. Bailey, J.M. Borwein, V Kapoor, and E.W. Weisstein Ten Problems in Experimental Mathematics,http://crd.lbl.gov/˜dhbailey/dhbpapers/tenproblems.pdf, March 8, 2006.
[2] D.H. Bailey, J.M. Borwein, R.E. Crandall Box integrals, Journal of Computational and Applied Mathematics Vol. 206, Issue 1, Sept. 2007, pp. 196-208.
[3] T.S. Bolis Solution of problem E2629: Average Distance between Two Points in a Box, Amer. Math. Monthly Vol. 85, No. 4. pp. 277-78, April. 1978.
[4] J. Philip, Calculation of Expected Distance on a Unit Cube.
www.math.kth.se/~johanph, Jan 2007.
[5] D.P. Robbins Problem E2629: Find the Average Distance between Two Points in a Box, Amer. Math. Monthly [1977,57].
[6] L.A. Santalo, Integral Geometry and Geometric Probability Encyclopedia of Mathematics and Its Applications, Addison-Wesley, 1976
P.S.附上MATLAB代碼
%For UCR EE114 CODING HW1
TIMES=1000000;
M1=rand(TIMES,2);
x1=M1(:,1);y1=M1(:,2);
M2=rand(TIMES,2);
x2=M2(:,1);y2=M2(:,2);
dis=sqrt((x1-x2).^2+(y1-y2).^2);
%-- Part 1
SPLIT=100;
intervals = (0:1.5*SPLIT)/SPLIT;
% [0,1.5] for maximum of dis =sqrt(2)=1.414
counts = histcounts(dis,intervals);
normalized_counts = counts/TIMES;
probabilities = normalized_counts / (1/SPLIT);
figure(1)
plot(intervals(1:end-1), probabilities, 'linewidth',1)
% set(gca,'fontsize',15);
ylabel('$f_X(x)$','interpreter','latex','fontsize',10)
hold on;
% draw a PDF to compare with the result
x=0:0.01:1.4
y=@(x)(2.*x.*(x.^2-4.*x+pi)).*(x>0&x<1)+(2.*x.*(-2-pi-x.^2+4.*asin(1./x)+4.*sqrt(x.^2-1))).*(x>1&x<1.4);
plot(x,y(x))
xlabel('$x$','interpreter','latex','fontsize',10)
grid('on')
想說幾句關於這個圓內取點問題需要注意的事情。
首先,多重積分 仍然是可以算的。只要你的計算功底足夠優秀,你就可以通過各種代換、積分次序交換、引入參數/幾何意義來這個累計分布函數(CDF)。但我仍然不幹這件事。我只是提一些要點,以免有人在隨機分布時都整出么蛾子來:
假設變為2維情形,你就會發現這時雖然兩個點都滿足均勻分布,但它們的各自的分量卻不然:
聯合分布函數為 ,這也就意味著邊緣分布變成了:
不再是一個均勻分布了。這和正方形中有本質的不同。我們無法再瀟灑地用卷積來得到答案,因為X和Y並不獨立。
此外,還有人提到在disk-line picking中使用均勻分布的極坐標來取點。請注意:這是值得警惕的。均勻分布則意味著在放置在任意位置處的面積微元都應當等概率地獲得點——也即每個面積微元的點密度是大致相同的。直角坐標 情形並不體現位置,但極坐標則不然:其面積微元為 ——這意味著,如果 各自獨立地滿足均勻分布,則投下的圓會變為左下圖。因為 越小, 面積元的面積則越小,則點的密度 越大。
為防止這種情況,應當採用 的面積微元。也即 的換元(係數1/2是無關緊要的)這樣,你就可以得到右下角的分布。
對更高維的坐標也是同理。
有關的計算在網絡上是很多的。
如:
Kendall, M. G. and Moran, P. A. P. Geometrical Probability. New York: Hafner, 1963.
Santaló, L. A. Integral Geometry and Geometric Probability. Reading, MA: Addison-Wesley, 1976.
Tu, S.-J. and Fischbach, E. "A New Geometric Probability Technique for an N-Dimensional Sphere and Its Applications" 17 Apr 2000. http://arxiv.org/abs/math-ph/0004021.
贅述沒有意義,因為都基於某些特定的幾何化簡技巧(為了後續的結論推廣)。
例如:A New Geometric Probability Technique for an N-dimensional Sphere and Its Applications to Physics,給出了一個n維球的公式,並得到了n維情況的 ball-line picking的概率密度圖:
▼▼▼更多驚喜點擊