在一個 1*1 的正方形隨機選兩個點,如何求這兩個點的期望歐幾裡得距離?

2021-02-13 數學職業家

對於這個問題,我們不僅可以求期望,還甚至可以求概率密度函數——有了概率密度函數,你想幹什麼,不都很簡單了嗎?

對於這個問題完全沒必要硬剛多重積分 ),雖然理論上依照這個做法可以做出來。

在概率論中我們有更簡單的方式來計算這個分布:

考慮一個Line-line picking problem. 也即在一條單位線段上,找兩個獨立地服從均勻分布的點,並計算它們距離平方的累計分布函數(Cumulative Distribution Function) 。在此之後對其求導,即可得到概率密度函數(Probability Density Function),也即

在解決了一維的問題後,我們可以發現,二維的問題變為計算 的分布了。而這可以由計算 得到,因為兩個獨立的隨機變量之和的概率密度函數等於這兩個隨機變量對應的概率密度函數的卷積。

在更高維的情況,只需要做更多次卷積即可得到 的分布。

計算完距離平方分布的函數,為了計算距離 的分布,只需要運用密度變換公式,也即 就可以得到需要的結果。

具體步驟如下:

1.

然後求導

2. 計算二維情況下的分布:

注意這裡卷積的區域需要分段討論。(如果結論推廣到矩形中,則會有更多的分段點)

這樣,距離分布為

我們可以用matlab編程驗證一下結果:

1,000,000次投點結果

計算得到的結果

把上面兩張圖畫到一起比較一下

至於期望,則直接可以積分這個分布函數得到答案

這是一元微積分學的內容,並不複雜。在此略去相關詳細計算步驟。

也有許多人研究過這個問題,你們如果感興趣可以參考:

[1] D.H. Bailey, J.M. Borwein, V Kapoor, and E.W. Weisstein Ten Problems in Experimental Mathematics,http://crd.lbl.gov/˜dhbailey/dhbpapers/tenproblems.pdf, March 8, 2006.

[2] D.H. Bailey, J.M. Borwein, R.E. Crandall Box integrals, Journal of Computational and Applied Mathematics Vol. 206, Issue 1, Sept. 2007, pp. 196-208.

[3] T.S. Bolis Solution of problem E2629: Average Distance between Two Points in a Box, Amer. Math. Monthly Vol. 85, No. 4. pp. 277-78, April. 1978.

[4] J. Philip, Calculation of Expected Distance on a Unit Cube.

www.math.kth.se/~johanph, Jan 2007.

[5] D.P. Robbins Problem E2629: Find the Average Distance between Two Points in a Box, Amer. Math. Monthly [1977,57].

[6] L.A. Santalo, Integral Geometry and Geometric Probability Encyclopedia of Mathematics and Its Applications, Addison-Wesley, 1976

P.S.附上MATLAB代碼

%For UCR EE114 CODING HW1
TIMES=1000000;
M1=rand(TIMES,2);
x1=M1(:,1);y1=M1(:,2);
M2=rand(TIMES,2);
x2=M2(:,1);y2=M2(:,2);
dis=sqrt((x1-x2).^2+(y1-y2).^2);
%-- Part 1
SPLIT=100;
intervals = (0:1.5*SPLIT)/SPLIT;
% [0,1.5] for maximum of dis =sqrt(2)=1.414
counts = histcounts(dis,intervals);
normalized_counts = counts/TIMES;
probabilities = normalized_counts / (1/SPLIT);
figure(1)
plot(intervals(1:end-1), probabilities, 'linewidth',1)
% set(gca,'fontsize',15);
ylabel('$f_X(x)$','interpreter','latex','fontsize',10)

hold on;
% draw a PDF to compare with the result
x=0:0.01:1.4
y=@(x)(2.*x.*(x.^2-4.*x+pi)).*(x>0&x<1)+(2.*x.*(-2-pi-x.^2+4.*asin(1./x)+4.*sqrt(x.^2-1))).*(x>1&x<1.4);
plot(x,y(x))
xlabel('$x$','interpreter','latex','fontsize',10)

grid('on')

想說幾句關於這個圓內取點問題需要注意的事情。

首先,多重積分 仍然是可以算的。只要你的計算功底足夠優秀,你就可以通過各種代換、積分次序交換、引入參數/幾何意義來這個累計分布函數(CDF)。但我仍然不幹這件事。我只是提一些要點,以免有人在隨機分布時都整出么蛾子來:

假設變為2維情形,你就會發現這時雖然兩個點都滿足均勻分布,但它們的各自的分量卻不然:

聯合分布函數為 ,這也就意味著邊緣分布變成了:

不再是一個均勻分布了。這和正方形中有本質的不同。我們無法再瀟灑地用卷積來得到答案,因為X和Y並不獨立。

此外,還有人提到在disk-line picking中使用均勻分布的極坐標來取點。請注意:這是值得警惕的。均勻分布則意味著在放置在任意位置處的面積微元都應當等概率地獲得點——也即每個面積微元的點密度是大致相同的。直角坐標 情形並不體現位置,但極坐標則不然:其面積微元為 ——這意味著,如果 各自獨立地滿足均勻分布,則投下的圓會變為左下圖。因為 越小, 面積元的面積則越小,則點的密度 越大。

為防止這種情況,應當採用 的面積微元。也即 的換元(係數1/2是無關緊要的)這樣,你就可以得到右下角的分布。

對更高維的坐標也是同理。

有關的計算在網絡上是很多的。

如:

Kendall, M. G. and Moran, P. A. P. Geometrical Probability. New York: Hafner, 1963.

Santaló, L. A. Integral Geometry and Geometric Probability. Reading, MA: Addison-Wesley, 1976.

Tu, S.-J. and Fischbach, E. "A New Geometric Probability Technique for an N-Dimensional Sphere and Its Applications" 17 Apr 2000. http://arxiv.org/abs/math-ph/0004021.

贅述沒有意義,因為都基於某些特定的幾何化簡技巧(為了後續的結論推廣)。

例如:A New Geometric Probability Technique for an N-dimensional Sphere and Its Applications to Physics,給出了一個n維球的公式,並得到了n維情況的 ball-line picking的概率密度圖:

▼▼▼更多驚喜點擊

相關焦點

  • 使用法向量求二面角,需要知道這點,否則得到的結果不一定正確
    圖一對於立體幾何中求二面角,只有兩種方法:一是常規方法,即過其中的一個面上的點A作另一個面垂線,交於底面與B,在過該點B作兩個面交線的垂線交於垂線於C,連接AC,則∠ACB就是要找的二面角;二是法向量法,即分別求出兩個面的法向量
  • 走進高維空間——所有點之間的距離都相等!奇妙、瘋狂、不可思議
    在今天的這篇文章中,我們不考慮點和原點(球心)之間的距離,而是考慮兩個隨機選擇的點之間的距離。一些概念如:n維球體的定義和第一部分完全一樣。如果您已經熟悉了這些概念,或者並不真正關心如何準確地測量這些距離,那麼您可以直接跳到下一節。我個人認為這些概念是非常迷人,但它們不是讓你的頭腦被我們所尋求的更高維度現象所震撼的必要條件。我們將從一個二維的簡單例子開始。考慮以下兩個隨機的點,一個藍色和一個紅色:如何測量這些點之間的距離呢?
  • 走進高維空間——所有點之間的距離都相等!奇妙、瘋狂、不可思議
    在今天的這篇文章中,我們不考慮點和原點(球心)之間的距離,而是考慮兩個隨機選擇的點之間的距離。一些概念如:n維球體的定義和第一部分完全一樣。測量兩點之間的距離首先,我們要學習如何測量任意高維空間中兩點之間的距離。
  • 機器學習中距離和相似性度量方法
    閔可夫斯基距離閔可夫斯基距離(Minkowski distance)是衡量數值點之間距離的一種非常常見的方法,假設數值點 P 和 Q 坐標如下:該距離最常用的 p 是 2 和 1, 前者是歐幾裡得距離(Euclidean distance),後者是曼哈頓距離(Manhattan distance)。
  • 什麼是「歐幾裡得距離」(ED)?| 群體遺傳專題
    要理解歐幾裡得距離,我們先要了解歐幾裡得空間。我們通常所在的空間是三維空間,三維空間任意的點可以被一個三維的坐標定義。而將三維拓展為更高的n維,即得到了n維歐幾裡得空間。而在n維空間中兩個點之間的距離,我們就稱之為歐幾裡得距離。在具體的應用中,如果一組數據擁有n個相互獨立的變量,我們就可以將其置於n維的歐幾裡得空間中,並應用歐幾裡得距離來量化兩組數據之間的差異。
  • 兩個正方形移動2根牙籤怎麼變成1個正方形方法 步驟答案
    最近小編在刷抖音的時候,看到有一個視頻是用8根牙籤組成2個正方形,視頻中說要移動2根牙籤來把這2個正方形變成一個正方形,相信有很多網友對這個問題比較感興趣,這個移牙籤減少正方形的方法是什麼呢?感興趣的朋友可以看一下相關的答案哦。
  • 比較直觀地歐幾裡得算法與更相減損術證明
    歐幾裡得算法,也叫做輾轉相除法。是偉大的歐幾裡得在《幾何原本》中描述的一種求兩個整數最大公約數的高效算法。是最古老的算法之一。相對應的,中國古代《九章算術》中記載的更相減損術也是求兩個整數最大公約數的方法。但是更相減損術的效率卻沒有歐幾裡得算法的高。
  • 衝刺19年高考數學,典型例題分析189:離散型隨機變量期望與方差...
    典型例題分析1:我校70校慶,各屆校友紛至沓來,高73級1班共來了n位校友(n>8且 n∈N*),其中女校友6位,組委會對這n位校友登記製作了一份校友名單,現隨機從中選出2位校友代表,若選出的2位校友是一男一女,則稱為「最佳組合」(Ⅰ)若隨機選出的2位校友代表為「最佳組合
  • 你知道「一條線段」和「一個正方形面積」包含多少個點嗎?
    我們想知道組成一條直線的點是有限的還是無限的,是可數的還是不可數的在直線下方畫一條輔助線,將直線上的點全部投影到輔助線上會發現,點與點之間的距離被放大了,或者被拉伸了再看兩個正方形:面是有線組成的,這兩個正方向只是大小不一樣,但他們包含相等的無窮點原始正方形面上的點重新組合排列後(或理解點的移動)後的正方向所以可以得出:所有面積存在的平面圖形都存在相等的無窮多的點,只是點的位置不一樣而已
  • p是曲線上的點,則該點到直線x-y-1=0的最小距離?幾個符合的切線
    圖一這道題是常見的類型題,很多時候我們會被給出的曲線y=e^x+x^2迷惑,不知道該如何解決。其實無論是什麼樣的曲線只要是讓你求曲線上的點到定直線的最小距離,都是先找到該p點到直線x-y-1=0的最小距離時的狀態,而此時的點P處的斜率恰好就是直線x-y-1=0的斜率。
  • 正方形內有個P點求面積,輔助線原來這樣做,初二初三孩子必看!
    P為正方形ABCD內的一點,並且PA=1,PB=2,PC=3,求正方形ABCD的面積多少?如圖,本題和前面做過一個等邊三角形的題,有著異曲同工之處,不同的是,本題是正方形ABCD內的一點P,且本題是求面積,我們沿用之前的思路直接通過圖形旋轉來思考
  • 中考難點,二次函數背景下的正方形存在性問題
    比如在平面中若已知兩個定點,可以在平面中確定另外兩個點使得它們構成正方形,而如果要求在某條線上確定點,則可能會出現不存在的情況,即我們所說的未知量小於方程個數,可能無解.從動點角度來說,關於正方形存在性問題可分為:(1)2個定點+2個全動點;(2)1個定點+2個半動點+1個全動點;甚至可以有:(3)4個半動點.
  • 中考數學壓軸題,如何解二次函數與正方形綜合問題
    正方形作為一種特殊的平行四邊形,不僅具有一般平行四邊形所有性質,更具自身特殊的性質,如:1、具有平行四邊形、矩形、菱形的一切性質;2、正方形的四個角都是直角,四條邊都相等;3、正方形的兩條對角線相等,並且互相垂直平分,每一條對角線平分一組對角;4、正方形是軸對稱圖形,有4條對稱軸;5、正方形的一條對角線把正方形分成兩個全等的等腰直角三角形
  • 詳解數學中的「距離」
    「常用的距離公式」的問題大家都學過幾何,對於線段的距離,兩點之間的距離都會求,方法是先求出兩個點的坐標,然後利用公式: 有了這個距離公式就可以通吃所有距離問題了嗎?你想的太簡單了,數學是科學,是要解決問題的,來看下面的問題:
  • 閔式距離詳解及其SPSS實現
    閔式距離計算公式1. 曼哈頓距離當q=1時的一階Minkowski距離稱為絕對值距離,又叫做曼哈頓距離(Manhattan Distance)。曼哈頓距離標明兩個點在標準坐標系上的絕對軸距總和。曼哈頓距離計算公式下列是兩個樣品的數據,每個樣品測定兩個指標。
  • 晚9點~凌晨1點、早晨5~7點 兩個時間點,睡好能長高
    在很多大人的認知中,身高多受遺傳因素影響,這讓很多身高並不高的家長很擔心。其實,遺傳只是決定身高的一個先天因素,後天因素也很關鍵,其中最重要的一點就是堅持運動和保證睡眠。運動有利於平衡骨骼生長及全身的鈣、磷代謝,加速礦物質在骨內沉積,刺激生長激素分泌,同時使骨承受適宜的壓力,促進骨骼生長。有的家長覺得孩子在學校每周的體育課就行了,其實這遠遠不夠。
  • 量子計算機如何分解兩個質數乘積
    知道一個大數是兩個質數的乘積,求出具體兩個質數,這樣的大數分解問題是一個難的問題,但是把兩個質數乘起來就簡單很多,比如n=10,104,547是兩個質數p,q的乘積,把n分解為2789和3623這兩個質數,比起把它們乘起來就耗時很多。
  • 歐幾裡得平面幾何體系的定義、公設和公理
    這一篇算是一個摘(ban)錄(yun)吧,內容全部來源於歐幾裡得所著《幾何原本》,希望對想要了解這些內容的朋友起到些許幫助,需要的話不妨收藏一下。1.3 線的兩端是點。1.4 直線:直線是點沿著一定方向及其相反方向的無限平鋪。1.5 面:面只有長度和寬度。1.6 一個面的邊是線。1.7 平面:平面是直線自身的均勻分布。1.8 平面角:平面角是兩條線在一個平面內相交所形成的的傾斜度。
  • 消耗掉所有的錢獲取一個隨機收藏品,和1點希望獲取全部收藏品
    我現在還對我抽到四個閃靈,三個賽媽這件事念念不忘。為什麼銀灰池能連出閃靈和賽媽?第二次池子我等了許久,好傢夥又是閃靈。我真想一盾牌拍死你,這是怕我去打人生怕回血回不過來?玩到現在一個強力爆發幹員都沒有。以至於我特麼過個400人大關想輕鬆點還要去借個銀灰或者陳。我特麼服了。銀灰,陳,小綿羊,傑哥,小火龍這幾個應該算遠古爆發有點的幹員吧。好傢夥。玩了快一年了。都沒有。一想到閃靈天賦快滿了。
  • 參數估計之點估計和區間估計
    即根據樣本數據如何選擇統計量去推斷總體的分布或數字特徵等。統計推斷是數理統計研究的核心問題。所謂統計推斷是指根據樣本對總體分布或分布的數字特徵等作出合理的推斷。它是統計推斷的一種基本形式,分為點估計和區間估計兩部分。一、點估計點估計是依據樣本估計總體分布中所含的未知參數或未知參數的函數。