考慮這樣一個現實的問題:
碧藍檔案的總力戰中,每個人每天有3次機會打總力戰,而將每個人打出的分數(最高分)進行排序,前15000名可以獲得最多的獎勵. 第15000名的分數被稱為一檔線. 那么如何建模才可以在一定程度上給出一檔線隨時間變化這一過程.
由于隨機過程如果考慮最最完善的情況的話,就會出現一個過程套另一個過程套另一個過程這樣套娃的情況,導致只能依賴數據進行數值計算,與此文章的目的相悖.
(資料圖)
故本文章考慮這樣一個理想的模型:
首先,要求不論什么時間(包括上班時間睡眠時間),都有穩定的玩家數量,一個人不打總力戰就得有另一個人去打總力戰,這樣就可以認為打總力戰是一個泊松過程,而且保證了泊松過程的強度恒定. 其次假定各位玩家的實力相當,且都打ins難度,這就意味著不同的人打完時,產生的分數獨立且同分布.?第三是每人只打一次,這個假定意味著玩家不能覆蓋自己的歷史最高分.
現在開始分析:?
首先,沒有足夠的證據證明成績近似服從正態分布,所以在分析中我們考慮最一般的情況,設各位參與者的成績服從分布的概率密度是??,而分布函數是 . 然后設分數線為第??個人的成績.?
由模型的假設,得到的分數的個數服從泊松分布??
當? 時,有以下條件概率密度
這個就是引用了n-m+1次序統計量的概率密度函數
此時算出條件分布函數為
而當? 時,由于沒有足夠的樣本,故可以認為m次序統計量為任意比可能的最低分還要小的數,因此
而根據全概率公式
得到第??大的分數的分布函數,并且求導還可以得到概率密度
這便是分數線服從的分布函數,其中參數??代表最多只能有多少人過線,參數? 是泊松分布的強度,參數? 是經過的時間. 雖然成績個數有幾率不足m個,使得P并非從0開始,但是隨著時間增長,分數個數不足m的概率快速趨于0,對于較大的??幾乎無影響.
此公式用于預測的示例:
一個比賽,每個人只能參加一次,并得到一個分數,每位選手得分服從期望和標準差都為10的正態分布,參加人數服從強度為10的泊松分布,只有前10名可以獲得獎品,預測時間為10時的分數線.
對其的預測可以用上述概率密度函數代入數值求期望來得到,通過mathematica進行數值積分得到期望約為23.02
而對其的檢驗試驗則可以通過生成偽隨機數來進行,方法如下:
(順帶一提,此種情況產生成績個數不足m的概率,數量級僅為10^(-32))
調用mathematica生成一個服從Poi(100)的隨機數n
調用mathematica生成n個服從的隨機數?
對??進行排序
輸出第10大的數
重復1-4步若干次,把輸出的數取平均值
這里進行了12次試驗,得到的數據如上,試驗樣本平均值為22.41,相較于預測值23.02,相對誤差2.6%
預測分數線關于參數的性質
上面已經介紹了對于各項參數都已經確定時,預測分數線的方法,但是我們有時也很關心分數線隨時間的變化情況.
用上述概率密度計算期望,并表示為??的函數
接下來我們來計算其一個特殊的漸近展開,即當成績服從正態分布時的漸近展開
簡單的變形得到
我們知道u趨于0時y趨于無窮,函數g的值主要由0附近的積分貢獻,所以考慮y在u=0附近的展開,由簡單的分部積分可以得到?
其中W是Lambert W 函數,因此?
代入積分得到?
這個積分的漸近展開我在此直接給出(或許未來的某天我會把證明發出來)
這便是在成績服從正態分布這一情況下,預測分數線的函數在時間很大時的漸近展開.
關鍵詞:
責任編輯:Rex_26