可靠性分析入門1_概率論術語及說明
主要對基本術語的說明,重點在術語的理解,對概率論的基礎掌握,才能把握數據分析。
1.數據data
連續數據(數量,測量值),名義數據(就是名字),順序數據(能表征順序,大小等),二項數據(非黑即白,非0即1)
區分數據類型,不會對我們的認知有什么改善。
會讓我們對數據的描述更有系統。
2.總體population,參數parameter
總體的描述叫做參數。
實際上永遠不會知道總體的參數具體是什么。只能通過樣本來表現
通常用希臘字母,μ,σ等,N
3.樣本sample, 統計量statistic
根據樣本計算的描述性數字度量。可以知道的,能夠用于推測總體情況。
通常用羅馬字母,或者戴帽子的希臘字母,Xbar,S,等,n
分清楚總體和樣本的區別,區分書寫方式,對后面的分析是最最基礎的事情。
4.均值Mean, 中位數Median,上四分位數Q3, 下四分位數Q1, 眾數Mode
不做解釋
需要注意統計量的含義,及其用法。
譬如收入和壽命,真實反映問題的應該是中位數,而非平均數。
5.標準差Standard Deviation,方差Variance,極差Range
均表示數據的離散程度。
標準差很好理解,單位和實際數據一致。
方差為了數學計算的方便,能夠累加。
極差當樣本量≤8,是唯一有用的離散度量。
6.自由度Degree of Freedom,無偏估計Unbiased Estimate
一個統計量,按道理只有一個數值,但是測試了n個樣本,不受限制的樣本數量是n-1, 所以自由度為n-1.
譬如有兩個數據,有了平均值,只需要知道x1就能知道x2,也就是說只有一個數據是未知量,也就是只有一個自由度。
!!!
注意了:無偏估計有個很有意思的點,以方差表示偏差。但是樣本方差的分母是n-1,就和自由度有關。
如果已知總體的均值μ,那么方差分母為n。
但是我們已知的總是樣本均值Xbar,而自由度的理論可知,X bar 已經用掉了一個自由度,如果繼續用n,則會導致方差和實際不同。
至于為啥用n-1,后面專門理一下推導過程。(貝塞爾校正,Bessel's Correction)
7.正態分布,Z變換,其他常見分布(Weibull,Exponential,Gamma)
最常見最簡單的分布,正態分布。
正態分布的樣品群,計算X bar 和 S。通過Excel,Minitab軟件可以很簡單得到某個區域的概率。
!!!
為什么有Z變換?無軟件,能夠借助查標準正態表就能方便地得到概率。
但是不借助軟件,需要通過Z變換進行歸一化,將某個測量值X0轉換為Z(0,1)上的Z值,Z值即是多少個標準差(sigma),查表能夠直接得到概率。
后續具體列一下詳細過程。目前只需記一個點,如果有人給你一個Z值(相當于給了sigma值),也就是給了概率值。
----
為什么有這么多分布,是因為實際情況沒法統一一個分布描述,甚至同一個事情的不同階段都不能用同一個分布去描述。
所以我們處理數據,首先要選擇合適的分布,而且要檢驗到底擬合得好不好,引出下一個概念,檢驗。
8.概率密度函數(Probability Density Function),累計密度函數(累計分布函數,Cumulative Distribution Function),失效概率圖(Probability Plot)
主要說一下失效概率圖,用于視覺直觀檢測(IOT, Interocular Trauma)。看看樣本數據是否在此圖上是一條直線。如果是直線,說明所選分布能夠合理描述該樣本。
后續專講,可靠性的最基本功能,如何做Probability Plot。其中還會用到CDF的經驗計算,非常重要。
9.區間估計Interval Estimation,置信區間 Confidence Interval,置信水平Confidence Level
樣本的統計量都是固定的。往往總體的參數都是未知。通過樣本僅僅能夠得到,總體參數在某個范圍的可信度,叫區間估計。
相對應的術語是點估計,對統計量的精確點描述Point Estimation。
所以只要是總體參數,那就肯定要有置信區間和置信水平。
其中這個范圍就是置信區間,這個可信度就是置信水平(通常默認為95%)。
區間估計的計算,后續會以小樣本(n < 25,貌似也有說30的,其本質就是樣本量足夠大以后,繼續增加樣本量對區間估計影響不大了,就可以定義為大樣本,數字具體是啥,不重要)的均值為例,做個專項學習。
10.假設檢驗Hypothesis Testing,原假設H0 Null Hypothesis,備擇假設Ha Alternative Hypothesis,檢驗方法(t,Z,F,卡方),顯著性水平 Significance Level(P-value) .
利用樣本來推斷真實情況,叫做假設檢驗。
H0,首先要明確的。一般為無異常的值,minitab中定義為等式。如均值壽命 = 100h.
Ha,與H0互斥,一般選為我們關心的結論。如均值壽命是否< 100h.
檢驗方法(t,Z,F,卡方)可以得到檢驗統計量,進而與臨界值做比較。或者計算P value。檢驗方法后面專項學習下。
最終得出拒絕原假設(P<0.05),或者被迫接受原假設(P>0.05)
工程師必備
- 項目客服
- 培訓客服
- 平臺客服
TOP




















