지수 분포 예제

또한 X가 평균 θ로 기하급수적으로 분포되어 있는 경우, 지수 분포에는 메모리없는 속성이 있으며, 이는 미래의 확률이 과거 정보에 의존하지 않는다는 것을 보여줄 수 있습니다. 수학적으로, 그것은 P (X > x + k | X > x) = P(X > k). 지수 분포로 작업할 때 고려해야 할 질문 유형입니다. 큰 값이 적고 값이 더 작습니다. 예를 들어 고객이 슈퍼마켓을 한 번 여행할 때 지출하는 금액은 기하급수적으로 분포되어 있습니다. 적은 금액을 지출하는 사람들이 더 많고 많은 돈을 지출하는 사람들이 적습니다. 수문학에서 지수 분포는 일일 강우량 및 하천 방전량의 월별 및 연간 최대값과 같은 변수의 극단적인 값을 분석하는 데 사용됩니다. [12] 이제 우리는 λ와 θ를 가지고 우리는 문제를 해체 시작할 수 있습니다. 아마 정규 배포에서 얻는 것과 마찬가지로 PDF 에서 영역을 찾아야합니다. 질문은 적어도 4 분 동안 요구하고 있으며, 4 를 포함하여 언제든지 수단을 사용할 수 있습니다. 이 영역을 찾으려면 두 범위 사이의 PDF의 단순 적분이 필요합니다.

다행히도, scipy는 우리가이 작업을 수행 할 수 있도록 좋은 기능을 가지고 있습니다. 문서의 시작 부분에서 제기된 것처럼 지수 분포의 중요한 속성은 메모리없는 상태이며, 분포의 지정된 지점에서 이전 상태와 독립적입니다. 따라서 설정된 시간이 경과한 점을 평가해야 하는 경우 초기 시간을 0으로 줄일 수 있습니다. 특정 고속도로에서 자동차가 분당 평균 5대의 차량을 통과한다고 가정해 봅시다. 연속 된 자동차 사이의 시간 기간이 지수 분포를 따른다고 가정합니다. 이 정의를 사용하면 일부 자연 이벤트가 모델에 맞을 수 있습니다. 예를 들어 매년 하와이를 강타한 허리케인의 수는 푸아송 분포입니다. 그러나 컴퓨터가 실패할 수 있는 시기를 파악하는 것은 아닙니다(이벤트가 한 번만 발생할 수 있음). 평균적으로 특정 컴퓨터 부품은 10년 동안 지속됩니다. 컴퓨터 부품이 지속되는 시간은 기하급수적으로 분산됩니다. 지수 분포 이전의 컨쥬게이트는 감마 분포입니다(지수 분포는 특별한 경우).

감마 확률 밀도 함수의 다음 매개 변수화는 유용합니다: 다른 기계의 관찰에 따라 이 기계가 실패하는 데 걸린 시간이 얼마나 오래 걸렸는지 살펴보면 여기에서 표준 정규 분포를 사용해야 합니까? 로그 정규 분포를 사용하여 기계가 성능 저하 또는 감소 후 어느 시점에서 얼마나 신뢰할 수 있는지 모델링하는 것도 고려할 수 있습니다. 또는 Weibull 분포를 살펴보고 정확한 고장 시간 분석을 결정할 수 있습니다. 매시간 웹사이트에서 평균 1회 조회를 하면 속도(λ)는 시간당 1이고 적중 시간 사이의 평균 시간은 1시간입니다. 그러나 시간당 평균 4회 조회가 있는 경우 속도는 시간당 4회이고 적중 시간 사이의 평균 시간은 0.25시간입니다. 이 매개 변수를 θ라고 하며 나중에 지수 분포의 적수를 확인하고 확률을 얻는 데 사용할 것입니다. 지수 분포는 푸아송 분포와 관련이 있습니다. 연속 시간 간격동안 연속된 이벤트 사이의 시간 주기 모델은 지수 모델이지만 푸아송 배포는 고정된 기간 동안 발생하는 이벤트를 처리합니다. 이벤트가 일정 시간 내에 발생하는 횟수는 푸아송 분포인 경우: 일반적으로 사용되는 대체 매개 변수화는 지수 분포의 확률 밀도 함수(pdf)를 정의하는 것입니다. 신뢰성 분야에서 널리 사용됩니다. 신뢰성은 제품이 지속되는 시간을 다룹니다. 작은 도시에서는 주당 평균 3건의 푸아송 분포로 자동차 사고가 발생합니다.