일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | ||||
4 | 5 | 6 | 7 | 8 | 9 | 10 |
11 | 12 | 13 | 14 | 15 | 16 | 17 |
18 | 19 | 20 | 21 | 22 | 23 | 24 |
25 | 26 | 27 | 28 | 29 | 30 | 31 |
- Manifold Learning
- data load
- Data 불러오기
- 캐글
- hive
- 스파크
- Feature extraction
- L2 정규화
- Tez
- Haddop
- Deeplearning 키워드
- 하이브
- Clodera Quick Start
- Hive CLI
- Spark
- Spark Data 불러오기
- 차원의 저주
- Auto Encoder
- .hiverc
- Spark 설치
- hive setting
- One-hot encoding
- Managed Table
- 선형 회귀
- 학습률
- 딥러닝
- Hadoop Ecosystems
- learning rate
- Over fitting
- DeepLearning
- Today
- Total
남는건 기록뿐
확률이란? 본문
확률이란?
→ 어떤 현상이 일어날 가능성에 대한 믿음의 정도 또는 어떤 실험(experiment)에서 특정한 사건(event)의 발생 비율에 해당되는 개념인데, 이는 어떤 사건(또는 사상)이 일어날 가능성을 수리적(0과 1사이의 값)으로 표현한 것에 해당되며, 이 값이 크면 사건이 일어날 가능성이 크고, 값이 작으면 가능성이 작다고 판단하게 된다.
확률의 고전적 정의
→ 공정한 하나의 동전을 던지는 실험을 할 때 앞면이 나올 확률은 누구나 1/2이라고 할 것이다. 이것은 실험의 결과가 앞면 또는 뒷면 두 가지인데, 그 중에 하나에 해당되므로 간단히 구할 수 있는 것이다. 어떤 실험에서 나올 수 있는 모든 가능한 결과의 집합을 표본공간(sample space)이라 부르고 보통 S라 표기한다. 예를 들어, 위의 동전 던지기 실험에서 표본공간은 {앞면, 뒷면}이 된다. 또한, 표본공간의 원소 또는 부분집합으로 관심의 대상이 되는 결과의 집합을 사건 또는 사상(event)이라고 부른다. 특히, 표본공간의 하나의 원소로만 이루어진 사건을 단순사건(sample event, elementary event)이라고 부르기도 한다. 사건 A가 일어날 확률은 P(A)라 표기하며, 표본공간 S가 유한집합이고 표본공간의 원소들이 일어날 가능성이 모두 같은 경우에 확률의 고전적 정의는 다음과 같다.
P(A) = 사건 A에 해당되는 원소의 수 / 표본공간 S의 원소의 수
예를 들면, 공정한 동전을 두 번 던지는 실험을 할 때, 앞면이 한 번만 나올 사건을 A라 하면, 사건 A가 일어날 확률은 S = {(H, H), (H, T), (T, H), (T, T)}, H=앞면, T=뒷면 과 같고 사건 A의 집합은 {(H, T), (T, H)}이므로 P(A) = 2/4 = 1/2이 된다.
확률의 경험적 정의
→ 반복되는 실험에서 상대도수(relative frequency)의 개념으로 특정한 사건이 발생할 확률을 설명하는 것이 확률의 경험적 정의에 해당된다. 즉, 전체 실험 횟수 또는 관측 도수를 n이라 하고, 특정 사건 A의 발생 횟수 또는 관측 도수를 x라 하면 경험적 정의에 의한 확률 P(A)는 다음과 같다.
P(A) = 사건 A의 발생 횟수 / 전체 실험 횟수 = x / n
여기서 n이 충분히 크면 사건 A에 대한 확률에 대해서 보다 신빙성있게 말할 수 있다.
예를 들면, 새로 문을 연 전자 제품 매장에 지금까지 방문한 사람이 154명인데 이 중에 108명이 제품을 구매하였다고 하면, 어떤 손님이 매장에 들어 왔을 때 경험에 의하면 이 손님이 제품을 구매할 확률은 P(A) = 108/154 = 0.7013 이 된다.
확률의 주관적 정의
→ 실생활에서는 관심을 갖는 확률 문제에서 일어날 수 있는 사건의 가능성이 서로 같지 않다던가, 실험의 반복에 대한 정보가 없는 경우가 허다하다. 예를 들어, 내년에 우리 나라 경제 성장률이 5% 이상일 확률, 독도의 한 지점에서 석유가 나올 확률, 우리 나라 월드컵 16강 진출 확률 등이 이에 속하며, 이러한 경우에 확률은 주관적인 감각이나 판단에 의한 믿음의 정도를 나타낸다고 볼 수 있다. 물론, 이러한 판단의 근거로는 비슷한 상황의 결과나 과거의 경험에 기초한 경우가 종종 있다.
'Basic Statistics' 카테고리의 다른 글
확률변수 (0) | 2020.01.21 |
---|---|
베이즈 정리 (0) | 2020.01.21 |