일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | ||||||
2 | 3 | 4 | 5 | 6 | 7 | 8 |
9 | 10 | 11 | 12 | 13 | 14 | 15 |
16 | 17 | 18 | 19 | 20 | 21 | 22 |
23 | 24 | 25 | 26 | 27 | 28 |
- Gram matrix
- SQL
- c#
- 오일러 프로젝트
- backpropagation
- 딥러닝
- 합성곱 신경망
- 베이지안
- 비샤몬당
- 전처리
- 냥코 센세
- mnist
- A Neural Algorithm of Artistic Style
- CNN
- Autoencoder
- 역전파법
- 역전파
- bayesian
- 소인수분해
- 오토인코더
- 신경망
- deep learning
- project euler
- 소수
- Python
- 자전거 여행
- 수달
- neural network
- Convolutional Neural Network
- 히토요시
- Today
- Total
목록통계 (6)
통계, IT, AI
1. 개요 최근에 두가지 베이즈 문제에 대해서 생각할 기회가 있었다. 하나는 몬티홀 문제를 베이즈 룰을 사용하여 증명하는 것이었고 또 하나는 간단한 베이즈 문제였다.2. 몬티홀 문제 몬티홀 문제는 아주 널리 알려진 확률론 문제로 확률과 직관이 항상 일치하지는 않는다는 예시이다. 진행을 위해 문제를 간단히 소개한다. 3개의 커튼 뒤에 염소 두마리와 스포츠카 한대가 있다. 도전자는 스포츠카가 어디에 있는지 모른다. 도전자가 3개의 커튼 중 하나를 선택하면, 스포츠카의 위치를 알고 있는 사회자가 염소가 있는 커튼을 열고 도전자에게 커튼을 바꿀 기회를 준다. 그렇다면 도전자는 선택을 바꾸는 것이 유리할까? 답은 "그렇다"라는 것이 잘 알려져 있다. 왜 그럴까? 나는 그 답을 베이즈 정리를 사용하여 유도해보고 싶..
보호되어 있는 글입니다.
1. 들어가며2차원의 세계가 존재한다고 가정하고 그곳을 플랫랜드라고 부르자. 즉, 플랫랜드에는 높이라는 것이 없다. 플랫랜드에서 일어나는 일을 상상해보자. 먼저 그곳의 주민들을 관찰한다면 아래와 같은 모습일 것이다. 테두리는 피부이고 그 안에 보이는 것은 장기이다. 우리는 장기를 관찰할 수 있고 심지어 만질 수도 있다. 그곳의 주민 A를 들어 다른 곳에 두자. 그러면 플랫랜드의 사람들은 A가 갑자기 사라지고 엉뚱한 곳에 나타났다고 생각할 것이다. 우리가 플랫랜드에 다리를 걸쳐둔다면 그들은 동그란 두개의 원을 볼 수 있을텐데 사실 그 두개의 원이 하나의 존재라는 것을 결코 쉽게 이해하지 못할 것이다. 이제 우리에게 과제가 하나 주어졌다. 아래와 같은 3차원의 물체를 어떻게 해야 그나마 그들에게 잘 이해시킬..
1. 들어가며 얼마전에 모표준편차를 추정하기 위하여 표본의 범위와 표본의 표준편차 중 무엇을 사용하는 것이 더 나은지 포스팅한 적이 있다. 그것을 밝히기 위해서 여러가지 공식을 증명했었지만 내용과 관련이 없는 것은 적지 않았다. 그렇게 증명한 것 중에 버리기 아까운 것을 적는다. 임의의 분포를 따르는 변수 \(X\)의 평균 \(E(X)\)이 0, 분산 \(Var(X)\)이 \(\sigma^2\), 제곱의 평균 \(E(X^2)\)이 \(\mu_2\) 그리고 네제곱의 평균 \(E(X^4)\)이 \(\mu_4\)라고 하자. \(E(X)\)을 0으로 설정한 이유는 일반성을 잃지 않으면서도 계산의 복잡성을 낮추기 위함이다. 독립적인 \(n\)개의 sample로 계산한 표본 분산 \(s^2\)이 \(\sum_{i}..
1. 들어가며 얼마전에 모표준편차를 추정하기 위하여 표본의 범위와 표본의 표준편차 중 무엇을 사용하는 것이 더 나은지 포스팅한 적이 있다. 그것을 밝히기 위해서 여러가지 공식을 증명했었지만 내용과 관련이 없는 것은 적지 않았다. 그렇게 증명한 것 중에 버리기 아까운 것을 적는다. 어떤 확률 변수 \(X\)와 \(Y\)의 결합누적분포함수(Joint Cumulative Distribution Function; Joint CDF)를 \(F_{XY}(x,y)\)라 하고 \(X\)와 \(Y\)의 CDF를 각각 \(F_X(x)\), \(F_Y(y)\)라고 하면 \(X\)와 \(Y\)의 공분산(Covariance)과 CDF는 아래와 같은 관계를 갖는다. $$Cov(X,Y)=\int _{R \times R}F_{XY}..
1. 개요 이것저것을 하다보니 통계적 공정 관리(Statistical Process Control; SPC)를 접할 일이 있었다. SPC란 통계적인 방법론을 사용하여 품질을 관리하는 시스템이다. 1920년대 초반에 아이디어가 나왔고 지금까지 많은 공장에서 사용되고 있다. SPC의 구체적인 내용은 이번 포스팅의 주제가 아니므로 다루지 않고 링크로 대체한다. SPC에서 나의 관심을 끈 것은 아래와 같은 그림이었다. Sample size(\(n\))가 2 이상, 10 미만인 경우 Xbar-R chart를, 10 이상일 때에는 Xbar-S chart를 사용하라고 한다. 즉, \(n\)이 작을 때에는 표본의 범위(\(r\))로 모표준편차(\(\sigma\))를 추정하고 \(n\)이 클 때에는 표본의 표준편차(\(..