JANGUN


실험계획법과 응용


지음 : 백재욱



목차

제1장 실험계획 개요
제2장 두 모집단의 비교
제3장 일원배치법
제4장 이원배치법
제5장 랜덤화블록계획과 라틴정방계획
제6장 회귀분석과 공분산분석
제7장 요인배치법
제8장 교락법과 일부실시법
제9장 다구치 실험계획
제10장 지분계획과 분할구계획
제11장 반응표면분석


1장 실험계획 개요

- 실험계획은 시스템의 성격을 알기 위하여 실험을 수행할 때 과연 어떤 식으로 실험을 수행해야 효율적인 정보획득이 가능한지, 또 어떻게 정보를 처리해야 얻은 정보에 대한 분석 및 해석이 가능한지 등을 다루는 통계방법이다.

- 시스템 :

제어 가능한 요인을 조절하여 출력이 어떻게 변화하는지를 관찰하고 조사하여 최적의 출력을 얻도록 제어 가능한 요인의 수준을 결정
잡음이 있더라도 제어가능한 인자의 수준을 잘 잡아 출력에 큰 변화를 없도록 하고자 한다.

- 실험 설계의 기본원리
(1) 랜덤화(randomization) : 실험단위의 배정 또는 실험순서를 랜덤하게 결정하는 것으로, 선택된 요인 외에 기타 원인들의 영향이 실험결과에 미치는 것을 막기 위한 방안이다.
(2) 반복(replication) : 동일한 조건하에서 실험을 두 번 이상 실험하는 것을 말한다. 반복실험하여 실험오차를 추정할 수 있다.
(3) 블록화(blocking) : 실험 전체가 이질적인 경우 여러 블록으로 나누는 것을 말한다. (블록 내는 동질적으로 그리고 블록 간은 이질적으로 나눔)
(4) 교락(confounding) : 어떤 요인의 효과와 또 다른 요인(또는 블록)의 효과가 중복되어 그 효과들이 서로 분리되지 않는 것을 말한다.
(5) 직교화(orthogonalization) : 각 요인의 효과를 독립적으로 추정할 수 있도록 실험계획 시 요인을 배치할 때 요인 간 직교성을 갖도록 실험을 배치하는 것을 말한다.

- 실험계획의 순서


- 실험계획을 활용할 때의 유의사항
(1) 주어진 문제에 대한 기술적인 지식을 최대한 활용하라.
이는 요인(factor)의 선택, 실험계획의 수립 등에 필수적인 요소이기 때문이다.
(2) 설계와 분석은 가능한 한 간단한 것을 사용하라.
정교한 분석을 하기 전에 원 데이터를 먼저 타점하고, 간단한 분석을 먼저 실시하라.
(3) 실제적 차이와 통계적 차이를 구분하라.
표준편차의 식에서 n이 분모로 가므로 표본의 크기가 크면 클수록 통계적 유의성을 커진다.
따라서 통계적 유의성과 실제적 유의성간의 차이를 구분해야 한다.
(4) 통계적 분석 결과가 기술적 지식, 상식 등과 상반된 결과가 나올 수 있는데 이 경우 기본 가정에 문제가 없는지 검토해보아야 한다.
(5) 실험은 한번으로 끝나지 않는다는 점을 명심하라.

- 실험 후 자료의 형태로 얻어지는 값을 특성값(characteristic value) 또는 반응변수(response variable)값이라고 한다.
- 특성값 또는 반응변수값에 영향을 미치는 원인 중에서 실험에 취급된 원인을 요인(인자, factor)이라고 하고,실험을 하기 위하여 설정한 실험조건을 요인의 수준(level)이라고 한다.



2장 두 모집단의 비교

- 유의수준(significance level) : 제1종 오류를 범하는 최대허용확률이다(사실은 허용하고 싶지 않지만 이를 허용하지 않으면 제2종의 오류가 범할 가능성이 너무 커진다).
- 유의확률(significance probability) : 귀무가설이 맞는다고 하는 가정하에 주어진 데이터가 우연히 대립가설을 지지할 확률이다.
흔히 P값(P-value)이라고 부르는 것으로, 실제로 귀무가설이 참인데도 대립가설이 맞는다고 할 확률을 말한다.
이 확률이 아주 작으면 귀무가설이 참이라고 하는 가설을 받아들일 수 없다.

- 두 모집단 비교


- 두 모집단의 분산이 같은 경우(이를 공통분산 σ2이라고 하자. 각 모집단에서 구한 표본분산의 가중평균으로 공통분산 σ2을 추정한다)


- 짝어어진 비교 : n개의 데이터 쌍이 서로 독립적으로 측정된 경우 짝지어진 t 검정(paired t-test)을 이용하여 두 모평균 간에 차이가 있는지는 볼 수 있다.



3장 일원배치법

일원배치법
- 일원배치법은 하나의 인자(독립변수)의 수준 차이가 특성값(반응변수값)에 영향을 미치는지 보는 실험계획법이다.
- 가장 중요한요인(인자)이반응치에어떤영향을미치는지알고싶다.
- 인자의 수준이 고정된 것이면 고정(모수)인자이고, 랜덤하게 변하면 랜덤(변량)인자이다.
- 고정요인의 경우 여러 처리수준을 실험단위에 랜덤하게 배치하는 것을 완전확률화계획(completely randomized design)이라고 한다.
- 인자가 고정인자로 구성되어 있으면 고정모형이고, 랜덤인자로 구성되어 있으면 랜덤모형이다. 두 개가 같이 있으면 혼합모형이다.



분산분석
- 어느 요인의 수준 간 차이가 특성값(반응변수값)에 차이를 일으키는지는 전체 데이터의 변동 중에서 해당 요인의 수준 간 차이에 의한 변동이 얼마나 되는지 살펴보는 분산분석을 활용하여 결정한다.
- 총변동은 급간변동과 급내변동으로 구성되어 있다.
- 급간변동과 급내변동을 각각의 자유도로 나눈 것을 평균제곱이라고 한다.



분산분석표
- 총제곱합과 자유도의 분할, 평균제곱, ‘요인효과의 차이가 없다’는 귀무가설에 대한 검정통계량과 기각역을 표로 정리한 것이다.


- 분산분석 후 대립가설(‘모두 다 똑같은 것은 아니다’는 가설)이 채택되는 경우 그 다음 단계로 구체적으로 어느 수준들 간에 차이가 있는지 살펴보는 것을 추후분석(follow-up analysis)이라고 한다.
- 각 수준마다 반복수가 일정하지 않더라도 분산분석을 실행할 수 있다.

- 랜덤모형 : 랜덤인자에 대한 효과는 요인 A의 분산 >0 인지 점검하는 것이다.
- 데이터의 총분산 중에서 요인A의 수준 간 산포에 기인하는 비율인 기여율을 구한다.





4장 이원배치법




5장 랜덤화블록계획과 라틴정방계획




6장 회귀분석과 공분산 분석




7장 요인배치법






8장 교락법과 일부실시법







9장 다구치 실험계획







10장 지분계획과 분할구계획





11장 반응표면분석

반응표면분석 조건
- 실험조건에서의 최적조건을 찾기보다 실험조건 주위의 관심영역 전체에서 최적조건을 찾고 싶다
- 계량인자의경우회귀분석을활용하여최적공정조건을파악하고싶다.