1. 비연속적 변인에 대립되는 용어로서, 하나의 주어진 범위 내에서는 그 사이에 어떤 값도 가질 수 있는 양적 변인.
예) 키․몸무게․기간 등은 하나의 주어진 범위 내에서 무한히 여러 가지 값을 가질 수 있다. → 비연속적 변인
1. 비연속적 변인에 대립되는 용어로서, 하나의 주어진 범위 내에서는 그 사이에 어떤 값도 가질 수 있는 양적 변인.
예) 키․몸무게․기간 등은 하나의 주어진 범위 내에서 무한히 여러 가지 값을 가질 수 있다. → 비연속적 변인
1. 한 검사선정에 있어서 고려되어야 할 세 가지 요인, 즉 타당도․신뢰도․실용도를 합친 것.
2. 한 검사가 주어진 목적을 얼마나 충실히 재어주고 있느냐 하는 타당도는 가장 중요한 것이지만 그 외에 검사가 얼마나 일관성 있게 재어주느냐 하는 신뢰도, 그리고 검사실시에 드는 노력과 비용에 비추어 본 실용도도 검사선정에 고려되어야 할 요인이 된다. → 타당도, 신뢰도, 실용도
1. 경험적 타당도에 대립되는 말로서 한 검사가 논리적인 견지에서 얼마나 타당한가를 따지는 타당도 확인과정의 한 측면
2. 검사가 논리적으로 얼마나 타당한가를 따지는 문제는 주로 내용타당도와 관련되어 있다.
3. 주어진 검사의 내용이 전문가의 입장에서 볼 때 측정하고자 하는 전집(全集)과 논리적으로 관계가 있는가를 따짐으로써 검사의 타당도를 확인하는 것을 말한다.
1. 한 특수한 연구에서 얻어진 연구결과를 그것이 수행된 맥락(脈絡)과는 다른 상황이나 피험자(被驗者)에까지 일반화시킬 수 있나 없나를 구분하는 정도
2. 상황에 따른 일반화가 특히 관심의 초점이 되는 경우는 보다 특수한 용어로서 「생태적 타당도」(ecological validity)라는 말을 쓴다.
3. 예 : 연구는 항상 특정한 상황에서 특정한 피험자를 대상으로 수행되지만 연구자는 그 연구결과가 보다 광범위하게 적용될 수 있기를 바란다. 예컨대, 실험실에서 이루어진 연구결과가 일상적인 상황에까지 일반화될 수 있다거나, 혹은 초등학생을 대상으로 얻은 기능과 학업성적과의 관계가 대학생에게까지 일반화될 수 있다면 그것은 일상적인 유용도의 면에서뿐만 아니라 과학적 지식의 발전이라는 면에서 바람직 한 일일 것이다.
4. 유의점 : 연구자는 자신의 소망과 객관적인 사실을 구분 짓는 태도를 가져야 한다. 다시 말하면 외적 타당도는 연구자의 기대나 소망에 의해서 보장되는 것이 아니라 사실에 의해서 검증(檢證)되어야 할 성질의 것이다. ⇨ 내적타당도
1. 한 검사로서 미래의 어떤 기준변인을 얼마만큼 예언하느냐 하는 정도
2. 준거타당도의 하나로서 미래의 어떤 기준, 예를 들면 대학이나 전문학교에서의 성공을 예언하기 위하여 학업 적성검사를 사용한다든가 또는 누가 정신병적 부적응을 나타낼 것인가 등을 예언하기 위하여 성격검사를 사용하는 경우에 이 검사가 예언하고자 하는 기준과 상관의 정도를 말한다.
3. 이와 같은 경우에 검사의 기능은 검사와는 질적으로 다른 어떤 행동을 나타내는 변인을 예언하는 데 있다.
4. 예언타당도는 기준변인의 자료가 미래에 있을 때, 즉 검사를 실시한 후 얼마 간 기간이 지난 후에 기준변인에 관한 자료를 수집하여 이와의 관계를 알아보는 데 있다. ⇨ 준거타당도
1. 검사문항이 그 검사가 재고자 하는 바를 충실하게 재어 주고 있다고 피검사자의 입장에서 보는 정도
2. 내용타당도와의 차이점
⑴ 안면타당도는 그 검사에 관한 검사자의 어느 정도 피상적인 관찰에 의해서 결정되며, 그 문항이 재고자 하는 것이 무엇인지 명료하게 판단될 수 있는 내용에 국한된다.
⑵ 내용타당도는 심리측정에 소양을 가진 전문가의 철저하고 계획적인 판단에 의해서 규정되며 명료하게 눈에 띄는 내용뿐만 아니라 그 의도가 명료하지 않은 복잡한 내용에 관한 것도 고려하게 된다.
1. 검사선정의 한 기준이 되는 검사의 실용성의 정도.
2. 검사의 타당도나 신뢰도는 우선적으로 검사선정에 고려하지만 또 하나 고려되어야 할 것은 그 검사가 얼마나 실용성이 있느냐 하는 것이다.
3. 어떤 검사가 필요한 결정을 내리는 데 아무리 좋은 정보를 제공해 준다고 해도 그 검사를 실제 이용하는 데 필요한 비용이나 인간의 노력을 고려할 때, 때로는 이러한 검사의 도움 없이 불확실한 결정을 내릴 때 초래되는 손해보다도 더 많은 비용이 드는 경우가 있는 것이다.
4. 이외에도 검사선정에 있어서 실제적인 문제로 검사의 가격이 피검사자에게 너무 큰 경제적 부담을 준다든가 또는 어떤 측정도구는 너무나 비싸서 사들일 수 없는 경우도 있을 것이다. 비용 이외에도 많은 고용인을 검사하는데 소비되는 시간 또는 학교나 군대 훈련기관 등의 일정하게 고정된 시간의 길이에 맞도록 되어야 할 것이다.
1. 소비자 단체가 생산자의 목표가 무엇인지 관계없이 생산품을 소비자의 입장에서 평가하는 것과 같이 교육 프로그램을 실 수혜자의 입장에 서서 수행하는 평가.
2. 이 평가에서는 소비자의 입장 즉 프로그램의 실수요자인 교사나 학생의 입장에서 프로그램의 효과에 관한 준거나 기준을 설정해 놓고 평가를 수행하는 것이 핵심이다.
3. 이 평가는 넓은 의미에서 탈목표평가(goal-free evaluation)의 구체적 예로서 파악될 수 있는 것으로 교육 프로그램에 대한 소비자의 욕구를 분석하여 그것을 바탕으로 평가가 이루어지는 것이다.
4. 이 평가에서는 교육 프로그램의 개발자나 평가자로부터 독립된 준거를 설정하여 평가하기 위하여전문자의 검토, 프로그램의 관찰, 소비자에 대한 면접 및 욕구 조사를 근간으로 하고 있다.
1. 한 검사의 신뢰도를 실제로 어떻게 추정하느냐에 따라 조작적인 견지에서 볼 때 여러 가지 다른 의미로 정의된다고 보겠으나, 측정하고자 하는 것을 그 검사가 얼마나 신뢰성 있게 또는 정확하게 측정해 주고 있느냐 하는 정도.
2. 한 검사점수가 일관성 없이 어제 측정한 결과와 오늘 측정한 결과가 예측할 수 없을 정도로 변화하여, 그 결과를 믿을 수 없다면 그 측정결과는 아무런 소용이 없을 것이다.
3. 한 검사가 어떤 목적으로 쓰이기 위해서는 우선 최소한의 신뢰도가 있어야 할 것이다.
4. 신뢰도란 여러 가지 오차의 근원, 즉 검사도구․피검사자 및 검사 실시 과정 등에서 오는 변산적 오차(變算的誤差)의 정도가 어느 정도 되는가를 나타내는 지수가 된다.
5. 한 검사의 신뢰도를 나타내는 신뢰도 계수는 관찰변량에 대한 오차 변량의 비로 정의되지만 실제의 진점수(眞點數)와 오차의 정확한 양은 알 수 없으므로 단지 얻어진 자료를 근거로 하여 일종의 모수치(母數値)에 대한 추정치를 구하는 수밖에 없다.⇨앞에서 정의된 신뢰도란 하나의 기본 가정인 것이며, 어떻게 이를 추정하느냐에 따라 한 검사에는 여러 가지 신뢰도계수가 있을 수 있다.
7. 신뢰도계수를 추정하는 방법에는 검사-재검사 신뢰도, 동형검사 신뢰도, 반분신뢰도, 쿠더-리처드슨 신뢰도 방법이 주가 되며, 이외에도 호이트(Hoyt)․룰론(Rulon) 및 크론바하(L.J. Cronbach)의 신뢰도에 대한 개념과 그 추정방법이 있다.
1. 이 모형에서는 교육 평가의 목적을 의사결정자에게 필요한 정보를 제공하여 의사결정을 촉진시키는 데 두고 있다. 따라서 이 모형에서는 평가자는 교육 현상의 가치에 대해 개인적인 평가를 하지 않고 가치를 결정하고 의사결정자에게 정보를 수집하여 제시해주는 역할만을 담당하게 된다.
2. 이 모형의 대표적인 제안자로서 스터플 빔(Staffle Beam)을 들 수 있다. 그에 의하면 의사결정 상황에 따라 의사결정 유형이 달라지고 의사결정 유형에 따라 평가 유형이 달라야 한다고 한다.
3. 의사결정 상황 : 원하는 변화를 효과적으로 수행하는 데 있어서 필요한 정보를 충분히 갖춘 바탕 위에 어떤 교육 프로그램을 완전히 바꾸려는 「전면 개혁」(metamorphism) 상황, 현재의 교육 프로그램을 그대로 지탱하며 정상적인 균형을 유지하는 범위 내에서 부분적으로 약간의 변화를 시도하려는 「현상 유지」(homeostasis) 상황, 프로그램의 계속적인 개선을 위해 전문가의 판단에 따라 점차적으로 변화를 요하는 「점진적 변화」(incremental change) 상황, 교육 프로그램을 일시에 대폭적으로 변화시키려는 「혁신적 변화」(neomobilistic change) 상황으로 구분된다.
4. 의사결정 유형 : 의도한 목표를 선정․결정하는 데 관련된 「계획적 의사결정」(planning decisions), 설정한 목표를 달성하기 위한 적절한 절차에 관련된 「구조적 의사결정」(structuring decisions), 달성된 절차를 실행에 옮기는 것과 관련된 「수행적 의사결정」(implementing decisions), 달성된 목표를 검토하여 프로그램의 계속 여부, 변화 여부, 포기 여부를 결정하는 것에 관련된 「재순환 의사결정」(recycling decisions)으로 구분하고 이러한 의사결정 유형에 따라 평가 유형을 나누고 있다.
5. 계획적 의사결정에 필요한 정보를 제공하는 투입 평가(input evaluation), 수행적 의사결정에 필요한 정보를 제공하는 과정 평가(process evaluation), 재순환 의사결정에 필요한 정보를 제공하는 산출 평가(product evaluation)로 평가 유형을 구분한다.
⑴ 상황 평가 : 평가의 상황적 조건을 세부적으로 파헤쳐 보고 평가를 해보고자 하는 요구사항을 토대로 프로그램의 목표를 발견하고 확인하는 평가
⑵ 투입 평가 : 교육 프로그램의 효능성을 잠정적으로 알아보기 위하여 그 프로그램에서 필요로 하는 적절한 절차가 제대로 되어 있는가를 확인하는 평가
⑶ 과정 평가 : 프로그램 시행 과정에서 발견할 수 있는 결점을 찾아보고 그 해결 가능성을 탐색하여 그에 대한 정보를 의사결정자에게 제공해주는 평가
⑷ 산출 평가 : 프로그램의 목표, 상황 평가, 투입 평가, 과정 평가에서 얻은 결과 및 정보들을 상호 비교하여 프로그램의 최종 효과를 파악하려는 평가
6. 특징 : 평가 활동과 의사결정 사이의 순환관계라고 할 수 있으며 평가자는 의사결정자에게 필요한 정보를 제공하여 의사결정을 촉진시키고, 계속적인 평가 활동을 통하여 이 전 단계에서 내린 의사결정을 재검토할 수 있도록 새로운 정보를 제공해 주는 역할을 하는 것이다.
7. 여기에서 CIPP란 용어는 Context, Input, Process, Product의 첫 글자를 따서 명명된 것이다.