평가

"오늘의AI위키"는 AI 기술로 일관성 있고 체계적인 최신 지식을 제공하는 혁신 플랫폼입니다.
"오늘의AI위키"의 AI를 통해 더욱 풍부하고 폭넓은 지식 경험을 누리세요.

1. 개요
2. 평가의 정의 및 목적
- 2.1. 목적
3. 평가의 유형 및 접근 방식
- 3.1. 평가 접근 방식의 분류
- 3.2. 각 접근 방식의 요약
4. 평가의 신뢰성
- 4.1. 평가자와 기술
5. 평가의 윤리 및 표준
- 5.1. 윤리적 고려 사항
- 5.2. 평가 표준
6. 평가의 방법 및 기법
7. 한국 사회에서의 평가
참조

1. 개요

평가는 제안, 결과의 영향에 대한 구조화된 해석과 의미 부여를 의미하며, 형성 평가와 총괄 평가로 나뉜다. 평가는 교육, 부동산, 기술, 제품, 인품 등 다양한 분야에서 이루어지며, 평정, 비평, 평론 등과 유사한 개념으로 사용되기도 한다. 평가의 목적은 프로그램의 질을 판단하고 결정하는 것이며, 형성 평가는 프로그램 개선을, 총괄 평가는 프로그램 채택 여부 결정을 위한 정보를 제공한다. 평가의 유형과 접근 방식은 하우스와 스터플빔과 웹스터에 의해 분류되었으며, 실험 연구, 정책 분석, 소비자 중심 연구 등 다양한 방법이 사용된다. 평가의 신뢰성은 평가자와 평가 방법에 대한 신뢰성으로 나뉘며, 평가자의 기술과 평가 기준에 대한 지식이 중요하다. 평가의 윤리적 고려 사항과 표준은 체계적인 조사, 역량, 성실성, 사람에 대한 존중, 사회적 책임을 강조한다. 평가 방법은 질적, 양적 연구 방법을 모두 활용하며, 공정하고 효과적인 평가가 이루어지도록 노력해야 한다.

더 읽어볼만한 페이지

평가 - 설명책임
설명책임은 개인이나 조직이 자신의 행동과 결정에 대한 책임을 지고 그 결과를 설명해야 하는 의무를 뜻하며, 정치, 경제, 사회 전반에서 다양한 방식으로 나타나고, 선거 외에도 시민 사회 활동이나 여론 조사 등으로 추궁될 수 있으며, 조직 내부 윤리, 보안, 개인의 책임과 공공-민간 영역의 책임 공백 문제도 포함하여, 다양한 분야에서 확보 및 강화 노력이 이루어지고 있다.
평가 - REACH
REACH는 유럽 연합의 화학 물질 등록, 평가, 허가 및 제한에 관한 규정으로, 사람의 건강과 환경 보호, EU 화학 산업 경쟁력 강화, 그리고 고위험성 물질의 대체을 장려하는 것을 목표로 한다.

2. 평가의 정의 및 목적

평가는 제안이나 결과의 예측되거나 실제적인 영향에 대해 구조화된 해석과 의미 부여를 하는 것이다. 평가는 원래 목표와 예측되었거나 달성된 것, 그리고 그것이 어떻게 달성되었는지를 살펴본다. 따라서 평가는 개념, 제안, 프로젝트 또는 조직의 개발 과정에서 이루어지는 형성적 평가가 될 수 있으며, 제안, 프로젝트 또는 조직의 가치 또는 효과를 향상시키는 것을 목표로 한다. 또한 완료된 행동이나 프로젝트 또는 조직으로부터 나중 시점이나 상황에서 교훈을 얻는 총괄적 평가가 될 수도 있다.^[3]

평가는 본질적으로 이론적으로 고려된 접근 방식(명시적이든 아니든)이며, 따라서 평가의 특정 정의는 그 맥락, 이론, 필요, 목적 및 평가 과정 자체의 방법론에 맞춰 조정되었을 것이다.

평가는 교육 현장에서의 성과 판단, 부동산이나 주식 등 재산 가치의 판단, 골동품 등 물건 가치의 판단, 공학에서의 기술이나 제품의 우열 및 성능 판단, 면접에서의 태도 등에 따른 인품 판단 등 다양한 상황에서 이루어진다.

평가는 몇 가지 항목이나 관점으로 나뉘어 이루어지는 경우가 많다. 비슷한 의미로 사용되는 말로 '''평정'''이 있는데, 평정은 “다양한 '''평가'''를 종합하여 최종적으로 정한 값매김”이라는 뉘앙스로, 평가와 평정은 엄밀히는 다른 것이다.

참고로, 자신의 가치에 대한 평가를 말하는 것을 '''비평'''이라고도 하지만, 비판적인 의미로 사용되는 경우가 있다. 또한 그 비평에 대해 논하는 것을 '''평론'''이라고 하며, 평론하는 것을 직업으로 하는 사람을 '''평론가'''라고 한다.

2. 1. 목적

프로그램 평가의 주된 목적은 프로그램의 질을 판단하고 개선하는 것이다.^[6] 평가는 다양한 이해관계자들이 '가치'를 어떻게 정의하는지에 따라 다르게 진행될 수 있다.^[5]

평가 목적에 따라 두 가지 기능이 있다.

'''형성적 평가''': 제품이나 프로세스를 개선하기 위한 정보를 제공한다.
'''총괄적 평가''': 제품이나 프로세스의 채택 여부를 결정하기 위한 단기 효과 또는 장기적 영향에 대한 정보를 제공한다.^[7]

3. 평가의 유형 및 접근 방식

평가는 제안이나 결과의 예측되거나 실제적인 영향에 대해 구조화된 해석과 의미를 부여하는 것이다. 원래 목표와 예측되었거나 달성된 것, 그리고 그것이 어떻게 달성되었는지를 살펴본다.^[3] 평가는 형성적 평가가 될 수도 있고, 총괄적 평가가 될 수도 있다.^[3]

평가는 본질적으로 이론적으로 고려된 접근 방식(명시적이든 아니든)이며, 따라서 평가의 특정 정의는 그 맥락, 이론, 필요, 목적 및 평가 과정 자체의 방법론에 맞춰 조정되었을 것이다. 평가는 통합된 이론적 틀의 일부가 아니며,^[8] 경영학, 조직 이론, 정책 분석, 교육학, 사회학, 사회인류학, 사회 변동을 포함한 여러 학문 분야를 활용한다.^[9]

마이클 퀸 패튼(Michael Quinn Patton)은 평가 절차가 활동, 특성, 결과, 프로그램에 대한 판단, 효과성 향상, 정보에 입각한 프로그램 의사결정을 목표로 해야 한다는 개념을 제시했다.

평가 작업에 대한 사고방식, 설계 및 수행에는 개념적으로 여러 가지 구별되는 방법이 존재한다. 오늘날 사용되는 많은 평가 접근 방식은 중요한 문제 해결에 실질적으로 독창적인 기여를 하는 반면, 다른 접근 방식은 기존 접근 방식을 어떤 식으로든 개선한다.

하우스^[17]는 모든 주요 평가 접근 방식이 자유민주주의라는 공통된 이데올로기에 기반한다고 보았다. 그는 또한 모든 접근 방식이 주관주의 윤리에 기반한다고 주장했는데, 여기서 윤리적 행위는 개인이나 집단의 주관적 또는 직관적인 경험에 기반한다. 이러한 윤리적 입장에는 상응하는 인식론—철학이 지식을 얻는 방법—이 존재한다. 객관주의 인식론은 공리주의 윤리와 관련이 있으며, 일반적으로 공개적으로 노출된 방법과 데이터를 통해 외부적으로 검증(주관 간 합의)될 수 있는 지식을 얻는 데 사용된다. 주관주의 인식론은 직관주의/다원주의 윤리와 관련이 있으며, 기존의 개인적인 지식뿐만 아니라 공개적으로 검사할 수 있는(명시적) 또는 없는(암묵적) 경험을 바탕으로 새로운 지식을 얻는 데 사용된다. 하우스는 그런 다음 각 인식론적 접근 방식을 두 가지 주요 정치적 관점으로 나눈다. 첫째, 접근 방식은 관리자와 전문가의 이익에 초점을 맞춘 엘리트 관점을 취할 수 있다. 또는 소비자와 참여적 접근 방식에 초점을 맞춘 대중적 관점을 취할 수도 있다.

스터플빔과 웹스터는 가치와 윤리적 고려의 역할에 대한 방향에 따라 접근 방식을 세 가지 그룹, 즉 정치적 방향, 질문 방향, 가치 지향으로 분류한다.

3. 1. 평가 접근 방식의 분류

하우스(House)^[17]와 스터플빔(Stufflebeam) & 웹스터(Webster)^[18]는 평가 접근 방식을 주요 관점, 인식론, 방향에 따라 15가지로 분류했다.^[18]

평가 수행을 위한 접근 방식 요약
접근 방식	속성
접근 방식	구성 요소	목적	주요 강점	주요 약점
정치적으로 통제됨	위협	영향력, 권력 또는 돈을 얻거나 유지하거나 증가시킴	갈등에서 클라이언트에게 유리한 증거를 확보함	완전하고 솔직한 공개 원칙 위반
홍보	선전 요구 사항	긍정적인 대중 이미지 창출	대중의 지지를 강화할 가능성이 가장 높은 증거 확보	균형 잡힌 보도, 정당한 결론 및 객관성의 원칙 위반
실험 연구	인과 관계	변수 간의 인과 관계 결정	인과 관계를 결정하는 가장 강력한 패러다임	통제된 환경이 필요하며, 증거의 범위가 제한되고, 주로 결과에 초점을 맞춤
경영 정보 시스템	과학적 효율성	프로그램의 자금 조달, 지시 및 통제에 필요한 증거를 지속적으로 제공	관리자에게 복잡한 프로그램에 대한 자세한 증거 제공	인적 서비스 변수는 필요한 좁고 정량적인 정의에 거의 적합하지 않음
교육 평가 프로그램	개인차	개인 및 집단의 시험 점수를 선택된 표준과 비교	많은 성과 영역에서 유효하고 신뢰할 수 있는 증거를 생성함. 대중에게 매우 친숙함	일반적으로 피험자의 성과에 대한 데이터만 포함되고, 시험 응시 기술을 과도하게 강조하며, 가르치거나 기대하는 내용의 샘플이 부실할 수 있음
목표 기반	목표	결과를 목표와 관련짓기	상식적인 호소력, 널리 사용됨, 행동 목표 및 시험 기술 사용	프로그램의 가치를 판단할 근거를 제공하기에는 너무 좁은 최종 증거로 이어짐
콘텐츠 분석	의사소통 내용	의사소통에 대해 설명하고 결론을 도출	많은 양의 비구조화된 상징적 자료에 대한 비침투적인 분석 허용	샘플이 대표적이지 않을 수 있지만 양이 압도적일 수 있음. 분석 설계가 질문에 대해 과도하게 단순화됨
책임	성과 기대치	구성원에게 결과에 대한 정확한 설명 제공	구성원에게 인기가 많음. 제품 및 서비스의 품질 향상을 목표로 함	실무자와 소비자 간에 불만을 야기함. 정치는 종종 조기 연구를 강요함
결정 중심	결정	결정을 내리고 옹호하기 위한 지식 및 가치 기반 제공	필요한 프로그램을 계획하고 구현하기 위해 평가 사용 장려. 계획 및 행동에 대한 결정 정당화에 도움	평가자와 의사 결정자 간의 필요한 협력은 결과에 편향을 초래할 수 있음
정책 분석 연구	광범위한 문제	경쟁 정책의 잠재적 비용과 이점을 식별하고 평가	광범위하게 초점을 맞춘 행동에 대한 일반적인 방향 제공	참가자의 정치적으로 동기가 부여된 행동에 의해 종종 손상되거나 훼손됨
소비자 중심	일반적인 요구와 가치, 효과	대안적인 상품 및 서비스의 상대적 장점 판단	실무자와 소비자를 부실한 제품 및 서비스로부터 보호하기 위한 독립적인 평가. 높은 대중적 신뢰도	실무자가 더 나은 일을 하는 데 도움이 되지 않을 수 있음. 신뢰할 수 있고 유능한 평가자가 필요함
인증 기관 인증 / 전문 자격증	표준 및 지침	특정 기능을 수행하기 위해 기관, 프로그램 및 인력을 승인해야 하는지 여부 결정	대중이 조직의 품질과 인력의 자격에 대해 정보에 입각한 결정을 내리는 데 도움	표준 및 지침은 일반적으로 결과 측정을 제외하고 내재적 기준을 강조함
감정가	중요한 지침	대상을 비판적으로 설명하고, 평가하고, 설명함	관심 있는 주제에 대한 고도로 발달된 전문 지식 활용. 다른 사람들이 더 통찰력 있는 노력을 기울이도록 영감을 줄 수 있음	소수의 전문가에게 의존하여 평가가 주관성, 편향 및 부패에 취약해짐
적대적 평가	"뜨거운" 문제	문제의 찬반 양론 제시	대표된 관점의 균형 잡힌 프레젠테이션 보장	협력을 단념시키고 적대감을 고조시킬 수 있음
클라이언트 중심	특정 관심사 및 문제	활동과 특정 환경에서 다양한 관점에서 어떻게 가치가 평가되는지에 대한 이해를 증진	실무자가 자체 평가를 수행하는 데 도움이 됨	외부 신뢰도가 낮고 참가자에게 유리하게 편향될 수 있음
참고. 주로 House (1978) 및 Stufflebeam & Webster (1980)에서 각색 및 축약됨.^[18]

정치적으로 통제된 연구와 홍보 연구는 엘리트 관점에서 객관주의 인식론에 기반을 둔다. 두 접근 방식 모두 대상에 대한 가치 해석을 왜곡하지만, 기능 방식은 다르다. 정치적으로 통제된 연구는 소유자의 이익을 위해 정보 공개를 조작하는 반면, 홍보 연구는 실제 상황과 무관하게 긍정적 이미지를 만든다. 이러한 접근 방식은 실제 상황에 적용되지만, 허용되는 평가 관행은 아니다.

5가지 준평가 접근 방식(실험 연구, 경영 정보 시스템, 시험 프로그램, 목표 기반 연구, 내용 분석)은 엄격한 조사 방법으로 존중받는다. 이들은 지식에 대한 질문에 집중하고 가치에 대한 질문은 다루지 않아 준평가로 간주된다. 이러한 연구는 특징을 생성하지만 평가를 생성하지 않을 수 있다. 그러나 특정 연구는 둘 다 생성할 수 있다. 각 접근 방식은 의도된 목적에 부합하며, 객관주의적 이상에 접근하는 정도에 따라 논의된다.

실험 연구는 변수 간의 인과 관계를 결정하는 데 가장 적합하다. 그러나 통제되고 양식화된 방법론은 인간 서비스 프로그램의 변화하는 요구에 대응하지 못할 수 있다.
경영 정보 시스템(MIS)은 복잡한 프로그램 운영에 대한 자세한 정보를 제공하지만, 쉽게 정량화할 수 있는 데이터로 제한된다.
검사 프로그램은 학교, 군대, 대기업 등에서 익숙하다. 개인이나 그룹을 표준과 비교하는 데 적합하지만, 피험자의 성과에만 초점을 맞추고 가르치는 내용을 충분히 샘플링하지 못할 수 있다.
목표 기반 접근 방식은 결과를 목표와 관련시켜 달성 수준을 판단하지만, 중요하지 않거나 좁은 결과에 초점을 맞출 수 있다.
내용 분석은 내용 분석 판단이 가치 진술이 아닌 지식에 기반할 수 있어 준평가이다. 가치에 기반한 내용 분석은 평가이다.
'''책임'''은 결과에 대한 정확한 설명을 제공하여 제품과 서비스의 품질을 향상시키는 것을 목표로 유권자들에게 인기가 있다. 그러나 강압적으로 시행될 경우 실무자와 소비자를 적대 관계로 만들 수 있다.

3. 2. 각 접근 방식의 요약

평가 수행을 위한 접근 방식 요약
접근 방식	속성
접근 방식	구성 요소	목적	주요 강점	주요 약점
정치적으로 통제됨	위협	영향력, 권력 또는 돈을 얻거나 유지하거나 증가시킴	갈등에서 클라이언트에게 유리한 증거를 확보함	완전하고 솔직한 공개 원칙 위반
홍보	선전 요구 사항	긍정적인 대중 이미지 창출	대중의 지지를 강화할 가능성이 가장 높은 증거 확보	균형 잡힌 보도, 정당한 결론 및 객관성의 원칙 위반
실험 연구	인과 관계	변수 간의 인과 관계 결정	인과 관계를 결정하는 가장 강력한 패러다임	통제된 환경이 필요하며, 증거의 범위가 제한되고, 주로 결과에 초점을 맞춤
경영 정보 시스템	과학적 효율성	프로그램의 자금 조달, 지시 및 통제에 필요한 증거를 지속적으로 제공	관리자에게 복잡한 프로그램에 대한 자세한 증거 제공	인적 서비스 변수는 필요한 좁고 정량적인 정의에 거의 적합하지 않음
교육 평가 프로그램	개인차	개인 및 집단의 시험 점수를 선택된 표준과 비교	많은 성과 영역에서 유효하고 신뢰할 수 있는 증거를 생성함. 대중에게 매우 친숙함	일반적으로 피험자의 성과에 대한 데이터만 포함되고, 시험 응시 기술을 과도하게 강조하며, 가르치거나 기대하는 내용의 샘플이 부실할 수 있음
목표 기반	목표	결과를 목표와 관련짓기	상식적인 호소력, 널리 사용됨, 행동 목표 및 시험 기술 사용	프로그램의 가치를 판단할 근거를 제공하기에는 너무 좁은 최종 증거로 이어짐
콘텐츠 분석	의사소통 내용	의사소통에 대해 설명하고 결론을 도출	많은 양의 비구조화된 상징적 자료에 대한 비침투적인 분석 허용	샘플이 대표적이지 않을 수 있지만 양이 압도적일 수 있음. 분석 설계가 질문에 대해 과도하게 단순화됨
책임	성과 기대치	구성원에게 결과에 대한 정확한 설명 제공	구성원에게 인기가 많음. 제품 및 서비스의 품질 향상을 목표로 함	실무자와 소비자 간에 불만을 야기함. 정치는 종종 조기 연구를 강요함
결정 중심	결정	결정을 내리고 옹호하기 위한 지식 및 가치 기반 제공	필요한 프로그램을 계획하고 구현하기 위해 평가 사용 장려. 계획 및 행동에 대한 결정 정당화에 도움	평가자와 의사 결정자 간의 필요한 협력은 결과에 편향을 초래할 수 있음
정책 분석 연구	광범위한 문제	경쟁 정책의 잠재적 비용과 이점을 식별하고 평가	광범위하게 초점을 맞춘 행동에 대한 일반적인 방향 제공	참가자의 정치적으로 동기가 부여된 행동에 의해 종종 손상되거나 훼손됨
소비자 중심	일반적인 요구와 가치, 효과	대안적인 상품 및 서비스의 상대적 장점 판단	실무자와 소비자를 부실한 제품 및 서비스로부터 보호하기 위한 독립적인 평가. 높은 대중적 신뢰도	실무자가 더 나은 일을 하는 데 도움이 되지 않을 수 있음. 신뢰할 수 있고 유능한 평가자가 필요함
인증 기관 인증 / 전문 자격증	표준 및 지침	특정 기능을 수행하기 위해 기관, 프로그램 및 인력을 승인해야 하는지 여부 결정	대중이 조직의 품질과 인력의 자격에 대해 정보에 입각한 결정을 내리는 데 도움	표준 및 지침은 일반적으로 결과 측정을 제외하고 내재적 기준을 강조함
감정가	중요한 지침	대상을 비판적으로 설명하고, 평가하고, 설명함	관심 있는 주제에 대한 고도로 발달된 전문 지식 활용. 다른 사람들이 더 통찰력 있는 노력을 기울이도록 영감을 줄 수 있음	소수의 전문가에게 의존하여 평가가 주관성, 편향 및 부패에 취약해짐
적대적 평가	"뜨거운" 문제	문제의 찬반 양론 제시	대표된 관점의 균형 잡힌 프레젠테이션 보장	협력을 단념시키고 적대감을 고조시킬 수 있음
클라이언트 중심	특정 관심사 및 문제	활동과 특정 환경에서 다양한 관점에서 어떻게 가치가 평가되는지에 대한 이해를 증진	실무자가 자체 평가를 수행하는 데 도움이 됨	외부 신뢰도가 낮고 참가자에게 유리하게 편향될 수 있음
참고. 주로 House (1978) 및 Stufflebeam & Webster (1980)에서 각색 및 축약됨.^[18]

정치적으로 통제된 연구와 홍보 연구는 엘리트 관점에서 객관주의 인식론에 기반을 둔다. 두 접근 방식 모두 대상에 대한 가치 해석을 잘못 제시하려 하지만, 서로 다른 방식으로 기능한다. 정치적으로 통제된 연구를 통해 얻은 정보는 소유자의 특수한 이익을 충족하기 위해 공개되거나 은폐되는 반면, 홍보 정보는 실제 상황에 관계없이 대상에 대한 긍정적인 이미지를 만든다. 실제 상황에 두 연구 모두 적용됨에도 불구하고, 이러한 접근 방식은 모두 허용되는 평가 관행이 아니다.

실험 연구, 경영 정보 시스템, 교육 평가 프로그램, 목표 기반, 콘텐츠 분석의 다섯 가지 접근 방식은 집단적으로 매우 존중받는 엄격한 조사 접근 방식의 모음을 나타낸다. 이들은 특정 연구가 가치에 대한 질문을 다루지 않고 지식에 대한 질문에만 집중할 수 있기 때문에 준평가 접근 방식으로 간주된다. 이러한 연구는 정의상 평가가 아니다. 이러한 접근 방식은 평가를 생성하지 않고도 특징을 생성할 수 있지만, 특정 연구는 둘 다 생성할 수 있다. 이러한 각 접근 방식은 의도된 목적에 잘 부합한다.

실험 연구는 인과 관계를 변수 간에 결정하는 데 가장 적합한 접근 방식이다.
관리 정보 시스템(MIS)은 복잡한 프로그램의 역동적인 운영에 대한 자세한 정보를 제공할 수 있다. 그러나 이 정보는 일반적으로 정기적인 간격으로 사용 가능한 쉽게 정량화할 수 있는 데이터로 제한된다.
검사 프로그램은 학교에 다녔거나 군 복무를 했거나 대기업에 근무한 거의 모든 사람에게 친숙하다.
목표 기반 접근 방식은 결과를 사전에 지정된 목표와 관련시켜 그 달성 수준에 대한 판단을 내릴 수 있도록 한다. 목표는 종종 중요한 것으로 입증되지 않거나 대상의 가치를 결정하는 기반을 제공하기에는 너무 좁은 결과에 초점을 맞춘다.
내용 분석은 내용 분석 판단이 가치 진술에 기반할 필요가 없기 때문에 준평가 접근 방식이다. 대신 지식에 기반할 수 있다. 이러한 내용 분석은 평가가 아니다. 반면에 내용 분석 판단이 가치에 기반하는 경우 이러한 연구는 평가이다.
'''책임'''은 결과에 대한 정확한 설명을 제공하여 제품과 서비스의 품질을 향상시키는 것을 목표로 하기 때문에 유권자들에게 인기가 있다. 그러나 이러한 접근 방식은 강압적으로 시행될 경우 실무자와 소비자를 적대 관계로 만들 수 있다.

4. 평가의 신뢰성

평가는 신뢰성이 요구되며, "평가자에 대한 신뢰성"과 "평가 방법에 대한 신뢰성"으로 나누어 생각할 수 있다. "평가자에 대한 신뢰성"은 평가자가 평가를 수행할 만한 충분한 기술을 가지고 있는지에 대한 것이다. "평가 방법에 대한 신뢰성"은 평가할 내용에 대해 적절하고 충분한 방법으로 평가를 하고 있는지에 대한 것이다.^[9]^[6]^[5]

예를 들어, 운전면허 시험에서 실기 시험관이 안일하다면, 그 평가는 적절하다고 보기 어렵다. 실기 시험이 신뢰를 얻으려면, 시험관은 운전에 관한 기술과 지식을 갖추고, 응시자의 운전 기술을 판단하는 훈련을 받아야 한다. 또한, 실기 시험은 운전 기술은 측정할 수 있지만, 운전에 필요한 지식을 측정하기에는 충분하지 않으므로, 필기 시험을 함께 실시해야 운전면허 부여 여부를 평가하는 적절한 방법이 된다.

하지만 예술 작품 평가와 같이 표준적인 평가 방법이 정해져 있지 않은 경우도 있다. 이러한 경우, 평가자의 권위, 인격적 신뢰, 또는 그 공적에 대한 신뢰 등이 평가에 큰 영향을 미치는 경우가 많다. 따라서 누가 평가를 했는지가 중요한 정보가 되며, 나중에 다른 평가자에 의해 평가 기준이 크게 변경되거나, 완전히 다른 평가가 내려지는 경우도 있다.

4. 1. 평가자와 기술

신뢰성 있는 평가는 평가자의 기술과 평가 기준에 대한 지식을 필요로 한다. 평가자의 주관이 섞이는 것을 막기 위해 체크리스트를 사용하거나, 자료를 장기간 보관하여 종합하는 등의 방법이 활용된다. 또한, 여러 평가자가 있는 경우에는 평가자 간에 서로 의견을 나누거나 평가 기술 및 방법에 대한 연구를 하는 등, 평가 관련 정보를 적극적으로 교환하는 것이 평가자 간의 평가 차이를 줄이는 데 효과적인 것으로 알려져 있다.^[9]^[6]^[5]

5. 평가의 윤리 및 표준

평가 과정의 질과 엄격성을 검토하는 전문가 그룹이 존재하며, 프로그램 및 프로젝트 평가는 윤리적으로 어려울 수 있다. 교육 평가 표준 합동 위원회는 프로그램, 인사, 학생 평가 표준을 개발했으며, 이는 유용성, 실현 가능성, 적절성, 정확성으로 나뉜다. 유럽 기관들도 유사한 표준을 마련했다.

미국 평가 협회는 평가자 지침 원칙을 제시했는데,^[12] 이는 우선순위가 없으며 상황에 따라 적용된다. 국제통화기금(IMF), 세계은행 등 국제기구도 독립적 평가 기능이 있다. 유엔 평가 그룹(UNEG)^[13]은 유엔 평가 표준 수립 및 기능 강화를 위해 노력하며, 경제협력개발기구(OECD)-DAC 내 평가 그룹은 개발 평가 표준 개선을 목표로 한다.^[15] 주요 다국적 개발 은행(MDB) 독립 평가 부서는 평가 협력 그룹^[16]을 통해 MDB 효과 및 책임성 강화를 위한 평가 활용, 교훈 공유, 평가 조정을 추진한다.

5. 1. 윤리적 고려 사항

평가자는 외부 평가에 저항하는 복잡하고 문화적으로 특수한 시스템에 직면할 수 있다. 또한 프로젝트 기관이나 다른 이해 관계자들은 특정 평가 결과에 투자했을 수 있다. 평가자 자신이 "이해 상충" 문제에 직면하거나 특정 평가를 뒷받침하는 결과를 제시하도록 간섭이나 압력을 받을 수도 있다.^[10]

일반적인 전문직 행동 강령은 상호 동료 관계(예: 다양성 및 개인 정보 보호 존중), 운영 문제(적절한 역량, 문서 정확성 및 자원의 적절한 사용), 이해 상충(족벌주의, 선물 수락 및 기타 유형의 편애)을 다룬다.^[10] 그러나 평가자의 역할에 특유한 구체적인 지침이 필요하다. 교육 평가 표준 합동 위원회는 프로그램, 인사 및 학생 평가에 대한 표준을 개발했으며, 유용성, 실현 가능성, 적절성, 정확성의 네 가지 섹션으로 나뉜다. 여러 유럽 기관도 이와 유사한 자체 표준을 마련했다.^[11]

미국 평가 협회는 평가자를 위한 지침 원칙을 만들었다.^[12] 이 원칙은 체계적인 조사, 역량, 성실성/정직성, 사람에 대한 존중, 일반 및 공공 복지에 대한 사회적 책임을 포함한다.

체계적인 조사: 평가자는 평가 대상에 대해 체계적이고 데이터 기반의 조사를 수행하고, 결과의 신뢰성을 높이기 위해 방어 가능한 지표를 선택하여 양질의 데이터를 수집해야 한다.^[13]
역량: 평가자는 이해 관계자에게 유능한 성과를 제공해야 하며, 평가 팀은 다양하고 적절한 전문 지식을 갖춰야 한다.^[10]
성실성/정직성: 평가자는 전체 평가 과정의 정직성과 성실성을 보장해야 하며, 평가에서 편견이 없어야 한다. 이는 공정성, 독립성, 투명성의 세 가지 원칙으로 강조된다.
독립성: 평가 결론이 다른 당사자의 영향을 받지 않고, 평가자는 특정 결론에 대한 이해관계가 없어야 한다. 이해 상충은 특히 평가 자금이 특정 기관에서 제공되는 경우 문제가 된다.^[10]
공정성: 결과가 프로젝트 또는 프로그램의 강점과 약점에 대한 공정하고 철저한 평가여야 한다. 관련된 모든 이해 관계자의 의견을 수렴하고, 편견 없이 결과를 제시하며, 결과와 권장 사항 간의 투명하고 비례적이며 설득력 있는 연결을 제공해야 한다.^[10]
투명성: 이해 관계자가 평가의 이유, 기준, 목적을 알고 있어야 한다. 결과는 읽기 쉽고, 평가 방법, 접근 방식, 정보 출처, 발생 비용에 대한 명확한 설명이 포함되어야 한다.^[10]
사람에 대한 존중: 평가자는 응답자, 프로그램 참가자, 소비자 및 기타 이해 관계자의 안전, 존엄성, 자존감을 존중해야 한다. 평가에 참여하는 사람들의 동의를 얻고, 기밀을 유지하며, 신원을 보호해야 한다.^[13]^[14]
일반 및 공공 복지에 대한 사회적 책임: 평가자는 일반 및 공공 복지와 관련된 다양한 이익과 가치를 명확히 하고 고려해야 한다. 대중의 평가 문서 접근을 용이하게 하여 토론과 피드백을 가능하게 해야 한다.^[10]

유엔 평가 그룹(UNEG)은 유엔 평가 표준을 수립하고 기능을 강화하기 위해 노력하며,^[13] OECD-DAC 내에도 개발 평가 표준 개선을 위한 평가 그룹이 있다.^[15] 주요 다국적 개발 은행(MDB)의 독립 평가 부서는 평가 협력 그룹을 만들어 MDB 효과 및 책임성을 강화하고, 교훈을 공유하며, 평가를 조정한다.^[16]

5. 2. 평가 표준

교육 평가 표준 합동 위원회와 미국 평가 협회 등에서는 평가 표준 및 지침 원칙을 제시하고 있다. 이러한 표준 및 지침에서 강조하는 주요 내용은 다음과 같다.

체계적인 조사: 평가는 체계적이고 데이터 기반의 조사를 통해 이루어져야 한다. 평가 대상에 대한 명확하고 신뢰할 수 있는 데이터를 수집하고, 사용된 방법론을 명확히 하여 결과의 신뢰성을 높여야 한다.^[13] 결과는 증거 기반이어야 하며, 평가의 목표에 맞게 신뢰할 수 있는 데이터를 제공해야 한다.^[10]
역량: 평가자는 이해 관계자에게 유능한 성과를 제공해야 한다. 평가 팀은 적절한 전문 지식을 갖춘 인원으로 구성되어야 하며, 평가자는 자신의 능력 범위 내에서 작업을 수행해야 한다.^[10]
성실성/정직성: 평가자는 전체 평가 과정에서 정직성과 성실성을 보장해야 한다. 평가에는 편견이 없어야 하며, 이를 위해 공정성, 독립성, 투명성을 확보해야 한다.^[10]
독립성: 평가자는 외부의 영향을 받지 않고 독립적으로 판단해야 하며, 이해 상충을 피해야 한다. 특히 평가 자금 제공 기관과 관련된 이해 상충에 주의해야 한다.^[10]
공정성: 평가는 프로그램의 강점과 약점을 공정하게 평가해야 한다. 모든 이해 관계자의 의견을 수렴하고, 편견 없이 결과를 제시하며, 결과와 권장 사항 간의 명확한 연결을 제공해야 한다.^[10]
투명성: 평가의 이유, 기준, 목적 등이 이해 관계자에게 명확하게 공개되어야 한다. 평가 방법, 정보 출처, 비용 등에 대한 정보를 투명하게 제공해야 한다.^[10]
사람에 대한 존중: 평가자는 응답자, 프로그램 참가자, 소비자 등 관련된 모든 사람들의 안전, 존엄성, 자존감을 존중해야 한다. 평가 참여자의 동의를 얻고, 기밀을 유지하며, 개인 정보를 보호해야 한다.^[14] 또한, 평가 대상자들의 관습과 신념을 존중해야 한다.^[10]
일반 및 공공 복지에 대한 사회적 책임: 평가자는 일반 및 공공 복지와 관련된 다양한 이익과 가치를 고려해야 한다. 평가 문서를 공개하여 토론과 피드백을 활성화해야 한다.^[10]

이 외에도, 국제통화기금(IMF), 세계은행과 같은 국제기구와 유엔 평가 그룹(UNEG), 경제협력개발기구(OECD)-DAC 내 평가 그룹, 주요 다국적 개발 은행(MDB)의 독립 평가 부서 등은 평가 기능 강화와 표준 수립을 위해 노력하고 있다.^[13]^[15]^[16]

6. 평가의 방법 및 기법

평가는 질적, 양적 연구 방법을 모두 활용하며, 다양한 방법과 기법이 사용된다.^[3] 사례 연구, 설문 조사, 통계 분석, 모델 구축 등과 더불어 다음과 같은 다양한 방법들이 활용된다.^[3]

7. 한국 사회에서의 평가

평가는 교육, 부동산, 주식 등 재산 가치, 골동품 등의 가치, 공학에서 기술이나 제품의 우열 및 성능, 면접에서 태도에 따른 인품 판단 등 다양한 상황에서 이루어진다.^[1]

평가는 보통 여러 항목이나 관점으로 나뉘어 진행된다. 비슷한 의미로 '''평정'''이 사용되기도 하는데, 평정은 "다양한 평가를 종합하여 최종적으로 정한 값매김"이라는 뉘앙스를 가지며, 엄밀하게는 평가와 다르다.

자신의 가치에 대한 평가는 '''비평'''이라고도 불리지만, 비판적인 의미로 사용되는 경우가 많다. 비평에 대해 논하는 것을 '''평론'''이라 하며, 평론을 직업으로 하는 사람을 '''평론가'''라고 한다.

7. 1. 교육 평가

평가는 평가자와 피평가자는 물론, 많은 사람이 납득할 수 있는 내용을 측정하고, 납득할 수 있는 방법으로 이루어지는 것이 바람직하다. 예를 들어, 어떤 시험의 1급을 가지고 있다고 해도, 그 시험이 누구에게나 쉽게 할 수 있는 내용이라면, 그 시험 1급에 대한 평가에는 큰 가치가 생기지 않는다.^[1]

비슷한 능력이나 가치를 가진 것이라면, 비슷한 평가를 받는 것은 당연하다. 어떤 요소가 평가 대상 사건에 거의 영향을 주지 않음에도 불구하고, 그 요소가 특별히 강조되어 평가에 큰 차이가 생기는 경우, 그 평가가 적절하다고 생각하기 어렵다. 구체적인 예를 들면, 남녀 차이 또는 연령 차이가 특별한 의미 없이 평가에 영향을 주는 경우나, 평가자가 다른 이유를 “개인차”, “개체차”라고 하면서도 구체적으로 어떤 측면에 차이가 있는지 평가자도 모르는 경우 등에서는, 평가 대상 내용이나 평가 방법에 오류가 있다고 생각할 수 있다.^[1]

평가는 공정하고, 효과적인 것이어야 신뢰할 수 있으며, 특히 교육 현장에서는 평가 내용과 방법의 엄격성이 특히 요구된다고 여겨진다.^[1] 또한, 많은 사람이 평가의 가치와 척도를 공유함으로써, 평가 자체가 가진 가치가 높아진다고 알려져 있다.^[1]

7. 2. 정책 평가

프로그램 평가의 주된 목적은 "판단을 형성하여 프로그램의 질을 결정하는 것"이다.^[6] 평가자, 자금 제공자 등 여러 이해관계자들은 각자 '가치'에 대한 정의가 다를 수 있어, 프로젝트를 평가하는 최선의 방법에 대해 다른 생각을 가질 수 있다. 따라서 무엇이 가치 있는지 정의하는 것이 중요하다.^[5]

평가는 "논쟁적인 용어"이다. 평가자들은 평가를 프로그램 평가 또는 조사에 사용하지만, 다른 사람들은 평가를 단순히 응용 연구와 동일하게 생각한다.

평가의 목적에는 두 가지 기능이 있다. 형성적 평가는 제품이나 프로세스를 개선하기 위한 정보를 제공한다. 총괄적 평가는 제품이나 프로세스의 채택 여부를 결정하기 위한 단기 효과 또는 장기적 영향에 대한 정보를 제공한다.^[7]

모든 평가가 동일한 목적을 가진 것은 아니다. 일부 평가는 측정 가능한 프로그램 결과에만 초점을 맞추는 것이 아니라 모니터링 기능을 수행하며, 평가 유형을 모두 나열하기는 어렵다.^[5] 평가는 통합된 이론적 틀의 일부가 아니며,^[8] 경영학, 조직 이론, 정책 분석, 교육학, 사회학, 사회인류학, 사회 변동 등 여러 학문 분야를 활용한다.^[9]

적대적 접근 방식은 준법적 절차를 통해 논쟁적인 문제의 장단점을 도출한다. 이는 문제에 대한 다양한 관점을 균형 있게 제시하지만, "승자"와 "패자"가 발생하면 협조를 저해하고 분쟁 당사자 간의 적대감을 높일 수 있다.

7. 3. 기업 및 노동 평가

평가는 평가자와 피평가자는 물론, 많은 사람이 납득할 수 있는 내용을 측정하고, 납득할 수 있는 방법으로 이루어지는 것이 바람직하다. 예를 들어, 어떤 시험의 1급 자격증을 가지고 있다고 해도, 그 시험이 누구에게나 쉽게 합격할 수 있는 내용이라면, 그 시험 1급에 대한 평가에는 큰 가치가 없을 것이다.

비슷한 능력이나 가치를 가진 것이라면, 비슷한 평가를 받는 것이 당연하다. 어떤 요소가 평가 대상 사건에 거의 영향을 주지 않음에도 불구하고, 그 요소가 특별히 강조되어 평가에 큰 차이가 생기는 경우, 그 평가는 적절하다고 생각하기 어렵다. 구체적인 예를 들면, 남녀 차이 또는 연령 차이가 특별한 의미 없이 평가에 영향을 주는 경우나, 평가자가 다른 이유를 “개인차”, “개체차”라고 하면서도 구체적으로 어떤 측면에 차이가 있는지 모르는 경우 등에서는, 평가 대상 내용이나 평가 방법에 오류가 있다고 생각할 수 있다.

평가는 공정하고 효과적이어야 신뢰할 수 있으며, 특히 교육 현장에서는 평가 내용과 방법의 엄격성이 특히 요구된다. 또한, 많은 사람이 평가의 가치와 척도를 공유함으로써, 평가 자체가 가진 가치가 높아진다고 알려져 있다.

참조

_[1] 웹사이트 2. What Is Evaluation? http://www.icap.org/[...] International Center for Alcohol Policies 2012-05-13
_[2] 웹사이트 WHAT is evaluation? http://www.evaluatio[...] The Evaluation Trust 2002-03-13
_[3] 서적 Curriculum evaluation Rand McNally
_[4] 서적 Evaluation: A systematic approach Sage
_[5] 학술지 Evaluating the evaluation: Understanding the utility and limitations of evaluation as a tool for organizational learning
_[6] 학술지 How Legitimate and Justified are Judgments in Program Evaluation?
_[7] 웹사이트 Evaluation Purpose http://www.edtech.vt[...] Learning Technologies at Virginia Tech 2012-05-13
_[8] 서적
_[9] 학술지 Psychology and the art of program evaluation
_[10] 서적 GEF Evaluation Office Ethical Guidelines http://www.thegef.or[...] Global Environment Facility Evaluation Office 2011-11-20
_[11] 웹사이트 News and Events http://www.wmich.edu[...] Joint Committee on Standards for Educational Evaluation 2012-05-13
_[12] 웹사이트 AMERICAN EVALUATION ASSOCIATION GUIDING PRINCIPLES FOR EVALUATORS http://www.eval.org/[...] American Evaluation Association 2004-07
_[13] 웹사이트 UNEG Home http://www.uneval.or[...] United Nations Evaluation Group 2012-05-13
_[14] 웹사이트 Monitoring & Evaluation for Results Evaluation Ethics What to expect from your evaluators http://siteresources[...] The World Bank Group 2012-05-13
_[15] 웹사이트 DAC Network On Development Evaluation http://www.oecd.org/[...] OECD 2012-05-13
_[16] 웹사이트 Evaluation Cooperation Group http://www.ecgnet.or[...] ECG 2013-05-31
_[17] 간행물 Assumptions underlying evaluation models
_[18] 학술지 An analysis of alternative approaches to evaluation https://www.jstor.or[...]
_[19] 웹사이트 評価（ひょうか）とは？意味・読み方・使い方をわかりやすく解説 - goo国語辞書 https://dictionary.g[...] goo 2024-12-21

본 사이트는 AI가 위키백과와 뉴스 기사,정부 간행물,학술 논문등을 바탕으로 정보를 가공하여 제공하는 백과사전형 서비스입니다.
모든 문서는 AI에 의해 자동 생성되며, CC BY-SA 4.0 라이선스에 따라 이용할 수 있습니다.
하지만, 위키백과나 뉴스 기사 자체에 오류, 부정확한 정보, 또는 가짜 뉴스가 포함될 수 있으며, AI는 이러한 내용을 완벽하게 걸러내지 못할 수 있습니다.
따라서 제공되는 정보에 일부 오류나 편향이 있을 수 있으므로, 중요한 정보는 반드시 다른 출처를 통해 교차 검증하시기 바랍니다.

문의하기 : help@durumis.com

평가
지도 정보
개요
정의	어떤 주제의 가치, 중요성, 의미를 체계적으로 결정하는 과정
목적	개선할 점이나 개선 방향을 찾아내는 것 효과성 검토 의사결정 과정 지원
사용 분야	정책 사업 교육 프로그램 개인 기관 그 외 다양한 분야
평가 방법
질적 평가	인터뷰, 설문 조사, 사례 연구 등의 질적 데이터 수집 주관적 경험과 의견 분석 심층적인 이해와 맥락 파악에 중점
양적 평가	통계, 지표, 데이터 분석 등의 양적 데이터 수집 객관적 측정과 수치화에 중점 일반화 및 경향성 분석에 용이
과정 평가	사업이나 프로그램의 실행 과정에 대한 평가 계획대로 진행되고 있는지, 문제점은 없는지 등을 파악
결과 평가	사업이나 프로그램의 결과에 대한 평가 목표 달성도, 효과성, 효율성 등을 평가
평가 요소
적절성	목표와 활동의 부합성, 필요성, 시급성 등 평가
효율성	자원 투입 대비 산출 성과, 비용 효과성 평가
효과성	의도한 목표 달성 정도, 성과 수준 평가
영향력	장단기적 변화, 사회적 파급 효과 평가
지속가능성	장기적으로 유지 가능 여부, 재정적 안정성 평가
형평성	혜택의 공정한 분배, 소외 계층 고려 여부 평가
기타
관련 용어	사정 (assessment) 감정 (appraisal) 측정 (measurement) 감사 (audit)