교육

영어 학습 평가 도구의 요건

with e.you 2023. 8. 17. 22:25

학습 평가 도구 요건

학습 평가 도구는 평가의 목적에 맞아야 하고 믿을 만한 결과를 나타내 주어야 하며 평가 도구는 평가를 시행할 수 있는 현실적인 여건에 맞아야 합니다. 일반적으로 평가 도구는 타당도, 신뢰도, 실용도가 높아야 합니다. 이중 타당도란 어떤 평가 도구가 측정하고자 의도하는 것을 얼마나 효과적으로 측정하느냐에 관한 것으로 즉 타당도란 평가의 목교에 관한 개념으로서 평가자가 의도하는 것을 전부, 혹은 어느 정도 측정하느냐에 관한 것입니다. 따라서 평가 도구는 원천적으로 좋거나 나쁜 것이 존재하는 것이 아니라 특정한 상황에 적용되었을 때 좋으냐 나쁘냐가 결정되는 것입니다. 그래서 어떤 평가든지 그 평가의 목적에 비추어 볼 때 타당하거나 타당하지 않다고 말할 수 있는 것이지, 모든 목적에 다 타당한 평가란 있을 수 없는 것입니다. 타당도는 세부적으로 내용 타당도, 예측 타당도, 공인 타당도, 안면 타당도, 구인 타당도로 구분하는 것이 일반적입니다. 타당도의 종류 내용 타동도 내용 타당도란 평가 도구가 측정하고자 하는 목적에 맞는 내용을 얼마나 대표성 있게, 또 얼마나 광범위하게 선정해서 포함 시켰는지에 관한 것으로 학교 상황에서 실시하는 성취도 평가에서 내용 타동도는 교육과정의 내용 즉, 가르친 내용을 얼마나 골고루 많이 포함하고 있느냐로 판단할 수 있는데 수업에서 다룬 내용들 중에서 대표성 있는 것들을 폭넓게 포함하고 있다면 타당도가 높다고 할 수 있습니다. 그라나 전반적인 의사소통의 소지 정도를 측정하는 숙달도 교육과정이나 교육과는 무관하기 때문에 구체적으로 내용 타당도를 견주어 검증할 대상이 없습니다. 따라서 언어 사용 숙달도를 보여 주는 데 필요한 대표적인 내용을 종합적으로 포함하고 있는가가 내용 타당도를 정하는 기준이 될 수 있을 것입니다. 보통 평가 문항의 내용을 선정할 때에는 교육의 내용이나 의사소통능력의 구성 요소와 내용을 전부 다 포함시킬 수는 없기 때문에 그중 일부를 선정할 수밖에 없는데, 그 내용을 선정할 때 어느 것을 어느 정도 선정하여 포함시키느냐가 매우 중요합니다.

 

또 다른 하나는 예측 타당도가 있는 평가 결과가 수험자가 어떤 일이나 활동 등을 얼마나 성공적으로 수행할 수 있을지 예측해 주느냐에 관한것으로 예를 들어 TOESL은 외국 학생들이 미국에서 대학 수준의 공부를 하는 데 필요한 수준의 영어능력을 측정하는 시험입니다. 만약 미국의 대학에 입학하여 공부하는 학생들의 입학 전 테솔 점수와 대학 1학년 재학 후 성적의 평점 평균 간의 상관관계를 계산해 보아서 두 성적 간의 상관관계가 높게 나온다면 즉, 입학 전 테솔 성적이 높은 학생들이 대학에서의 성적도 높게 나오고 입학 전 테솔 성적이 낮은 학생은 대학에서의 성적도 낮게 나오는 경향을 보인다면, 테솔은 그 목적에 대한 예측 타당도가 높다고 할 수 있을 것입니다. 평가의 타당도는 높을수록 좋은 이유는 타당도를 높이기 위해서는 타당도를 저해하는 요인이 무엇인지를 알고 대처하는 것이 현명한 일입니다. 평가의 타당도를 저해하는 요인도 알아봐야 하는데 첫 번째 평가 방법의 불합리성으로 만약 말하기 평가를 지필 시험으로 본다면 그 평가는 방법을 잘못 선택한 것입니다. 이런 경우 그 지필 시험은 말하기 평가로서의 타당도가 낮을 수밖에 없다. 평가 문항이 교육의 목표나 내용과 일치하지 않거나 교육내용의 범위를 균형 있게 포함하지 못한 경우, 가르치지 않은 내용을 포함하는 경우나 특정 내용을 집중적으로 포함하고 그 외의 내요은 포함시키지 않은 경우 등은 평가의 내용을 적절하게 선정했다고 할 수 없을 것입니다. 이런 경우 평가의 타당도는 저해되며 이 문제를 해결하기 위해서는 평가계획서를 보다 면밀하게 짜고, 평가 전문가의 검토를 받아 수정하거나 보완하는 것이 필요합니다. 두 번째로는 평가 기준 선정의 부적절성 이를테면 말하기 평가에서 평가 기준 자체가 너무 복잡하거나 부적절하다면 그 평가 기준을 적용해서 나온 평가 결과도 일관성이 부족하거나 부적절할 것입니다. 즉, 평가하고자 하는 바를 효과적으로 측정하지 못하게 될 것이며, 그러므로 평가의 내용이나 방법 등이 적절하다 하더라도 평가 기준 자체가 부적절하다면 그로 인해 그 평가 전체는 타당도에 손상을 입는 결과를 가져올 것입니다. 한 가지 더 평가 내용의 과대 간소화는 인간이 지닌 언어능력의 구성 요소는 매우 복잡하고 다양하고 이런 언어 능력을 한 번의 평가로 충실하게 측정하기는 현실적으로 어렵습니다. 그렇다고 해서 그 복잡한 언어능력을 평가의 편의를 위해 인위적으로 지나치게 간소화하여 평가의 대상으로 삼는다면 그것은 인간의 복잡한 언어능력의 구성 요소 중 상당 부분을 평가의 대상에서 제외하나 결과를 초래하게 될 것입니다. 그럴 경우 본질적인 언어능력 측정이라는 평가의 목표에 맞지 않게 되고, 따라서 평가 목적을 달성하지 못하는 꼴이 되어 평가의 타당도가 저해된다고 볼 수 있습니다. 마지막으로 특정 수험자 집단에 대해 높은 변별도를 나타내어 좋은 문항 즉, 타당도가 높은 문항이라고 여겨지는 문항들이 다른 수험자 집단에 대해서는 좋지 않은 문항으로 나타날 수도 있고 이것은 수험자 집단의 성격에 따라 평가의 타당도가 다르게 나타날수 있다는 것을 보여 줄 수 있으므로 타당도를 산정하는 준거 집단이 평가의 목적에 맞는 집단 이어야 합니다.