6. Overall Quality Rating지금까지 검토했던 채점 항목들 즉 Writing Quality, Verbosity, Instruction Following, Truthfulness, Harmful/Safety 5개 채점항목을 뭉뚱그려 종합 평가(Overall Quality Rating)해 보자.Response에 심각한 오류가 있을 경우는 Bad 이다.심각한 오류로는 첫번째 haluucination 즉 착각 할만한 잘못된 정보일때, 이는 AI가 상당히 교활하므로 그렇싸하게 Response 를 조작하는 것은 일도 아니라는 점에 유의해야 한다. Response 요놈 내용을 뜯어보니 Prompt 요구대로 하지 않고 있다는 것이 명확하면 두번째 심각한 오류로서 Instruction Following ..