인공지능(AI)의 능력이 날로 진화하고 발전하면서 수능 국어 영역에서도 놀라운 성과를 보이고 있습니다.
19일 공개된 '수능 국어 LLM 리더보드'에 따르면, 올해 9월 출시된 오픈AI의 챗GPT o1-프리뷰 모델이 2025년도 수능 국어 영역에서 원점수 97점으로 1등급을 기록했습니다. 이는 단 한 문제만 틀리고 나머지 문제를 모두 맞춘 결과로, 선택 과목으로는 '화법과 작문'을 선택했으며 추정 등급컷은 93~95점 수준으로 평가되었습니다.
오픈소스 소프트웨어 웹사이트인 깃허브(GitHub)에는 총 5개의 AI 모델이 2025학년도 수능 국어 영역을 푼 결과가 공개되었습니다. 이 모델들은 모두 챗GPT를 기반으로 하며, o1 프리뷰, o1 미니, GPT4o, GPT4o 미니, GPT3.5 터보가 포함되었습니다. 이번 테스트는 국내 AI 연구기업 마커AI에서 진행한 프로젝트로, 10년치 수능 국어 시험을 바탕으로 주요 LLM의 성능을 평가하는 것을 목적으로 하였습니다.
가장 높은 점수를 기록한 모델은 오픈AI의 최신 모델인 o1 프리뷰로, 원점수 97점을 받아 1등급을 달성했습니다. o1 미니와 GPT4o는 각각 78점과 75점을 기록해 추정 등급컷 4등급에 해당하였고, GPT4o 미니는 5등급(원점수 59점), GPT3.5 터보는 8등급(원점수 16점)으로 추정되었습니다.
Korean-SAT-LLM-Leaderboard/Korean_README.md at main · Marker-Inc-Korea/Korean-SAT-LLM-Leaderboard
Korean SAT leader board. Contribute to Marker-Inc-Korea/Korean-SAT-LLM-Leaderboard development by creating an account on GitHub.
github.com