유료 구독자 전용
무료 회원 공개
전체 공개
2026 수능 문제지를 생성형 AI에게 풀게 한다면?
순천향대학교 컴퓨터소프트웨어공학과 소속 구유겸 학생이 2026학년도 대학수학능력시험 주요 과목 문제 풀이 결과를 깃허브에 공개하며 주요 글로벌 인공지능(AI) 모델들의 학업 성취도에 대한 관심이 집중되고 있습니다. 이번 실험은 GPT-5.1, 구글 제미나이 2.5 플래시 등 최신 대형 언어 모델(LLM) 및 소형·구형 모델 15종을 대상으로 진행됐습니다. 오픈AI, 구글, 앤트로픽, xAI, 딥시크의 모델들이 활용되었으며 특히 오픈AI는 6종, 구글은 제미나이 2.5 프로·플래시·플래시 라이트 3종이 투입됐습니다. 평가 체계는 실제 수능과 동일하게 국어·수학·영어·한국사·탐구(물리 I·화학 I) 포함 총 450점 만점 기준으로 설계됐습니다. 채점 방식은 모델이 제시한 답안을 한국교육과정평가원 공식 정답과 대조하는 방식으로 실제 수험 환경을 구현했습니다. 단, 딥시크 모델은 이미지 인식을 지원하지 않아 모든 문항이 텍스트 기반으로 풀이됐습니다. 국어 영역에서는 GPT-5.1이 평
로그인한 회원만 댓글을 쓰고 읽을 수 있습니다.