Gemini란?
Gemini(제미나이)는 Google과 DeepMind가 개발한 멀티모달 생성형 인공지능(AI) 모델입니다. 기존의 텍스트 기반 AI 모델과 달리 텍스트뿐만 아니라 이미지, 오디오, 비디오 등 다양한 입출력을 지원하는 것이 특징입니다.
Google은 이를 MMLU(Massive Multitask Language Understanding) 벤치마크를 기반으로 평가하며, AI 모델의 성능을 지속적으로 개선해 나가고 있습니다. 이번 블로그에서는 Gemini의 주요 버전 및 특징을 알아보겠습니다.
Gemini의 주요 버전 및 특징
Gemini 1.0
2023년 5월 10일, Google I/O 2023에서 처음 공개된 Gemini 1.0은 AI 분야에서 큰 관심을 받았습니다. 이후 12월 6일에 Ultra, Pro, Nano 세 가지 모델로 나뉘어 출시되었습니다.
- Ultra: 최고 성능을 가진 모델로 2024년부터 "Gemini Advanced"로 적용되었습니다.
- Pro: Google의 Gemini 앱(구 바드)에 기본 적용되었습니다.
- Nano: 작은 크기의 AI 모델로, Pixel 스마트폰 등에 온디바이스 AI 모델로 탑재되었습니다.
Gemini 1.0 Ultra는 GPT-4보다 많은 매개변수를 사용하며, 대규모 멀티태스킹 언어 이해(MMLU) 평가에서 90%의 정답률을 기록해 인간 전문가(89.8%)를 뛰어넘는 성과를 보였습니다.
Gemini 1.5
2024년 2월 15일에 공개된 Gemini 1.5는 컨텍스트 처리 능력이 대폭 향상되었으며, 멀티모달 기능이 강화되었습니다.
- 44분짜리 무성영화를 입력하고 특정 장면을 찾아내는 기능을 시연해 주목을 받았습니다.
- Gemini 1.0 Pro 대비 87% 성능 향상이 이루어졌습니다.
- Google I/O 2024에서는 속도를 더욱 개선한 Gemini 1.5 Flash 모델이 공개되었습니다.
Gemini 2.0
2024년 12월 6일에 AI Studio에서 조용히 공개된 Gemini 2.0 Pro 모델은 기존 모델보다 더욱 발전된 기능을 제공합니다.
- 2024년 12월 12일 Flash 모델 실험버전 공개
- 2024년 12월 19일 "Thinking" Experimental 모델 실험버전 공개
- 2025년 1월 22일에는 업데이트 버전이 출시되어 최대 100만(1M) 토큰까지 대화가 가능해졌습니다.
Gemini의 장점
- 빠른 응답 속도: Gemini는 Google Bard의 강점이었던 빠른 답변 속도를 유지하며, 한 가지 질문에 대해 세 가지 유형의 답변(정보 기반, 분석 및 통찰, 창의적인 답변)을 제공합니다.
- 우수한 문학적 능력: 영어로 된 소설 창작과 번역 성능이 뛰어나며, AI 모델 중에서도 창의적 표현 능력이 우수한 것으로 평가받고 있습니다.
- 대용량 컨텍스트 지원: Gemini 1.5 Pro는 최대 200만(2M) 토큰 컨텍스트를 지원하며, 이는 2시간 이상의 동영상이나 긴 문서 분석이 가능함을 의미합니다.
Gemini의 단점과 논란
- 융통성 부족: 일부 질문에 대한 정확한 답변을 하지 못하거나, 논란이 되는 주제에 대해 회피하는 경향이 있습니다.
- 높은 검열 수준: 특정 뉴스나 정치적 이슈에 대해 답변을 피하거나 오래된 정보를 제공하는 경우가 있습니다.
- 다국어 논리력 부족: 영어 외 다른 언어에서는 논리적 이해력이 떨어지는 경우가 보고되었습니다.
- 잦은 오류: 다국어 사용 시 문장에 다른 언어 단어가 섞이거나, 제공되는 3가지 답변이 거의 유사한 경우가 종종 발생합니다.
시연 영상 조작 논란
Google이 Gemini의 성능을 강조하기 위해 시연 영상을 편집한 사실이 밝혀졌습니다. 실제보다 더 빠르고 정확한 응답을 보여주기 위해 영상 속도를 조작했다는 지적이 있었으며, 이에 대해 Google은 "AI의 상호작용을 이해하기 쉽게 만들기 위한 편집"이라고 해명했습니다.
PC주의 논란
Gemini는 정치적 올바름(PC주의) 논란에 휘말리기도 했습니다. 역사적 인물 이미지 생성 시 원래 백인이었던 인물을 흑인으로 표현하는 등 과도한 정치적 편향성을 보였다는 지적이 나왔습니다. 이에 대한 논란이 커지면서 Google은 내부 정책 조정을 검토하고 있습니다.
마무리
Gemini는 Google과 DeepMind의 최첨단 AI 기술이 집약된 모델로, 멀티모달 기능을 통해 다양한 입출력을 지원하는 강력한 AI입니다.
빠른 응답 속도와 강력한 문맥 이해 능력 등 여러 장점이 있지만, 검열 문제나 언어적 한계 등 해결해야 할 과제도 남아 있습니다. AI 기술이 지속적으로 발전하는 만큼, 앞으로 Gemini 시리즈가 어떻게 진화할지 기대됩니다.
'IT' 카테고리의 다른 글
딥시크 DeepSeek 관련주 총정리 | 국내 AI 반도체 수혜주는? (2) | 2025.02.07 |
---|---|
딥시크란? DeepSeek AI 뜻 | 모델 특징 및 기술 총정리 (1) | 2025.02.03 |
닌텐도 스위치2 출시일 임박! | 2세대 디자인, 가격, 사양 완벽 분석 (0) | 2025.01.17 |