"GPT-4 잡을 더 센 놈 온다"… 구글, 새 LLM '제미니' 테스트 시작
구글이 차세대 대규모언어모델(LLM) ‘제미니’ 출시를 앞두고 일부 기업 상대로 기능 테스트 시작했다. 제미니는 생성형 인공지능(AI) 챗GPT를 개발한 오픈AI의 LLM GPT-4 대항마로 알려져 있다. 제미니의 파라미터(매개변수)는 1조개로 알려져 있음. 5000억개로 추정되는 GPT-4보다 2배 큰 규모다. 올해 말 출시되면 ‘마이크로소프트(MS) 오픈AI 동맹’과 구글 간의 AI 경쟁이 한층 격화할 전망이다.
16일(현지시간) 로이터 등 외신과 관련 업계에 따르면 구글은 최근 일부 기업에 제미니의 초기 버전을 제공하고, 이에 대한 테스트에 들어갔다. 구글은 제미니를 AI 리더십 회복에 큰 역할을 할 것으로 기대하고 있다. 지난해 말 MS의 지원을 등에 업은 오픈AI가 챗GPT를 출시해 생성형 AI 시장의 주도권을 가져가자, 구글은 올해 이 부분에 대한 투자를 강화해왔다.
제미니는 텍스트 요약 생성, 코딩은 물론 이미지까지 만들어내는 ‘멀티모달’ 기능이 탑재될 것으로 보인다. 멀티모달이란 텍스트, 이미지, 음성 등 여러 종류의 데이터를 동시에 처리할 수 있는 기술을 뜻한다. 생성형 AI가 텍스트 기반을 넘어 다양하고 복잡한 정보를 이해하고 처리할 수 있게 되는 것이다. 제미니의 파라미터는 1조개에 달할 것으로 알려졌다. 이는 5000억개로 추정되는 GTP-4보다 2배 큰 규모다. 파라미터는 생성형 AI가 정보를 학습하고 기억하는 두뇌 역할을 한다. 파라미터 규모가 클수록 보다 복잡한 성능을 구현할 수 있다.
이런 멀티모달 기능은 지난 3월 출시된 GPT-4에도 탑재돼 있다. 예를 들어 밀가루, 우유, 계란 사진을 제시하고 “이 재료들로 무엇을 만들 수 있을까”라고 물어보면 팬케이크, 와플 등의 요리법을 알려준다. 또한 무거운 추가 달린 풍선 사진을 보여주고, “줄을 자르면 어떻게 될까”라고 물어보면 “풍선이 하늘로 날아간다”고 답변한다. 다만, GPT-4는 텍스트를 입력했을 때 이미지를 만들어주는 기능은 없다. 구글 제미니는 ‘텍스트 입력 시 이미지 생성’ 기능도 탑재될 전망이다. 제미니의 멀티모달 기능이 GPT-4보다 얼마나 더 우수한가에 따라 MS-오픈AI 동맹과 구글 간의 AI 주도권 경쟁에서 구글이 다시 주도권을 쥘 수 있을 것이라는 관측이 나온다.
제미니는 테스트를 거쳐 올해 말 출시될 것으로 보인다. 로이터는 구글의 기업용 클라우드 서비스인 ‘구글 버텍스 AI’를 통해 제미니를 기업에 제공할 계획이라고 보도했다. 다만, 이번에 일부 기업에 제공된 버전은 초기 버전으로 GPT-4와 비슷한 수준은 아닌 것으로 알려졌다.
실리콘밸리=최진석 특파원 iskra@hankyung.com