과연 구글의 반격일까? 인간의 능력을 뛰어넘은 구글 Gemini 공개👽 #28호

구글 차세대 LLM Gemini 공개, 텍스트, 이미지, 음성 동시 처리하는 멀티모달

2023. 12. 12.

이 메일이 잘 안보이시나요?

2023.12.13｜028호｜구독하기

"반격일까, 무리수일까? 구글 제미나이(Gemini) 공개"

구글이 6일(현지시간) 오픈AI의 챗GPT-4에 맞설 대항마로 차세대 생성형 인공지능 Gemini를 공개했습니다.

지난 주 구글이 최종적으로 테스트하는 과정에서 비영어권 프롬프트 오류를 발견하여 제미나이 출시일을 내년 초로 미루겠다는 소식🔗을 전했는데요. 구글은 당초 예정했던 날 제미나이를 공개했습니다. 다만 외신들이 언급한 오류들이 해결되었는지 여부는 밝혀지지 않았습니다.🤔

구글은 제미나이가 오픈AI의 GPT-4보다 우수한 성능을 제공한다고 강조했는데요. 과연 사실일까요? 어떤 기능이 있을지 함께 보시죠✨

📢Today's topic

1. 멀티모달 방식의 차세대 생성형AI 제미나이 공개

2. '제미나이 1.0' 크기와 성능에 따라 3가지 최적화 버전

3. 과연 구글의 반격일까? 오픈AI를 향한 성급한 견제구일까

1. 오픈AI 대항마, 구글 차세대 언어모델 Gemini 공개

32개 지표 중 30개에서 앞 서...GPT-4보다 뛰어넘는 최고 성능 언어모델 제미나이(Gemini)

<출처- google>

구글은 6일(현지시간) '가장 유능하고 범용적인 AI 모델 제미나이' 제목의 온라인 간담회를 통해 최고 성능 언어모델 제미나이(Gemini)를 공개했습니다. 제미나이는 텍스트, 이미지, 오디오 등을 동시에 인식하고 이해하는 것은 물론 수학 문제를 풀거나 추론하는 것도 가능한 멀티모달입니다.

특히 제미나이의 최상위 버전인 Gemini Ultra는 테스트 결과 오픈AI GPT-4의 성능을 뛰어 넘는다고 발표했습니다. 구글 딥마인드 최고경영자 Demis Hassabis는 "Gemini Ultra는 수학, 물리학, 역사, 법률, 의학, 윤리 등 57개 과목을 조합하여 지식, 문제 해결 능력을 테스트하는 MMLU(대규모 다중작업 언어 이해)에서 90%의 점수를 얻었다"며 "인간 전문가 점수인 89.8%를 넘은 첫 AI 모델"이라고 밝혔습니다.

<출처-구글 블로그>

구글 제미나이는 개발 초기부터 멀티모달로 설계되어 기존보다 개념적이거나 복잡한 추론도 가능합니다. 구글 제미나이가 공개한 영상에 따르면 고무 오리를 보고 성분을 분석해 물에 뜰지 안뜰지 예측하고 야바위를 하는 등 시청각을 활용해 텍스트 뿐만 아니라 이미지, 음성, 영상 등으로 상호작용 할 수 있습니다. 구글은 현재 가장 우수한 모델인 GPT-4와 비교표를 공개하며 32개 지표 중 30개가 앞서 있다고 강조했습니다.

다만 국내외 전문가들은 제미나이가 실제로 GPT-4 모델에 비해 월등히 우수하다는 능력은 알 수 없다며, 미국 매사추세츠 공과 대학(MIT) 테크놀로지리뷰 사이트🔗에서는 '제미나이가 놀라워 보이지만, 과대 광고 일 수 있다'는 전문가들의 의견을 게제했습니다.

🔗구글 딥마인드 Gemini 소개 바로가기

2. '제미나이 1.0' 크기와 성능에 따라 3가지 버전으로 나눠

제미나이의 첫번째 버전인 '제미나이 1.0'은 크기와 성능에 따라 3가지 버전으로 최적화되었습니다.

Gemini Ultra: 구글이 지금까지 내 놓은 가장 강력한 LLM이자 데이터 센터와 기업용 모델
Gemini Pro: 광범위한 작업에 걸쳐 확장할 수 있는, 구글 AI 챗봇 바드의 중추가 될 최고의 모델
Gemini Nano: 스마트폰 등 온디자이스 작업을 위한 가장 효율적인 모델

구글은 제미나이를 두 단계 걸쳐 바드에 적용하겠다는 계획을 세웠습니다. 우선 이 날부터 가장 범용으로 쓰이는 'Gemini Pro'는 구글 AI 챗봇 서비스인 바드에 탑재되었습니다.(*바드는 지금까지 PaLM2를 사용했습니다.) 현재는 170개 이상 국가 및 지역에서 영어로 제공되며, 향후 서비스 확장 및 새로운 지역과 언어도 지원될 예정입니다. 'Gemini Ultra'는 내년 초 '바드 어드밴스드'라는 이름으로 바드에 장착될 예정입니다.

'Gemini Nano'는 스마트폰, PC 등에서 클라우드 연결 없이 구동되는 모델로 구글이 지난 10월 공개한 자사 스마트폰 '픽셀8 프로'에 탑재🔗하여 온디바이스 인공지능 스마트폰 경쟁을 본격화할 예정입니다. 또한 개발자들이나 기업고객은 13일부터 구글 AI 스튜디오 또는 구글의 기업용 생성AI 플랫폼 버택스 AI에서 Gemini Pro를 사용할 수 있습니다.

순다르 피차이 CEO는 구글의 최종 목표는 구글의 검색 엔진, 광고 제품, 크롬 브라우저에 제미나이를 결합해 전 세계에서 사용 가능하도록 하는 것이라고 밝혔습니다.

🔗더 자세히 알아보기 *클릭 시, Google deepmind Gemini 소개 페이지로 이동합니다.

3. 구글 제미나이(Gemini) 과연 반격일까? 성급한 일격일까?

블룸버그 "느릿느릿한 검색 대기업이 챗GPT에 앞서나가는 모습을 보이기 위해 애쓰고 있다”

<출처-구글 시연 영상>

#구글 시연 영상 조작하다!😶‍🌫️

구글 제미나이의 등장과 함께 기대감과 비판적인 시각도 제기되고 있습니다. 8일 블룸버그🔗는 익명의 구글 직원들로부터 “확실한 사실이 아닌 내용을 (제미나이) 홍보용 동영상에 넣는 것이 대중에게 오해를 불러일으킬 수 있는지 내부 논의가 있었다"고 보도했습니다. 또한 "아직 구글 제미나이는 위 영상을 본 이용자들이 상상하는 것과 달리 매끄럽게 작동하지 않으며 구글의 일부 직원들도 이런 불일치를 지적했다"고 말했습니다.

이어 구글은 시연 영상의 '조작' 논란🔗에 휩싸였습니다. 구글도 시연이 실시간으로 진행되지않고 짜집기 편집을 통해 제작되었다고 인정했는데요. “시연은 실시간으로 진행되지 않고, 미리 준비된 이미지와 텍스트 프롬프트를 기반으로 제작되었다”며 “영상은 제미나이가 멀티모달 기능을 통해 상호작용할 수 있다는 것을 예시로 묘사한 것”이라고 밝혔습니다.

#이용자들의 실망감 표출!😟

<출처- X >

구글의 제미나이 프로가 챗봇 '바드(Bard)'에 탑재되어 사용할 수 있게 되자, 많은 이용자가 제미나이의 성능에 실망감을 드러냈습니다.

엔비디아 데이터 사이언티스트 'Bojan Tunguz'는 X(트위터)를 통해 이스라엘 전쟁에 대한 최신 업데이트를 요청했지만 잠재적인 논란을 우려해 구글 검색을 해서 찾아보라는 답변만을 받았습니다. 그는 Grok과 ChatGPT, Bing의 답변을 비교하며 제미나이 프로에 실망감을 드러냈습니다. 구글은 제미니를 소개할 때 향상된 코딩 능력을 강조하였는데 실제로는 기본적인 코딩 기능에도 어려움을 겪고 있는 상황입니다.

제미나이 모델 중 가장 성능이 좋은 '제미나이 울트라'는 내년 초 출시될 예정으로 경쟁사인 오픈AI의 견제를 위해 준비되지 않은 상태로 성급하게 공개한 것이 아니냐는 지적이 나오고 있습니다.

마무리 인사👋🏻

구글은 검색시장의 독보적인 1위를 점유하고 있습니다. 하지만 작년 오픈AI가 챗GPT를 공개하여 폭발적인 인기를 얻자 시기상조인 챗봇 '바드(Bard)'를 발표하며 주가 폭락하는 대망신을 당했습니다. 이번 구글 제미나이도 홍보 영상과 달리 이용자들의 실망감이 커지고 있어 오픈AI 기술 경쟁에 대한 무리수를 던진 것이 아니냐는 분석이 나오고 있습니다.(구글은 이미 2018년 5월 AI 음성비서 '듀플렉스' 시연 동영상에서 신뢰성 논란을 겪은 전적이 있습니다.)

무리수는 비단 구글 만의 이야기는 아닐 것입니다. 생성형AI의 시장 규모가 점차 커질 전망이 유력해지자 선두주자의 타이틀을 빼앗기지 않으려는 빅테크들의 경쟁은 심화되고 있습니다. 마이크로소프트는 오픈AI의 영리법인 지분을 49% 인수하며 단순한 투자가 아닌 합병인지 미국과 영국 규제당국의 조사🔗가 시작될 예정입니다. 또한 메타와 IBM이 주축이되어 50여 개의 기업이 'AI 얼라이언스(동맹)🔗'를 맺었습니다.

전문가들은 AI개발 경쟁 과열로 인해 이르면 3~5년 이내 AGI가 등장할 수 있다고 보고있습니다. 과연 이 경쟁의 끝은 무엇일까요?🔜

국내/외 AI Weekly News🗞️📰

*타이틀 클릭 시 기사로 이동합니다.

글로벌 소식