Apple 연구원들은 텍스트와 이미지 모두에서 대규모 언어 모델을 학습하는 새로운 방법을 개발하여 더욱 강력하고 유연한 AI 시스템을 구현함으로써 인공지능과 미래의 Apple 제품에 중요한 진전을 이룰 수 있게 되었습니다.
이 연구는 "MM1: MM1: 멀티모달 LLM 사전 학습의 방법, 분석 및 인사이트"라는 제목으로 이번 주에 arxiv.org에 조용히 게시된 이 연구는 다양한 유형의 학습 데이터와 모델 아키텍처를 신중하게 결합하여 다양한 AI 벤치마크에서 최첨단 성능을 이끌어낼 수 있음을 보여줍니다.
연구진은 "이미지 캡션, 인터리브 이미지-텍스트, 텍스트 전용 데이터를 신중하게 조합하여 대규모 멀티모달 사전 학습을 수행하는 것이 여러 벤치마크에서 최신의 몇 샷 결과를 달성하는 데 중요하다는 것을 보여줍니다."라고 설명합니다. 시각 및 언어 정보를 아우르는 다양한 데이터 세트에 대한 모델 훈련을 통해 MM1 모델은 이미지 캡션, 시각적 질문 답변, 자연어 추론과 같은 작업에서 탁월한 성능을 발휘할 수 있었습니다.
시각적 구성 요소 확장이 핵심
연구진은 또한 이미지 인코더의 선택과 입력 이미지의 해상도가 모델 성능에 큰 영향을 미친다는 사실을 발견했습니다. "이미지 해상도 및 이미지 토큰 수와 함께
이미지 인코더가 상당한 영향을 미치는 반면, 비전-언어 커넥터 설계는 상대적으로 중요하지 않다는 것을 보여주었습니다."라고 연구진은 말합니다. 이는 이러한 멀티모달 모델의 시각적 구성 요소를 지속적으로 확장하고 개선하는 것이 더 많은 이점을 얻을 수 있는 열쇠가 될 것임을 시사합니다.
놀랍게도 가장 큰 300억 개의 매개변수를 가진 MM1 모델은 강력한 상황 내 학습 능력을 보여줬으며, 몇 번의 '생각의 사슬' 프롬프트를 사용하여 여러 입력 이미지에 대해 다단계 추론을 수행할 수 있었습니다. 이는 기반 언어 이해와 생성이 필요한 복잡하고 개방적인 문제를 해결할 수 있는 대규모 멀티모달 모델의 잠재력을 보여줍니다.
Apple의 10억 달러 규모의 AI 투자
MM1 연구는 애플이 구글, 마이크로소프트, 아마존과 같은 경쟁사를 따라잡기 위해 인공 지능에 대한 투자를 늘리고 있는 가운데 나온 것으로, 애플은 제품에 제너레이티브 AI 기능을 통합하는 데 앞장서고 있습니다. 최근 블룸버그 보고서에 따르면 애플은 AI 개발에 연간 10억 달러를 투자할 계획이라고 합니다.
소식통에 따르면 Apple은 "Ajax"라는 대규모 언어 모델 프레임워크와 내부적으로 "Apple GPT"로 알려진 챗봇을 개발 중이라고 합니다. 목표는 이러한 기술을 Siri, 메시지, Apple 음악 및 기타 앱과 서비스에 통합하는 것입니다. 예를 들어, AI는 개인화된 재생 목록을 자동으로 생성하거나 개발자의 코드 작성을 지원하거나 개방형 대화 및 작업 완료에 사용될 수 있습니다.
우리는 AI와 머신러닝을 기본 기술로 간주하며, 이는 우리가 출시하는 거의 모든 제품에 필수적인 요소입니다."라고 최근 실적 발표에서 팀 쿡 Apple CEO는 말했습니다. "그것이 무엇인지에 대해 자세히 설명하지는 않겠습니다. 아시다시피, 우리는 그렇게 하지 않기 때문입니다. 하지만 우리가 투자하고 있고, 꽤 많은 투자를 하고 있으며, 책임감 있게 투자할 것이고, 시간이 지나면서 이러한 기술이 핵심이 되는 제품 발전을 보게 될 것입니다."라고 말했습니다.
AI 군비 경쟁의 높은 위험성
Apple은 주요 기술 변화에 있어서는 퍼스트 무버가 아닌 패스트 팔로워의 역사를 가지고 있습니다. 하지만 AI가 디지털 환경의 모든 측면을 변화시킬 준비가 되어 있는 지금, 아이폰 제조업체가 경쟁력을 유지하기 위해서는 많은 노력이 필요합니다. MM1 연구에 따르면 Apple은 최첨단 기술을 발전시킬 수 있는 인재와 자원을 보유하고 있습니다. 하지만 비밀주의로 악명 높은 이 회사가 격화되는 AI 군비 경쟁에서 보조를 맞출 만큼 빠르게 움직일 수 있을지는 아직 미지수입니다.
많은 사람들이 6월에 열리는 Apple의 세계 개발자 컨퍼런스에서 새로운 AI 기반 기능과 개발자 도구를 공개할 것으로 예상되는 Apple의 행보에 주목할 것입니다. 그 사이에도 키프레머 애니메이션 도구와 같은 작은 AI 발전과 Apple 연구소의 성능 향상은 보이지 않는 곳에서 꾸준한 진전이 이루어지고 있음을 보여줍니다.
Cook이 최근 1분기 실적 발표에서 암시했듯이 말입니다: "올해 말 AI 분야에서 진행 중인 작업의 세부 사항을 공유할 수 있게 되어 기쁩니다." 이 작업에는 대규모의 복합 지능을 마스터하기 위한 야심찬 노력이 포함되어 있습니다. 널리 도움이 되고 인간과 유사한 AI의 시대가 생각보다 빨리 도래할 수 있으며, Apple은 이를 형성하는 데 중요한 역할을 할 계획입니다.