AIMAKORY.COM
AI꿀팁
📢 AI 소식Vibed 꼬딩2026. 4. 8.

26년 4월, 마이크로소프트가 자체 AI 모델 3개를 한꺼번에 공개!

2026년 4월 초, 마이크로소프트가 자사의 AI 브랜드인 'MAI' 라인업에 새로운 모델 세 가지를 추가했다. 음성 인식, 음성 생성, 이미지 생성 분야를 각각 담당하는 모델들로, Microsoft Foundry와 MAI Playground를 통해 개발자들에게 공개된 상태다. 이번 발표는 마이크로소프트 AI 부문 대표인 무스타파 술레이만이 직접 공표한 것으로 알려졌으며, 오픈AI나 구글 등과의 경쟁에서 자체 모델 역량을 강화하겠다는 의지를 드러낸 것이라는 평가가 나오고 있다. 세 가지 모델, 각각 어떤 역할인가 첫 번째로 공개된 MAI-Transcribe-1은 말 그대로 '듣고 받아쓰는' 기능에 특화된 모델이다. 전 세계에서 가장 많이 쓰이는 25개 언어의 음성을 텍스트로 전환하는데, 기존 마이크로소프트 애저(Azure)의 고속 전사 서비스보다 속도가 2.5배 빠른 것으로 전해진다. 또한 FLEURS라는 업계 표준 벤치마크 기준으로 11개 핵심 언어에서 1위를 기록했다고 한다. 가격은 시간당 0.36달러 수준으로 책정됐다. 두 번째는 MAI-Voice-1으로, 텍스트를 자연스러운 음성으로 변환하는 모델이다. 단순히 글을 읽어주는 수준을 넘어 감정 표현, 어조의 미묘한 뉘앙스, 화자의 고유한 목소리 특성까지 반영할 수 있다고 알려졌다. 특히 주목받는 기능은 몇 초 분량의 음성 샘플만 있으면 해당 목소리로 커스텀 음성을 만들 수 있다는 점이다. 처리 속도도 눈에 띄는데, 60초 분량의 오디오를 단 1초 만에 생성할 수 있다고 한다. 가격은 100만 글자(1M 캐릭터)당 22달러다. 세 번째는 MAI-Image-2로, 이미지 생성 분야의 모델이다. 이전 버전 대비 생성 속도가 2배 이상 빨라졌으며, 실제 사용자 트래픽 데이터 기준으로도 품질은 비슷하거나 그 이상이라는 평가다. 자연스러운 조명 표현, 정확한 피부 톤과 질감, 이미지 내 텍스트 가독성 등을 특별히 신경 썼다고 하며, 세계 최대 마케팅 그룹 중 하나인 WPP가 이미 이 모델을 실무에 도입 중인 것으로 전해진다. 가격은 텍스트 입력 기준 100만 토큰당 5달러, 이미지 출력 기준 100만 토큰당 33달러다. 마이크로소프트가 자체 모델에 공을 들이는 이유 마이크로소프트는 오픈AI와의 협력 관계를 유지하면서도, 별도로 자체 AI 모델 라인업을 구축해 온 것으로 알려져 있다. 이번 MAI 시리즈는 그 흐름의 연장선으로 볼 수 있다. AI 모델을 외부에서 조달하는 것이 아니라 직접 개발해 자사 제품인 코파일럿(Copilot), 빙(Bing), 파워포인트 등에 우선 적용하고, 이를 외부 개발자들에게도 공급하는 구조다. 업계에서는 이번 공개를 단순한 신제품 발표가 아니라, 마이크로소프트가 AI 공급망 전체를 직접 통제하려는 전략적 움직임으로 해석하는 시각도 있다. 일반 사용자에게 미치는 영향은 현재 이 세 가지 모델은 주로 개발자와 기업을 대상으로 공개된 상태다. 하지만 코파일럿, 빙, 파워포인트 등 일반인도 자주 쓰는 서비스에 순차적으로 적용될 예정이라고 하니, 실제로 체감할 날이 그리 멀지 않을 것으로 보인다. 특히 음성 인식과 이미지 생성 기능이 일상 앱에 녹아들면, 사용자 입장에서는 따로 AI 툴을 쓰지 않아도 자연스럽게 AI 기술을 경험하게 되는 환경이 만들어지는 셈이다.
조회 31

댓글 0

💬

아직 댓글이 없어요

첫 댓글을 남겨보세요!

피드AI꿀팁팀프로필