Publicado em:

12/11/2025

ElevenLabs Lança Marketplace Ético de Vozes Icônicas

A ElevenLabs acaba de dar dois passos gigantescos para consolidar um ecossistema completo de áudio por IA. A empresa, já referência em síntese de voz, lançou seu Iconic Voice Marketplace, uma plataforma que redefine o licenciamento de identidade auditiva para marcas, ao mesmo tempo que apresentou o Scribe v2 Realtime, um modelo de reconhecimento de fala (speech-to-text) de altíssima performance.

Isso sinaliza uma nova fase de maturidade para o mercado de IA de áudio, focada não apenas na capacidade técnica, mas na comercialização ética e em escala.

O Marketplace: Voz como Identidade Licenciada

O novo marketplace permite que empresas e criadores de conteúdo licenciem legalmente vozes de IA de alta fidelidade de figuras renomadas. Estamos falando de lendas como Michael Caine e Liza Minnelli, e até de recriações de figuras históricas, como Mark Twain, a partir de gravações existentes.

O ponto-chave é o modelo de negócios:

  • Intermediação Ética: A ElevenLabs atua como intermediária, conectando as marcas diretamente com os detentores dos direitos da voz (sejam os próprios artistas ou seus representantes).
  • Transparência e Remuneração: Todas as vozes são verificadas, usadas com permissão explícita e garantem remuneração aos talentos. Isso resolve um dos maiores gargalos éticos da clonagem de voz.

Michael Caine, que participa do projeto, destacou a iniciativa como uma forma de "dar a todos as ferramentas para serem ouvidos". Para as marcas, isso abre a possibilidade de usar vozes icônicas em anúncios e conteúdos digitais, garantindo autenticidade e segurança jurídica.

Scribe v2: A IA que Escuta em Tempo Real

Para complementar a "saída" (síntese de voz), a ElevenLabs otimizou a "entrada" (reconhecimento de voz). O Scribe v2 Realtime foi apresentado como o modelo de speech-to-text mais preciso e rápido do mercado.

Os dados técnicos são impressionantes:

  • Latência: Transcrição ao vivo em menos de 150 milissegundos.
  • Precisão: 93,5% de acurácia.
  • Alcance: Suporte para 6 idiomas principais e mais 90 em processamento.

A aplicação disso na inovação corporativa é imediata: assistentes de voz que respondem instantaneamente, ferramentas de reunião que transcrevem em tempo real e legendas ao vivo de alta fidelidade.

Por que isso importa?

A ElevenLabs não está apenas lançando produtos; está construindo um ecossistema de áudio verticalmente integrado.

De um lado, a IA agora pode entender o que é dito com precisão e velocidade (Scribe v2). Do outro, ela pode responder não com uma voz robótica genérica, mas com uma voz icônica e licenciada (Marketplace).

Para líderes de inovação e startups, a pergunta muda. Não é mais "Podemos usar IA para voz?", mas sim: "Qual deve ser a identidade auditiva da nossa marca na era da IA, e como podemos garanti-la de forma ética?"