arenadigital

a

Radar IA

Podcasts

Gemma 4 12B: a inteligência artificial do Google que analisa vídeo e áudio diretamente no seu computador portátil

4 Junho 2026

Durante anos, a ideia de ter uma inteligência artificial poderosa a correr localmente, sem depender de servidores na nuvem, pertencia ao reino da ficção científica para o utilizador comum. Era território reservado a grandes empresas com infraestruturas caríssimas. O Google acaba de mudar essa equação de forma significativa com o lançamento do Gemma 4 12B, um modelo de inteligência artificial de código aberto capaz de processar texto, imagens, áudio e vídeo, e que foi desenhado para funcionar em hardware acessível, como um computador portátil de gama média.

O que significa “12B” e por que é que isso importa?

O número “12B” refere-se a 12 mil milhões de parâmetros. Pensemos nos parâmetros como os neurónios de um cérebro artificial: quanto mais existirem, maior a capacidade de raciocínio do modelo. Durante muito tempo, os modelos com esta dimensão exigiam servidores com dezenas de placas gráficas profissionais, o tipo de equipamento que custa centenas de milhares de euros. O que o Google conseguiu com o Gemma 4 12B foi otimizar a arquitetura ao ponto de este modelo funcionar de forma fluida em computadores portáteis com placas gráficas de consumidor, como as da linha NVIDIA RTX ou mesmo em chips Apple Silicon.

A analogia mais próxima é a da evolução dos automóveis: durante décadas, ter um motor V8 de alta performance exigia um veículo enorme e um depósito de combustível igualmente grande. A engenharia moderna conseguiu colocar essa potência num carro compacto, sem sacrificar a experiência de condução. O Gemma 4 12B faz o mesmo com a inteligência artificial.

Multimodal e local: a combinação que muda tudo

O grande salto qualitativo desta versão não é apenas o tamanho reduzido para a potência oferecida. É a capacidade multimodal a correr de forma local. Isso significa que o modelo consegue, no mesmo sistema e sem enviar dados para qualquer servidor externo, analisar uma fotografia e descrever o seu conteúdo, transcrever e interpretar o que foi dito numa gravação de áudio, e compreender o contexto de um clipe de vídeo, identificando objetos, ações e padrões ao longo do tempo.

Para os utilizadores comuns, isto abre portas muito concretas. Um jornalista pode transcrever e resumir automaticamente entrevistas gravadas sem pagar por serviços de nuvem. Um criador de conteúdo pode analisar os seus próprios vídeos para gerar descrições ou legendas. Um investigador pode processar dados sensíveis sem que esses dados saiam do seu dispositivo, o que representa uma vantagem enorme em termos de privacidade e conformidade com regulamentações como o RGPD.

Código aberto: a filosofia que multiplica o valor

O facto de o Gemma 4 12B ser lançado em código aberto não é um detalhe técnico secundário. É uma decisão estratégica com implicações profundas para toda a comunidade tecnológica. Quando um modelo desta capacidade é disponibilizado livremente, qualquer programador, startup ou universidade pode estudá-lo, modificá-lo e construir aplicações em cima dele sem pagar licenças ou depender da política comercial de uma única empresa.

É como a diferença entre comprar um automóvel selado onde o motor não pode ser tocado, e receber os planos completos de engenharia com permissão total para modificar, melhorar e até construir uma versão própria. O ecossistema que se cria em torno de modelos abertos tende a inovar muito mais rapidamente, porque milhares de mentes diferentes trabalham em paralelo sobre a mesma base.

O que muda na prática para quem usa tecnologia em Portugal

Para os utilizadores da Arena Digital, o impacto mais imediato é a democratização do acesso a ferramentas de análise de conteúdo sofisticadas. Até agora, ter um assistente capaz de ver um vídeo, ouvir áudio e responder com contexto exigia subscrições pagas a serviços como o GPT-4o ou o Gemini Advanced. Com o Gemma 4 12B, esse tipo de capacidade pode ser integrado em ferramentas gratuitas e de código aberto como o LM Studio ou o Ollama, que qualquer pessoa pode instalar num computador portátil moderno.

A barreira de entrada para experimentar inteligência artificial de ponta nunca foi tão baixa. E isso, no fundo, é a notícia mais importante de todas.

Fonte: Notícia Original

Este artigo baseia-se em factos reportados originalmente pela fonte indicada, analisados para te trazer uma visão aprofundada sobre os prós, contras e consequências práticas da tecnologia no seu quotidiano. O conteúdo foi gerado com o apoio de Inteligência Artificial, sob curadoria e revisão rigorosa da equipa Arena Digital. Partimos da notícia original para garantir a precisão, acrescentando a nossa análise sobre o impacto desta inovação no seu negócio ou quotidiano.

Mais artigos

Radar IA

Como o maior IPO da história pode mudar o que sabemos sobre investir em tecnologia espacial

Radar IA

O que o maior investimento em IA e emprego significa para o futuro do trabalho em Portugal

Radar IA

O que muda para nós quando o Google deixa de depender de um único fabricante de chips de IA

Radar IA

Por que a Amazon está a pedir emprestado milhares de milhões para apostar em inteligência artificial

Podcast Arena Digital

Day(s)

:

Hour(s)

:

Minute(s)

:

Second(s)