Futuro Hoje

A câmara do seu telemóvel ou os olhos da Inteligência Artificial

Gemini Live da Google e o ChatGPT Advanced Voice with Vision da OpenAI são agora capazes de ver o que nos rodeia, saber onde estamos e até ajudar a tomar decisões. O Lourenço Medeiros andou pela redação da SIC Notícias a experimentar as versões portuguesas de Inteligência Artificial com interação por voz e vídeo.

Lourenço Medeiros

São um salto importante que permite conversas mais intuitivas com as máquinas, ferramentas que usam voz, imagem e até vídeo, abrem novas possibilidades para a criatividade, resolução de problemas e assistência no dia-a-dia. Mas convém não esquecer que estão ainda no início e, por isso, sujeitas a muitos erros e às muito faladas alucinações.

O Gemini Live, que já funcionava em inglês, ficou nos últimos dias disponível em 45 idiomas, incluindo o português, e nas nossas experiências “escorrega” cada vez menos para o português do Brasil. Consegue deduzir a nossa localização com base no que "vê" através da câmara.

Inicialmente, apenas para subscritores do Gemini Advanced em dispositivos Android compatíveis, foi anunciada a disponibilidade para todos os utilizadores do Gemini Basic em dispositivos Pixel 9 e Samsung S25.

Não se limita a dizer o que vê, pode combinar roupas numa loja ou casa, ajudar a decorar uma casa ou dar conselhos de design, que escolhas destas serão sempre polémicas. Aqui não há verdades absolutas.

Não experimentámos ainda mas a Google recomenda o seu Gemini para dar conselhos passo a passo para resolver problemas ou ajudar em reparações, por exemplo quando a Internet lá de casa vai abaixo ou se precisar de trocar um pneu.

Pode ser também um assistente de cozinha, se enviarmos fotografias dos ingredientes disponíveis consegue sugerir receitas, é capaz de analisar e resumir documentos.

O ChatGPT Advanced Voice with Vision também interage através de voz, de imagens fixas e vídeos. Está disponível exclusivamente para quem paga assinaturas do ChatGPT Plus e Pro.

Os dois sistemas são um avanço muito significativo para os prometidos agentes, para o dia em que podermos usar o telemóvel como um assistente permanente, capaz de antecipar as nossas dificuldades e problemas, capaz de realizar verdadeiras tarefas como marcar um restaurante ou tratar da nossa contabilidade individual, quem sabe até oferecer recomendações de saúde e tomar a iniciativa de propor uma consulta que nem sabíamos ainda que podíamos estar a precisar.

Para quem quer preservar os seus dados, é óbvio que o uso de destes sistemas é uma potentíssima ferramenta de recolha de dados sobre a nossa forma de vida. Estes dados são habitualmente anonimizados, ou seja não podem ser associados ao utilizador mas para funções mais avançadas pode ser necessária a identificação.

Não pensamos muito nisso mas claro que sempre que pedimos a um sistema de GPS para nos indicar o caminho, o sistema tem de “saber” onde estamos e para onde vamos.

O Lourenço Medeiros andou pela redação a experimentar as versões portuguesas de Inteligência Artificial com interação por voz e vídeo.

Últimas