AWS anuncia três novos serviços Amazon de inteligência artificial

CloudInovação
0 3 Sem Comentários

A Amazon Web Services (AWS) lançou três serviços de inteligência artificial (IA) que permitem que qualquer programador crie apps que entendam linguagens naturais, transformam textos escritos em fala realista, conversem usando voz ou texto, analisem imagens e reconheçam rostos, objetos e cenas.

É mais um investimento na área de inteligência artificial, onde a empresa está a entrar com tudo.  Os serviço são o Amazon Lex, Polly e Rekognition, com base em recursos escaláveis e gerenciados – ou seja, não há necessidade de desenvolver algoritmos de aprendizagem profunda, treinar modelos de aprendizagem automática nem de se comprometer com investimentos antecipados em infraestrutura.

A ideia é que os programadores se concentrem na definição e criação de novas aplicações, que podem ver, ouvir, falar, compreender e interagir com o mundo à sua volta. Até hoje, pouquíssimos programadores conseguiram desenvolver, implementar e escalar aplicações com recursos de IA, visto que precisavam de enormes volumes de dados e especialistas em aprendizagem automática e redes neurais. A Amazon quer eliminar todo o trabalho manual e tornar a IA acessível para todos os developers de aplicações.

“A combinação de algoritmos melhores com acesso amplo a volumes enormes de dados e a capacidade computacional económica fornecida pela nuvem está a tornar a IA uma realidade para programadores de aplicações”, diz Raju Gulabani, vice-presidente de base de dados e IA da AWS.

O executivo diz que a empresa está a disponibilizar a tecnologia por trás de inovações como o assistente digital Alexa e o motor de previsão dos desejos dos clientes, por exemplo.

Conversas inteligentes com o Amazon Lex

O Amazon Lex é um novo serviço para a criação de interfaces conversacionais que utiliza voz e texto desenvolvidos com as mesmas tecnologias de reconhecimento automático de voz  e compreensão de linguagem natural utilizados no Alexa. Permite implementar recursos sofisticados de linguagem natural em praticamente qualquer app. Os programadores podem criar e testar bots (aplicativos conversacionais que realizam tarefas automatizadas, como verificar o clima ou agendar voos) diretamente do AWS Management Console, digitando algumas frases simples (“encontre um voo” ou “reserve um voo”, por exemplo), além das instruções de como obter os parâmetros necessários para completar a tarefa (data e destino da viagem, por exemplo) e perguntas de esclarecimento a serem feitas ao utilizador (“quando deseja viajar?” e “aonde deseja ir?”, por exemplo).

Os bots podem ser utilizados em qualquer lugar, de aplicações web aos de mensagens, como o Slack e Facebook Messenger, ou através da voz em aplicações de dispositivos móveis ou conectados. Além disso, os programadores não precisam de se preocupar em escalar a sua infraestrutura, uma vez que o Amazon Lex escala automaticamente de acordo com o aumento do tráfego direcionado a um bot e, assim, são apenas pagas as chamadas realizadas à API.

Fala inteligente com o Polly

O Polly possibilita a adição de recursos de fala realista a aplicações já existentes, como leitores de notícias e plataformas de e-learning, e a criação de categorias totalmente novas de produtos que tenham recursos de voz, de aplicações móveis a aparelhos domésticos. É fácil de usar: os programadores enviam textos ao Amazon Polly usando SDK ou a partir do AWS Management Console, e o Polly responde com um streaming de áudio que pode ser reproduzido diretamente ou armazenado num formato de áudio padrão.

Com 47 vozes realistas e suporte a 24 idiomas, os developers podem escolher vozes masculinas ou femininas com diversos sotaques e desenvolver aplicações para utilizadores em todo o mundo. E, como tem uma pronúncia fluída dos conteúdos de texto, as aplicações oferecem output de voz de alta qualidade em diversos formatos de texto. Os programadores pagam apenas pelo texto convertido e podem converter as falas geradas em cache, a fim de reproduzi-las quantas vezes quiserem, sem restrições.

Análise de imagem com o Rekognition

O Rekognition permite a criação de aplicações de análise de imagens e de reconhecimento de rostos, objetos e cenas. Utiliza tecnologias de aprendizagem profunda para identificar automaticamente objetos e cenas, tais como veículos, animais de estimação ou móveis, e oferece uma pontuação de confiança que permite aos programadores inserirem imagens que podem ser utilizadas na pesquisa de imagens específicas com palavras-chave.

O sistema consegue localizar rostos dentro de imagens e detectar atributos, tais como o clima e se a pessoa está a sorrir ou está de olhos abertos. Tem, também, suporte para funcionalidades avançadas de análise facial, tais como pesquisa e comparação de rostos. Utilizando o Rekognition, os programadores podem criar uma aplicação que analisa a probabilidade de correspondência entre os rostos de duas imagens diferentes a fim de verificar um utilizador mediante uma foto de referência quase que instantaneamente.

De forma semelhante, os utilizadores podem criar coleções de milhões de rostos (detectados em imagens) e podem pesquisar correspondências para a sua imagem de referência na coleção. Não há custos iniciais com o Amazon Rekognition; os developers pagam por imagem analisada e por vetor de feições faciais armazenado.

No momento, o Polly e o Rekognition estão disponíveis nas regiões leste (Ohio e norte de Virginia) e oeste (Oregon) dos EUA e na Europa (Dublin) e chegarão a outras regiões nos próximos meses. Os clientes podem se inscrever para a versão de pré-lançamento do Lex.


Clique para ler a bio do autor  Clique para fechar a bio do autor