Amazon Rekognition ganha novas funcionalidades

Em uma publicação recente, a Amazon anunciou a adição de três novas funcionalidades ao seu serviço Rekognition. Estas novas funcionalidades possibilitam a detecção e reconhecimento de texto em imagens, a detecção de até uma centena de faces em uma imagem completa e o reconhecimento de face em tempo real entre mais de dez milhões de faces.

No evento Amazon re:Invent 2016, a Amazon apresentou o Rekognition, permitindo que desenvolvedores adicionassem a análise de imagem às suas aplicações. Agora, a Amazon está fazendo investimentos adicionais neste serviço cognitivo ao adicionar novas funcionalidades. Um adotante inicial do Amazon Rekognition é o Pinterest. Sobre este produto, Vanja Josifovski, CTO do Pinterest, disse:

Como uma plataforma visualmente dirigida, o Pinterest confia fortemente na velocidade e na qualidade de imagens, mas o texto por trás destas imagens é tão importante quanto a própria imagem, uma vez que provê um contexto e torna cada Pin acionável para nossos mais de 200 milhões de "pinadores" ativos. Trabalhando com o Amazon Rekognition para texto em imagem, melhoramos a extração de texto rico capturado em imagens em escala e com baixa latência para os milhões de Pins armazenados na Amazon S3. Procuramos continuar a desenvolver a parceria com a AWS para manter a alta qualidade e experiências rápidas para os "pinadores" e negócios que estão no Pinterest.

A Cloudinary, uma plataforma de gestão de mídia para desenvolvedores web e mobile, tem incorporado as novas funcionalidades do Rekognition aos seus serviços. Daniel Amitai, vice-presidente de desenvolvimento de negócios da Cloudinary, disse:

A Cloudinary tem trabalhado muito próxima da AWS para trazer esta solução à vida. Nossa integração com o Amazon Rekognition levou esta relação ao próximo nível, eliminando o trabalho tedioso de analisar manualmente o conteúdo da imagem e permitindo que os usuários automaticamente categorizem as imagens como parte de seus fluxos de trabalho já existentes de gestão de imagens.

A API do Amazon Rekognition disponibiliza diversas operações para reconhecimento facial e funcionalidades de análise de imagem; entre estas funcionalidades é possível destacar:

DetectFaces para detectar até uma centena dos maiores rostos em uma imagem. Para cada face, provê detalhes como faixa etária, gênero e emoções.
CompareFaces para comparar características faciais. A comparação de um até uma centena dos maiores rostos na imagem de entrada é comparada com as faces detectadas em uma imagem alvo.
DetectText para detectar e extrair texto de imagens. O texto é retornado como um vetor de elementos.
RecognizeCelebrities para identificar até uma centena de celebridades específicas em uma imagem. Para cada celebridade determinada provê detalhes como o nome e links para informações adicionais.

Clientes podem testar as capacidades da API logando na Amazon AWS.

Os desenvolvedores podem analisar imagens enviadas como um objeto ou conjunto de bytes para o Serviço Simples de Armazenamento da Amazon (S3) através da API do Rekognition. O Rekogntion suporta tanto formatos JPEG quanto PNG, e as imagens podem ser de até 15MB quando passadas como um objeto S3 - ou de até 5MB se passadas como um conjunto de bytes. A API do Rekognition pode ser consumida em várias linguagens como Java, .NET e Python via seus respectivos SDKs da AWS. O Amazon Rekognition atualmente está disponível nas regiões dos Estados Unidos e Europa, e os detalhes de preços podem ser obtidos em seu site.

Amazon, Google e Microsoft competem entre si através de suas respectivas ofertas de Inteligência Artificial (IA) na tentativa de trazer mais clientes para suas plataformas. A Microsoft oferece mais de 25 APIs com seus Cognitive Services, incluindo a API Emotion and Computer Vision que tem capacidades de análise de imagem e facial. O Google disponibiliza a API Vision que possibilita a detecção de objetos e faces em imagens. Ambos tiveram estes serviços de reconhecimento disponíveis já há algum tempo, e agora a Amazon está dando mais passos para conseguir também mostrar seus serviços. De acordo com a Bloomberg em um artigo da Investopedia:

Entre as áreas em que a Amazon está fraca, está o desenvolvimento de aplicações na área de IA que ajudará os clientes de computação em nuvem a analisar dados, entender a fala e reconhecer imagens. Enquanto a Amazon continua a ser a líder do mercado em computação em nuvem, a Microsoft e o Google estão fechando a lacuna parcialmente oferecendo aplicações de IA que induzem os clientes a trocar de plataforma.

Unlock the full InfoQ experience

Não tem uma conta no InfoQ?

Tópicos

Crank, o novo framework frontend com renderização assíncrona integrada - Bate papo com Brian Kim

APIs em tempo real no contexto do Apache Kafka

COVID-19 e Mineração de Redes Sociais - Habilitando Cargas de Trabalho de Aprendizado de Máquina com Big Data

Entendendo Os Valores e Princípios Ágeis

Bate papo sobre o livro “De pé sobre os ombros: Um guia para líderes na transformação digital"

Links úteis

Escolha a região

Avalie esse artigo

Conteúdo publicado no tópico Cloud

Tópicos Relacionados:

Conteúdo editorial relacionado

Conteúdo relacionado de patrocinadores

Conteúdo educacional

Crank, o novo framework frontend com renderização assíncrona integrada - Bate papo com Brian Kim

Blockchain Empresarial: Jornada de uma rede multi-organização à produção

PHP 7 - Melhorias na biblioteca padrão

O último conteúdo do InfoQ Brasil

APIs em tempo real no contexto do Apache Kafka

Sete duras lições aprendidas na migração de um monólito para microservices

Adquira leads qualificados no mercado de desenvolvimento de software com a eMag InfoQ

Entendendo Os Valores e Princípios Ágeis

Somente empresas ágeis sobrevivem ao ambiente de negócios em constante mudança

COVID-19 e Mineração de Redes Sociais - Habilitando Cargas de Trabalho de Aprendizado de Máquina com Big Data

A inteligência artificial estaria mais próxima do bom senso?

Desafios na avaliação postural humana em aplicativos de condicionamento físico baseados em IA

Bate papo sobre o livro “De pé sobre os ombros: Um guia para líderes na transformação digital"

Arquitetura de Microservices Multi-Runtime

Armadilhas de design NoSQL com Java

QCon London

InfoQ Architect Certification

QCon AI Boston

QCon San Francisco