BT

A sua opinião é importante! Por favor preencha a pesquisa do InfoQ sobre os seus hábitos de leitura!

Amazon Rekognition ganha novas funcionalidades

| por Steef-Jan Wiggers Seguir 9 Seguidores , traduzido por Camilla Albuquerque Seguir 3 Seguidores em 09 jan 2018. Tempo estimado de leitura: 3 minutos |

Em uma publicação recente, a Amazon anunciou a adição de três novas funcionalidades ao seu serviço Rekognition. Estas novas funcionalidades possibilitam a detecção e reconhecimento de texto em imagens, a detecção de até uma centena de faces em uma imagem completa e o reconhecimento de face em tempo real entre mais de dez milhões de faces.

No evento Amazon re:Invent 2016, a Amazon apresentou o Rekognition, permitindo que desenvolvedores adicionassem a análise de imagem às suas aplicações. Agora, a Amazon está fazendo investimentos adicionais neste serviço cognitivo ao adicionar novas funcionalidades. Um adotante inicial do Amazon Rekognition é o Pinterest. Sobre este produto, Vanja Josifovski, CTO do Pinterest, disse:

Como uma plataforma visualmente dirigida, o Pinterest confia fortemente na velocidade e na qualidade de imagens, mas o texto por trás destas imagens é tão importante quanto a própria imagem, uma vez que provê um contexto e torna cada Pin acionável para nossos mais de 200 milhões de "pinadores" ativos. Trabalhando com o Amazon Rekognition para texto em imagem, melhoramos a extração de texto rico capturado em imagens em escala e com baixa latência para os milhões de Pins armazenados na Amazon S3. Procuramos continuar a desenvolver a parceria com a AWS para manter a alta qualidade e experiências rápidas para os "pinadores" e negócios que estão no Pinterest.

A Cloudinary, uma plataforma de gestão de mídia para desenvolvedores web e mobile, tem incorporado as novas funcionalidades do Rekognition aos seus serviços. Daniel Amitai, vice-presidente de desenvolvimento de negócios da Cloudinary, disse:

A Cloudinary tem trabalhado muito próxima da AWS para trazer esta solução à vida. Nossa integração com o Amazon Rekognition levou esta relação ao próximo nível, eliminando o trabalho tedioso de analisar manualmente o conteúdo da imagem e permitindo que os usuários automaticamente categorizem as imagens como parte de seus fluxos de trabalho já existentes de gestão de imagens.

A API do Amazon Rekognition disponibiliza diversas operações para reconhecimento facial e funcionalidades de análise de imagem; entre estas funcionalidades é possível destacar:

  • DetectFaces para detectar até uma centena dos maiores rostos em uma imagem. Para cada face, provê detalhes como faixa etária, gênero e emoções.
  • CompareFaces para comparar características faciais. A comparação de um até uma centena dos maiores rostos na imagem de entrada é comparada com as faces detectadas em uma imagem alvo.
  • DetectText para detectar e extrair texto de imagens. O texto é retornado como um vetor de elementos.
  • RecognizeCelebrities para identificar até uma centena de celebridades específicas em uma imagem. Para cada celebridade determinada provê detalhes como o nome e links para informações adicionais.

Clientes podem testar as capacidades da API logando na Amazon AWS.

Os desenvolvedores podem analisar imagens enviadas como um objeto ou conjunto de bytes para o Serviço Simples de Armazenamento da Amazon (S3) através da API do Rekognition. O Rekogntion suporta tanto formatos JPEG quanto PNG, e as imagens podem ser de até 15MB quando passadas como um objeto S3 - ou de até 5MB se passadas como um conjunto de bytes. A API do Rekognition pode ser consumida em várias linguagens como Java, .NET e Python via seus respectivos SDKs da AWS. O Amazon Rekognition atualmente está disponível nas regiões dos Estados Unidos e Europa, e os detalhes de preços podem ser obtidos em seu site.

Amazon, Google e Microsoft competem entre si através de suas respectivas ofertas de Inteligência Artificial (IA) na tentativa de trazer mais clientes para suas plataformas. A Microsoft oferece mais de 25 APIs com seus Cognitive Services, incluindo a API Emotion and Computer Vision que tem capacidades de análise de imagem e facial. O Google disponibiliza a API Vision que possibilita a detecção de objetos e faces em imagens. Ambos tiveram estes serviços de reconhecimento disponíveis já há algum tempo, e agora a Amazon está dando mais passos para conseguir também mostrar seus serviços. De acordo com a Bloomberg em um artigo da Investopedia:

Entre as áreas em que a Amazon está fraca, está o desenvolvimento de aplicações na área de IA que ajudará os clientes de computação em nuvem a analisar dados, entender a fala e reconhecer imagens. Enquanto a Amazon continua a ser a líder do mercado em computação em nuvem, a Microsoft e o Google estão fechando a lacuna parcialmente oferecendo aplicações de IA que induzem os clientes a trocar de plataforma.

Avalie esse artigo

Relevância
Estilo/Redação

Olá visitante

Você precisa cadastrar-se no InfoQ Brasil ou para enviar comentários. Há muitas vantagens em se cadastrar.

Obtenha o máximo da experiência do InfoQ Brasil.

Dê sua opinião

HTML é permitido: a,b,br,blockquote,i,li,pre,u,ul,p

Receber mensagens dessa discussão
Comentários da comunidade

HTML é permitido: a,b,br,blockquote,i,li,pre,u,ul,p

Receber mensagens dessa discussão

HTML é permitido: a,b,br,blockquote,i,li,pre,u,ul,p

Receber mensagens dessa discussão

Dê sua opinião
BT