Início IA, ML e Engenharia de Dados no InfoQ Brasil
Artigos
Feed RSS-
Ciência de Dados: princípios de modelo sustentável para organização orientada a dados
Esse artigo apresenta para líderes tanto de áreas técnicas como de negócios, o framework “Healthy Data Science Organization”, que tem como objetivo nortear a implantação da ciência de dados como mentalidade de forma saudável nas organizações.
-
Podemos confiar em algoritmos para tomada de decisão automática?
A adoção de tomada de decisão automática vem crescendo a cada dia. Os algoritmos podem produzir resultados socialmente não compreendidos. Há como afirmar que são seguros se não podemos compreendê-los? Os receios do público sobre a incapacidade de prever as consequências adversas impediram tecnologias como a energia nuclear e as culturas geneticamente modificadas.
-
Conquistando os desafios de preparação de dados para manutenção preditiva
Ian Downard aborda neste artigo alguns dos mais difíceis desafios que envolve a preparação de dados enfrentados pelos profissionais de Machine Learning na área da Indústria, discutindo as soluções que envolvem a ingestão de dados e aplicação de Aprendizado de Máquina aplicada relacionados às aplicações de manutenção preditiva.
-
Robótica Open Source: Começando com Gazebo e ROS 2
Uma introdução às ferramentas robóticas open source amplamente utilizadas na academia e na indústria. Gazebo é um simulador de robô versátil e ROS 2 é a versão mais recente do Robot Operating System.
-
Dimensionando um processador de Stream distribuído em um ambiente containerizado
Este artigo apresenta um experimento de escalonamento de processadores de Stream distribuído em um ambiente de Kubernetes. Para fazer isto, o processador de stream deve fornecer uma linguagem de programação de consulta para manter o nível ideal de paralelismo, independentemente da escala inicial do aplicativo.
-
O que Machine Learning pode aprender com DevOps
De acordo com Thiago de Faria, o DevOps estabelece uma base sólida: a mudança de cultura para apoiar a experimentação, a avaliação contínua, camadas de abstração, monitoramento e trabalho em produtos e serviços.
-
Apache Kafka: dez melhores práticas para otimizar sua implantação
O author Ben Bromhead discute as melhores práticas mais recentes do Kafka para que os desenvolvedores gerenciem a plataforma de streaming de dados mais efetivamente. As melhores práticas incluem configuração de log, uso adequado de hardware, configuração do Zookeeper, fator de replicação e número de partições.
-
Análise de sentimentos: duas abordagens básicas para começar
A análise de sentimentos é amplamente aplicada em aplicações de voz do cliente (VOC). Neste artigo, os autores discutem a análise de sentimentos baseada em processamento de linguagem natural (NLP) com machine learning e abordagens lexicais usando ferramentas KNIME de análise de dados.
-
PostgreSQL BRIN índices como uma solução para Big Data
Você já imaginou o PostgreSQL como uma solução para Big Data? Em um cenário o qual seja necessário escrever mais de duas mil linhas por segundo e ler mais de 60 mil linhas o mais rápido possível? Este artigo é um relato de experiência sobre os motivos pelos quais adotamos o PostgreSQL como solução de Big Data em substituição à ferramentas tradicionais como o Apache Cassandra
-
Processamento de Linguagem Natural com Java - segunda edição: revisão e entrevista
O livro Processamento de Linguagem Natural com Java - Segunda Edição aborda o tópico PLN (ou em inglês: NLP - Natural Language Processing) e várias ferramentas que os desenvolvedores podem usar em seus aplicativos. O InfoQ falou com o co-autor Richard Reese sobre o livro.
-
Monitorar performance de aplicações Spark usando o profiler de JVM do Uber, com InfluxDB e Grafana
Neste artigo, Amit Baghel discute como monitorar aplicações baseadas no Apache Spark usando o profiler de JVM do Uber, o banco de dados InfluxDB e a ferramenta de visualização Grafana.
-
Como escolher um processador de stream para a sua aplicação
Processadores de stream são plataformas de software que permitem aos usuários responderem mais rapidamente aos streams de dados que chegam em comparação ao processamento tradicional de dados em lotes. Neste artigo, os autores apresentam a arquitetura de referência de processadores de stream, características importantes necessárias e opcionais com base nos casos de uso específicos.