BT

如何利用碎片时间提升技术认知与能力? 点击获取答案

  • 他的粉丝

    Apache Kylin实践:链家数据分析引擎的演变史

    作者 王龙帅 关注 0 他的粉丝 , 张如松 关注 0 他的粉丝 发布于  2018年4月20日

    伴随链家业务线的拓宽和发展,以及数据生态的建设,数据规模快速增长。2015年大数据部门成立至今,集群数据存储量为 9PB,服务器规模为 200 台 +。与此同时,数据需求也随着业务的发展落地不断增长,如统计分析、指标 API、运营报表等,不同业务需求差异较大,维度越来越多,需要定制化开发。面对数十亿行级别的数据,低延迟响应的特性,保障服务稳定、数据准确,链家的数据分析引擎经历了如下的发展历程。

  • 他的粉丝

    如何整合复杂技术打造数据分析平台?

    作者 万晓川 关注 2 他的粉丝 发布于  2017年11月29日

    随着企业安全边界的扩大化模糊化、各类威胁新出速度越来越快、影响越来越广,视企业安全边界为静态、仍然依赖各种特征码技术的传统安全思路早已落后,无法实际解决安全问题。必须通过各种创新,整合大数据、人工智能、可视化等领域的最新技术进展,安全产品才能解决目前和将来的企业安全难题。 但如何选择并整合各种技术是复杂系统工程,比常规企业安全软件开发需要考虑更多因素。本次分享中对大数据、人工智能、可视化的最新进展和应用案例做个总结,重点讨论大数据平台云部署运维、交互批处理与实时流处理的关系、有监督学习解决的安全问题和大数据可视化这四个细分领域。

  • 他的粉丝

    数据湖只是个哗众取宠的伪概念吗?

    作者 Uli Bethke 关注 0 他的粉丝 ,译者 足下 关注 1 他的粉丝   发布于  2017年10月12日

    最直接的答案是是的,最大的问题在于“数据湖”这个词已经不堪重负,被供应商和分析师们赋予了太多不同的含义,最后成了一个不清楚的、模糊的概念。

他的粉丝

nginScript系列:使用nginScript掩蔽用户隐私数据

作者 Nginx 关注 0 他的粉丝 ,译者 Mister Who 关注 0 他的粉丝   发布于  2017年6月28日

这是nginScript系列文章的第四篇,将介绍如何使用nginScript掩蔽用户隐私数据。

他的粉丝

用数据的心智经营一家公司

作者 叶杰生 关注 0 他的粉丝 发布于  2017年6月7日

这篇文章给大家详细介绍国外一家创新公司Stitch Fix如何将应用数据科学技术和理论到实际问题,希望能够引起国内实业家的共鸣,大胆创新,将数据科学在国内肥沃的土壤上落地发芽。

他的粉丝

兼顾稳定和性能,58大数据平台的技术演进与实践

作者 尚剑 关注 2 他的粉丝 发布于  2017年5月18日

这篇文章总结了58大数据平台在最近一年半的时间内技术演进的过程。主要内容分为三方面:58大数据平台目前的整体架构是怎么样的;最近一年半的时间内我们面临的问题、挑战以及技术演进过程;以及未来的规划。 1

他的粉丝

火力全开:大数据领域2017年全景剖析

作者 Matt Turck 关注 0 他的粉丝 ,译者 大愚若智 关注 9 他的粉丝   发布于  2017年4月20日

数据生态系统在2017年终于实现了火力全开。本文为大家提供了一个有关大数据领域详细的“国情咨文”,以及投资机构针对这一行业的见解和关键趋势。 1

他的粉丝

NanoNets:数据不足时如何深度学习

作者 Sarthak Jain 关注 0 他的粉丝 ,译者 大愚若智 关注 9 他的粉丝   发布于  2017年4月5日

使用深度学习技术解决问题的过程中,最常见的障碍在于训练模型过程中所需的海量数据。需要如此多的数据,原因在于机器在学习的过程中会在模型中遇到大量参数。在面对某一领域的具体问题时,通常可能无法得到构建模型所需规模的数据。然而在一个模型训练任务中针对某种类型数据获得的关系也可以轻松地应用于同一领域的不同问题,这就是所谓的迁移学习。

他的粉丝

到底什么是数据科学家?

作者 杨旸 关注 2 他的粉丝 发布于  2017年3月3日

“数据科学家“在数据化的进程中,扮演着极为重要的角色。他们既继承着统计师和业务分析师的职责,又需要将日新月异的大数据技术、算法、模型等逐渐转化为企业价值。 而这一角色的定义比较模糊,那么数据科学家的职责包括什么? 需要哪些技能?对于有志于从事这份工作的朋友,从哪里开始,如何能在较短时间内赢得数据科学家的工作机会?

他的粉丝

AI背后的数据科学

作者 刘志勇 关注 2 他的粉丝 发布于  2017年2月17日

Bill Vorhies不久前写了一篇文章《AI背后的数据科学》,他分享的观点很新颖,经作者授权,InfoQ翻译并发布。 对于那些对AI感兴趣但还没有深入研究的传统数据科学家,下面是对数据科学技术的简要概述,这些数据科学技术在通俗报纸中被称为人工智能(AI)。

他的粉丝

大数据挖掘更多时间都在于清洗数据

作者 汪榕 关注 4 他的粉丝 发布于  2017年1月11日

编者按:本文作者汪榕曾写过一篇文章:《以什么姿势进入数据挖掘会少走弯路》,是对想入行大数据的读者的肺腑之言,其中也表达了作者的一些想法,希望大家不要随便去上没有结合业务的收费培训班课程;而后,他有了结合他本人的工作经验,写一系列帮助大家进行实践学习课程文章的想法,InfoQ也觉得这是件非常有意义的事情,特别是对于大数据行业1-3年工作经验的人士,或者是没有相关工作经验但是想入行大数据行业的人。

他的粉丝

从小数据分析到大数据平台,这十几年来大数据开源技术是如何演进的?

作者 杨仿今 关注 0 他的粉丝 发布于  2016年9月8日

在QCon 2016 北京站上,Druid开源项目的负责人,同时也是一家位于旧金山的技术公司共同创始人的Fangjin Yang杨仿今老师分享了题为 《Evolution of Open Source Data Infrastructure》的主题演讲,在演讲里杨老师详细的介绍了开源大数据的过去,现在的形态以及未来几年发展的趋势和方向。本文根据他的演讲整理而成。

登陆InfoQ,与你最关心的话题互动。


找回密码....

Follow

关注你最喜爱的话题和作者

快速浏览网站内你所感兴趣话题的精选内容。

Like

内容自由定制

选择想要阅读的主题和喜爱的作者定制自己的新闻源。

Notifications

获取更新

设置通知机制以获取内容更新对您而言是否重要

BT