我是一名专业的大数据工程师,写这个博客为了记录工作上和生活上的点滴收获。除了明确标明,均属于个人原创,任何形式的转载请联系本人。 -- 关于我

Writing..

大数据机器学习系统产品化设计 本文描述了整个机器学习系统的架构设计和搭建,重点在数据流、控制流和人员控制方面,保障整个系统的易用性、灵活性和水平可扩展。 Read more

技术产品化的思考 本文讲述了一个工程师是如何思考产品化的,特别是对于什么样的功能怎么样设计,才能更好的提升系统的产品化进程,有我的一些简单理解。 Read more

Hive Llap尝试(0) Hive在2.0版本之后添加一个llap的功能,加速SQL语句执行,本文描述了如何进行配置以及途中遇到的问题。 Read more

解密姨搜系列1 - 总览 这是系列文章解密姨搜的第一篇,主要包括对于风控系统的理解,用户的多种需求,以及架构的总体设计。 Read more

读书笔记 - As We Speak 假期读了这本书《As We Speak》,中文译本叫《高效演讲》,收获不小,这里做一些简单的记录。 Read more

Hbase快速重连DataNode的问题 - 发现与分析 前些时间发现了DN上的一系列异常的日志,知道近期才有时间和人手研究这个问题。这篇文章介绍了一下我们发现的问题,以及查找问题根源的步骤。从中有不少值得吸取的经验。 Read more