大数据机器学习系统产品化设计 — 本文描述了整个机器学习系统的架构设计和搭建,重点在数据流、控制流和人员控制方面,保障整个系统的易用性、灵活性和水平可扩展。 Read more
— 我是一名专业的大数据工程师,写这个博客为了记录工作上和生活上的点滴收获。除了明确标明,均属于个人原创,任何形式的转载请联系本人。 -- 关于我
Writing..
技术产品化的思考 — 本文讲述了一个工程师是如何思考产品化的,特别是对于什么样的功能怎么样设计,才能更好的提升系统的产品化进程,有我的一些简单理解。 Read more
—Hive Llap尝试(0) — Hive在2.0版本之后添加一个llap的功能,加速SQL语句执行,本文描述了如何进行配置以及途中遇到的问题。 Read more
—解密姨搜系列1 - 总览 — 这是系列文章解密姨搜的第一篇,主要包括对于风控系统的理解,用户的多种需求,以及架构的总体设计。 Read more
—读书笔记 - As We Speak — 假期读了这本书《As We Speak》,中文译本叫《高效演讲》,收获不小,这里做一些简单的记录。 Read more
—PMCAFF 大数据风控的原理与应用 姨搜分享活动 现场速记 — 这里面有我8月27日PMCAFF的分享活动中的速记文稿。 Read more
—PMCAFF 大数据风控的原理与应用 姨搜分享活动PPT — 这里面有我8月27日PMCAFF的分享活动中的PPT。 Read more
—RegionServer不断重建Stream Pipeline问题 — RegionServer在写WAL日志时,出现不断选择DataNode重建pipeline的问题,直到无DataNode可用而导致异常退出 Read more
—Hbase快速重连DataNode的问题 - 发现与分析 — 前些时间发现了DN上的一系列异常的日志,知道近期才有时间和人手研究这个问题。这篇文章介绍了一下我们发现的问题,以及查找问题根源的步骤。从中有不少值得吸取的经验。 Read more
—