Ray
I am a full stack engineer, working on big data.
Last Articles
kylin智能构建工具
1. 背景介绍Kylin作为OLAP on Hadoop的标准,查询和构建作为Kylin的两个主要功能,可以通过Kylin的界面或者调用Kylin的RestApi、odbc和Jdbc等方式查询,构建也可以通过Kylin界面或者Rest...
我的博客史
说起我的博客历史,大概分为6段小历史,首先得从2010年说起。 12010年,从大学毕业一开始就已经开始了我的博客生涯。当时第一个博客还是在Iteye上,当时的博客地址是:帅的被神砍 ,寥寥写了几篇技术文章。当时每天必上的技术网站就...
ycsb使用指南
简介YCSB(Yahoo! Cloud Serving Benchmark)是雅虎开源的一款通用的性能测试工具。通过这个工具我们可以对各类NoSQL产品进行相关的性能测试,包括:PNUTS、BigTable 、HBase、Hypertable、Azure、Cassandra、CouchDB、Voldemort、MongoDb、Dynomite。 YCSB与HBase自带的性能测试工具(Per...
kerberos定时登录设置
1. 增加Crontab定时任务12# 定时每小时20分执行一次,同时输出执行日志20 * * * * sh /user/kylin/kerberos_init.sh >> /user/kylin/kerberos_init.log 2>&1 2.脚本 kerberos_init.sh脚本 123456789## 引入Fusioninght客户端变量,CDH不需要...
Hello Hexo
已经很长时间没有管理博客了,在2018快要到来之前,决心整理下了,在github上部署了Hexo,选取了以前各个博客系统的主要文章,同步到了hexo,以前的文章用markdown格式在文章迁移上,优势就体现出来了。只不过评论就不同步了。 纯静态化、可以快速部署在github或coding、高效、易于扩展,最重要的是轻量简洁,同时还不需要管理服务器,不用再担心服务器故障,在有文章发布时,pu...
大数据技术文章索引
存储格式 深入分析Parquet列式存储格式 大数据开源列式存储引擎Parquet和ORC Hive:ORC File Format存储格式详解 文件系统 HDFS 原理、架构与特性介绍 HDFS的运行原理 Namenode HA...
shell逐行读取文本的几种方法
经常会对文体文件进行逐行处理,在Shell里面如何获取每行数据,然后处理该行数据,最后读取下一行数据,循环处理.有多种解决方法如下: 通过read命令完成.read命令接收标准输入,或其他文件描述符的输入,得到输入后,read命令将...
浅谈2017NBA常规赛MVP
16-17赛季常规赛接近尾声,西部季后赛球队名单和排名基本确定,反观东部,3-4名还在争夺,5/6/7/8/9还在激烈争夺。 常规赛MVP,这个赛季也是竞争相当激烈。 MVP候选浅析詹姆斯.哈登哈登场均29.1分8.1个篮板11.2...
有效的管理邮件
邮件,作为工作中很重要的东西。工作多年,有自己使用的一些方法和技巧。最近也参加了一个知乎关于邮件处理的live,总结下关于邮件处理的应该注意的一些心得和技巧,合理的利用这些在短期内提高管理电子邮件的效率。 Zero InboxZer...