如何拓展Hadoop的InputFormat为其他分隔符

在Hadoop中,常用的TextInputFormat是以换行符作为Record分隔符的。

在实际应用中,我们经常会出现一条Record中包含多行的情况,例如:
<doc>
....
</doc>
此时,需要拓展TextInputFormat以完成这个功能。

先来看一下原始实现:
public class TextInputFormat extends FileInputFormat<LongWritable, Text> {[......]

继续阅读

Ubuntu 14.04 Fallback模式,如何删除启动栏图标

Ubuntu 14.04,启用了Gnome经典模式(Fallback)。这种情况下,删除启动栏的图标一直是一个难题。

看了解决方案后,再次给Gnome/Ubuntu跪了。。这是什么奇葩设计思路。。

转载自:http://askubuntu.com/questions/91445/how-do-i-remove-an-icon-from-the-top-panel-in-gnome-fallback-mode

You are using the Gnome-Classic int[......]

继续阅读

Ubuntu 14.04中在桌面显示"Home"、"回收站"等图标

如题。升级到14.04后,原先通过gconf-editor设置的方法失效了。

实际上,14.04转而使用dconf-editor了。。
sudo apt-get install dconf-editor
然后找到:

org.gnome.nautilus.desktop

这下面的值分别代表了图标,不解释了,找到需要的设置为true即可。

 [......]

继续阅读

[转]使用Fabric部署网站应用

转载自:《使用Fabric部署网站应用》
以前一直用rsync同步代码到服务器,这种山寨方法用一次两次还可,每天部署10次就麻烦了,最近抽空研究了一下Fabric,发现这个东西部署起来简直太爽了。
Fabric是一个用Python开发的部署工具,最大特点是不用登录远程服务器,在本地运行远程命令,几行Python脚本就可以轻松部署。
花10分钟写了一个部署脚本fabfile.py(名字不能变),放到工程目录下:

#!/usr/bin/env python
# -*- coding:[......]

继续阅读