设为首页 加入收藏

TOP

采用Python来访问Hadoop HSFS存储实现文件的操作
2014-11-24 03:08:18 来源: 作者: 【 】 浏览:1
Tags:采用 Python 访问 Hadoop HSFS 存储 实现 文件 操作

用python访问hdfs是个很头疼的事情。


这个是pyhdfs的库


import pyhdfs
fs = pyhdfs.connect("192.168.1.1", 9000)
pyhdfs.get(fs, "/rui/111", "/var/111")
f = pyhdfs.open(fs, "/test/xxx", "w")
pyhdfs.write(fs, f, "fuck\0gfw\n")
pyhdfs.close(fs, f)
pyhdfs.disconnect(fs)


pyhdfs的安装过程很吐血


还有是把 selinux也给关了 不然会出现莫名的问题


如果出现
/usr/lib/jvm/java-6-sun/include/jni.h:27:20: error: jni_md.h: No such file or directory
搜下find / -name jni.h
然后修改#include "jni_md.h" 为 #include "linux/jni_md.h"


这个是用pydoop的库


import pydoop.hdfs as hdfs
with hdfs.open('/user/myuser/filename') as f:
for line in f:
print(line)


我现在使用的方法是用subprocess
也挺行~
需要把很多自己常用的指定都封装成库


cat = subprocess.Popen(["hadoop", "fs", "-cat", "/path/to/myfile"], stdout=subprocess.PIPE)
for line in cat.stdout:
print line


】【打印繁体】【投稿】【收藏】 【推荐】【举报】【评论】 【关闭】 【返回顶部
分享到: 
上一篇bash脚本之for语句if语句以及各种.. 下一篇Java基本数据类型及运算符小结

评论

帐  号: 密码: (新用户注册)
验 证 码:
表  情:
内  容:

·Announcing October (2025-12-24 15:18:16)
·MySQL有什么推荐的学 (2025-12-24 15:18:13)
·到底应该用MySQL还是 (2025-12-24 15:18:11)
·进入Linux世界大门的 (2025-12-24 14:51:47)
·Download Linux | Li (2025-12-24 14:51:44)