代码如下
from pyhdfs import HdfsClient client = HdfsClient(hosts='192.168.1.1:50070') # TypeError: cannot use a string pattern on a bytes-like object #从hdfs中读取文件 file = client.open("/data/movielens/train/ra.train") #获取内容 content = file.read() #open后,file是二进制,str()转换为字符串并转码 s = str(content, "utf-8") #打开本地文件.csv 并写入内容 file = open("/home/data/data.csv", "w") file.write(s) #pandas读取本地csv文件 train_data = pd.read_csv("/home/data/data.csv", sep=self.sep, header=None, usecols=[0, 1, 2], names=['user', 'item', 'rating'])
热门文章
- 1月3日 - 最高速度18.9M/S,2025年Nekobox每天更新免费节点订阅地址
- 1月2日 - 最高速度18.9M/S,2025年Nekobox每天更新免费节点订阅地址
- 由浅入深快速掌握Java 数组的使用_java
- C#实现DataTable转TXT、CSV文件_C#教程_
- 宠物买卖纠纷(宠物买卖纠纷报警如何处理)
- 12月27日 - 最高速度21.3M/S,2024年Nekobox每天更新免费节点订阅地址
- 动物防疫站地址 动物防疫站地址查询
- 1月7日 - 最高速度19.4M/S,2025年Nekobox每天更新免费节点订阅地址
- element-plus 一个vue3.xUI框架 (element-ui的3.x 版初体验)
- 1月15日 - 最高速度19.6M/S,2025年Nekobox每天更新免费节点订阅地址