发新帖

【已学会】TF学习之数据预处理坑---【如何批量化处理txt to...

[复制链接]
683 7

快来加入 TensorFlowers 大家庭!

您需要 登录 才可以下载或查看,没有帐号?加入社区

x
本帖最后由 M丶Sulayman 于 2018-4-28 11:30 编辑

QQ图片20180426132352.png


在一个文件夹下,有多个txt文件,如何批量化转存为相同名称的csv文件?


求大神代码支持,万分感谢!!!



rz828的指导下,该问题已经解决。其实质在于文件的批量读取以及创建。
我知道答案 回答被采纳将会获得10 金币 + 10 金币 已有7人回答
本楼点评(2) 收起
  • rz828文件内容需要转化吗?
    或者给个文件的内容例子出来看看最好。
    2018-4-26 14:12 回复
  • M丶Sulayman回复 rz828 :内容用我下面的代码就能转,关键在于如何批量化文件转换,也就是创建同名CSV文件,再把对应名字的TXT文件写入该同名CSV文件中
    2018-4-26 14:14 回复

精彩评论7

M丶Sulayman  TF豆豆  发表于 2018-4-26 13:29:35 | 显示全部楼层
#  我只会这种最LOW......粘贴复制文件名......
import numpy as np
import pandas as pd

txt = np.loadtxt('video_create_log.txt')
txtDF = pd.DataFrame(txt)
txtDF.to_csv('video_create_log.csv', index=False)

本楼点评(0) 收起
rz828  TF荚荚  发表于 2018-4-26 14:33:26 | 显示全部楼层
既然这里是TensorFlow论坛,我们就用下tensorflow吧,代码如下:
注意我只在python2下测试过

  1. # -*- coding: UTF-8 -*-
  2. import os
  3. import numpy as np
  4. import pandas as pd
  5. import tensorflow as tf


  6. def convert(filename):
  7.     name_with_extension = os.path.basename(filename)
  8.     name, _ = os.path.splitext(name_with_extension)

  9.     # 以下内容为题主自己写的代码
  10.     txt = np.loadtxt(filename)
  11.     txt_df = pd.DataFrame(txt)
  12.     txt_df.to_csv(name + '.csv', index=False)


  13. # 假设你想要批量处理的文件在某个路径
  14. file_dir = './test/*.txt'

  15. # 获得所有文件的名字列表
  16. file_list = tf.gfile.Glob(file_dir)

  17. for f in file_list:
  18.     convert(f)
复制代码
本楼点评(0) 收起
M丶Sulayman  TF豆豆  发表于 2018-4-26 14:39:34 | 显示全部楼层
rz828 发表于 2018-4-26 14:33
既然这里是TensorFlow论坛,我们就用下tensorflow吧,代码如下:
注意我只在python2下测试过

学到了,感谢~python3.X代码也没问题
本楼点评(0) 收起
ViolinSolo  TF芽芽  发表于 2018-7-3 20:00:24 | 显示全部楼层
其实就是读入再写文件。。。莫慌,随便一个脚本就能解决
本楼点评(0) 收起
ves  TF荚荚  发表于 2018-7-4 21:18:51 | 显示全部楼层
提供另一个思路:加逗号、修改文件后缀
本楼点评(0) 收起
neverchange  TF豆豆  发表于 2018-7-4 23:35:57 | 显示全部楼层
这个不是tensorflow得问题,是python得问题。
关键要做遍历,for file in file_list,取出名字然后进行操作。
也可以存到数组里,最后再产生csv文件。
本楼点评(0) 收起
kdongyi  TF荚荚  发表于 2018-7-15 17:20:09 | 显示全部楼层
# -*- coding: UTF-8 -*-
import os
import numpy as np
import pandas as pd
import tensorflow as tf


def convert(filename):
    name_with_extension = os.path.basename(filename)
    name, _ = os.path.splitext(name_with_extension)

    # 以下内容为题主自己写的代码
    txt = np.loadtxt(filename)
    txt_df = pd.DataFrame(txt)
    txt_df.to_csv(name + '.csv', index=False)


# 假设你想要批量处理的文件在某个路径
file_dir = './test/*.txt'

# 获得所有文件的名字列表
file_list = tf.gfile.Glob(file_dir)

for f in file_list:
    convert(f)
本楼点评(0) 收起
您需要登录后才可以回帖 登录 | 加入社区

本版积分规则

快速回复 返回顶部 返回列表