python 读取以空格分开的文件操作

 更新时间:2021年04月16日 11:26:09   投稿:jingxian  
这篇文章主要介绍了python 读取以空格分开的文件操作,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧

在查找数据集的时候发现,并不是所有的数据集都是以csv的格式存储,也就是每一列特征数据的分割并不是都以逗号分割,有的数据格式是以空格为分割

例如.data格式,

接下来就实现对.data格式数据的读取:

(数据来源于Boston房价预测数据集,文件名称为“housing.data”)

import pandas as pd
data = pd.read_csv('./housing.data', delim_whiteshape=True)

以上代码就是实现了对空格的分割,但是不知道针对也是以一列存储,并且数据分割也是空格的csv文件此方法还行得通不。

另外pd.read_csv()中的参数sep和delimiter表示的意义一样,具体如何使用不清楚,目前用到不多。

遇到读取文件不知如何操作的,最后要访问下官方文档或者google查询。

pd.read_csv官方文档

另外,可以直接在原数据集文件加后缀名.csv即可转换成csv文件,但前提是data中的数据已经以,分割好了。

pd.read_csv()中读取文件时,默认第一行作为列名,但有时候第一行也是我们需要的数据,这时需制定参数header=None,或者给每列提前设置好名字,names=[‘column0',‘column1',…]

补充:python 实现以空格分隔的文件读写及二维数组按列折半查找

最近文件读写的工作比较多,每一次读文件都会写单独的函数来适应文件格式,所以写了一个类对文件进行操作。

(用pandas.read_csv读取文件更好用)

import os
class DealData:
    # 数据加载函数
    def load(self, filename):
        data = []
        file = open(filename, 'r')
        for line in file.readlines():
            line = line.strip('\n')         # 除去换行
            line = line.split(' ')          # 文件以“ ”分隔
            if "" in line:                  # 解决每行结尾有空格的问题
                line.remove("")
            data.append(line)
        file.close()
        return data
 
    # 折半查找                               # array是一个二维数组,函数实现的功能是按照array的第lie列折半查找
    def search(self, array, lie, target):
        low = 0
        high = len(array) - 1
        while array[low][lie] <= array[high][lie]:
            mid = int((low + high) / 2)
            midval = array[mid][lie]
            if midval < target:
                low = mid + 1
            elif midval > target:
                high = mid - 1
            if high < 0 or low >= len(array):
                break
        return high
    # 将数据保存到文件                
    def save(self, data, filename):
        file = open(filename, 'w')
        for i in range(0, len(data), 1):
            for k in range(0, len(data[i]), 1):
                file.write(str(data[i][k]))
                file.write(" ")
            file.write("\n")
        file.close()

可以将Dealdata类单独创建一个python文件,命名为Dealdata,调用方法如下:

from DealData import DealData 
deal = DealData()
totaldata = deal.load("E:\low_data.txt")

之前先引用类:from Dealdata import Dealdata, 其中第一个Dealdata为被调用的python文件名, 第二个Dealdata为被调用的类名。

以上为个人经验,希望能给大家一个参考,也希望大家多多支持脚本之家。如有错误或未考虑完全的地方,望不吝赐教。

相关文章

  • Django使用Jinja2模板引擎的示例代码

    Django使用Jinja2模板引擎的示例代码

    这篇文章主要介绍了Django使用Jinja2模板引擎的示例代码,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
    2019-08-08
  • pytorch中nn.RNN()汇总

    pytorch中nn.RNN()汇总

    这篇文章主要介绍了pytorch中nn.RNN()知识,本文通过实例代码给大家介绍的非常详细,对大家的学习或工作具有一定的参考借鉴价值,需要的朋友可以参考下
    2022-12-12
  • Python两个字典键同值相加的几种方法

    Python两个字典键同值相加的几种方法

    今天小编就为大家分享一篇关于Python两个字典键同值相加的几种方法,小编觉得内容挺不错的,现在分享给大家,具有很好的参考价值,需要的朋友一起跟随小编来看看吧
    2019-03-03
  • Python中实现堆排序算法

    Python中实现堆排序算法

    堆排序是一种强大的算法,用于在 Python 中对数组和列表进行排序, 它很受欢迎,因为它非常快,并且不像合并排序和快速排序那样占用任何额外空间,本篇文章将介绍堆排序算法在 Python 中的实现,感兴趣的朋友跟随小编一起看看吧
    2023-08-08
  • pytorch中的matmul与mm,bmm区别说明

    pytorch中的matmul与mm,bmm区别说明

    这篇文章主要介绍了pytorch中的matmul与mm,bmm区别说明,具有很好的参考价值,希望对大家有所帮助。如有错误或未考虑完全的地方,望不吝赐教
    2021-05-05
  • 使用python将图片按标签分入不同文件夹的方法

    使用python将图片按标签分入不同文件夹的方法

    今天小编就为大家分享一篇使用python将图片按标签分入不同文件夹的方法,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2018-12-12
  • Python numpy.array()生成相同元素数组的示例

    Python numpy.array()生成相同元素数组的示例

    今天小编就为大家分享一篇Python numpy.array()生成相同元素数组的示例,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2018-11-11
  • python用TensorFlow做图像识别的实现

    python用TensorFlow做图像识别的实现

    这篇文章主要介绍了python用TensorFlow做图像识别的实现,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
    2020-04-04
  • Python游戏开发之精灵和精灵组

    Python游戏开发之精灵和精灵组

    python作为当前非常受欢迎的编程语言,很大一部分原因是拥有丰富的库,这篇文章主要给大家介绍了关于Python游戏开发之精灵和精灵组的相关资料,文中通过图文介绍的非常详细,需要的朋友可以参考下
    2023-05-05
  • 分享15 超级好用得 Python 实用技巧

    分享15 超级好用得 Python 实用技巧

    这篇文章主要分享了15 超级好用得 Python 实用技巧,如果你对其中一个或多个感兴趣,可以参考一下,希望对你能有所帮助
    2021-12-12

最新评论