python实现txt文件格式转换为arff格式

 更新时间:2018年05月31日 10:05:40   作者:君的名字  
这篇文章主要为大家详细介绍了python实现txt文件格式转换为arff格式的方法,具有一定的参考价值,感兴趣的小伙伴们可以参考一下

本文实例为大家分享了python实现txt文件格式转换为arff格式的具体代码,供大家参考,具体内容如下

将文件读取出来的时候默认都是字符型的,所以有转换出来有点问题,但是还是可以用的。

文件要求第一行是你对应的属性名,之后是数字。

import sys 
import re 
 
relationname = "" 
filename = "" 
 
if (len(sys.argv)<2): 
  print("Usage:\npython arff.py MyRelationName filename.txt") 
else: 
  relationname = sys.argv[1] 
  filename = sys.argv[2] 
 
 
class Arff: 
  def __init__(self, r, f): 
    self.relationname = r if r is not "" else "MachineLearning" 
    f = f if f is not "" else "MMG_data.txt" 
    self.file1 = open(f, 'r') 
    self.data = [] 
    self.names = [] 
    self.parseData() 
    self.writeToFile() 
 
  def parseData(self): 
    firstLine = True 
    for line in self.file1.readlines(): 
      if not firstLine: 
        try: 
          line = line.replace("\n", "") 
          words = line.split(" ") 
        except ValueError: 
          print("cant parse file!!") 
        self.data.append(words) 
      else: 
        firstLine = False 
        line = line.replace("\n", "") 
        words = line.split(" ") 
        self.names = words 
 
  def getType(self, value): 
    v = "" 
    if(type(value) == type(1)): 
      v = "numeric" 
    elif(type(value) == type(1.0)): 
      v = "numeric" 
    elif(re.match("[0-9]{4}\-[0-9]{2}\-[0-9]{2}\s[0-9]{2}\:[0-9]{2}\:[0-9]{2}", value)): 
      v = "date " + "yyyy-MM-dd HH:mm:ss" 
    elif(type(value) == type("string")): 
      v = "string" 
    elif(v == ""): 
      print("Data type "+value+" not supported yet.") 
    return v 
 
  def writeToFile(self): 
    values = self.data[0] 
    file2 = open("Dexhunter_test_result.arff", 'w+' ) 
 
    self.relationname+="\n" 
 
    relationString = '@RELATION ' + self.relationname 
    file2.write(''+relationString+'') 
 
    for i in range(len(self.names)): 
      str2 = "@ATTRIBUTE " + self.names[i] + " " + self.getType( values[i] ) + "\n" 
      file2.write(''+str2+'') 
    file2.write('''''@DATA\n''') 
 
    for line in self.data: 
      try: 
        file2.write(",".join(line)+"\n") 
      except UnicodeEncodeError: 
          print("cant write Data to file!!") 
 
Arff(relationname, filename) 

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持脚本之家。

相关文章

  • 如何使用OpenCV实现手势音量控制

    如何使用OpenCV实现手势音量控制

    今天来学习一下如何使用OpenCV实现手势音量控制,本次实验需要使用OpenCV和mediapipe库进行手势识别,并利用手势距离控制电脑音量,感兴趣的朋友跟随小编一起看看吧
    2023-11-11
  • python之excel文件(.xls文件)处理方式

    python之excel文件(.xls文件)处理方式

    这篇文章主要介绍了python之excel文件(.xls文件)处理方式,具有很好的参考价值,希望对大家有所帮助。如有错误或未考虑完全的地方,望不吝赐教
    2023-05-05
  • 解决Python报错:ValueError:operands could not be broadcast together with shapes

    解决Python报错:ValueError:operands could not be broadcast t

    这篇文章主要给大家介绍了关于解决Python报错:ValueError:operands could not be broadcast together with shapes的相关资料,文中通过实例代码介绍的非常详细,需要的朋友可以参考下
    2023-02-02
  • 详解Python数据类型、进制转换、字符串格式化的问题

    详解Python数据类型、进制转换、字符串格式化的问题

    这篇文章主要介绍了Python数据类型、进制转换、字符串格式化,Python2中区分整型int、长整型long,Python3中只有统称为整型int,本文给大家介绍的非常详细,需要的朋友参考下吧
    2022-04-04
  • pymysql模块的操作实例

    pymysql模块的操作实例

    在本篇文章里小编给大家分享的是关于pymysql模块的简单操作,有需要的朋友们可以参考下。
    2019-12-12
  • Python使用flask作为web服务器的代码实现

    Python使用flask作为web服务器的代码实现

    Python Flask 框架是一个轻量级的 Web 框架,它简单易用,灵活多变,非常适合用于构建小型到中型规模的 Web 应用程序,本文给大家介绍了Python使用flask作为web服务器的代码实现,需要的朋友可以参考下
    2024-06-06
  • python编程项目中线上问题排查与解决

    python编程项目中线上问题排查与解决

    因为业务上的设计存在问题,导致数据库表总是被锁,而且是不定期的锁定,导致服务器运行异常,今天就来跟大家说说该如何避免这种问题
    2021-11-11
  • 基于python3监控服务器状态进行邮件报警

    基于python3监控服务器状态进行邮件报警

    这篇文章主要介绍了基于python3监控服务器状态进行邮件报警,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下
    2019-10-10
  • Django Admin实现上传图片校验功能

    Django Admin实现上传图片校验功能

    这篇文章主要介绍了Django Admin实现上传图片校验功能的相关资料,需要的朋友可以参考下
    2016-03-03
  • Python文件与文件夹操作大全(非常全面)

    Python文件与文件夹操作大全(非常全面)

    Python具有强大的文件处理功能,如文件的创建、打开、文件内容的写入、读出文件中的内容等等,这篇文章主要介绍了Python文件与文件夹操作,需要的朋友可以参考下
    2023-09-09

最新评论