python实现txt文件格式转换为arff格式

 更新时间:2018年05月31日 10:05:40   作者:君的名字  
这篇文章主要为大家详细介绍了python实现txt文件格式转换为arff格式的方法,具有一定的参考价值,感兴趣的小伙伴们可以参考一下

本文实例为大家分享了python实现txt文件格式转换为arff格式的具体代码,供大家参考,具体内容如下

将文件读取出来的时候默认都是字符型的,所以有转换出来有点问题,但是还是可以用的。

文件要求第一行是你对应的属性名,之后是数字。

import sys 
import re 
 
relationname = "" 
filename = "" 
 
if (len(sys.argv)<2): 
  print("Usage:\npython arff.py MyRelationName filename.txt") 
else: 
  relationname = sys.argv[1] 
  filename = sys.argv[2] 
 
 
class Arff: 
  def __init__(self, r, f): 
    self.relationname = r if r is not "" else "MachineLearning" 
    f = f if f is not "" else "MMG_data.txt" 
    self.file1 = open(f, 'r') 
    self.data = [] 
    self.names = [] 
    self.parseData() 
    self.writeToFile() 
 
  def parseData(self): 
    firstLine = True 
    for line in self.file1.readlines(): 
      if not firstLine: 
        try: 
          line = line.replace("\n", "") 
          words = line.split(" ") 
        except ValueError: 
          print("cant parse file!!") 
        self.data.append(words) 
      else: 
        firstLine = False 
        line = line.replace("\n", "") 
        words = line.split(" ") 
        self.names = words 
 
  def getType(self, value): 
    v = "" 
    if(type(value) == type(1)): 
      v = "numeric" 
    elif(type(value) == type(1.0)): 
      v = "numeric" 
    elif(re.match("[0-9]{4}\-[0-9]{2}\-[0-9]{2}\s[0-9]{2}\:[0-9]{2}\:[0-9]{2}", value)): 
      v = "date " + "yyyy-MM-dd HH:mm:ss" 
    elif(type(value) == type("string")): 
      v = "string" 
    elif(v == ""): 
      print("Data type "+value+" not supported yet.") 
    return v 
 
  def writeToFile(self): 
    values = self.data[0] 
    file2 = open("Dexhunter_test_result.arff", 'w+' ) 
 
    self.relationname+="\n" 
 
    relationString = '@RELATION ' + self.relationname 
    file2.write(''+relationString+'') 
 
    for i in range(len(self.names)): 
      str2 = "@ATTRIBUTE " + self.names[i] + " " + self.getType( values[i] ) + "\n" 
      file2.write(''+str2+'') 
    file2.write('''''@DATA\n''') 
 
    for line in self.data: 
      try: 
        file2.write(",".join(line)+"\n") 
      except UnicodeEncodeError: 
          print("cant write Data to file!!") 
 
Arff(relationname, filename) 

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持脚本之家。

相关文章

  • Pycharm配置anaconda环境图文教程

    Pycharm配置anaconda环境图文教程

    这篇文章主要介绍了Pycharm配置anaconda环境图文教程,具有很好的参考价值,希望对大家有所帮助。如有错误或未考虑完全的地方,望不吝赐教
    2022-11-11
  • django框架实现模板中获取request 的各种信息示例

    django框架实现模板中获取request 的各种信息示例

    这篇文章主要介绍了django框架实现模板中获取request 的各种信息,结合实例形式分析了Django框架模板直接获取request信息的相关配置与操作技巧,需要的朋友可以参考下
    2019-07-07
  • Python实现批量执行同目录下的py文件方法

    Python实现批量执行同目录下的py文件方法

    今天小编就为大家分享一篇Python实现批量执行同目录下的py文件方法,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2019-01-01
  • Python drop()删除行列的操作方法

    Python drop()删除行列的操作方法

    这篇文章主要介绍了Python drop()删除行列的操作方法,本文给大家介绍的非常详细,对大家的学习或工作具有一定的参考借鉴价值,需要的朋友可以参考下
    2023-04-04
  • Pandas DataFrame转换为字典的方法

    Pandas DataFrame转换为字典的方法

    实际开发中我们可能会遇到一类问题,如何将Pandas DataFrame转换为字典,本文就来介绍一下,感兴趣的可以了解一下
    2021-05-05
  • numpy.meshgrid()理解(小结)

    numpy.meshgrid()理解(小结)

    这篇文章主要介绍了numpy.meshgrid()理解,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
    2019-08-08
  • python工具之清理 Markdown 中没有引用的图片

    python工具之清理 Markdown 中没有引用的图片

    这篇文章主要介绍了python工具之清理 Markdown 中没有引用的图片,文章围绕主题展开详细的的内容介绍,需要的朋友可以参考一下
    2022-06-06
  • Django+Celery实现定时任务的示例

    Django+Celery实现定时任务的示例

    Celery是一个基于python开发的分布式任务队列,而做python WEB开发最为流行的框架莫属Django,本示例使用主要依赖包Django+Celery实现定时任务,感兴趣的朋友一起看看吧
    2021-06-06
  • 探究Python多进程编程下线程之间变量的共享问题

    探究Python多进程编程下线程之间变量的共享问题

    这篇文章主要介绍了探究Python多进程编程下线程之间变量的共享问题,多进程编程是Python学习进阶中的重要知识,需要的朋友可以参考下
    2015-05-05
  • python内置函数之eval函数详解

    python内置函数之eval函数详解

    这篇文章主要为大家介绍了python内置函数之eval函数,具有一定的参考价值,感兴趣的小伙伴们可以参考一下,希望能够给你带来帮助
    2022-01-01

最新评论