python处理csv中的空值方法

 更新时间:2018年06月22日 09:49:41   作者:勿在浮沙筑高台LS  
今天小编就为大家分享一篇python处理csv中的空值方法,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧

如下所示:

# -*- coding: UTF-8 -*-
import jieba.posseg
import tensorflow as tf
import pandas as pd
import csv
import math
"""
1.必須獲取CSV文件夾(ID:文本)
2.返回(ID:分词后的文本)
"""
flags = tf.app.flags
flags.DEFINE_string("train_file_address","D:/NLPWORD/cut_word_test/hzytest.csv","添加训练数据文件")
flags.DEFINE_string("result_file_address","D:/NLPWORD/cut_word_test/hzytest_result.csv","生成结果数据文件")
FLAGS = tf.app.flags.FLAGS
def cut_word(train_data):
 """
 把数据按照行进行遍历,然后把结果按照行写在csv中
 :return:分词结果list
 """
 jieba.load_userdict("newdict.txt")
 with open(FLAGS.result_file_address, "w", encoding='utf8') as csvfile:
 writer = csv.writer(csvfile)
 for row in train_data.index:
  datas = train_data.loc[row].values[1]
  if isinstance(datas,str) or not math.isnan(datas):
  words = jieba.posseg.cut(datas)
  line = ''
  for word in words:
   line = line + word.word + " "
  writer.writerow([train_data.loc[row].values[0], line])
def main(_):
 data = pd.read_csv(FLAGS.train_file_address)
 cut_word(data)

if __name__ == "__main__":
 tf.app.run(main)

以上这篇python处理csv中的空值方法就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持脚本之家。

相关文章

  • 谈谈python中GUI的选择

    谈谈python中GUI的选择

    本篇文章给大家详细分析了一个在python编程中GUI的选择相关知识点,如果大家对此有兴趣可以阅读参考下。
    2018-03-03
  • python 利用Pyinstaller打包Web项目

    python 利用Pyinstaller打包Web项目

    这篇文章主要介绍了python 利用Pyinstaller打包Web项目,帮助大家更好的理解和使用python,感兴趣的朋友可以了解下
    2020-10-10
  • python读取txt文件并取其某一列数据的示例

    python读取txt文件并取其某一列数据的示例

    今天小编就为大家分享一篇python读取txt文件并取其某一列数据的示例,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2019-02-02
  • python 用opencv调用训练好的模型进行识别的方法

    python 用opencv调用训练好的模型进行识别的方法

    今天小编就为大家分享一篇python 用opencv调用训练好的模型进行识别的方法,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2018-12-12
  • python3读取文件指定行的三种方法

    python3读取文件指定行的三种方法

    考虑到深度学习领域中的数据规模一般都比较大,尤其是训练集,这个限制条件对应到实际编程中就意味着,我们很有可能无法将整个数据文件的内容全部都加载到内存中。那么就需要一些特殊的处理方式,本文将要介绍的是从文件中只读取特定行的内容的3种解决方案。
    2021-05-05
  • 详解Python手写数字识别模型的构建与使用

    详解Python手写数字识别模型的构建与使用

    这篇文章主要为大家详细介绍了Python中手写数字识别模型的构建与使用,文中的示例代码简洁易懂,对我们学习Python有一定的帮助,需要的可以参考一下
    2022-12-12
  • tensorflow实现从.ckpt文件中读取任意变量

    tensorflow实现从.ckpt文件中读取任意变量

    这篇文章主要介绍了tensorflow实现从.ckpt文件中读取任意变量,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2020-05-05
  • python爬虫之请求模块urllib的基本使用

    python爬虫之请求模块urllib的基本使用

    urllib是python内置的HTTP请求库,是一个用来处理网络请求的python标准库,下面这篇文章主要给大家介绍了关于python爬虫之请求模块urllib的基本使用,需要的朋友可以参考下
    2022-04-04
  • python之mock模块基本使用方法详解

    python之mock模块基本使用方法详解

    这篇文章主要介绍了python之mock模块基本使用方法详解,Mock是Python中一个用于支持单元测试的库,它的主要功能是使用mock对象替代掉指定的Python对象,以达到模拟对象的行为,需要的朋友可以参考下
    2019-06-06
  • 通过实例简单了解Python中yield的作用

    通过实例简单了解Python中yield的作用

    这篇文章主要介绍了通过实例简单了解Python中yield的作用,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下
    2019-12-12

最新评论