Python文本处理简单易懂方法解析

更新时间：2019年12月19日 10:11:35 作者：Python探索牛

这篇文章主要介绍了Python文本处理简单易懂方法解析,文中通过示例代码介绍的非常详细，对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下

自从认识了python这门语言，所有的事情好像变得容易了，作为小白，逗汁儿今天就为大家总结一下python的文本处理的一些小方法。

话不多说，代码撸起来。

python大小写字符互换

在进行大小写互换时，常用到的方法有4种，upper（）、lower（）、capitalize() 和title（）。

str = "www.dataCASTLE.com"
print(str.upper())# 把所有字符中的小写字母转换成大写字母
print(str.lower())# 把所有字符中的大写字母转换成小写字母
print(str.capitalize())# 把第一个字母转化为大写字母，其余小写
print(str.title())# 把每个单词的第一个字母转化为大写，其余小写 
WWW.DATACASTLE.COM
www.datacastle.com
Www.datacastle.com
Www.Datacastle.Com

还可以同时进行大小写互换：

s="hGdssWW678qqfdDDD777f8888sD8FJJss jjYYhVV #sh&" 
def fn(x):
  if x.is lower():
    return x.upper()
  elif x.is upper():
    return x.lower()
  else:
    return x
result=''.join([fn(r) for r in list(s)])
print(result)
HgDSSww678QQFDddd777F8888Sd8fjjSS JJyyHvv #SH&

在s当中，不仅有大小写字母，还有数字，符号作为干扰，运用代码成功将大小写进行了互换。

行列互换

01 ：insert进行A行与N行的互换

with open('D:
.txt','r') as f:
  txt=f.readlines()
  txt.insert(4,txt[1])#第二行插入第五行的位置
  del(txt[1])#删除原来的第二行
  print(txt)
1  A  一 
3  C  三 
4  D  四 
2  B  二 
5  E  五 
6  F  六

02：矩阵的行列互换

matrix = [[1, 1, 1, 1],
         [2, 2, 2, 2],
         [3, 3, 3, 3],]

trans = []
for i in range(4):
  trans.append([row[i] for row in matrix])

print('', trans)
 [[1, 2, 3], 
 [1, 2, 3], 
 [1, 2, 3], 
 [1, 2, 3]]

关于行列互换的情况，python有一个很好用的库pandas，其中的操作非常简便，可以到之前的文章”十分钟上手pandas“中查看。

实现快速排序

快排的思想：首先任意选取一个数据（通常选用数组的第一个数）作为关键数据，然后将所有比它小的数都放到它前面，所有比它大的数都放到它后面，这个过程称为一趟快速排序。

01：超级"简短"的python实现的快速排序，一行代码轻松实现快速排序。

def quickSort(arg):
  if(arg==[]):
     return []
  return quickSort([i for i in arg[1:] if i<=arg[0]])+[arg[0]]+quickSort([i for i in arg[1:] if i>arg[0]])
print quickSort([11,22,8,23,7,33,13,28,66,777])
[7, 8, 11, 13, 22, 23, 28, 33, 66, 777]

02：一般快排实现

def quicksort(array, left, right):
  #建立递归终止条件
  if left >= right:
    return
  low = left#low为序列左边要移动的游标
  high = right#high为序列右边要移动的游标
  key = array[low]#将左边的数设为基准元素

  while left < right:
    # 当left与right未重合，并且比基准元素要大，就将游标向左移动
    while left < right and array[right] > key:
      right -= 1
    # 如果比基准元素小，就跳出循环，并且把其放在基准元素左边
    array[left] = array[right]

    # 当low与last未重合，并且比基准元素要小，就将游标向右移动
    while left < right and array[left] <= key:
      left += 1
    # 如果比基准元素大，就跳出循环，并且把其放在基准元素右边
    array[right] = array[left]

  # 当low与last相等，就是基准元素的排序位置
  array[right] = key

  # 对排序好的元素左右两边的序列进行递归
  quicksort(array, low, left - 1)
  quicksort(array, left + 1, high)

array = [11,22,8,23,7,33,13,28,66,777]
print("Quick Sort: ")
quicksort(array,0,len(array)-1)
print(array)
[7, 8, 11, 13, 22, 23, 28, 33, 66, 777]

03：《算法导论》中的快排程序

def quicksort(array, l, r):
  if l < r:
    q = partition(array, l, r)
    quick_sort(array, l, q - 1)
    quick_sort(array, q + 1, r)

def partition(array, l, r):
  x = array[r]
  i = l - 1
  for j in range(l, r):
    if array[j] <= x:
      i += 1
      array[i], array[j] = array[j], array[i]
  array[i + 1], array[r] = array[r], array[i+1]
  return i + 1
array = [11,22,8,23,7,33,13,28,66,777]
print("Quick Sort: ")
quicksort(array,0,len(array)-1)
print(array)
[7, 8, 11, 13, 22, 23, 28, 33, 66, 777]

04：python对list有一个内置函数sorted()排序

a = [11,22,8,23,7,33,13,28,66,777]
b=sorted(a)
print(b)
print(a)

[7, 8, 11, 13, 22, 23, 28, 33, 66, 777]
[11, 22, 8, 23, 7, 33, 13, 28, 66, 777]

sorted虽然是使用函数方法进行排序，但是效果非常好。使用sorted函数进行排序，不会改变a原有的排序，并且当文本中有其余字母符号等干扰时，也可以成功的将数字进行排序。

文本对齐

有些时候我们得到的文本可能是混乱的，需要进行对齐处理，关于对齐有以下几种方法：

01：format格式化对齐

# format格式化对齐
def f1():  
  with open("D:
.txt","r") as f:
    for s in f:
      l=s.rsplit ()
      #左对齐，填充符号自定
      t='{0:<5} {1:<7} {2}'.format(l[0],l[1],l[2])  
      print(str(t))
f1()

111   ABC     西瓜
22222 AABBC   水蜜桃
3333  CSDDGFF 香蕉
44    QQQSED  波罗蜜

02：just对齐

#just对齐
r=''
def f2():
  f=open("D:
.txt","r")
  for s in f:
    l=s.rsplit() #通过指定分隔符对字符串进行切片
    print(l[0].ljust(5," "),l[1].ljust(7," "),l[2])
f2()

111   ABC     西瓜
22222 AABBC   水蜜桃
3333  CSDDGFF 香蕉
44    QQQSED  波罗蜜

分行输出

01：正则表达式分行输出

#正则表达式
a="aA1一bB2二cC3三dD4四eE5五fF6六gG7七hH8八iI9九"
import re
reg=["[a-z]","[A-Z]","d","[^da-zA-Z]"]
#compile和findall一起使用，返回一个列表
for s in reg:  
  rega=re.compile(s)
  s=re.findall(rega,a)
  print("".join(s))

abcdefghi
ABCDEFGHI
123456789
一二三四五六七八九

02：string方法分行输出

#string方法
a="aA1一bB2二cC3三dD4四eE5五fF6六gG7七hH8八iI9九"
import string
ta=tb=tc=td=''
la=string.ascii_lowercase#la为小写字母
ua=string.ascii_uppercase#ua为大写字母
nb=string.digits#nb为0~9的数字
ub="一二三四五六七八九"

#分别从a中找出小写、大写字母、数字并进行分行输出
for s in a:
  if s in la:
    ta=ta+s
  if s in ua:
    tb=tb+s
  if s in nb:
    tc=tc+s
  if s in ub:
    td=td+s
print(ta)
print(tb)
print(tc)
print(td)

abcdefghi
ABCDEFGHI
123456789
一二三四五六七八九

好了，今天的分享就到这里。

以上就是本文的全部内容，希望对大家的学习有所帮助，也希望大家多多支持脚本之家。

您可能感兴趣的文章:

浅谈pandas中Dataframe的查询方法([], loc, iloc, at, iat, ix)
下面小编就为大家分享一篇浅谈pandas中Dataframe的查询方法([], loc, iloc, at, iat, ix)，具有很好的参考价值，希望对大家有所帮助。一起跟随小编过来看看吧
2018-04-04
Python爬虫之正则表达式基本用法实例分析
这篇文章主要介绍了Python爬虫之正则表达式基本用法,结合实例形式分析了Python正则表达式的基本概念、函数语法、相关使用方法及操作注意事项,需要的朋友可以参考下
2018-08-08
matplotlib一维散点分布图的实现
本文主要介绍了matplotlib一维散点分布图的实现，文中通过示例代码介绍的非常详细，对大家的学习或者工作具有一定的参考学习价值，需要的朋友们下面随着小编来一起学习学习吧
2023-03-03
python持久化存储文件操作方法
本文给大家分享python持久化存储文件操作方法，给大家讲解存储文件的重要性，指针的基本概念及关闭文件的方法，介绍文件的创建和删除技巧，感兴趣的朋友一起看看吧
2021-06-06
Python PyMuPDF实现PDF与图片和PPT相互转换
能够用来对PDF文档进行操作的Python包有好几个，如提取内容的PdfPlumber、PDFMiner，可以用来对PDF文件进行修改操作的PyPDF2等等，如果只是需要简单地对PDF文件实现合并、拆分、书签操作，使用PyPDF2就足以满足。但如果想对PDF文件进行一些底层操作，基本上只有PyMuPDF了
2022-12-12
Python实现插入排序和选择排序的方法
这篇文章主要介绍了Python实现插入排序和选择排序的方法,非常不错，具有一定的参考借鉴价值，需要的朋友可以参考下
2019-05-05
使用Python绘制动态爱心并表白的代码详解
在这个充满浪漫的季节,如何用代码表达你的爱意呢？今天我们将使用 Python 的 matplotlib 和 numpy 库绘制一个动态的爱心,并且在爱心上添加表白的文字,这将是一个独特而浪漫的方式来表达你的心声,感兴趣的小伙伴跟着小编来看看吧
2025-04-04
基于python 将列表作为参数传入函数时的测试与理解
这篇文章主要介绍了基于python 将列表作为参数传入函数时的测试与理解，具有很好的参考价值，希望对大家有所帮助。一起跟随小编过来看看吧
2020-06-06
pandas.DataFrame的for循环迭代的实现
本文主要介绍了pandas.DataFrame的for循环迭代的实现，文中通过示例代码介绍的非常详细，对大家的学习或者工作具有一定的参考学习价值，需要的朋友们下面随着小编来一起学习学习吧
2023-02-02
Python实现考试自动答题的脚本分享
最近这段时间天气正正好，不冷不热，是学习考驾照的好时机。为了帮助大家能够顺利获得驾照，小编为大家准备了驾照考试的自动答题小程序，希望对大家有所帮助
2023-03-03

Python文本处理简单易懂方法解析

相关文章

最新评论

大家感兴趣的内容

最近更新的内容

常用在线小工具