Python实现删除Android工程中的冗余字符串

 更新时间:2015年01月19日 10:04:13   投稿:junjie  
这篇文章主要介绍了Python实现删除Android工程中的冗余字符串,本文实现的是删除Android资源(语言)国际化机制中的一些冗余字符串,需要的朋友可以参考下

Android提供了一套很方便的进行资源(语言)国际化机制,为了更好地支持多语言,很多工程的翻译往往会放到类似crowdin这样的平台上。资源是全了,但是还是会有一些问题。

哪些问题

以下使用一些语言进行举例。其中values为工程默认的资源。

1.某语言的资源和某语言限定区域的资源之间。如values-fr-rCA存在于values-fr相同的字符串,这种表现最为严重。
2.某语言的资源和默认的资源之间。values-fr存在与values相同的字符串,可能原因是由于values-fr存在未翻译字符串导致

为什么要去重

洁癖,容不下半点冗余。

解决思路

1.如果values-fr-rCA存在于values-fr相同的字符串,去除values-fr-rCA中的重复字符串,保留values-fr。这样可以保证在values-fr-rCA下也可以正确读取到资源。

2.如果values-fr存在与values相同的字符串。如去除values-fr中得重复字符串,保留values的条目。

Py脚本

复制代码 代码如下:

#!/usr/bin/env python
# coding=utf-8
from os import listdir,path, system
from sys import argv
try:
    import xml.etree.cElementTree as ET
except ImportError:
    import xml.etree.ElementTree as ET


def genRegionLangPair(filePath):
    basicLanguage = None
    if ('values' in filePath) :
        hasRegionLimit = ('r' == filePath[-3:-2])
        if (hasRegionLimit):
            basicLanguage = filePath[0:-4]
            if (not path.exists(basicLanguage)) :
                return None
            belongsToEnglish =  ("values-en" in basicLanguage)
            if (belongsToEnglish):
                #Compare with the res/values/strings.xml
                return (path.dirname(basicLanguage) + '/values/strings.xml', filePath + "/strings.xml")
            else:
                return (basicLanguage + '/strings.xml', filePath + "/strings.xml")
    return None

def genLangPair(filePath):
    def shouldGenLanPair(filePath):
        if (not 'values' in filePath ):
            return False
        if('dpi' in filePath):
            return False
        if ('dimes' in filePath):
            return False
        if ('large' in filePath):
            return False
        return True

    if(shouldGenLanPair(filePath)):
        basicLanguage = path.dirname(filePath) + '/values/strings.xml'
        targetLanguage = filePath + '/strings.xml'
        if (not path.exists(targetLanguage)):
           return None

        if (not path.samefile(basicLanguage,targetLanguage)) :
            return (basicLanguage, targetLanguage)
    return None

def genCompareList(filePath):
    compareLists = []
    for file in listdir(filePath):
        regionPair = genRegionLangPair(filePath + '/' + file)
        if (None != regionPair):
            compareLists.append(regionPair)

        languagePair = genLangPair(filePath + '/' + file)
        if (None != languagePair) :
            compareLists.append(languagePair)

    return compareLists

def getXmlEntries(filePath):
    root = ET.ElementTree(file=filePath).getroot()
    entries = {}
    for child in root:
        attrib = child.attrib
        if (None != attrib) :
            entries[attrib.get('name')] = child.text
    print 'xmlEntriesCount',len(entries)
    return entries

def rewriteRegionFile(sourceEntries, filePath):
    if (not path.exists(filePath)):
        return
    ET.register_namespace('xliff',"urn:oasis:names:tc:xliff:document:1.2")
    tree = ET.ElementTree(file=filePath)
    root = tree.getroot()
    print root
    totalCount = 0
    removeCount = 0
    unRemoveCount = 0
    print len(root)
    toRemoveList = []
    for child in root:
        totalCount = totalCount + 1
        attrib = child.attrib
        if (None == attrib):
            continue

        childName = attrib.get('name')

        if (sourceEntries.get(childName) == child.text):
            removeCount = removeCount + 1
            toRemoveList.append(child)
        else:
            unRemoveCount = unRemoveCount + 1
            print childName, sourceEntries.get(childName), child.text
    print filePath,totalCount, removeCount,unRemoveCount

    for aItem in toRemoveList:
        root.remove(aItem)

    if (len(root) != 0 ):
        tree.write(filePath, encoding="UTF-8")
    else:
        command = 'rm -rf %s'%(path.dirname(filePath))
        print command
        system(command)

def main(projectDir):
    lists = genCompareList(projectDir + "/res/")

    for item in lists:
        print item
        src = item[0]
        dest = item[1]
        rewriteRegionFile(getXmlEntries(src),dest)

if __name__ == "__main__":
    if (len(argv) == 2) :
        main(argv[1])

如何使用

复制代码 代码如下:

python removeRepeatedStrings.py your_android_project_root_dir

相关文章

  • Python操作MongoDB的教程详解(插,查,改,排,删)

    Python操作MongoDB的教程详解(插,查,改,排,删)

    MongoDB是一个基于分布式文件存储的数据库。是一个介于关系数据库和非关系数据库之间的产品,是非关系数据库当中功能最丰富,最像关系数据库的。本文将详细和大家聊聊Python操作MongoDB的方法,需要的可以参考一下
    2022-09-09
  • 使用Tensorflow hub完成目标检测过程详解

    使用Tensorflow hub完成目标检测过程详解

    这篇文章主要为大家介绍了使用Tensorflow hub完成目标检测过程详解,有需要的朋友可以借鉴参考下,希望能够有所帮助,祝大家多多进步,早日升职加薪
    2023-04-04
  • python中列表的常见操作梳理总结(二)

    python中列表的常见操作梳理总结(二)

    这篇文章主要介绍了python中列表的常见操作总结,文章围通过列表的索引与切片的相关资料展开全文详细的内容,具有一定的参考价值,需要的小伙伴可以参考一下
    2022-07-07
  • pandas表连接 索引上的合并方法

    pandas表连接 索引上的合并方法

    今天小编就为大家分享一篇pandas表连接 索引上的合并方法,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2018-06-06
  • 零基础写python爬虫之抓取百度贴吧并存储到本地txt文件改进版

    零基础写python爬虫之抓取百度贴吧并存储到本地txt文件改进版

    前面已经发了一篇关于百度贴吧抓取的代码,今天我们来看下代码的改进版,参考了上篇抓取糗事百科的思路,给需要的小伙伴们参考下吧
    2014-11-11
  • Python报错TypeError: object of type ‘generator‘ has no len ()的解决方法

    Python报错TypeError: object of type ‘gener

    在Python开发的复杂世界中,报错信息就像神秘的谜题,困扰着开发者和环境配置者,其中,TypeError: object of type ‘generator’ has no len()这个报错,常常在不经意间打乱我们的开发节奏,本文让我们一起深入探究这个报错问题,为Python开发之路扫除障碍
    2024-10-10
  • python单向循环链表原理与实现方法示例

    python单向循环链表原理与实现方法示例

    这篇文章主要介绍了python单向循环链表原理与实现方法,结合实例形式详细分析了Python单向循环链表概念、原理、定义及使用方法,需要的朋友可以参考下
    2019-12-12
  • python利用pandas分析学生期末成绩实例代码

    python利用pandas分析学生期末成绩实例代码

    pandas是数据分析师最常用的工具之一,这篇文章主要给大家介绍了关于python如何利用pandas分析学生期末成绩的相关资料,文中给出了详细的实现方法,需要的朋友可以参考下
    2021-07-07
  • Python算法之求n个节点不同二叉树个数

    Python算法之求n个节点不同二叉树个数

    本文先向大家分享了建立二叉树的简单代码,其次介绍了Python计算n个节点不同二叉树个数的问题及实现代码示例,具有一定参考价值,需要的朋友可以了解下。
    2017-10-10
  • 提升python处理速度原理及方法实例

    提升python处理速度原理及方法实例

    这篇文章主要介绍了提升python处理速度原理及方法实例,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下
    2019-12-12

最新评论