Python实现的一个简单LRU cache

 更新时间:2014年09月26日 12:03:05   投稿:junjie  
这篇文章主要介绍了Python实现的一个简单LRU cache,本文根据实际需求总结而来,需要的朋友可以参考下

起因:我的同事需要一个固定大小的cache,如果记录在cache中,直接从cache中读取,否则从数据库中读取。python的dict 是一个非常简单的cache,但是由于数据量很大,内存很可能增长的过大,因此需要限定记录数,并用LRU算法丢弃旧记录。key 是整型,value是10KB左右的python对象

分析:

1)可以想到,在对于cache,我们需要维护 key -> value 的关系

2)而为了实现LRU,我们又需要一个基于时间的优先级队列,来维护   timestamp  -> (key, value) 的关系

3)当cache 中的记录数达到一个上界maxsize时,需要将timestamp 最小的(key,value) 出队列

4) 当一个(key, value) 被命中时,实际上我们需要将它从队列中,移除并插入到队列的尾部。

从分析可以看出我们的cache 要达到性能最优需要满足上面的四项功能,对于队表的快速移除和插入,链表显然是最优的选择,为了快速移除,最好使用双向链表,为了插入尾部,需要有指向尾部的指针。

下面用python 来实现:

复制代码 代码如下:

#encoding=utf-8

class LRUCache(object):
    def __init__(self, maxsize):
        # cache 的最大记录数
        self.maxsize = maxsize
        # 用于真实的存储数据
        self.inner_dd = {}
        # 链表-头指针
        self.head = None
        # 链表-尾指针
        self.tail = None

    def set(self, key, value):
        # 达到指定大小     
        if len(self.inner_dd) >= self.maxsize:
            self.remove_head_node()

        node = Node()
        node.data = (key, value)
        self.insert_to_tail(node)
        self.inner_dd[key] = node

    def insert_to_tail(self, node):
        if self.tail is None:
            self.tail = node
            self.head = node
        else:
            self.tail.next = node
            node.pre = self.tail
            self.tail = node

    def remove_head_node(self):
        node = self.head
        del self.inner_dd[node.data[0]]
        node = None
        self.head = self.head.next
        self.head.pre = None
    def get(self, key):
        if key in self.inner_dd:
            # 如果命中, 需要将对应的节点移动到队列的尾部
            node = self.inner_dd.get(key)
            self.move_to_tail(node)
            return node.data[1]
        return None

    def move_to_tail(self, node):
        # 只需处理在队列头部和中间的情况
        if not (node == self.tail):
            if node == self.head:
                self.head = node.next
                self.head.pre = None
                self.tail.next = node
                node.pre = self.tail
                node.next = None
                self.tail = node
            else:
                pre_node = node.pre
                next_node = node.next
                pre_node.next = next_node
                next_node.pre = pre_node

                self.tail.next = node
                node.pre = self.tail
                node.next = None
                self.tail = node

class Node(object):
    def __init__(self):
        self.pre = None
        self.next = None
        # (key, value)
        self.data = None

    def __eq__(self, other):
        if self.data[0] == other.data[0]:
            return True
        return False
    def __str__(self):
       return str(self.data)

if __name__ == '__main__':
    cache = LRUCache(10)
    for i in xrange(1000):
        cache.set(i, i+1)
        cache.get(2)
    for key in cache.inner_dd:
        print key, cache.inner_dd[key]

您可能感兴趣的文章:

相关文章

  • 利用scikitlearn画ROC曲线实例

    利用scikitlearn画ROC曲线实例

    这篇文章主要介绍了利用scikitlearn画ROC曲线实例,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2020-07-07
  • python pdb调试器及使用方法

    python pdb调试器及使用方法

    这篇文章主要介绍了python pdb调试器及使用方法,本文给大家介绍的非常详细,对大家的学习或工作具有一定的参考借鉴价值,需要的朋友可以参考下
    2022-06-06
  • 使用批处理脚本自动生成并上传NuGet包(操作方法)

    使用批处理脚本自动生成并上传NuGet包(操作方法)

    这篇文章主要介绍了使用批处理脚本自动生成并上传NuGet包的操作方法,非常不错,具有一定的参考借鉴价值,需要的朋友可以参考下
    2019-11-11
  • python使用多线程备份数据库的步骤

    python使用多线程备份数据库的步骤

    在日常服务器运维工作中,备份数据库是必不可少的,刚工作那会看到公司都是用shell脚本循环备份数据库,到现在自己学习python语言后,利用多进程多线程相关技术来实现并行备份数据库,充分利用服务器资源,提高备份速度。
    2021-05-05
  • python使用append合并两个数组的方法

    python使用append合并两个数组的方法

    这篇文章主要介绍了python使用append合并两个数组的方法,涉及Python中append方法的使用技巧,需要的朋友可以参考下
    2015-04-04
  • 16行Python代码实现微信聊天机器人并自动智能回复功能

    16行Python代码实现微信聊天机器人并自动智能回复功能

    聊天机器人自动智能回复给我们的生活带来了极大的便利,尤其在业务比较繁忙的时候,智能机器人给我们带来极大的方便,今天小编教大家一招通过16行代码实现微信聊天智能机器人,感兴趣的朋友一起看看吧
    2022-01-01
  • python 爬虫一键爬取 淘宝天猫宝贝页面主图颜色图和详情图的教程

    python 爬虫一键爬取 淘宝天猫宝贝页面主图颜色图和详情图的教程

    今天小编就为大家分享一篇python 爬虫一键爬取 淘宝天猫宝贝页面主图颜色图和详情图的教程,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2018-05-05
  • Python实现多个圆和圆中圆的检测

    Python实现多个圆和圆中圆的检测

    这篇文章主要为大家详细介绍了Python如何实现多个圆检测和圆中圆的检测,文中的实现方法讲解详细,具有一定的借鉴价值,需要的可以参考一下
    2022-11-11
  • pandas如何将datetime64[ns]转为字符串日期

    pandas如何将datetime64[ns]转为字符串日期

    这篇文章主要介绍了pandas如何将datetime64[ns]转为字符串日期,具有很好的参考价值,希望对大家有所帮助。如有错误或未考虑完全的地方,望不吝赐教
    2022-07-07
  • python实现mask矩阵示例(根据列表所给元素)

    python实现mask矩阵示例(根据列表所给元素)

    这篇文章主要介绍了python实现mask矩阵示例(根据列表所给元素),文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
    2020-07-07

最新评论