网站开发中的文件存储目录结构的探讨

 更新时间:2010年07月10日 00:37:43   作者:  
网站应用中经常会有文件存储的需求,目录结构该怎么建才好呢?让我们来做下分析
对于少量用户写信息,大量用户都是在看信息的网站:例如CMS系统,编辑发咨询,用户看,例如中小企业产品发布网站。 对于这类需求我们可以把文件专门放到一个目录下,例如放到网站根目录的upload目录下,然后按天建文件夹,将每天的文件放到一个目录下,文件名可采用数字生成。例如:upload/20100612/1224455.jpg;通常的情况下这种目录结构就可以保证每个目录下不会有太多的文件。

对于博客,论坛应用,需要对每个用户分配文件存储空间,如果有需求的话还要限制用户的存储空间,对于一般规模的网站目录结构可以用用户id+日期的形式;例如upload/234/20100612/abc.jpg。如果规模较大,可以将文件分布到几台不同的服务器上,可以根据用户id制定一个分布的规则,每台服务器用不同的域名,并在数据库中存储文件的完整url地址,这种情况下的路径结构通常是:http://file1.abc.com/upload/234/20100612/abc.jpg。

我曾经观察过微软的文件下载文件存储的路径结构,他是用guid生成的一个路径,例如:http://download.microsoft.com/download/5/6/7/567758a3-759e-473e-bf8f-52154438565a/dotnetfx.exe ;它这个结构目录是guid的前三位和guid做了一个4级的目录,这种情况下,就保证了,每个目录下不会有很多目录,因为是guid所以每一个文件都放到一个单一的目录下了,这种结构对于做下载的网站应该是一种不错的选择。

还有web2.0的网站会涉及到用户头像的存储,头像的存储比较特殊,一个用户固定有那么几个尺寸的图片,我们分析一下开心网和sina的头像地址,看他们是如何做的存储
1. 开心网的存储,如下是两对链接地址,每对中的第一个是头像地址,第二个是用户首页,首页中的参数是用户id

http://pic1.kaixin001.com.cn/logo/13/39/50_133973_82.jpg

http://www.kaixin001.com/home/?uid=133973

http://www.kaixin001.com/home/?uid=36131662

http://pic.kaixin001.com.cn/logo/13/16/50_36131662_2.jpg

可以看出开心网的存储方式是存储到几台不同的服务器上,头像的地址是根据用户的id去划分目录做的存储,id的前4位被分成两个目录,文件名用的是包含前缀+用户id+后缀的方式做的存储。
2. 如下是两对sina的空间地址,和博客头像的地址

http://space.sina.com.cn/u/1642511512

http://portrait1.sinaimg.cn/1642511512/blog/180

http://space.sina.com.cn/u/1725778305

http://portrait2.sinaimg.cn/1725778305/blog/180

Sina博客头像的存储方式和开心不同,是用户id做一级目录,然后加上blog(应该是应用的名字)再加上一个数字180(猜想可能是头像类型的数字);sina和开心的区别是没有图片扩展名,猜想它可能是把头像放到了一个键值对的数据库中,根据url参数从键值对数据库中取出头像的图片数据,然后输出给客户端

从上面的分析可以猜想开心可能是直接存的文件,而sina可能存储在键值对数据库中,如果数据量很大的话,应该是新浪的方式根据伸缩性。

最后我们还得提一下为我们提供服务的博客园的存储方式,如下地址:

http://pic.cnblogs.com/face/u15230.jpg

http://pic.cnblogs.com/face/u105416.png

http://pic.cnblogs.com/face/u40200.png

很简单直观应该是放到了一个目录下,直接用户id做的文件名,没有分目录结构,这样在文件夹中文件过多时是否会引起性能问题呢?

相关文章

  • 关于Sourcetree启动问题(完美解决)

    关于Sourcetree启动问题(完美解决)

    文章讲述了SourceTree闪退的问题及其解决方法,源因为未关闭SourceTree而关机或系统更新导致缓存信息不匹配,解决方法是删除缓存文件或特定缓存目录中的[Composition.cache]文件
    2024-11-11
  • Git标签管理

    Git标签管理

    本篇文章主要介绍了Git标签管理的相关知识。具有很好的参考价值。下面跟着小编一起来看下吧
    2017-04-04
  • 为Jenkins创建定时构建任务

    为Jenkins创建定时构建任务

    这篇文章介绍了为Jenkins创建定时构建任务的方法,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
    2022-03-03
  • 关于使用mvn deploy命令将本地jar包上传到maven私服的问题(收藏)

    关于使用mvn deploy命令将本地jar包上传到maven私服的问题(收藏)

    这篇文章主要介绍了使用mvn deploy命令将本地jar包上传到maven私服,分享本篇教程可以帮助多数朋友少走弯路,本文具有很好的收藏价值,需要的朋友可以参考下
    2022-03-03
  • hexo博客开启https的SSL 证书实现过程

    hexo博客开启https的SSL 证书实现过程

    这篇文章主要为大家介绍了hexo 博客开启https的SSL证书实现过程详解,有需要的朋友可以借鉴参考下,希望能够有所帮助,祝大家多多进步,早日升职加薪
    2023-10-10
  • 快速掌握和使用Flyway的详细教程

    快速掌握和使用Flyway的详细教程

    这篇文章主要介绍了快速掌握和使用Flyway的详细教程,需要的朋友可以参考下
    2020-07-07
  • 使用 Loki 实现 Kubernetes 容器日志监控的方法

    使用 Loki 实现 Kubernetes 容器日志监控的方法

    Loki 是由 Grafana Labs 团队开发的,基于 Go 语言实现,是一个水平可扩展,高可用性,多租户的日志聚合系统。它的设计非常经济高效且易于操作,这篇文章主要介绍了使用 Loki 实现 Kubernetes 容器日志监控的相关知识,感兴趣的朋友一起看看吧
    2022-05-05
  • Git Commitizen提交规范化自动生成changelog文件

    Git Commitizen提交规范化自动生成changelog文件

    这篇文章主要为大家介绍了Git Commitizen提交规范化自动生成changelog文件详解,有需要的朋友可以借鉴参考下,希望能够有所帮助,祝大家多多进步,早日升职加薪
    2022-09-09
  • git add -A 和 git add . 的区别详解

    git add -A 和 git add . 的区别详解

    这篇文章主要介绍了git add -A 和 git add . 的区别详解,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
    2020-07-07
  • IDEA编写SQL语句没有提示的解决办法

    IDEA编写SQL语句没有提示的解决办法

    这篇文章主要给大家介绍了关于IDEA编写SQL语句没有提示的解决办法,在IDEA中如果你在编写SQL语句时没有得到语法提示,可能是因为没有正确配置数据库连接或者缺少相应的插件,需要的朋友可以参考下
    2023-08-08

最新评论