信息架构本质(8)
时间:2025-07-08
时间:2025-07-08
信息架构本质
文件存储需求 = (平均文件大小 * 文件数量 + 索引大小 * 索引数年) * 2(针对备份需求)
如果使用压缩,那么您通常可以将结果除以一个最大为 2 的因子,具体取决于文件是否已经压缩(例如 JPEG 和 MPEG 文件)。还要注意,文件元数据存储需求通常仅占总体存储需求的一小部分。
如 果需要适应一些超大型文件,可以对平均数使用一个权重因子来扩展这个简单计算。无论存储机制如何(数据库、网络设备 [磁带] 或文件系统),存储需求都是相似的。请记住,您必须为将来的需求提供足够的扩展余地,并提供足够的带宽以满足用户进行内容下载。至于处理器能力,如果按照 搜索需要对与文件关联的元数据正确建立了索引(仅命中索引),则处理器需求往往与用户的负载呈线性比例关系。
组织信息
内容的组织意味着必须以某种方式标记所有信息,以便以后用户能够容易地定位信息。此标记可以像文档标题一样简单,也可以像美国国会图书馆的元分类 (metacategory) 方法(请参见 参考资料)一样复杂。在任一种情况下,最好在正式的元数据定义文档中开发控制词汇,以指导初始的存储库开发和新资料的获取。控制词汇 是适用于存储库中所有信息的分类标签层次结构。对于大多数目的,单个层次结构就足够了,例如用于简单的文档检索;但是如果存储了多种内容形式,您可能需要 在交叉引用的二级层次结构中组织资料(例如,第一维可以描述内容,第二维可以表示内容形式——戏剧/视频或纪录片/录音书籍)。 对于任何控制词汇,为每个级别的标记层次选择正确的粒度对于维护和信息导航来说都是一个关键决策。这是信息组织工作中最困难的部分,并且是最可能在添加新的资料方面导致长期困难性的部分。本系列中的下一篇文章将讨论对于控制词汇的开发非常重要的抽象和矫正问题。
通过最终用户熟悉的术语选择,可以直接影响对存储库搜索的返回结果集进行导航和筛选的能力。如果资料的组织方式对您的用户没有意义,那么建立受控的资料组织方式将没有任何用处。在为内容开发元数据标记时,务必要花时间了解信息上下文的性质。
管理信息
存储库的管理涉及到在存档较旧的资料和添加较新的资料时定期更新资料。取决于信息的技术存储机制(数据库、内容管理系统或文件系统),配置变更控制机制要么直接由存储软件提供(例如对于内容管理系统),要么必须在信息存储之上进行分层(例如对于文件系统)。
配置管理提供了多种信息管理用途:
上一篇:内蒙古工业大学文献检索第3单元
下一篇:独家销售代理的协议通用范本