信息管理概论整理版内容摘要:

其所含相关信息密度大,一直是信息服务机构选择和管理的重点对象。 但如果过分注重核心信息源,就会忽略分布在其他信息源中有价值的信息。 而且核心信息源如果不加以控制,任其在某一方面的优势过度积累,高度专门化,其所含的信息就会越来越单一,这对部分用户有利,但会失去更多的用户。 ,马太效应青 睐名人、拒绝新人的习惯势力不利于新人的成长,限制了新思想、新知识和新信息的产生及传播。 3)因此,马太效应的积累要适度,不能任其发展,为保证信息的产生和分布比较科学合理,适当的干预是必需的。 马太效应的数学模拟 马太效应描述的实质上是成功和失败机会的累积过程及效果,这一过程及效果可以用数学语言进行描述和模拟。 1)普利亚分布:亦称单缸模型,在单缸模型中,红球和黑球的每一次出现,都将进一步增加这种出现的频率,成功的结果增大了进一步成功的机会,同样,失败也增加了再次失败的机会。 2)塔格分布:又称多缸模型,是对单缸模型的补充和修正。 它能很好地模拟核心信息源的形成过程。 3)威布尔分布 信息 内容的离散分布规律 (布拉德福德 定律和齐夫定律) 信息的离散分布是信息的重要属性,它表现为信息的内容单元以不同方式从不同角度分布于各种载体中,信息的离散分布具有复杂的机理,本质上是由信息的生产和利用决定的。 信息的离散分布是人类所有信息活动的基础,也是对信息进行有效管理的基础。 1. 布拉德福定律: 某一学科领域中的相关论文在期刊中的分布是不均匀的,而且具有明显的集中与分散规律。 “如果将科学期刊按其刊 载某个学科主题的论文数量,以递减顺序排列起来,就可以在所有这些期刊中区分出载文率最高的‘核心’部分和包含着与核心部分同等数量论文的随后几区,这时核心区和后继各区中所含的期刊数成 1: a: a2 的关系”这就是布拉德福定律的区域表述形式。 布拉德福定律有两个基本要点:一是频次等级排序,形成主体来源(期刊)的有序目录;二是确定相关论文在主体来源中的分布规律。 文献分散的原因是,在某一新的学科中,写第一批论文时,人们首先把它寄给最合适的杂志发表。 这些杂志伴随着该学科的发展,刊载越来越多的这类文章。 于是许多著者都希望把他们的文章发表在本专业的,以前发表了大量高质量论文的这类杂志上。 投稿数量大大增加,使杂志选择性增大,因而对文章的质量要求提高,杂志的威信也日益提高,这就产生了一些带核心性质的杂志,这种现象就是文献分布中的“堆加”效应。 同时,有关这一学科的文章也在其他杂志上发表,这就产生了集中与分散的现象。 布拉德福定律也存在一些问题,如公式繁多、立论各异、至今尚无统一的结论,理论与实际脱节等。 这都说明该定律还不够成熟,经验色彩较浓。 另外,布拉德福定律主要揭示的是宏观层次的信息(文献)离散分布,而对于微观层次的信息(内容单元) 分布的研究则基本上是空白。 2. 齐夫定律: 如果将一篇较长文章(约 5000字以上)中每个词按其出现频次递减排列起来(高频词在前,低频词在后),并用自然数给这些词编上等级序号,出现频次最高的为 1级,其次为 2 级„„这样一直到 D级,如果用 f 表示词在文章中出现的频次,用 r 表示词的等级序号,则有: fr = c (齐夫定律) 式中 c 为常数。 齐夫定律的其他形式:因为齐夫定律是一个纯粹的经验定律,仅仅使用了一般的统计方法,其过于简单的形式和结论对于出现频次特别高的词和特别低的词都不能完全满足。 于是美国学者朱斯提出了双参 数等级分布定律;曼德尔布罗则运用信息论原理和概率论方法来研究词频分布,用三参数修正了齐夫定律,使其更具有一般性和普遍意义。 齐夫定律是对自然语言词汇统计所得到的规律。 但对于人工语言及人工语言语词构成的集合同样满足。 也完全符合汉语语言词汇的分布。 齐夫定律具有广泛的应用,在信息系统建设、词表管理和控制、自动标引、信息存贮与检索方面都取得了许多应用成果。 通过词频分布来提示信息的分布规律是齐夫定律在理论上的重要开拓。 三、 信息生产者的分布规律 (洛特卡 定律和 普赖斯 定律) :在论文数 X 和作者数 Yx 之间, 存在着下列一种关系: XnYx = C 此式中, Yx 是发表了论文 X篇的作者数, n 和 c 是对应于这一典型数据集合而估计出来的两个常数, n 的数值在 2 上下波动。 指数 n 近似为 2。 则上式可改为 :Yx = C / X2 所有生产一篇论文的著者的比例刚刚超过 60%, 生产 n 篇论文的作者数量大约是生产 1篇论文作者数量的 1 / n2。 洛特卡定律是对两组数据统计的推广,是对信息生产的一般理论估计,而不是一个精确的统计分布,因而有其局限性。 :即在某一特定领域中,全部论文的半数系由该领域中全部作者的平方根的那些人撰 写的。 “那些人”无疑是核心或高产作者。 不能将普赖斯定律绝对化,它仅是在洛特卡定律基础上提出的一种假说构思,洛特卡定律 n≠ 2 的情形同样影响着普赖斯定律。 普赖斯定律对我们的价值在于,它简洁地描述了信息按生产者能力的分布。 四、 信息对时间的分布规律 (指数 增长率,逐渐过时 率 ) 研究信息在时间轴上的动态分布规律可以提示信息的增长与老化,用科学高效的理论模型来刻画信息随时间的推移所表现出来的趋势,把握信息量的变化,对信息实施动态管理。 1. 指数增长率: 1)普赖斯曲线:如果用 F(t) 表示时刻 t的文献量,则指数定律可表示为: F(t) = aebt 其中a 是统计的初始时刻( t=0)的文献量; e = ; b 表示持续增长率 文献信息的指数增长规律在一定程度上正确反映了文献的实际增长情况。 文献信息(或者信息)指数增长的内在原因是由于社会信息流的传播和影响的结果。 在一个健全的社会信息交流系统中,那些业已掌握新思想、新信息的成员,必然主动或被动地影响其他社会成员。 人们接受新思想、新信息的概率会随着时间的推移而增大。 因为这与掌握新思想的累积人数有关。 这些掌握新思想和新信息的人数本身就是按指数增加的, 他们必然要从事知识信息的生产和传播,这就必然引致信息量指数增长。 文献信息的指数增长规律是对每一年的文献累积数而言的,并不是相对于每一年新发表的文献数量。 每年文献信息的累积数,即该年可以利用的文献总量。 文献信息的增长律仅仅是一个理想模式,它没有考虑到许多复杂的因素对文献增长的限制。 实际的统计发现,不同时期、不同级别、不同质量、不同学科领域的文献信息增长趋势是不一样的。 2)生长曲线: F(t) = k / 1 + aekbt 式中 F(t) 表示时刻 t 的文献量, k为文献增长的最大值。 普赖斯指出,考虑物质 的、经济的、智力的及时间的影响和限制,文献信息的增长更趋近于生物的生长曲线,即最初生长或繁殖很快,随着时间推移,其生长速度越来越慢,以致几乎不增加了。 生长曲线表明,在文献增长的初始阶段,它是符合指数增长规律的,但它不能始终保持指数增长的势头,当文献增至最大值的一半时,增长率开始变小,最后缓慢增长,最后到达极限。 如果单独就某一具体学科领域内文献的增长而言,生长曲线极好地描述了它们的增长规律。 在不同的阶段科学文献增长的态势是不同的。 学科处于诞生和发展阶段,文献量指数增长,文献的寿命较短。 随着研究深入,学科进 入相对成熟阶段,文献增长率变小,但文献寿命相对变长。 同时,也意味着该知识领域正面临新的突破,将产出更新的分支领域,而内容上更新的文献又将进入一个新的急剧增长时期,然后又进入一个稳定时期。 文献的增长往往会出现几个急剧增长时期和几个相对稳定时期,呈现出错综复杂的格局。 对不同的领域,描述其文献增长的生长曲线中各个常数是不相同的。 如果能分别对各门具体学科文献增长状况作历史的、全面的统计分析,绘制出相应的生长曲线,则对评价该门学科所处的阶段,预测其未来的发展,估计该学科不同时期的文献寿命,以指导信息搜集和提供,是很有意义的。 生长曲线的局限性:生长曲线意味着某个年代之后,再也没有新的文献产生,这显然是不符合实际的。 3)利用指数曲线和生长曲线来研究文献增长、预测未来文献总量必然会有局限,这是因为: A. 指数增长定律的产生,首先是普赖斯分析研究物理学文献数量的增长时提出的。 把 对文献某一方面、某一历史阶段的研究成果,推广到文献的全部领域,根据是不充分的。 B. 利用上述二曲线对文献增长所作的预测,依据的是预测学中的趋势外推法。 文献作为传播信息这一复杂系统中的子系统,其增长规律受到许多因素的影响和制约,只有利用系统论的观点对其作系统分析,才能得到比较符合实际的结果。 2. 逐渐过时律 1)文献信息的老化一般指这样四种情形:文献中所含信息仍然有用,但现在已被包含在更新的其他论著中;文献中信息仍旧有用,但现在正处于一个人们对其兴趣下降的学科;文献中的信息仍旧有用,但为后来的著作所超越; 信息不再有用。 2)所谓文献的半衰期:是指某学科领域现时尚在利用的全部文献中的一半是在多长一段时间内发表的。 半衰期大体上与某学科领域的文献中半数失效所经历的时间相同。 3)与半衰期有着密切联系的另一个衡量文献老化的指标是普赖斯指数,即某一学科领域内,对发表年限不超过 5 年的文献的引用次数与总引用次数之比值。 一般来说,普赖斯指数越大,半衰期就越小,文献老化的速度越快。 4)对文献按年代被引证的次数进行分析,可以得到某一门类或某一学科领域的文献老化速度最可靠的指标。 但是,必须利用大量的文献摘录、计算书目引证次数, 以便最大限度地补偿各种著作随意引证他人文献的特点。 文献老化速度的指标仅仅是概略性的,而且不是指个别的文献或某一组文献,指的是某一门类或某一学科领域文献的总和。 5)相应的方程可表示为 C(t) = keat , 其中 C(t) 表示发表了 t年的文献的被引次数, k是常数,随着学科不同而异 , a 为老化率。 6)已发表文献的老化速度,不仅取决于这些文献所属的学科领域,还取决于其他一些因素,特别是文献的种类和性质。 已发表的文献的半衰期,还与信息需求的特点有关。 7)文献信息老化受许多因素的影响: :文献的 增长和老化是一个事物的两个方面,它们从不同的侧面来描述科学的发展,阐明科学知识的修正率。 文献的老化,首先是与文献的增长联系在一起的。 文献增长得越快,文献的半衰期就越短。 如果每篇文献被引用的概率相同,由于文献增加的结果,会使得新文献被引的次数较多,而旧文献被引的机会减少,这样就加速了文献的老化。 :并不是所有学科的文献老化速度都是大体一样的,相反,彼此间差异很大。 普赖斯将文献分为两大类,一类是档案性文献,其半衰期大于 5 年,另一类则是有现时作用的文献,其半衰期小于 5 年。 :即使是同一学科,不同的时期或阶段,文献的半衰期也不完全相同。 学科处于诞生和发展初期,文献量指数增长,文献的老化符合负指数函数;进入相对成熟时期后,文献增长速度变小,其相应的老化曲线也变得平缓,半衰期加长。 半衰期加长,表明学科已进入相对成熟阶段,文献的科学价值达到一定深度,从而使文献利用寿命加长。 :不同信息用户对文献的需求是不同的,国家与国家,地区与地区之间对文献使用的年代也不完全相同。 8)逐渐过时律主要描述的是文献信息尤其是科学文献信息的老化模式,对于其他一些类型的 信息则不一定符合。 第 四章 信息 系统 一 、信息系统的基本概念 信息系统的概念与功能 1)信息系统是由计算机硬件、网络和通讯设备、计算机软件、信息资源、信息用户和规章制度组成的以处理信息流为目的的人机一体化系统。 2)信息系统的结构:为输入、存贮、处理、输出和控制等模块组成的逻辑结构。 3)信息系统的功能:是指具有确定结构的信息系统在一定的约束条件下作用于环境的能力,它表征了信息系统在与环境之间进行信息输入和输出的转换关系中对于环境的输出能力大小。 信息系统的功能可划分为输入、存贮、处理、输出和控制五个 基本功能。 图中用实线表示信息流,虚线表示控制流。 在信息流运动过程中,处理是核心功能,而在控制流的运动过程中,控制是核心功能。 不同的信息系统的系统结构、处理能力往往差别很大,体现在以上各模块上,控制和处理功能的差别最大。 :信息系统的输入功能决定于系统所要达到的目的及系统的能力和信息环境的许可。 包括信息资源的采集、控制指令的输入、信息检索条件的输入等等。 :信息系统的存贮功能是与输入功能紧密联系在一起的。 存贮功能指的是系统存贮各种信息资料和数据的能力。 当原始数据和资料输入信息系统 后,首先需要将其存贮起来,以便多次使用,并在多个处理环节和过程中实现数据资料共享。 在发生信息爆炸的现代信息环境中,一方面要求信息系统具有最大的存贮容量,另一方面,大量的存贮往往会带来系统检索、输出上的某些困难,降低系统的服务效率,给用户的利用造成不便。 信息系统的存贮,需要从实际出发尽可能少增加投资,扩大整体的存贮量,保证所存贮的数据资料充分有限,便于用户利用。 :大量的信息资料和数据得以存贮之后,必须及时进行加工处理。 处理是信息系统内部的生产过程。 计算机的应用使人类进行信息处理的能力大大增强。 信 息处理过程的机械化、自动化、协作化将会极大地提高系统的信息处理功能。 信息系统处理功能的大小,取决于系统内部的专业技术力量和信息处理技术设备的现代化水平。 :信息系统的各种功能都是为了保证最终实现最佳的输出功能。 信息经过处理后,输出内容包括经过信息系统加工处理后的资料信息等等。 信息系统的输出功能、处理功能、传输功能、存贮功能都是根据输出功能来确定并不断进行调整的。 :为了保持信息系统输入、存贮、。
阅读剩余 0%
本站所有文章资讯、展示的图片素材等内容均为注册用户上传(部分报媒/平媒内容转载自网络合作媒体),仅供学习参考。 用户通过本站上传、发布的任何内容的知识产权归属用户或原始著作权人所有。如有侵犯您的版权,请联系我们反馈本站将在三个工作日内改正。