游戏拍卖行系统毕业设计论文内容摘要:
in a matrix R0 (n, m), by duplicating, for each Ui of R, the row in R associated to Ui with cardinality of Ui . It is also possible to obtain a matrix associated to the database B, by replacing, for each Ui of R, the row in R associated to Ui by rows associated to Ui in B. Replacing n rows of B by p rows in R permit to decrease size of data to treat. Each row of R represents the mean of rows in B associated to Ui . Let RX be the reduced matrix associated to a projection PX of B. Given X a subset of attributes of database B from an attributepartition A. M is the operation of projection defined by M: B, X ! PX .Massociates the projection PX of B to the subset X. PX is obtain using a mask MX on matrix B. The mask MX is defined by a n, m matrix such as MXi j = 1, 8i, 8 j with Aj 2 X and MXi j = 0, 8i, 8 j with Aj 62 X. The operation of projectionM is then defined by:M(B, X) = MX t X = PX . Partition F. A partition of a database is a row partition of the associated matrix with putation of rows. This operation is achieved by the use of a classical clustering algorithm as a step of algorithm DPC. 网格上分布式数据库的聚类方法 ScienceDirect:Future Generation Computer Systems 23 (2020) 997– 1002 摘要 :集群和网格的工作站为数据挖掘过程提供可利用的资源。 为了利用这些资源,新的分布式算法是必要的,特别是涉及分配数据以及使用分区的方法。 我们提出一个被称为逐步聚类的聚类算法,它可以为网格中的数据提供一个“智能”分区。 该算法的应用显示了分布式数据挖掘任务。 关键词:网格式和并行处理;数据挖掘;聚类 导言 数据库中的知识发现,也称为数据挖掘,是 一种宝贵的工程工具,可从非常大的数据库提取有用的信息。 此工具通常需要高计算能力,可以提供并行处理和分配。 这里的开发工作是 DisDaMin 项目一部分, DisDaMin 项目是利用分布式计算处理数据挖掘的问题(如关联规则,聚类分析,„„)。 DisDaMin 的目的是为数据挖掘问题开发并行和分布式方案。 它在执行时间方面实现了两个成果:成果从并行的使用和减少计算来获得(通过使用一种数据的智能分布和计算)。 在并行和分布式环境,如网格或集群,限制固有的执行平台,必须考虑到的算法。 中心记忆的不存在迫使我们分发数据到片段,并且 利用并行来处理这些片段。 由于在这样的环境下的高通信成本,并行计算必须尽可能避免昂贵的通讯费(或至少是同步)。 但是,现有的网格数据挖掘项目(如 Discovery Net, GridMiner, DMGA[7],或 Knowledge Grid[11])提供的机制,都是整合和部署经典算法的网格,但不是新的网格的算法。 另一方面, DisDaMin 项目要处理的数据挖掘任务考虑数据挖掘细节以及网格计算细节。 数据挖掘的问题,获取智能数据分区是必要的,以便计算更单独的数据片段。 其主要的问题是如何取得这个智能分区。 对于关联规则 的问题,例如,智能分区的主要标准时每个片段的数据行是尽可能相似的(根据每个属性的值),片段之间数据行是尽可能不同的。 这一标准通常需要我们访问整个数据库来并行这个问题。 它使我们能够降低复杂性(见 [2])。 由于分配的标准在目标聚类算法表现得很相似,分区可产生的聚类待遇。 从关联规则问题方面的聚类获得的智能分区的好处已经进行了研究(见 [2])。 显然,聚类阶段本身已分发,而且需要快速进行,为了不减慢全球执行的时间。 在网格上,聚类方法将在引入逐步分布聚类算法的执行之前被描述。 聚类 聚类是数据分割成不同的群体(集群) 的过程,使同一集群的数据相似,但不同于其他集群。 独特的聚类方法可以根据两种主要原则分开:分层方法和分割方法。 Kmeans 聚类 凝聚聚类 输入:数据,用来计算的聚类号( k) 输出:数据的聚类 输入:数据,结束标准 输出:数据的聚类 ( 1)初始化 k对象作为初始中心 ( 2)重复 ( 3)转让每个对象到最近的聚类 ( 4)更新聚类的值 ( 5)知道没有数据可以改变 ( 6)返回 k被定义的聚类 ( 1)考虑每个数据作为聚类 ( 2)重复 ( 3)合并最近的两个聚类 ( 4)更新聚类的距离 ( 5)直到结束标准 ( 6)返回被定义 的聚类 图 分层的方法是由凝聚部分(即最初根据惟一的数据实例考虑分区,合并邻近的簇,直到满足终止的标准)和分布部分(即最初根据一个集群考虑分区,这个集群包含所有数据实例并且消减集群迭代直至终止)组成。 划分的方法是以距离为基础的方法(如 KMeans [8]所示),基于密度的方法或基于概率的方法。 其他标准使我们能够区分聚类方法(见 [10]);那些方法基于集群的数据实例的隶属度(很难被引用或含糊不清(见 [4])),以及数据实例的增量方法在某一时刻可以代替所有数据时被考虑(见 [5]),这种方法基于邻里搜索( kneareat 邻居)„„两个著名的聚类算法是分割 KMeans(见 [8])(产生近似的结果,并有可接受的时间复杂性)和凝聚的方法(见 [12])(其中产量相对优质的成果,但受到时间复杂度的限制)。 原则 Kmeans: KMeans 是一个迭代算法,构建了数据实例的初始化 K分区。 迭代迁移技术试图通过将数据从一组移动到另一组的方式来改善分区,直至终止的标准(见图 1,左部分)。 KMeans 将产生局部最优的结果。 凝聚聚类的原则:分层凝聚聚类包括一个问题的自下而上的方法,这个问题是要把所有数 据分别作为集群还是在每个迭代上合并两个最近的集群直至终止条件(见图 1,右部分)。 这种方法使用了相似度量矩阵,使该方法不适合大数据集(由于存储成本)。 并行算法:前面的两个方法需要访问整个数据库或在每次迭代进行沟通,以获得正确的解决办法。 并行方法存在 KMeans(见 [3])和凝聚聚类中。 并行版本也存在于其他算法引用之前(见 [6])。 为了达到同一质量集群作为顺序聚类的并行集群来说,大量的通信是必需的。 这些方法适用于作为 CC – NUMA 或 SMP 的大型计算机,它使用一个相同的记忆和快速的内部交互网络( IBM SP3 的并行数据挖掘)。 在现有的并行方法中大量的通信产生网格文本里的性能问题。 将在下一节中考虑分布式逐步聚类( DPC)方法的这些制约因素。 逐步聚类 分布式逐步聚类方法以循序渐进的方式处理属性(在分布式逐步聚类技术中,它有别于现有的增量方法,现有的增量方法处理越来越多的数据实例取代处理越来越多的属性)。 该方法适用于利用当地算法以构建全球结果无需同步的分布式执行。 分布式逐步聚类技术通过CLIQUE(见 [1])这种序列聚类算法被定义, CLIQUE 包括在每层被映射的聚类数据,并将这些数据预测定义为深度聚类。 该 方法假定整个数据库都能被映射。 在网格文本中,通过垂直分裂(多基)来假定来分布数据库。 分布式逐步聚类技术自下而上的办法进行工作,它考虑数据库的属性。 它首先计算集群在包含一些属性的标准片段中,然后结合这些集群获得集群的更高层面。 这两个步骤(即垂直片段的集群和集群的合并)以分布的方法被执行,这种方法受益于分布式执行。 在下面的部分将研究分布式逐步聚类方法。 三个步骤可确定:初步聚类,交叉和合并优化的步骤。 K/A A1 Aj Am 1 ith instance 1 j m ith row K1 Ki v11„ v1j„ v1m „ „ v11 „ v1j „ v1m „ „ Vi1„ vij„ vim Vi1 „ vij „ vim Kn „ „ Vn1„ vnj„ vnm n „ „ Vn1 „ vnj „ vnm Database B Matrix V associated to database B 图 B和关联矩阵 V 定义 一个属性为 M属性列和 N 行(实例)的数据库,被表示 B=( A, K, V),此处: A = {A1, A2,„ Am}是一个有限的属性集。 K = {K1, K2,„ Kn}是数据库行的关键字集; V 是关联矩阵 1(见图 .2), vi, j( 1 _ i _ m 和 1 _ j _ n 的位置)是第 j 行的第 i 个坐标。 设 U 是一个基于关键字的分区, 2就是 U={U1, S„ ,Up},Ui={Kl 2 K},iUi =K 和 Ui/Uj=。 设 A是一个属性划分,如 A={X1,„ ,Xq},Xj={Ak 2 A},SjXj=A 和 Xj/Xk=。 设 PX 是数据库 B 在属性子集X(X2 A)上的映射。 给定 X = {Ak„ Ar }, PX 的相关矩阵有 n行和 q 列(行代表 B的每个实例,列待变 X的每个属性 Aj)。 PX 的第 j 列和 B 的第 j 列相关联(见图 3)。 给定数据库 B( m 列)的一个实例分割 U( P 个因子),( U, B)和下一层矩阵 R 相关联( p, r 矩阵,见图 3)。 R 的每一行和数据库 B的实例 Ui的子集相关联。 从 R( p, m 矩阵)里可以获得矩阵 R0( n, m),通过重复,对于 R 的每个 Ui, R 的每一行都和带有 Ui的基数的 Ui相关联。 也可以通过取代和数据库 B相关联,对于 R的每个 Ui,R 的每一行都和数据库 B 中 Ui 行相关的方式与 Ui 相连。 通过 R 中的 p行取代数据库 B 中的 n行,允许缩小数据处理的规模。 R的每一行代表和 Ui 相关联的数据库 B 的所属行。 设 RX是与数据库 B的一个映射 PX 相关联的低层矩阵。 给定 X一个数据库 B的属性子集,与属性分布 A相对应的。 M 是对通过 M: B, X。 PX被定义的映射的操作。 将 B的映射 PX投影到子集 X上。 PX 是在矩阵 B 中获得一个隐藏的 MX。 这个隐藏的 MX 是指被 n, m 矩阵定义,像 MXi j = 1, 8i, 8 j ,Aj 2 X 和 MXi j = 0, 8i, 8 j 以及 Aj 62 X 这种形式。 映射 M 的操作通过 M( B, X) =MXt X=PX定义。 分区 F、数据库的一个分区是具有行运算的关联矩阵的行分区。 A 这种操作通过经典聚类算法来实现,这个算法是分布式逐步聚类方法的一个步骤。 大连交通大学信息工程学院 毕业设计调研报告 学生姓名 李青霖 专业班级 软件工程 081班 指导教师 常敬岩 史原 职 称 高工 讲师 所在单位 信息科学系 软件 工程教研室 教研室 主任 刘瑞杰 完成日期 2020 年 4 月 6 日 实习报告 1 课题的 来源及意义 近年来,随着电子商务和 Inter 技术的不断发展,网上 (在线 )拍卖模式已经成为电子商务重要的常见业务之一,并作为一种新型电子商务模式正逐渐被越来越多的用户所接受。 拍卖是从美国兴起的,它通过 Inter 将过去少数人才能参于的贵族式的物品交换形式,变成每一个网民都可以加入的平民化交易方式。 拍卖网站营造了一个供需有效集结的市场,成为消费者和生产商各取所需的 场所。 随着电子商务模式的不断改变, 大多数网民认同并充满激情的在参与竞拍,觉得这种商务方式能给自己带来趣味和娱乐,是以往传统方式所不能有的,觉得花几十元甚至是几块钱就可以买到自己心仪而且高。游戏拍卖行系统毕业设计论文
相关推荐
...................................................................87 全文检索 ...............................................................................................................88 地方志阅读 ....
和发展规划纲要( 2020~ 2020 年)》为指导,贯彻落实教育部财政部关于实施国家示范性高等职业院校建设系列文件精神,围绕‚ 两区 ‛经济开发,依托黄河三角洲高效生态产业,秉承‚责任‛校训,践行‚与市场共舞、助群雁起飞‛办学理念,‚多元参与、合作共治‛创新体制机制,‚对接纺织、服务园区‛打造专业特色,‚引派结合、校企互通‛建设双师队伍,‚研发与培训并重、交流与合作并举‛助推经济发展
率先批判了“两个凡是”的错误方针,在邓小平的领导和支持下,关于真理标准问题的讨论成了全党的一次思想大解放运动。 1978年 12月,在中央工作会议上,邓小平作了题为《解放思想,实事求是,团结一致向前看》的报告。 他高度评价了真理标准讨论的意义。 邓小平的这个讲话,实际上是十一届三中全会的主题报告,是在“文化大革命”结束以后,中国面临向何处去的重大历史关头,冲破“两个凡是”的禁锢,开辟新时期新道路
服务器能够很方便的进行安装与配置,由于 Domino/Notes 服务器支持多种协议,因此可以在具有不同协议的工作站之间进行通讯。 图 2 显示的是在基本的 LAN 环境中增加 Notes 服务器的网络结构,它支持现存网络中的通讯协议,同时为远程用户提供例如拨号上网访问方式。 Domino/Notes 服务器实施的安全步骤是重要和有效的,其授权访问采用双密钥方式
方 法 等 级 三 等 四 等 一、二级 卫星高度角,(186。 ) 静 态 ≥ 15 ≥ 15 ≥ 15 快速静态 有效观测卫星个数 静 态 ≥ 4 ≥ 4 ≥ 4 快速静态 ≥ 5 ≥ 5 ≥ 5 平均重复设站数 静 态 ≥ 2 ≥ ≥ 快速静态 时段长度 min 静 态 ≥ 60 ≥ 45 ≥ 45 快速静态 ≥ 20 ≥ 15 ≥ 5 数据采样间隔, s 静 态 1560 1560