基于cs结构的中小型医院住院管理系统的设计与实现本科毕业论文(编辑修改稿)内容摘要:

息了悟 (TIA)项目 (现在被下马 )和计算机辅助的 乘客预先筛分系统 II (安全飞行 (现在取消和替换的 ) CAPPS II)项目。 如同在其他方面 ,而对数据挖掘技术能力是重要的 ,还有其他的实施和监督问题可以影响一个项目的成功的结果。 一个问题是数据质量 ,所谓的数据的准确性和完整性进行了实证分析。 第二个问题是互操作的数据挖掘软件和数据库在使用不同的代理机构。 第三个因素是任务蠕变 ,或使用数据以外的任何其他目的的数据最初收集起来。 第四个问题是隐私。 那可能包括考虑问题的程度 ,政府有关部门应使用和混合商业数据与政府的数据 ,数据来源是否正被用于其他用途以外的原始设计 ,和可能的应用 ,这些计划的隐私法案。 它被预期是数据挖掘的国会监督项目将会随着数据挖掘的努力继续进化。 这份报告将更新为事件令。 xxx 本科学士论文 13 内容 数据挖 掘是什么 ? ........................................ 14 数据挖掘的局限性 ....................................... 16 数据挖掘的利用 ......................................... 16 恐怖主义信息意识 (TIA)的 程序 .................................... 18 计算机辅助乘客初筛检测系统 ..................................... 20 数据挖掘问题 ........................................... 24 数据质量 ....................................................... 24 互操作性 ....................................................... 24 使命蠕变 ....................................................... 25 隐私 ........................................................... 26 第 108 次国会立法 ....................................... 26 为进一步阅读,可参看: .................................. 29 xxx 本科学士论文 14 数据挖掘 :概述 数据挖 掘是什么 ? 数据挖掘涉及到使用复杂的数据分析工具来发现以前不为人知的 ,有效的模式和在大数据集之间的关系。 【 1】 这些工具可以包括统计模型、数学演算法、机器学习方法 (算法改进系统的性能自动通过经验 ,如神经网络和决策树 )。 因此 ,数据挖掘是由超过收集和管理数据 ,它还包括分析与预测。 数据挖掘可以执行数据代表了在定量、文本、或多媒体形式。 数据挖掘应用程序能使用的各种参数 ,以检查数据。 他们包括协会 (模式 ,在那里一个事件被连接到另一个事件 ,比如购买一支钢笔和采购纸张 )、序或路径分析 (模型在一个事件导致另一件事 ,如生育一个孩子和采购尿布 )、分类 (识别的新模式 ,比如购买之间的管道胶带的巧合和塑料薄膜采购 )、聚类 (发现和视力记录组以前未知的事实 ,如地理位置和品牌偏好 (发现 ),和预测模式 ,一个可以做出合理的预测对未来的活动 ,如本研究之预测 ,显示 人们加入一项体育俱乐部可能锻炼课 )。 【 2】 作为一个应用程序 ,相较于其他数据分析的应用软件 ,如结构化查询 (用于很多商业数据库 )或统计分析软件 ,数据挖掘代表一个不同类型的不同而不是学位的不一样。 许多更为简单的分析工具应用一个基于证明的方法 ,那些用户开发一种假说 ,然后测试数据 ,以证实或否认的假说。 例如 ,一个用户可能假设一名顾客买一把锤子 ,还会买一盒的指甲。 该方法的有效性可以限制用户的创造力开发多种假说 ,以及软件的结构被利用了。 相比之下 ,发现数据挖掘运用方法 ,算法可以检测几种多维数据的关系 ,同时 ,鉴别出那些独特 或频繁的代言人。 例如 ,一个硬件存储工具可以比较其客户的购买与置业、汽车的驱动类型、年龄、职业、收入、和住宅和商店之间的距离 [1]两只乌鸦公司 ,《数据挖掘和知识发现的介绍》 (第 3版 )(波多马克 ,MD:两只乌鸦公司 ,1999); Pieter Adriaans和 Dolf Zantinge,数据挖掘 (纽约 :艾迪卫斯里 ,1996)。 [2] 为数据采集的一个针对技术的定义 ,请见 ]。 xxx 本科学士论文 15 CRS2 由于其复杂的能力是很重要的 ,两个数据挖掘前兆作为一个成功的运用。 一个清晰的制定需要解决的问题 ,并获得了相关数据。 [3] 数据挖掘反映的这个概念 ,一些观察家认为数据挖掘只是一步在一个更大的过程称为数据库中知识发现 (KDD)。 其它的步骤在 KDD过程中有秩序的进步 ,包括数据清理、数据集成、数据的选择、数据转换、数据挖掘、模式评价和知识呈现。 [4] 许多先进的技术和业务流程 ,这些都造成了日益增长的兴趣 ,在这两个数据挖掘中公共和私营部门。 其中一些改变包括计算机网络的增长 ,这 可以用来连接数据库的发展 ,增强搜索链接技术和神经网络等先进的算法。 蔓延的客户机 /服务器计算模型 ,允许用户访问集中式数据资源 ,从桌面。 一个与能力的提高数据从各种不同的消息源结合成一个单一的可查找的来源。 [5] 除了这些改进数据管理工具 ,利用增加的成本信息和降低储存这也发挥了重要的作用。 在过去的几年中有了迅速增长的大量信息收集并存储与之 ,一些观察家暗示的数量 ,世界上的数据约双打每年。 [6]在同一时间 ,成本的数据存储有明显的减少与美元每兆到便士每兆。 同样 ,计算能力已继续每 18 24个月成倍飙涨 ,而的相对成本 ,计算能力已继续减少。 [7] 数据挖掘已成为越来越普遍 ,在这两个公共和私营部门。 组织使用数据挖掘作为一种工具来调查客户信息 ,减少浪费 ,欺诈和协助医学的研究。 然而 ,数据挖掘的扩散已经提出了一些实施和监督的问题。 这些包括关心质量的数据进行了实证分析 ,互操作的数据库和软件机构之间的、潜在的侵犯隐私的。 同样地 ,有一些担心限制了数据挖掘工作 ,忽略了机构同样强调他们的国土安全措施。 [3]约翰, “ 政府公然反抗数据挖掘系统的定义”华盛顿技术, 1999年 2月 22日, 1999年的功能 / ]。 [4] 韩佳伟与米舍利娜,数据挖掘 :概念和技术 (纽约 :摩根考夫曼出版商 ,2020年 ),第 7页。 [5] 彼得 Adriaans和道夫 Zantinge,数据挖掘 (纽约 :艾迪卫斯里 ,1996年 ),第 56页。 [6] 同上,第 2页。 [7] 两只乌鸦公司,《数据挖掘和知识发现的介绍》 (第 3版 ), (波多马克 ,MD:两只乌鸦公司 ,1999),第 4页。 xxx 本科学士论文 16 CRS3 数据挖掘的局限性 尽管数据挖掘产品可能是非常强 大的工具 ,但他们不可以自给自足的应用。 要是成功的话 ,数据采集要求能构造分析并且解释产品被创造的熟练的技术和分析专家。 结果,数据采集的局限是主要数据或与人员相关的,而不是与技术相关。 [8] 尽管数据挖掘能够帮助揭示模式和关系 ,但它不能告诉用户这些模式的价值或意义。 这些类型的应用都必须由用户使用来决定。 同样的 ,发现模式的有效性取决于他们如何比较“ 真实世界 ” 的情况。 例如 ,以评估效力的数据挖掘应用程序设计去识别在一个大水坑里的潜在的恐怖分子嫌疑人 ,用户可以测试模型中使用的数据 ,这些数据包含了关于有名的恐怖分子。 然而 ,尽管可能再确定一个特定配置文件 ,但是这并不意味着应用程序将会确定嫌疑犯,因为其行为明显偏离原模型。 另一组数据挖掘的限制是,虽然它可以识别行为和变量之间的连接,它并不一定确定的因果关系。 例如 ,一项应用也许识别出一种行为模式的倾向 ,如购买机票 ,只是在飞机起飞之前不久买的 ,它关系到以下特征例如收入、教育程度水平和互联网的使用。 然而 ,那并不一定表明机票购买行为是由于一个或多个上述变量。 事实上 ,个人的行为可能会受到一些附加变量 ,如职业 (需要在短时间内出差 ),家庭状况 (一个有病的亲戚需要照顾 ),或一种嗜好 (利用最后一分钟的折扣来访问新目的地 )。 [9] 数据挖掘的利用 数据挖掘是以各种各样的用途在私人和公共部门应用。 工业如银行、保险、医药、零售等通常使用数据挖掘技术可以降低他们的成本 ,增强研究 ,并增加销售量。 例如 ,保险和银行等行业使用的数据挖掘应用来侦测诈骗和协助风险评估 (例如 ,信用评分法 )。 使用客户所收集的数据在几年内 ,公司可以发展模型 ,预测客户有无一个良好的信用风险 ,或者是否意外权利要求可以欺骗、应当研究更密切。 医疗团体有时用数据挖掘来帮助预测程序的有效性和医学奖。 制药公司使用数据挖掘的化合物和遗传资料来 帮助指导研究新的治疗疾病的方法。 零售商可以利用收集的资料 ,通过亲和 (例如 ,购物者的俱乐部会员卡 ,频繁的宣传单分 ,竞赛活动 )来评估 [8] 同上,第 2页。 [9] 同上,第 1页。 xxx 本科学士论文 17 CRS4 产品的选择和放置的有效性 ,赠券提议 ,并决定购买哪些产品经常在一起。 公司如电话服务提供商和音乐俱乐部可以使用数据挖掘分析 ,建立一个 “ 流失 ” 来 评估哪一类的客户可能继续保持为用户和哪些是可能会切换到一个竞争对手。 [10] 在公共部门 ,数据挖掘应用最初被作为一种手段来侦测诈骗和浪费 ,但他们已经成熟时也能使用等目的测量和改 善程序的执行。 据报道 ,数据挖掘已经帮助了联邦政府恢复了数百万美元的欺诈医疗保险支付。 [11]司法部已经能够使用数据挖掘来评估模式 ,调整资源犯罪以及相应的解决方法。 同样 ,该部门已经使用了退伍军人事务部数据挖掘来帮助预测人口变化在该区它服务 ,以便它能更好地估计其预算的需要。 另一个例子是联邦航空管理局 ,使用数据挖掘数据回顾飞机失事和推荐来识别常见缺陷的预防措施。 [12] 最近 , 数据挖掘作为一种为国土安全预报系统的重要工具越来越广泛受到引用。 一些观察家建议数据挖掘能够作为一种手段来识别恐怖活动 ,如资金转移和通信 ,以及识别和跟踪个人 ,又不会使恐怖分子逍遥法外 ,如通过旅行和出入境记录。 两项举措已经引起了足够的重视 ,包括现在中断的信息意识恐怖主义进行 (TIA)项目。 [13] 举办由国防高级研究计划局 (国防部高级研究计划局 )和现在被取消的计算机辅助的乘客预先筛分系统 II (由运输安全管理的CAPPS II) (TSA)开发。 CAPPS II被称 “ 安全飞行 ” 的一个新的节目替换。 [10] 两只乌鸦公司 ,介绍数据挖掘和知识发现 (第 3版 )》 (波多马克 ,MD:两只乌鸦公司 ,1999),第 5页。 帕特里克狄龙 ,数据挖掘 :改变 商业数据转化为竞争优势 ,智力资本 (亚特兰大 GA:信息管理论坛 ,1998年 ),第 5– 6页。 [11] 乔治 Cahlink水龙头 ,“ 数据挖掘 ” 的趋势 ,政府行政执行杂志 ,2020年 10日, [12] 同上且更详细。 对于由评审的目的 ,数据挖掘进行联邦部门和机构 ,看到美国总会计办公室 ,数据挖掘 :联邦政府努力涵盖广泛的用途 ,高报告 GAO04548(华盛顿 :2020年 5月 )。 [13] 这个项目最初是被 确认为项目的总信息意识 ,直到重新命名为 “ 恐怖主义 ” DARPA已于2020年 5月公开信息意识项目。 部分的 FY2020 8131国防部的拨款法案 ( ,10887)禁止 TIA作为一个整体 ,同时让未指明的次元件的 TIA主动资助作为国防部的预算分级 ,根据本法规定国家外国情报的程序 ,它制约着信息的处理和分析美国公民。 为进一步的详细情况 ,则本规定 ,授权与RL31805看到 CRS报告 :国防拨款 ,FY2020和斯蒂芬 Daggett艾米 Belasco。 xxx 本科学士论文 18 CRS5 恐怖主义信息意识 (TIA)的程序 恐怖袭击事件发生后 , 在 2020年 9月 11日 以来的这一个月 ,许多问题的研究进展 ,提出了对这个国家的智能工具和能力 ,以及政府的能力感知其他所谓的 “ 沉睡的细胞 ” ,如果需要 ,确实 ,它们是存在的。 针对这些问题之一是信息识别办公室( IAO的)在美国国防部高级研究计划局( DARPA) 2020年 1月 14日创建。 [14] IAO的作用是 “ 在部分领导的召集下 ,一个技术办公室主任 ,现有的几个 DARPA项目集中在应用信息技术打击恐怖威胁。 ” [15]使命宣言为 IAO表明这些技术计画的重点是 “ 不对称威胁要通过柜台总数为抢占 ,有用信 息意识的国家安全预警 ,国家安全决策。 ” [16]到此为止 ,TIA项目是为。
阅读剩余 0%
本站所有文章资讯、展示的图片素材等内容均为注册用户上传(部分报媒/平媒内容转载自网络合作媒体),仅供学习参考。 用户通过本站上传、发布的任何内容的知识产权归属用户或原始著作权人所有。如有侵犯您的版权,请联系我们反馈本站将在三个工作日内改正。