

处理大数据挑战:管理与监督
发布时间:2012-12-4 1:09:59 阅读次数:
大数据挑战需要管理监督
对于一些组织来说,管理和分析超大规模数 据集的最大挑战之一就是搜索可以带来商业利益的有价值的信息,决定哪些数据 可以被丢弃。
例如:UPMC是一家总部位于匹兹堡的医疗保健网络机构,它 拥有20多家医院和超过五万名员工,该机构发现最近几年的数据存储突飞猛进地 增长。William Costantini是该公司综合业务中心的副主任,他认为很大程度上 是因为员工们不敢删除任何信息。
Costantini说:“目前最大的问题是要 弄清楚哪些你可以清除,哪些你不能清除,因为每个人都害怕担责任和被起诉。 每个人都不敢丢弃任何信息或去掉任何内容。同时,每个人都想精打细算把数据 量降下来。”
除了大数据量的调整,组织还要面临日益普及的“数据沙箱 ”,它使得数据分析师们要在信息子集上探索和体验,这些信息通常来自外部数 据仓库。分析师们还表示,公司需要对沙箱保持密切关注,确保他们不会形成各 不相容的数据“烟囱”。
此外,用来存储非事务形式大数据的数据库和 Hadoop安装,通常是由独立的IT部门应用开发人员设置的。Adrian在BI首脑峰会 上说:“这是由外面的人做的,通常IT关注的焦点是不同的工具。已管理妥善可 能是太慷慨的一个说法了。”
他补充说,Gartner公司的观点是,能把那 些数据类型整合到统一信息管理基础设施中的组织将胜过那些做不到这一点的组 织。
网站关键词:千喜网络 云主机租用 服务器托管 CDN加速 虚拟主机 网站空间 域名注册 企业邮局 数据库
上一章:部署数据仓库系统需要避免的三大问题 下一章:考虑两种数据仓库架构共存的可行性