大数据专业调研报告(精选3篇)_大数据行业调研报告

调研报告 时间:2021-11-17 07:32:55 收藏本文下载本文
【www.daodoc.com - 调研报告】

大数据专业调研报告(精选3篇)由刀豆文库小编整理,希望给你工作、学习、生活带来方便,猜你可能喜欢“大数据行业调研报告”。

第1篇:大数据调研报告

大数据技术市场调查报告:“BigData浪潮”迫使企业做出抉择

发表于2012-02-06 13:26| 2517次阅读| 来源CSDN| 0 条评论| 作者李智

数据中心浪潮数据挖掘数据分析大数据

摘要:大数据时代的数据格式特性 首先让我们先来了解一下大数据时代的数据格式特性。从IT角度来看,信息结构类型大致经历了三次浪潮。必须注意这一点,新的浪潮并没取代旧浪潮,它们仍在不断发展,三种数据结构类型一直存在,只是其中一种结构类型往往主导于其他结构: 结构化信息这种信息可以在关...根据IDC的调查报告预测到2020年全球电子设备存储的数据将暴增30倍,达到35ZB(相当于10亿块1TB的硬盘的容量)。大数据浪潮的到来也为企业带来了新一轮的挑战。对于有准备的企业来说这无疑是一座信息金矿,能够合理的将大数据转换为有价值信息成为未来企业的必备技能。恰逢此时,CSDN专门针对企业相关人员进行了大规模问卷调研,并在数千份的调查报告中总结出现今企业大数据业务的现状。在此我们也将调研结果展示与此以供大家参考。

大数据时代的数据格式特性 首先让我们先来了解一下大数据时代的数据格式特性。从IT角度来看,信息结构类型大致经历了三次浪潮。必须注意这一点,新的浪潮并没取代旧浪潮,它们仍在不断发展,三种数据结构类型一直存在,只是其中一种结构类型往往主导于其他结构:

结构化信息——这种信息可以在关系数据库中找到,多年来一直主导着IT应用。这是关键任务OLTP系统业务所依赖的信息,另外,还可对结构数据库信息进行排序和查询; 半结构化信息——这是IT的第二次浪潮,包括电子邮件,文字处理文件以及大量保存和发布在网络上的信息。半结构化信息是以内容为基础,可以用于搜索,这也是谷歌存在的理由; 非结构化信息——该信息在本质形式上可认为主要是位映射数据。数据必须处于一种可感知的形式中(诸如可在音频、视频和多媒体文件中被听或被看)。许多大数据都是非结构化的,其庞大规模和复杂性需要高级分析工具来创建或利用一种更易于人们感知和交互的结构。

企业内部大数据处理基础设施普遍落后

从调查结果可以看出,接近50%的企业服务器数量在100台以内,而拥有100至500台占据了22%的比例。500至2000台服务器则占据剩下28.4%的比例。可以看出面对大数据现今大部分企业还没有完善其硬件基础架构设施。以现阶段企业内大数据处理基础设施的情况来看50%的企业面临大数据处理的问题(中小企业在面对大数据的解决之道应遵循采集、导入/处理、查询、挖掘的流程)。

但这只是暂时状况,“廉价”服务器设施会随着企业业务的发展逐渐被淘汰出历史的舞台,在未来企业基础架构体系的硬件选用上,多核多路处理器以及SSD等设备会成为企业的首选。Facebook的Open Compute Project就在业界树立了榜样,Open Compute Project利用开源社区的理念改善服务器硬件以及机架的设计。其数据中心PUE值也是领先与业内的其他对手。

而在具有大数据处理需求的企业中52.2%的日数据生成量在100GB以下,日数据生成量100GB到50TB占据了43.5%,而令人惊讶的是,日数据生成量50TB以上也有4.4%的份额。数据量持续的增长,公司将被迫增加基础设施的部署。专利费用将一直增加,而开源技术,则省了这笔一直持续的专利费。对于急需改变自己传统IT架构的企业而言,传统的结构化数据与非结构化数据的融合,成了所有人关心的问题。

企业面对大数据处理的挑战与问题

现今大数据呈现出“4V + 1C”的特点。既Variety:一般包括结构化、半结构化和非结构化等多类数据,而且它们处理和分析方式有区别;Volume:通过各种设备产生了大量的数据,PB级别是常态;Velocity:要求快速处理,存在时效性;Vitality:分析和处理模型必须快速变化,因为需求在变;Complexity:处理和分析的难度非常大。

从图中我们可以看出资源利用率低、扩展性差以及应用部署过于复杂是现今企业数据系统架构面临的主要问题。其实大数据的基础架构首要需要考虑就是前瞻性,随着数据的不断增长,用户需要从硬体、软件层面思考需要怎样的架构去实现。而具备资源高利用率、高扩展性并对文件存储友好的文件系统必将是未来的发展趋势。

应用部署过于复杂也催生了大数据处理系统管理员这一新兴职业,其主要负责日常Hadoop集群正常运行。例如直接或间接的管理硬件,当需要添加硬件时需保证集群仍能够稳定运行。同时还要负责系统监控和配置,保证Hadoop与其他系统的有机结合。

而多格式数据、读写速度(读写速度是指数据从端点移动到处理器和存储的速度)以及海量数据是企业面临大数据处理急需解决的技术挑战。众所周知随着大容量数据(TB级、PB级甚至EB级)的出现,业务数据对IT系统带来了更大的挑战,数据的存储和安全以及在未来访问和使用这些数据已成为难点。同时大数据不只是关于数据量而已。大数据包括了越来越多不同格式的数据,这些不同格式的数据也需要不同的处理方法。充分利用有用的数据,废弃虚伪无用的数据,是数据挖掘技术的最重要的应用。

企业内部数据分析与挖掘工具应用现状

云时代企业数据挖掘面临如下三点挑战。挖掘效率:进入云计算时代后,BI的思路发生了转换。以前是基于封闭的企业数据进行挖掘,而面对引入互联网应用后海量的异构数据时,目前并行挖掘算法的效率很低;多源数据:引入云计算后,企业数据的位置有可能在提供公有云服务的平台上,也可能在企业自建的私有云上,如何面对不同的数据源进行挖掘也是一个挑战;异构数据:Web数据的最大特点就是半结构化,如文档、报表、网页、声音、图像、视频等,而云计算带来了大量的基于互联网模式提供的SaaS应用,如何梳理有效数据是一个挑战。抛去价格因素之外可以看出反应速度慢、操作不方便、数据不准确、分析不准确这四项是企业数据分析与数据挖掘面临的主要问题。商业化解决方案固然成熟,但成本也是显而易见的。而具备在开源平台之上处理分析大数据能力的数据科学家则成为另外的一种选择。数据科学家具备专业领域知识并具备研究利用相应算法分析对应问题的能力,可帮助创建推动业务发展的相应的大数据产品和大数据解决方案。

从调查结果中我们可以看出Hadoop占据了半壁江山,而同为开源的HBase也有将近四分之一的占有率。而商业化的数据分析与挖掘平台(如Teradata、Netezza、Greenplum等)总共只有13.9%的份额。短期来讲,开源分析将越来越广泛的使用,并且增长迅速。长期来看,混合技术的应用将在高度竞争的市场上出现,两者将同样有巨大的需求。可以预见的是,Hadoop作为企业级数据仓库体系结构核心技术,在未来的10年中它将会保持增长。随着云时代的到来,企业面临的应用方式更加多元化,通过云的手段提供海量数据挖掘的方法,提高了挖掘的效率,增加了挖掘的精度,更利于挖掘应用的推广以及专业的行业知识库的构建。同时收集、存储庞大的新型数据充满了挑战,然而分析这些数据的新方法才是帮助最成功企业甩开竞争对手的利器。

第2篇:大数据审计调研报告

大数据审计调研报告

胡泽君审计长曾多次强调指出,要积极推进大数据审计,坚持科技强审,通过信息化、数字化,努力提高审计监督的质量和效率。新形势下,审计工作特别离不开大数据的支撑,利用大数据进行审计,或将成为审计机关应对复杂社会经济管理形势、提升审计工作质量的重要手段。以“金审工程”为基础的审计信息系统经过多年的建设发展,目前正逐步建立和完善。同时,在政府各部门中社会保障大数据既具有较高的完整性,也兼具较高的准确性。这些得天独厚的条件,不仅使审计对“大数据”监督管理成为可能,更为实施以“大数据”为基础的审计“全覆盖”奠定了基础。

一、大数据技术在财政审计方面的运用

(一)运用大数据开展财政审计是时代发展的必然要求。大数据不仅是信息技术的重大进步,更是发展理念的重大创新,对经济社会发展起到重要作用,对与数据密切相关的审计工作也必将产生深刻影响。当前,财政、税务、人民银行等部门普遍进行信息系统建设,财政部门开展的“金财工程”覆盖财政收支管理的业务应用系统,涵盖了预算管理、国库集中收付等业务,对财政部门的审计单位信息化的发展,迫切要求运用大数据开展财政审计。

(二)运用大数据开展财政审计是推动完善国家治理的迫切需要。财政审计的范围突破了传统的财政收支概念,囊括了政府性收支的全部内容。全口径预算的审查监督付诸实施,如何在有限的时间内查找和发现问题,运用大数据开展财政审计成为推动完善国家治理的迫切需要。

(三)运用大数据开展财政审计是财政精细化管理的要求。在精细化管理要求之下,财政预算审查、预算执行差异分析、预算与决算的对比分析都是使用系统大数据来完成的。相应地,财政预算执行审计要实现全口径分析,必须使用系统数据。如利用国库支付系统的数据,通过对指标来源、资金性质、资金流向的跟踪分析,实现所有财政资金全过程跟踪审计。(四)大数据审计现在的运用情况。按照审计署的要求,建立了财政数据定期报送机制,每半年收集一次财政数据,并对收集的数据进行整理,生成审计人员可以使用的标准表。财政科联合信息科,对预算编报系统、预算指标系统、非税征管系统、决算编报系统等的财务和业务数据,集中进行多系统关联、大数据比对。将数据分析形成的审计中间表和疑点表作为重点进行审计,提高了效率和增强指导性。审计结束后,强化经验总结,形成数据采集转换指南,归集整理形成财政大数据审计模型方法体系表,为进一步深化大数据审计积累经验。

二、社保审计大数据信息管理现状

(一)社保部门数据管理情况。一是社保业务实现网络化。随着金保工程的推进,社会保险“六险”统征已经实现,社会保障业务办理正逐步向社区(村)、单位及个人延伸,社会保障业务一体化架构正逐渐完善。二是社保资金使用服务实现规范化。卫生三级医疗服务网初步实现信息化,市级、县级医院、乡镇卫生院医疗业务管理系统已经平稳运行,乡村卫生管理一体化正逐步规范,居民人口及流动人口信息统计系统已趋于成熟。三是民政事业实现信息化。民政城乡居民低保、医疗救助及优抚等业务完成了由手工到信息化的转变,数据也由纸质向信息化转换。

(二)审计机关对社保数据的审计情况。审计机关在工作中采集了大量的财务数据和业务数据,但没有对这些数据进行统一和规范地管理,一般是保存在审计人员的电脑中,很难实现与局内其他审计人员和所属部门的数据共享,导致工作中出现重复采集数据的现象。由于大数据信息化环境下社保系统的特殊性,内部控制转变为对人和系统两方面的控制,而且多数情况是以计算机自动控制为主。数据网络安全存在隐患,大数据技术本身的技术架构,决定了采用“大数据”技术架构的系统安全防护的难度。

审计局在社保资金审计中,收集了医保、养老、低保、公积金等民生资金的业务数据,建立了审计数据库,信息技术人员和社保审计人员联合对各类数据进行了深入分析。在审计分析中,首先明确所面临问题的类型,然后根据类型的不同选择具体的处理方法。例如,在做参保对象的信用分析时,首先明确该问题类型属于分类,如果该问题类型无法用数据挖掘工具解决,那么就应当选择另外更加适合的方法来进行解决。建立审计方法,对采集的业务数据、财政财务数据以及相关外部数据进行综合分析,生成审计中间表和疑点分析数据,采取业务跟踪、内控测试、数据比对等方式,发现审计疑点并进行分析、筛查和分类。运用“互联网+”思维,注重外部数据的搜集和运用,包括企业登记信息、税务征缴信息、车辆信息、房产信息等与社保审计相关的数据。注重发票查询系统、企业信用公示系统等在公开资源的使用,积极挖掘和构建内、外部数据间潜在的关联,寻找相关的线索和突破口,搭建多维度、立体式审计工作大数据平台。(三)当前在社保审计中需解决的几个问题。一是解决数据价值认识和利用问题。在审计机关还存在着有些对于数据价值观念不强,不注重基础社保数据的积累和分类工作,对于历年的重要数据只是简单记录储存,从不进行仔细分析进而指导工作实践。对于多样复杂的大体量的社保数据,要么简要进行汇总统计,要么不知所措,甚至直接置之不理。就数据的分析方法而言,分析手段有限,专业性数据分析能力欠缺,不能够深度挖掘数据价值,加以充分吸收利用。二是解决架构模式改变问题。随着“大数据”、“云计算”在各行业的不断应用,数据架构与以往相比有了很大的变化,对数据的采集利用提出了新的、更高的要求。三是解决高端数据人才培养问题。多培养通晓相关专业知识和信息技术的复合型的人才,培养一批懂得大数据,收集大数据,并且善于研究大数据,深挖大数据的专家。加大对现有信息管理人员的大数据培训力度,掌握大数据相关技术。

三、大数据审计发展方向 面对大数据时代对审计工作带来的挑战,审计方式和途径将实现以下四个方面的转变。

(一)应用大数据分析技术,实现审计方法从数据验证性分析向数据挖掘性分析转变。

传统的计算机审计,是通过电子数据采集转换对数据进行验证,通过构建查询分析、多维分析等方法模型进行数据分析,而应用大数据分析技术,则能够使审计数据分析逐步由传统的验证性分析向挖掘性分析转变。挖掘性分析是指采用大数据处理技术,利用数据仓库、数据挖掘和模型预测工具进行审计分析,从大量数据中发现蕴涵的数据模式和规律。

(二)应用大数据分析模式,实现审计方式从发现问题向风险预警转变。

传统审计工作以发现问题为主,对经济形势进行预测分析,因而须等到相关事件发生并且形成一定规模后,再根据搜集到的足够数据进行分析研究,具有滞后性。而大数据技术可通过对跨领域的大规模经济、社会行为数据进行分析,对经济社会相关异常动态实现早期关注,利用其对异常数据的敏感性实现早期预警。审计可以运用大数据相关技术,对宏观经济社会风险问题展开初步分析。(三)应用大数据审计作业平台,实现单机审计向云审计转变。

以审计大数据为中心建设“云审计”平台,实现远程存储和移动计算,使审计机关能够通过网络接入“云”实施审计,利用大数据分析、人工智能等信息技术,解决数据采集分析和管理中存在的问题,实现审计成果共享。其次,应完善联网审计系统,逐步建立预算、执行、财政、地税、社会保障、医疗机构、公积金等重要行业和部门的审计实时监督系统。再次,应建设审计数据综合分析平台,运用大数据技术,加大业务数据与财务数据、单位数据与行业数据,以及跨行业、跨领域数据的综合比对和关联分析,提高运用信息化技术查核问题、评价判断、宏观分析的能力。最后,应推广“总体分析、发现疑点、分散核实、系统研究”的审计模式。

(四)构建专业的审计分析队伍,实现传统纸质账本审计向大数据审计转变。

审计工作应实现“六大转变”,即由单点离散审计向多点联动审计转变、由局部审计向全覆盖审计转变、由静态审计向静态与动态审计相结合转变、由事后审计向事后与事中审计相结合转变、由现场审计向现场审计与非现场审计相结合转变、由微观审计向微观与宏观审计相结合转变。为此,需要在组织方式、人员结构、思维方式等方面与之相适应。在组织方式上,应尝试开展无项目审计,依托审计数据中心积累的数据资源,横向关联比对分析,纵向深入挖掘分析,从数据中发现审计疑点和线索。在人员结构上,应不断提升“四种能力”,即大数据分析能力、综合研究能力、创新能力和跨领域知识运用能力,不断加强对大数据先进理念和前沿技术的学习,掌握大数据分析方法,提升审计人员综合素质。在思维方式上,应培养“数据先行”意识,以数据为核心,使数据分析在审计工作开展前先行实施,根据数据分析结果,有重点、有步骤、有深度地在审计实施过程中进行核查验证、追踪线索、发现问题,全面深化大数据技术在审计工作中的应用。

第3篇:大数据中心选址调研报告

大数据中心选址调研报告

一、数据中心概念

大数据中心,是指服务于大数据存储、挖掘、分析和应用的数据中心。大数据(big data,mega data),或称巨量资料,指的是需要新处理模式才能具有更强的决策力、洞察力和流程优化能力的海量、高增长率和多样化的信息资产。目前我国的数据中心总数已接近100万。

二、行业分布

作为信息化建设的核心内容,数据中心始终是金融、政府、能源、交通等行业的投入重点;而伴随着电信行业的转型和移动互联网的发展,IDC也成为电信行业重点投资领域。此外IPDC互联网数据中心成为市场的热点,互联网提供商大规模建设云数据中心。

三、发展前景

十二五”规划中明确了战略新兴产业是国家未来重点扶持的对象,其中信息技术被确立为七大战略性新兴产业之一,将被重点推进。新一代信息技术分为六个方面,分别是下一代通信网络、物联网、三网融合、新型平板显示、高性能集成电路和以云计算为代表的高端软件。

四、选址要素

1.数据中心属于高能耗产业,一个10万台服务器级别的数据中心需要两路或更多合共50-60MW的电力支持。且数据中心用电负荷必须持续稳定,因此需要选择建设在能源充裕,并且能源的价格相对便宜的区域,以降低数据中心的运营成本; 2.为了满足(1)的用电要求,周边配电站设施也需要完善。条件包括配电站等级,配电站与场地距离,配电站变压器的供电余量,变压器目前的用户类别(如共用),上级电网的联系;

通常情况下,如果数据中心用户单独自建用户站,可选择的电压等级有以下几种: a)380V:适合于小型数据中心,不在考虑范围内

b)10KV:适用于两路市电进入用户站的总容量不超过20MVA的容量项目;即,每一路10KV市电进线容量不超过10MVA;当用户的进线容量需求超过这个范围时,可以考虑多路10KV进线的方式。对于数据中心的安全等级要求超过TIER2以上级别时,两路、或多路10KV进线应来自不同上级变电站,或同一变电站的不同的变压器。(目前,国内数据中心用户最多选用的一个电压等级。全国各个省市在具体设计和管理上略有不同。)

c)35 KV:不是所有地方都有该电压等级,在已有的可以选用的35 KV用户站中,其每一路的容量一般不超过20MVA d)110 KV:当用户的单一回路用电负荷超过20MVA级别时,需要考虑110 KV变电站,或66 KV变电站(在我国部分地区有分布)。监狱在中国采用大工业用电方式计费时,要按照变压器的装机容量记收基础电费(或按照最大装机容量记收基础电费),对于冗余度要求高的数据中心,如TIRE3或以上级别,需要双路市电供电,双路变压器设计的数据中心,过高的变压器装机量冗余度,将使得数据中心本身的基础电费成本过高,在单一回路市电需求功率30MVA以上级别时,尽可能独立考虑独立的110 KV变电站。

(备注:需要和当地国家电网规划和管理部门具体落实。)

3.数据中心里大部分IT和电气设备的耗电会转换为大量的热,所以需要一套有效的散热体系。通常情况下,数据中心更适合建设在室外环境温度常年比较低的区域;以便于数据中心的散热可以尽可能地使用自然冷源或延长使用自然冷源的时间,减少机械制冷的能耗。

4.以目前所掌握的制冷技术来看,采用离心式冷冻水机组的制冷系统能效比(COP)最高,大规模数据中心,通常会考虑采用这种制冷系统,以尽可能地提高机械制冷时期的效率;但是,这个系统利用了室外的湿球温度散热,需要有长期,稳定的洁净水(包括再生水)资源做保障,对于水资源匮乏的区域,或者水资源昂贵的区域,建设大规模数据中心是不太适宜的。如果在电力资源非常便宜的情况下,可以适当考虑采用完全干式的冷却系统来替代水蒸发散热系统,以牺牲少量低价格的能耗,来换取针对昂贵的(或者可靠性低的)水资源的以来;

5.针对我国网络带宽资源的现状,除非骨干网上的地区,需要根据可开发的带宽资源、带宽质量来确定数据中心的建设规模策略;对于无法解决带宽的偏远地区,不适合建设大规模的数据中心;

6.数据中心建设目前还是一个高投入,高风险也是高产出的产业;对于选址方面,需要地方政府在政策上能够给予足够的扶持力度;包括:a)土地:地方政府在土地,位置、及土地性质继续协助安排;

b)电价:数据中心属于高能耗产业,由于本身对现场环境基本没有严重污染问题,相对其他高能耗产业,可以申请政府在电价上给予补贴;通常政府换届会影响,前期会有帮助,另外,对于项目后期的融资也会有影响。

c)税收:地方政府通常在在地税部分,主要是服务类吸纳灌木,给予政策上的N年减n年免;

d)科技补贴:地方政府可以针对技术含量比较高的数据中心行业,提供一定的科技补贴,以吸引投资。

e)贴息贷款:针对数据中心的高投入部分,地方政府可以协助减少项目的后期大规模建设的融资成本;

7.数据中心的建设,运行维护需要多专业,多工种人才的协作工作。这里面包括了(且不限于): a)中压电力 b)低压电力 c)暖通空调 d)给排水 e)消防 f)安保

g)BMS自动化控制 h)动力环境的监控 i)网络

j)IT硬件服务,软件服务等一系列人才 k)各主要设备供应商的技术支持人才

目前在我国,这些专业的有经验的人才大部分聚集在一线城市里,最多可以布局的部分发达的二线城市;而我国能源充裕的地区,恰恰缺乏这方面的人才,是的在这些地区,数据中心交付时旺旺很难找齐合适人才来源,并在数据中心建设阶段,运维人员就应该陆续到岗,并需要跟进项目的建设,针对各专业系统,深入了解;在数据中心的测试验收阶段,需要基本全员到岗,并一同参与所有的测试,验收和接收工作;对于远离一线城市的偏远地区,如果不能落实人才问题,3 数据中心的选址需要慎重考虑。

五、标准要求

(一)自然地理环境 1.避免地质灾害区域

a)地震,尽可能避免选址在地震带上,即使建筑物有足够的抗震等级,地震发生似的振动也会对服务器硬盘的性能产生影响,严重时,服务器的工作能力迅速衰减

b)洪灾,数据中心在选址时,要考察附近的河流,湖泊的流域状况,了解50年以上级别的洪水水位位置,流向;应尽可能避免在洪水水线以下的位置;数据中心的基础层为孩子应高于周边最高水位为止,并周边没有发生过洪涝灾害,且需要考虑地哪里,供排水等基础设施、路由是否能够在灾害发生时,确保安全。如场地在沿海或接近河口,也需要考虑大潮时对城市排水系统或河流排水能力影响 c)海啸,数据中心在选址时,如果是在海边,应选择在位置足够高的位置,且需要考虑电力,供排水等基础设施、路由是否能够在灾害发生时,确保安全。d)塌陷、泥石流、雪崩等自然灾害,数据中心选址应避免在如上风险的区域 e)火山,附近处于活火山的区域,且火山有处于活跃状态的风险

2.尽可能选择有便于自然冷却的气候条件的地区,这取决于所选择区域的维度,及海拔高度,鉴于部分设备在海拔高度超过2500平米是,性能会受到影响,数据中心的选址时,应避免在海拔高度超过2500米的地区;

3.对空气污染的注意,尤其对于空气里的硫化物(如二氧化硫、硫化氢)含量污染。

4.不建议靠近高速公路,交通干道,铁路,飞机场,码头;这些区域都会产生硫化污染问题,且同时还要考虑在意外情况下的安全防护问题;

5.远离危险品生产、储存、运输环境;(包括化工厂,炼油厂,加油站,储油罐,弹药库,烟花生产厂等)

6.远离军事基地,演戏、实验基地

7.避开垃圾填埋、焚烧厂地,火力发电站等容易产生硫化污染的区域 8.在开采(或预计开采)的矿山,会产生震动影响

9.避免在有民族矛盾、军事冲突、社会治安不稳定的地区及附近建设数据中心10.当数据中心建设在水源地时,还要考虑柴油发电机的储存燃油一旦发生泄漏时,不能外流污染水源

11.地下水位关注,会影响往后地库(电缆槽,补水池)施工难度,成本和地库设施的寿命

(二)配套设施

数据中心的业务特点以及其质量和容量的要求,决定了数据中心对当地供电能力的要求,供电量必须保证充足和稳定。我们需要了解的因素包括:可用性——在了解当地电力供应情况的同时,我们需要权衡备选地点是否有多个成熟的电网;成本因素——我们还需要比较各种电力成本。也就是说,每千瓦时的动力源的成本应该足够低;具备替代的能源——决策管理层还需要考虑备选地点是否有诸如太阳能、风能、空气等可再生的能源,这将有助于企业打造更加绿色的企业形象。

双电源供电

电对数据中心的重要性就像水对鱼儿的重要性一样,一旦数据中心发生断电情况,若没有很好的备份供电系统,诸多设备承载的业务就会发生中断,给数据中心带来严重损失。现在的数据中心供电都要考虑冗余,确保用电可靠性。

供电方案

这是传统数据中心普遍采用的供电方案,数据中心采用两套供电输入系统,一套市电,一套备用电,备用电可以是蓄电池或柴油发电机组,市电是主用供电系统,当市电故障时,通过ATS自动切换到备用电上,这样断电故障不会对后端设备产生影响。高精度的UPS供电切换时间可以在30MS以下,可以满足绝大部分设备持续供电。

(三)成本因素

对于一个建设项目来说,成本必然是一个必须反复权衡的因素。成本涉及到当地规划及土地价格、房屋建筑价格、租赁和物业价格、网络通讯费用、用电价格、5 用水价格等多发因素。数据中心选址时,需要从通信基础设施的角度需要考虑各种因素。如:光纤主干线路及其距数据中心选址的距离。这将有助于衡量从光纤主干线路到数据中心选址所需投资的确切数据;光纤类型,这会影响传输速度;所在地通讯服务运营商的类型及其支持的服务模式;延迟因素,传输和交付延迟时间也将是一个重要的因素。

(四)政策环境

良好的政策环境将有利于一个基地气候的形成,促进客户的选择和落户。需要考虑的因素包括:物业税、企业税和销售税。

(五)高科技人才环境

人力资源主要包括:高校数据、IT人员数量,其他科技教育机构数量。主要考察当地经济文化发展水平、科技教育环境、交通便利条件、人力资源供应及水平等方面,数据中心作为信息技术的集中体现,对各种社会资源的要求都非常高。

1、人员配置:

针对于不同的数据中心管理目标,相应的人员配置决策显然将会不同。对于C4 的数据中心,要求运维人员做到全年7X24 小时的值守。UI 在美国的数据统计表明,全天候的值守可以将数据中心故障的发生率降低50%,对于提升整体数据中心的可用性有相当大的影响。为了实现全天候的值守,13个人的运维团队是最基本的配置,其中包括了数据中心机房经理1人,3名二线技术支持人员(覆盖电气、空调和弱电专业,可以在必要的时候顶替日常值班人员),1名运维主管以及8名一线的运维技术人员。8名一线的运维人员分为4个班组,采用8小时或者12小时一班进行轮值。在这8名运维人员中,每一班需要有至少一名资深人员,具备对于现场紧急情况进行快速处置的能力。当然,这13人的运维团队只是最基本的配置人数,随着数据中心功率和设备数量的增长,运维人员在各个专业也应该有相应人数的补充,从而与工作量相匹配。

2、组织结构

组织结构通常包括两方面内容:一是对机房内所有活动的角色和他们的工作职责进行准确的定义;二是呈现各角色之间的汇报关系以及运维团队与建筑工程、IT系统、安防系统之间的工作界面。对角色和职责的准确定义可以将工作 6 内容细分到每个人身上,做到责任到岗、责任到人;各级之间的汇报关系是处理数据中心事件,尤其是紧急事件的方式依据,对不同等级的事件要明确上报的途径和终点。

(六)社会及当地的人力资源条件

主要考察当地经济文化发展水平、科技教育环境、交通便利条件、人力资源供应及水平等方面,数据中心作为信息技术的集中体现,对各种社会资源的要求都非常高。

六、区域发展倾向

目前全国性的数据中心和灾难备份中心主要集中在北京、上海和广东这几个地区,北京是各行业主管机关的所在地,全国众多的主要金融机构总部所在地,因此也是多数总部级数据中心的天然所在地。上海目前已经成为全国银行业数据中心的集中地,广东作为中国经济最发达地区之一,也是数据中心/灾备中心的集聚地。

造成数据中心选址倾向性有几个原因:一个是总部所在地的原因。第二是银行数据中心选址,对其它行业有影响。第三,由于信息不对称,很多领导决策的时候没有充分地考虑很多问题,凭感觉或者经验就决定了。第四,我们比较缺乏系统的考察指标。

七、建设方式

(一)企业自建数据中心

很多大型企业都拥有自己的数据中心,然后通过租用运营商的广域网线路,实现多个内部数据中心的互联。比如:军网、公安网、平安工程、银行行业、石油行业 等,这些专网使用的都是专有的数据中心,由各大政府部门、企业主导自行创建的。

优势:自建的数据中心,使用非常灵活,可以根据自己需求任意改动,灵活性高,尤其这种自建的数据中心安全度最高,信息泄露,受攻击的可能性大为减少。劣势:这种数据中心投入大,建设成本高,具有封闭性,专为单个企业或部门提供服务。由于建设数据中心要申请工业建筑用地、要得到供电部门、建设部门的同意,手续非常繁琐。而且建成后到投入使用,往往需要几年的时间,建设周期长。

(二)租用运营商数据中心

运营商提供场地、机柜、网络带宽和供电,互联网企业直接将设备放入运营商网络中即可。

优势:一般只要一周就可以建设完一个数据中心并投入使用,速度非常快,这种方式在互 联网企业中非常普遍,这样互联网企业只需要关注自己的应用设备(主要是网络设备和服务器)运行状况即可,不必关心机房环境、空调、供电等一系列问题。虽然 要向运营商支付不菲的租用金额,但仍可为互联网企业节省了大量的人力和物力。互联网企业而且可以根据自己的业务实际情况,在运营商的各级省市都去租用数据 中心机房,迅速部署业务。

劣势:使用仍有一些限制,比如机房环境的维护、设备出入管理都受到运营商的限制。租用期限、新增机 房面积都要和运营商沟通,需要运营商的同意才能实施。这些互联网企业要想发展的好首先就要和这些运营商搞好关系。

(三)租用数据中心提供的服务

通过直 接租用大型数据中心的服务,就可以部署自己企业的业务。比如可以根据自己的业务需求,向阿里云租用100GT的硬盘和200G的内存,10G的带宽,对于中小企业,满足这些性能的物理硬件完全不可见。

优势:这样企业用户可以完全聚焦于自己的应用业务,不必关心数据中心底层实现,也为企业节省了人力。

劣势:

1、故障恢复性难度大。当然这样的形式使得企业的核心业务稳定性与租用的数据中心运行稳定性关系较大,有时出现故障,由于企业自身看不到数据中心底层实现,只能甘等业务恢复。

2、有时还会出现互相推诿的情况,而由于租用方处于技术弱势方,往往故障所带来的损失很难得到补偿。

3、安全性无保障。除了上层应用,数据中心底层实现都不受自己控制,受到攻击都没有任何手段,因此安全性完全取决于承租的数据中心。因此在选择租用数据中心服务时,要对其数据中心的安全性进行充分考量。现在提供数据中心应用服务的还比较少,只有几家,竞争还不充分,这给中小企业选择的余地较少。

八、大数据产业园

(一)陕西西咸新区沣西新城:西新城大数据产业园区规划占地3平方公里,包括基础数据产业区、数据应用研发区和数据叠加拓展区3大板块,预计到2020年实现500亿元产值,成为国家政务资源后台处理与备份中心和国家级大数据处理中心。目前引进了四大运营商,中国联通、中国电信、中国移动和陕西广电网络,以及一个国家部委国家计生委的灾备中心。通过大数据的引领发展,带动信息产业的发展,带动软件包括装备制造产业的发展。

(二)重庆西永微电子产业园区:园区于2005年8月正式设立,规划面积30平方公里,其中产业区20平方公里,配套服务区(西部新城的城市中心区)10平方公里。园区产业以集成电路产业和软件及信息服务产业为主导,着力打造集设计、研发、制造、封装测试、应用以及配套于一体的集成电路产业和软件与信息服务产业集群。

(三)天津市滨海新区:部署建设大数据产业园区。一期规划布局1个大数据产业示范基地和3个大数据产业园区。其中,开发区云计算产业基地作为大数据产业示范基地;保税区数字出版基地、高新区软件与服务外包基地、塘沽海洋高新区作为3个大数据产业园区,争取成为国家级大数据产业基地。

(四)中关村大数据产业园:设立中关村软件园和清华科技园两个分园,建筑面积2.5万余平方米,已吸引了10余家符合条件的企业入驻。

大数据专业调研报告(专业12篇)

报告能够帮助读者更好地了解特定主题,为决策和行动提供支持。在撰写报告时,要注意用词精准,避免模糊和主观判断。以下是小编为大家收集的报告范文,希望能够给大家提供一些参考和......

大数据调研报告

大数据技术市场调查报告:“BigData浪潮”迫使企业做出抉择发表于2012-02-06 13:26| 2517次阅读| 来源CSDN| 0 条评论| 作者李智 数据中心浪潮数据挖掘数据分析大数据摘要:大数......

大数据的调研报告(专业21篇)

报告的撰写需要注意文风的规范性和专业性,杜绝使用夸张的修辞和口语化的表达方式。在写报告之前,我们需要对相关领域的文献和前沿研究进行深入了解,确保我们的报告具备独特性。......

大数据专业调研报告(热门21篇)

在撰写报告时,我们应该注重逻辑清晰、论述有据,并注意结构的合理和连贯。在开始写报告之前,我们应该对相关主题进行深入研究和了解。对于报告写作不太熟悉的人,以下是一些简单明......

大数据应用调研报告

“报告”使用范围很广,按照上级部署或工作计划,每完成一项任务,一般都要向上级写报告,反映工作中的基本情况、工作中取得的经验教训、存在的问题以及今后工作设想等,以取得上级领......

下载大数据专业调研报告(精选3篇)word格式文档
下载大数据专业调研报告(精选3篇).doc
将本文档下载到自己电脑,方便修改和收藏。
点此处下载文档

文档为doc格式

热门文章
点击下载本文