您好,欢迎来到年旅网。
搜索
您的当前位置:首页大数据时代下的数据分析探究

大数据时代下的数据分析探究

来源:年旅网
2016年第20期信息与电脑China Computer&Communication数据库技术大数据时代下的数据分析探究牛佳惠(陕西职业技术学院,陕西 西安 710100)摘 要:近几年来随着网络技术的迅猛发展,社交网络与云计算和物联网等多种网络服务形式的出现,促使社会信息数据的种类与规模不断增长和扩大,现阶段已完全进入信息互联网的大数据时代,数据并不是以往单一的处理分析对象,正在向着结构化、半结构化与非结构化方向转型,数据逐渐成为可利用具有价值的资源,所以如何对大数据这种资源进行科学合理的分析并加以利用已成为现阶段社会各界都非常重视的课题,因此,笔者就对大数据的具体分析方法进行简要论述。关键词:互联网;数据挖掘;大数据;数据分析中图分类号:TP311.13  文献标识码:A  文章编号:1003-9767(2016)20-159-021 我国现阶段大数据分析发展状况由于只有对数据进行准确的分析和整理辨别才能够真正获得其中所隐藏的价值,所以数据分析是处理数据的重中之重,大数据当中的信息数据量是相当巨大的,这就对信息数据的储存分析和查询提出了更高的标准与要求,从实践的视角来讲想要进行大数据分析就要从对传统数据分析方法当中寻找和摸索出一种全新的分析模式,找出致使实际状况发生的根本原因,并利用预测和模型对其进行优化,进而能够在多个行业领域当中不断创新和完善。近几年来“大数据”这个概念在各个行业领域当中被媒体不断提出,然而我国的“大数据”分析还属于刚刚起步的阶段,从现阶段我国所有行业当中只有很少数的一些行业和现代企业单位对大数据进行了初级的分析与应用,在进行业务决策的过程当中将大数据分析结果来当作依据,我国大数据分析主要运用在保险和银行及电商领域当中。目前在大数据分析技术方面,已具备比较成熟的数据分析技术如现有的信息数据挖掘技术与商业智能技术,并且被很多行业所运用,特别是在电商行业当中运用该种技术对大数据进行分析,进而使行业总体的运行效率得(1)在每一个网站当中用户的浏览和点击量,各种类型网站和网页当中信息内容的变动,通过各种搜索工具当中各种词语的搜索次数,网络实施监测信息数据等。(2)通过对这些数据的分析能够对用户的日常行为活动,对计算机网络系统所进行的操作和系统正常运行的状态进行了解和分析。(3)通信领域当中的个人信息通话地点时间及各种信号指令信息数据。(4)我国社会当中的各个行业领域当中所统计出来的信息数据。由于这些信息数据的来源是各不相同的,是非结构化的信息数据,对这种模式进行分析的特征为:在互联网当中所产出的各种信息数据,主要被运用在创建搜索引擎利用搜索工具对信息数据进行检索处理,伴随着互联网技术的迅猛发展,大数据分析搜索引擎和出现可以高效在巨大容量的信息数据当中提取出具备一定价值的重要数据,日志数据是计算机用户日常浏览互联网络与记录计算机系统的日常运行而生成的,对其进行分析能够依据具体状况使计算机系统得出的到提升的同时对行业总体的经济效益也起到重要的促进作用。结果更具智能性,分析网站数据及日志信息的模式基本相同,从信息数据的来源层面来考虑,在实际当中很多企业都是对皆是对数据进行细密的分析继而获得具备价值的数据,此种其自身所具备的累计数据进行分析,进而解决所出现的问题,而且针对问题本身来搜集相关信息数据,并没有运用互联网当中的大数据来分析自身问题,并没有发挥大数据的真正作用和价值。处理模式被叫作“离线批处置模式”;在通信行业当中的数据分析,分析人员通过对信息数据的细密分析进而实现总结查询与归纳,同时在短期内得到最高价值意义的数据信息,进而能够有效提高用户体验,同时保证体系的交互性,此种分析模式被叫作“查询式分析”模式;对我国经济比较重要的行业领域当中各种类型的数据进行监控的模式被叫作“实时数据分析模式”。数据分析作为处理大数据的核心,以往传统的数据分析2 大数据的分析模式和分析技术大数据具备“多源异构”的特点,对大数据进行分析就是对数据进行逐层降维并归纳与分析的过程,以数据收集根源来划分可以把大数据要处理的分析数据分成以下几种类型。都是对结构型数据进行分析,基本程序为:将结构化数据储作者简介:牛佳惠(1988-),女,陕西户县人,硕士,助理工程师。研究方向:教育信息化。—   159   —数据库技术信息与电脑China Computer&Communication2016年第20期存到数据库当中,以此为依据建立数据信息库,根据问题的实际需要建立相关立方体继而进行综合性的分析,这种分析方法分析结构化数量较小的数据时比较高效,对于大数据来说就会出现诸多的问题,所以有关技术人员研发出了Hadoop技术,并在分析大数据当中更得到了广泛运用,该技术是以Java分布式密集信息数据处置与分析为基础的一种软件框架,用户能够在不熟悉分布式底部细节的状况之下研发分布程序,进而利用其集群的力量来进行高效的运算与数据的储存。别类,这样做的主要目的就是建立起分类模型,进而把数据库当中的数据项反映到既定的类别当中去,比如淘宝网的商铺通过对用户在一个阶段当中所浏览与购买的商品数据类别进行划分,向用户推荐有关的商品,进而提升浏览点击量和销售量。(2)聚类和分类挖掘法基本相同,不同点在于二者的目的不同,聚类是对数据的相同点与异同点把数据分成不同的种别和类型,同一种类的数据之间存在较大的相同点,不同种类的数据相同性较小,跨越类别的数据不互相关联。(3)回归分析就是对数据库当中信息数据的特征和属性进行分析,利用函数对信息数据进行表达,进而反映出属性值之间互相依存的联系,这种方法比较适用于对数据序列进行预测和有关关系的分析当中。3 挖掘数据所运用的方法进入大数据时期以来挖掘数据是非常重要的工作,大数据挖掘就是在不够完全的、海量的、不清晰的、随机生成的巨型信息库当中挖掘出具备实际价值和意义的信息数据的过程,还是一个为决策提供支持的过程,是以人工智能及模式及机械学习和统计学等多科学课为基础来实现的,挖掘大数据的主要方法包括分类和聚类与回归分析法等方法,这些挖掘方法从多种视角对大数据进行挖掘。(1)分类挖掘,这种挖掘方法就是将数据库当中具备相同特征的数据进行分门参考文献[1]王悦.数据挖掘技术探讨[J].信息科学,2012(6):12-18.[2]张智斌.浅议大数据时代下的数据分析理念[J].信息传媒技术,2014(6).(上接第153页)对输入数据进行合法性验证,是数据进入数据库的门户。用户接口层有利于数据完整性约束,同时也提高了界面的可操作性。4.1 区分输入数据,减少错误数据输入在对数据库信息系统进行输入数据分析时,其主要包括三种类型值域:一是例如性别取值,分为男与女,这种值域具有互斥、确定以及可枚举的特点;二是例如学生选课数据,学生可以在全部课程中选择一门或者几门课程,因此,其具有确定、可组合以及可枚举的特点;三是例如姓名、地址等,这些值域具有不确定的特点。在应用程序开发工具中,不同类别的输入数据都有相对应的Data-Aware控件。这样不但能够限定输入数据的值域,同时也规范了输入数据以及输入操作,从而减少了输入的工作量。4.2 使用数据项输入窗Date-Aware控件具有可见以及可操作数据库的数据,在执行命令时,用户对其是可见的,因此,Date-Aware控件是用户录入以及编辑数据的常用部件。但是Date-Aware控件缺乏数据校验功能,在利用Date-Aware控件进行操作事件时,需要为修改的数据在控件界面上建立输入窗,这样能够有效实现修改以及合法性验证的数据项。5 结 语无论是在数据库中,还是在应用程序编程中,都能够实现对数据库数据的约束,作为数据约束的最基本防线,数据库的完整性是极其重要的。从用户方面来说,数据约束实现得越早,就能够越快知道数据的对错,从而根据系统提示进行修改。为了确保数据库中数据的完整性,可以在不同访问数据的时机运用各种完整性约束方法来实现。参考文献[1]李伟.数据完整性在数据库应用系统的设计与实施[J].煤炭技术,2011,30(3):167-168.[2]王虹.数据库系统中的数据完整性[J].电脑知识与技术,2011,7(16):3770-3771.[3]唐业敏,郭乐江,王琳艳.数据库应用系统中一种数据完整性实现方法[J].空军预警学院学报,2010,24(6):443-445.[4]凃云杰.教学管理系统中数据库完整性的设计与实现[J].电子制作,2014(16):67-68.—   160   —

因篇幅问题不能全部显示,请点此查看更多更全内容

Copyright © 2019- oldu.cn 版权所有 浙ICP备2024123271号-1

违法及侵权请联系:TEL:199 1889 7713 E-MAIL:2724546146@qq.com

本站由北京市万商天勤律师事务所王兴未律师提供法律服务