首席数据官

Hi, 请登录

数据可视化的研究与发展

数据的可视化技术结课论文姓名:****号:20120628学院:食品科学与工程学院专业班级:葡萄与葡萄酒1201论文方式:汉译英数据可视化的研究与发展摘要:针对数据可视化是可视化技术在大型数据库的应用中提出的新的数据分析和处理技术。该文介绍了数据可视化的概念和发展状况,然后针对大型数据集介绍了几种数据可视化技术以及它们的代表方法,并对数据可视化和科学计算可视化进行了分析和比较,最后探讨了数据可视化的研究方向关键词:数据可视化;数据开发;数据开发分析数据可视化的基本概念可视化(Visualization)技术是利用计算机图形学和图像处理技术,将数据转换成图形或图像在屏幕上显示出来,并进行交互处理的理论、方法和技术。它涉及到计算机图形学、图像处理、计算机视觉、计算机辅助设计等多个领域,成为研究数据表示、数据处理、决策分析等一系列问题的综合技术。可视化技术最早运用于计算科学中,并形成了可视化技术的一个重要分支——科学计算可视化(VisualizationScientificComputing)。科学计算可视化能够把科学数据,包括测量获得的数值、图像或是计算中涉及、产生的数字信息变为直观的、以图形图像信息表示的、随时间和空间变化的物理现像或物理量呈现在研究者面前,使他们能够观察、模拟和计算。

科学计算可视化自1987年提出以来,在各工程和计算领域得到了广泛的应用和发展。近年来,随着数据仓库技术、网络技术、电子商务技术等的发展,可视化技术涵盖了更广泛的内容,并进一步提出了数据可视化的概念,所谓数据可视化是对大型数据库或数据仓库中的数据的可视化,它是可视化技术在非空间数据领域的应用,使人们不再局限于通过关系数据表来观察和分析数据信息,还能以更直观的方式看到数据及其结构关系。数据可视化技术的基本思想是将数据库中每一个数据项作为单个图元元素表示,大量的数据集构成数据图像,同时将数据的各个属性值以多维数据的形式表示,可以从不同的维度观察数据,从而对数据进行更深入的观察和分析。数据可视化技术包含以下几个基本概念:(1)数据空间:是由n维属性和m个元素组成的数据集所构成的多维信息空间;(2)数据开发:是指利用一定的算法和工具对数据进行定量的推演和计算;(3)数据分析:指对多维数据进行切片、块、旋转等动作剖析数据,从而能多角度多侧面观察数据;(4)数据可视化:是指将大型数据集中的数据以图形图像形式表示,并利用数据分析和开发工具发现其中未知信息的处理过程。二、数据可视化的主要技术目前数据可视化已经提出了许多方法,这些方法根据其可视化的原理不同可以划分为基于几何的技术、面向像素技术、基于图标的技术、基于层次的技术、基于图像的技术和分布式技术等等。

数据可视化技术的目的_数据可视化技术及现状_大数据可视化技术 图书

下面介绍的是几种主要的技术。2.1基于几何的技术基于几何的可视化技术包括Scatterplots、Landscapes、ProjectionPursuit、ParallelCoordinates等等,是以几何画法或几何投影的方式来表示数据库中的数据。平行坐标法是最早提出的以二维形式表示n维数据的可视化技术之一。它的基本思想是将n维数据属性空间通过n条等距离的平行轴映射到二维平面上,每一条轴线代表一个属性维,轴线上的取值范围从对应属性的最小值到最大值均匀分布。这样,每一个数据项都可以根据其属性值用一条折线段在n条平行轴上表示出来。利用平行坐标法开发的系统包括ParallelVisualExplorer(IBM)、XMDV(MattWard)、AVS/Express(vanWijk)等等。这个方法的优点在于,对于较少的数据集能使用户在二维平面上看到每个数据的n维属性,对于大型的数据集能反映出各维属性之间的关系和数据在各维属性之间的走向趋势。2.2面向像素技术面向像素技术是由德国慕尼黑大学的D.A.Keim提出的,并且开发了VisDB可视化系统。面向像素技术的基本思想是将每一个数据项的数据值对应于一个带颜色的屏幕像素,对于不同的数据属性以不同的窗口分别表示。

面向像素技术的特点在于能在屏幕中尽可能多地显示出相关的数据项,对于高分辨率的显示器来说,可显示多达106数量级的数据。面向像素的可视化方法包含独立于查询的方法和基于查询的方法两种。独立于查询的方法将数据库中的数据依从左到右(从上到下)的次序一行一行(一列一列)地排列显示出来,数据值的变化范围同事先固定好的颜色变化范围相对应;基于查询的方法是根据数据值同所查询的要求的符合程度来匹配不同的颜色。针对每一个数据项的值及查询要求通过一个距离函数计算每个属性值与查询要求的匹配值,得到每个数据的一个总的距离值以反映数据项与查询要求之间的匹配程度数据可视化技术及现状,总的距离值越小越是用户所希望看到的数据。查询的数据结果按dn+1的值由小到大从屏幕的中央螺旋地向四周展开。这样不仅能看到所查询的数据,而且对于数据从近似匹配到不匹配的走势也能直观地表现。2.3基于图标的技术基于图标技术的基本思想是用一个简单图标的各个部分来表示n维数据属性。基于图标的可视化技术包括Chernoff-face、ShapeCoding、StickFigures这种技术适用于某些维值在二维平面上具有良好展开属性的数据集。枝形图方法(StickFigures)是其中的基本方法之一。

枝形图方法首先选取多维属性中的两种属性作为基本的X-Y平面轴,在此平面上利用小树枝的长度或角度的不同表示出其他属性值的变化。2.4基于层次的可视化技术基于层次的可视化技术主要针对数据库系统中具有层次结构的数据信息,例如人事组织、文件目录、人口调查数据等。它的基本思想使将n维数据空间划分为若干子空间,对这些子空间仍以层次结构的方式组织并以图形表示出来。基于层次的技术包括DimensionalStacking、Treemap、ConeTrees等方法。树图(Treemap)是其中的一种代表技术。树图根据数据的层次结构将屏幕空间划分成一个个矩形子空间,子空间大小由结点大小决定。树图层次则依据由根结点到叶结点的顺序,水平和垂直依次转换,开始将空间水平划分,下一层将得到的子空间垂直划分,再下一层又水平划分,依此类推。对于每一个划分的矩形可以进行相应的颜色匹配或必要的说明。数据可视化和科学计算可视化的比较数据可视化的发展和科学计算可视化的发展形成了可视化技术的两大主要分支,是可视化技术运用于不同领域的结果。它们的最大区别在于所处理的数据对像是不同的。科学计算可视化主要针对的是科学和工程领域的计算或测量数据,侧重于科学与工程测量领域的空间连续数据可视化。

而数据可视化则主要针对大型数据集中的非空间离散数据。科学计算可视化主要是数据场的可视化,包括点数据场、标量场、矢量场和张量场的可视化等。数据可视化致力于在二维平面上显示数据的多维属性,分析并发现其中的关联和走势。科学计算可视化可以利用基本的参考模型,先将原始数据转换为几何数据,再将几何数据转换为图像数据数据可视化技术及现状,最后进行映射和绘制。数据可视化没有基本的模型可以遵循,可视化系统可给出带有多变量 的图形化分析数据,帮助分析员进行信息发现,然后查看到那些无论系统计算能 力有多强,机器算法都难以确定的模式和关系。 数据可视化和科学计算可视化虽然应用的领域和处理方法都不尽相同,但因为两 者的基础都是利用计算机图形图像处理技术来分析和显示数据源,所以在具体的 技术方法中仍有值得互相借鉴的地方。如数据可视化技术中的Che

试看结束,如继续查看请付费↓↓↓↓
打赏0.5元才能查看本内容,立即打赏

来源【首席数据官】,更多内容/合作请关注「辉声辉语」公众号,送10G营销资料!

版权声明:本文内容来源互联网整理,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 jkhui22@126.com举报,一经查实,本站将立刻删除。

相关推荐

二维码
评论