【期末复习向】数据可视化技术

一、重点复习

        题型:填空题(15道,2分一个)与简答题(3道题目,10分一个)与绘图题(选画2个类型的图)

1.什么是数据可视化

         在计算机视觉领域,数据可视化是对数据的一种形象直观的解释,实现从不同维度观察数据,从而得到更有价值的信息。数据可视化将抽象的、复杂的、不易理解的数据转化为人眼可识别的图形、图像、符号、颜色、纹理等 ,这些转化后的数据通常具备较高的识别效率,能够有效地传达出数据本身所包含的有用信息。

        数据可视化是为了从数据中寻找出三个方面的信息:模式、关系和异常。(1)模式。指数据中的规律。(2)关系。指数据中的相关性。(3)异常。指有问题的数据。

2.数据可视化的作用

       数据可视化的作用包括记录信息、分析推理、信息传播与协同等。(1)记录信息。自古以来,记录信息的有效方式之一是用图形的方式描述各种具体或抽象的事务。(2)分析推理。数据可视化极大地降低了数据理解的复杂度,有效提升了信息认知的效率,从而有助于人们更快地分析和推理出有效信息。(3)信息传播与协同。通过数据可视化可以加深对数据的感知。

        大数据的问题:(1)大量数据不能有效利用,弃之可惜,想用却不知如何下手。(2)数据展示模式繁杂晦涩,无法快速甄别有效信息。

        数据可视化在大数据分析中的作用:(1)动作更快。使用图表来总结复杂的数据,可以确保对关系的理解要比那些混乱的报告或电子表格更快。可视化提供了一种非常清晰的交互方式,从而能够使用户更快地理解和处理这些信息。(2)以建设性方式提供结果。大数据可视化工具能够用一些简短的图形描述复杂的信息。通过可交互的图表界面,轻松地理解各种不同类型的数据。(3)理解数据之间的联系。在市场竞争环境中,找到业务和市场之间的相关性是至关重要的。

3.数据可视化的分类

        数据可视化的处理对象是数据。根据所处理的数据对象的不同,数据可视化可分为科学可视化和信息可视化。科学可视化面向科学和工程领域数据,如三维空间测量数据、计算模拟数据和医学影像数据等,重点探索如何以集合、拓扑和形状特征来呈现数据中蕴含的规律;信息可视化的处理对象则是非结构化的数据,如金融交易、社交网络和文本数据,其核心挑战是如何从大规模高维度复杂数据中提取出有用信息。(最多加一个可视分析学,可视分析学被定义为一门以可视交互界面为基础的分析推理科学,综合了图形学、数据挖掘和人机交互等技术)

4.数据可视化的发展方向

        数据可视化技术的发展主要集中在以下3个方向:(1)可视化技术与数据挖掘技术的紧密结合。数据可视化可以帮助人类洞察出数据背后隐藏的潜在规律,进而提高数据挖掘的效率。因此,可视化与数据挖掘紧密结合是可视化研究的一个重要方向。(2)可视化技术与人机交互技术的紧密结合。用户与数据交互,可方便用户控制数据,更好地实现人机交互是人类一直追求的目标。因此,可视化与人机交互相结合是可视化研究的一个重要发展方向。(3)可视化技术广泛应用于大规模、高维度、非结构化数据的处理与分析。目前,我们处在大数据时代,大规模、高维度、非结构化数据层出不穷,若将这些数据以可视化形式完美地展示出来,对人们挖掘数据中潜藏的价值大有裨益。因此,可视化与大规模、高维度、非结构化数据结合是可视化研究的一个重要发展方向。

5.视觉感知的处理过程

        在视觉感知的过程中,人们会经历6个心理过程:(1)视觉寻找。指在视线所能达到的范围内搜寻目标。(2)寻找。当发现视线探测到的对象与预期所需目标相符合时,则排除其他对象,锁定目标。(3)分辨。对多个相似的对象的信息进行深入探测。(4)识别。指根据视觉特征信息和细节信息的差异,识别目标的含义。(5)确定。指锁定的对象与记忆中的存储信息相吻合,确认目标。(6)记忆搜索。是以上视觉过程的基础。通过以上步骤所获得的信息都要与记忆信息对比,然后做出判断。

6.格式塔原则

        格式塔原则描述了人在视觉上如何感知对象,它是视觉可视化设计的基本原则。格式塔包括以下基本原则。

(1)接近原则。通常人在进行视觉感知时会把在距离上相互靠近的元素视作一个整体。元素之间的距离越大,被视作组合的概率越大。

(2)相似原则。相似原则看中的是元素内部特性的不同,对于元素内部的纹理、颜色、形状、大小等特征,人们的视觉感知常常会把这些明显具有共同特征的元素当做一个整体或归为一类。

(3)闭合原则。闭合原则是指人们通常会在潜意识中把一个不连贯的图形补充完整,使之连贯。人们常会将不完全封闭的东西视作统一的整体。在设计中,可以通过不完整的图形,让人去想象闭合图形,这样可以引起用户的兴趣和关注。

(4)连续原则。是以实物形象上的不连续使用户产生心理上的连续知觉。凡具有连续性或共同运动方向的元素容易被视为一个整体。

7.颜色理论

(1)光的特性。人们能够看到物体,是因为有光的存在;人眼能够区分不同的颜色,是因为不同光的波长和强度有区别。三基色:红、绿、蓝

(2)三基色原理。大多数的颜色可以通过红、绿、蓝三色光按照不同的比例合成产生。同样,绝大多数单色光也可以分解成红、绿、蓝三种色光。

(3)不同的色彩对人心理的影响。暖色系的颜色是以橘色为中心的色群,适用于积极、健康、努力等内容;冷色系是以蓝色为中心的色群,适用于表现商业、科技、学习等方面的内容。

(4)色彩的三要素。从可视化编码的角度对颜色进行分析,可将颜色分为色相、明度和饱和度三个视觉通道。1.色相。即色彩的相貌和特征,指颜色的种类和名称。黑白没有色相,为中性。2.明度。又称亮度,指颜色的深浅,明暗的变化。3.饱和度。又称纯度,指颜色的鲜艳程度。

(5)数据可视化色彩搭配技巧。1.色调与明度上的变化要大。在进行色彩搭配时,配色要容易辨识与区分,明度差异需要进行整体设计,而且明度差异要够大。2.学习大自然的色彩过渡。设计者应该更多了解大自然中的色彩过渡,再将其应用到可视化设计中。3.尽量使用渐变来替换静态的单一颜色。要想让设计效果更加美观,则可以在不同色调的基础上加上渐变。

8.视觉的编码

(1)视觉编码的定义。描述数据与可视化结果的映射关系。

(2)标记。指图形元素,如点、线、面、体。

(3)视觉通道。指用于控制图形元素的展示特性,包括元素的颜色、位置 、尺寸、形状、方向、色调、饱和度、亮度、纹理等。

(4)视觉通道的类型。1.定性或分类的视觉通道。适合用于编码分类的数据信息,如形状、颜色的色调、空间位置。2.定量或定序的视觉通道。适合用于编码有序的或者连续性的数据信息,如直线的长度、区域面积、空间的体积、颜色的饱和度和亮度等。3.分组的视觉通道。分组是通过多个或多种标记的组合来进行描述的,分组通道包括接近性、相似性和包括性。

(5)视觉通道的表现力和有效性。视觉通道表现力和有效性体现在以下几个方面:1.精确性。指人们视觉感知后的判断结果是否与原始数据一致。2.可辨性。指视觉通道有不同的取值范围,如何取值能使人们更容易区分该视觉通道的多种取值状态。3.可分离性。指将不同视觉通道的编码对象放置到一起,是否容易分辨。4.视觉突出。指对重要的信息,是否使用更加突出的视觉通道进行编码。

(6)视觉编码的两大原则。1.表达性、一致性。可视化的结果应该充分表达数据想要表达的信息,且不会让用户产生歧义。2.有效型、理解性。可视化之后比前一种数据表达方案更加有效,更加容易让人理解。

9.数据的类型

        根据数据模型,可以将数据分为浮点数、整数、字符等。通常根据测量标度将数据分为四类:类别型数据:用于区分物体、有序型数据:用来表示对象间的顺序关系、区间型数据:用于得到对象间的定量比较、比值型数据:用于比较数值间的比例关系。通常并不区分区间型数据和比值型数据,所以可以将数据类型精简为三种:类别型数据、有序型数据、数值型数据

10.数据预处理

        大数据时代,数据来源广泛,数据类型和格式存在差异,并且这些数据中的大部分是有噪声的、不完整的,甚至存在错误。因此数据预处理的目的是提升数据质量,使得后续的数据处理、分析、可视化过程更加容易、有效。

        数据的质量:(1)有效性。数据与实际情况对应时,是否违背约束条件。(2)准确性。数据能否准确地反映现实。(3)完整性。采集的数据集是否包含了数据源中的所有数据点,且每个样本的属性都是完整的。(4)一致性。整个数据集中的数据的衡量标准要一致。(5)时效性数据适合当下时间区间内的分析任务。(6)可信性。数据源中的数据是使用者可依赖的。

        数据预处理的步骤:(1)数据清理。指修正数据中的错误、识别脏数据、更正不一致数据的过程。(2)数据集成。指把来自不同数据源的同类数据进行合并,减少数据冲突,降低数据荣誉程度等。(3)数据归约:指在保证数据挖掘结果准确性的前提下,最大限度地精简数据量,得到简化的数据集。(4)数据转换。指对数据进行规范化处理。

11.数据分析与数据挖掘

(1)数据分析。数据分析是指用适当的统计分析方法对收集来的大量数据进行分析,目的是找出内在规律,提取隐藏在大量数据中的信息,从而帮助人们理解,判断,决策和行动。

        常用的数据分析有统计分析、探索性数据分析、验证性数据分析、在线分析与处理。1.统计分析:是指对数据进行统计描述和统计推断的过程。2.探索性数据分析:是对调查、观测所得到的的一些初步的杂乱无章的数据,在尽量少的先验假设下进行处理,通过作图、制表等形式和防尘你和、计算某些特征量等手段,探索数据的结构和规律的一种数据分析方法。3.验证性数据分析:是指在已经有事先假设的关系模型等情况下通过数据分析来验证已提出的假设。4.在线分析与处理(OLAP):是一种交互式探索大规模多维数据集的方法。OLAP的基本功能有切片和切块、钻取和旋转。

(2)数据挖掘。数据挖掘一般是指从大量的数据中通过算法搜索隐藏于其中的信息的过程。常见的数据挖掘的方法有分类与预测、聚类分析、关联分析和异常分析等。1.分类与预测。分裂算法是从数据中选出已经分好类的训练集,再次训练集上运用数据挖掘分类技术,构造一个分类模型,然后在根据此分类模型对数据集中未分类的数据进行分类。2.聚类分析。聚类指将数据集聚集成几个簇,使得同一个聚类中的数据集之间的相似程度高,而不聚类中的数据集之间的相似程度低,利用分布规律从数据集中发现有用的规律。3.关联分析。关联分析就是发现存在于大量数据集中的关联性或相关性,从而描述了一个事物中某些属性同时出现的规律和模式。4.异常分析。少量数据与大多数数据的特征不一样,通常它们被认为是噪声,但是也可能是重要信息。

(3)数据挖掘的步骤。1.确定业务对象。清晰地定义业务问题,认清数据挖掘的目的。数据的挖掘结果是不可预测的,但要探索的方向应是有遇见的,不应该带有盲目性。2.数据准备。数据的准备包括数据的选择、数据的预处理和数据的转换。3.数据挖掘。对所得到的经过预处理的数据进行挖掘。4.结果分析。解释并评估结果。使用的分析方法一般应根据数据挖掘操作而定。5.知识的同化。将分析所得到的知识集成到业务信息系统的组织结构中去。

12.数据可视化的流程

        数据可视化的流程以数据流向为主线,其核心流程主要包括数据采集、数据处理和变换、可视化映射和用户感知四大步骤。

        (1)数据采集。在可视化设计过程中,一定要事先了解数据的来源、采集方法和数据属性,这样才能准确地反映要解决的问题。

        (2)数据处理和变换。可视化之前需要将原始数据转换程用户可以理解的模式和特征并显示出来。它包括去噪、数据清洗、提取特征等流程。

        (3)可视化映射。可视化映射过程是整个流程的核心,其主要目的是让用户通过可视化结果去劣迹数据信息以及数据背后隐含的规律。

        (4)用户感知。可视化映射后的结果只有通过用户感知才能转换成知识和灵感。用户从数据的可视化结果中进行信息融合、提炼、总结知识和获得灵感。

13.数据可视化的设计标准及框架

(1)数据可视化的设计标准。1.表达力强。能真实全面的反映数据的内容。2.有效性强。一个有效的可视化设计应在短时间内把数据信息以用户容易理解的方式显示出来。3.能简洁地传达信息。这样能在有限的画面里呈现更多的数据,而且不容易让用户产生误解。4.易用。用户交互的方式应该简单、明了,用户操作起来很方便。5.美观。视觉上的美感可以让用户更易于理解可视化要表达的内容,提高工作效率。

(2)数据可视化的设计框架。

第一层描述现实生活中用户遇到的实际问题。了解用户数据所属领域,搜集相关信息建立系统原型。第二层是抽象层。将第一层确定的任务和数据转换为信息可视化术语。第三层是编码层,涉及视觉编码和交互方式,是可视化研究的核心内容。第四层则需要具体实现与前三个层次匹配的数据可视化展示和交互算法,是解决如何完成。

14.数据到可视化的直观映射

        (1)在设计数据到可视化的映射时,设计者不仅要明确数据 语义,还要了解用户的个性特征。利用已有的先验知识,预测用户在使用可视化结果时的行为和期望,减少用户对信息的感知和认知所需的时间。

        (2)数据到可视化的映射还要求设计者使用正确的视觉通道去编码数据信息。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mfbz.cn/a/292392.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

re:Invent 2023 技术上新|Amazon Q 使用生成式 AI 助理,更快更轻松地获得数据洞察...

Amazon Q in QuickSight 现已提供预览版。现在,您可以体验 Amazon QuickSight 于7月26日发布的生成式 BI 功能,以及为业务用户提供的两项附加功能。 利用 Amazon Q in QuickSight 更快地将见解转化为影响力 随着这项功能的发布,业务用户现在…

Linkage Mapper 各工具参数详解——Barrier Mapper

【小白一学就会无需其他教程】此文档用于解析使用Linkage Mapper 各输入输出参数详情以及可能的影响,并介绍了如何解释模型输出结果和输出参数,适合刚入手的人。篇幅很长很啰嗦,是因为每个参数都解释的万分细致。 从以下链接中获取内容&#…

express+mongoDB开发入门教程之mongoose使用讲解

系列文章 node.js express框架开发入门教程 expressmongoDB开发入门教程之mongoDB安装expressmongoDB开发入门教程之mongoose使用讲解 文章目录 系列文章前言一、Mongoose是什么?二、Mongoose安装三、Mongoose在express项目中使用步骤一、连接mongoDB数据库步骤二、…

游戏缺少emp.dll详细修复教程,快速解决游戏无法启动问题

在现代游戏中,我们经常会遇到一些错误提示,其中之一就是“emp.dll丢失”。emp.dll是一个动态链接库文件,它包含了许多程序运行所需的函数和数据。当一个程序需要调用这些函数时,系统会从emp.dll文件中加载相应的内容。因此&#x…

Maven简介及环境搭建和基本使用(Java开发中的实用工具)

一、概述 Maven 是 Apache 软件基金会的一个开源项目,是一个优秀的项目构建工具,它 用来帮助开发者管理项目中的 jar,以及 jar 之间的依赖关系、完成项目的编译、 测试、打包和发布等工作。 Maven的相关概念 pom.xml文件:里面可以配置相关信息,指导ma…

Mac内心os:在下只是个工具,指望我干人事?

呜呜呜,今天去医院看病了,乌央央的好多人。最近在研究苹果开发者工具中的HealthKit,等我研究透给大家安利。今天还是继续闲聊吧😂😂提前感谢大家体谅我这个病号,发射小红心,biubiubiu~ 据说&am…

uniapp 无限级树形结构面包屑、单选-多选、搜索、移除功能插件,基于【虚拟列表】高性能渲染海量数据,加入动态高度、缓冲区

hyq-tree-vtw 无限级树形结构面包屑、单选-多选、搜索、移除功能 示例项目 单选-user 单选-任意一项 多选-关联下级 多选-任意一项 已选择数据弹框 说明 本插件需要使用uni-popup、uni-transition用于已选择数据弹框,因此需要有这些依赖,请自行导入本插件基于【虚…

vue-mixins混入处理

定义 mixins(混入):一种分发 Vue 组件中可复用功能的非常灵活的方式,mixins 是一个 js 对象,它可以包含我们组件script中的任意功能选项,如:data、components、methods、created、computed 等等…

202365读书笔记|《温暖和百感交集的旅程》——时间帮助着一个人的一生在几千字的篇幅里栩栩如生

202365读书笔记|《温暖和百感交集的旅程》——时间帮助着一个人的一生在几千字的篇幅里栩栩如生 我能否相信自己温暖和百感交集的旅程前言和后记 《温暖和百感交集的旅程》作者余华,之前读完的一本书,已经不太记得内容了,看着笔记整理的这篇书…

Java项目:109SpringBoot超市仓管系统

博主主页:Java旅途 简介:分享计算机知识、学习路线、系统源码及教程 文末获取源码 一、项目介绍 超市仓管系统基于SpringBootMybatis开发,系统使用shiro框架做权限安全控制,超级管理员登录系统后可根据自己的实际需求配角色&…

Tectum:BTC L2终极解决方案+最快区块链,表现强势开启质押

随着加密市场的不断成长,不管是金融属性还是使用体验都有了质的提升!牛市即将到来,多个机构的比特币 ETF 正在申请中,无论什么时候获得 SEC 的批准,都将为加密市场带来万亿级别的资金,同时吸引更多的 Web2 …

大数据 MapReduce是什么?

在Hadoop问世之前,其实已经有了分布式计算,只是那个时候的分布式计算都是专用的系统,只能专门处理某一类计算,比如进行大规模数据的排序。 很显然,这样的系统无法复用到其他的大数据计算场景,每一种应用都…

会声会影2023如何实现自定义尺寸MP4格式视频制作 会声会影视频制作过程 会声会影免费吗

在使用会声会影生成视频时,默认提供了很多不同的尺寸参数,但有些时候,我们需要自定义生成的尺寸,同时保证生成文件的格式为mp4.视频的体积不能过大,这时候我们要如何做呢?今天来介绍2个方法,供大…

72.乐理基础-打拍子-加延音线的节奏型

什么是延音线看这里:乐理基础-音符的组合方式-延音线 上一个内容:71.乐理基础-打拍子-三连音的变体-CSDN博客 为了让二八、四十六、前八后十六、前十六后八、前附点、后附点、小切分、大附点、大切分、三连音这是个基础节奏型产生更丰富的节奏形态&…

分享10篇优秀论文,涉及图神经网络、大模型优化、表格分析

引言 第38届AAAI人工智能年度会议将于2024年2月在加拿大温哥华举行。今天给大家分享十篇AAAI2024论文,主要涉及图神经网络,大模型幻觉、中文书法文字生成、表格数据分析、KGs错误检测、多模态Prompt、思维图生成等。 论文获取方式,回复&am…

【Linux驱动】Linux中断(二)—— 按键中断驱动

前一篇已经在设备树的 gpio-led 节点中引入了中断信息&#xff0c;接下来将通过API来获取设备树中的中断信息。gpio-led 节点具体内容如下&#xff1a; gpio-key0 {pinctrl-names "default";pinctrl-0 <&pinctrl_gpio_keys>; // pinctrl子系…

计算化学顶刊封面!玻色量子联合上海交大张健课题组发表量子计算重要成果

​2023年12月13日&#xff0c;北京玻色量子科技有限公司&#xff08;以下简称“玻色量子”&#xff09;联合上海交通大学在中科院分区1区、计算化学领域Top刊物JCTC&#xff08;Journal of Chemical Theory and Computation&#xff09;内刊的封面上发表了以“Encoding Molecul…

【Spring】AOP原来如此

AOP概述 什么是AOP的技术&#xff1f; 在软件业&#xff0c;AOP为Aspect Oriented Programming的缩写&#xff0c;意为&#xff1a;面向切面编程AOP是一种编程范式&#xff0c;隶属于软工范畴&#xff0c;指导开发者如何组织程序结构AOP最早由AOP联盟的组织提出的,制定了一套…

vercel部署Gemini pro

一、注册一个vercel账号&#xff08;这个东西类似于第三方的github pages&#xff0c;能部署github中的项目&#xff09; 二、注册结束后&#xff0c;填写github的账号&#xff08;需要事先在该github账号中fork一个gemini的repository&#xff09; 三、babaohuang/GeminiPro…

Koordinator 助力云原生应用性能提升:小红书混部技术实践

作者&#xff1a;宋泽辉&#xff08;小红书&#xff09;、张佐玮&#xff08;阿里云&#xff09; 编者按&#xff1a; Koordinator 是一个开源项目&#xff0c;是基于阿里巴巴内部多年容器调度、混部实践经验孵化诞生&#xff0c;是行业首个生产可用、面向大规模场景的开源混…