什么是“数据集市技术”啊?

A浩然传媒 2024-05-24 20:18:57
最佳回答
1、数据集市的产生 当今信息社会,“数据”不等于“信息”,只有对数据进行恰当的处理,才会找到所需要的信息。为了把数据转化为有价值的信息,必须拓展最终用户的查询能力,企业应能使用户对其详细的业务数据随时进行查询,于是出现了数据仓库这一新的技术概念。数据仓库(data warehouse)实际上是把传统数据库对数据的操作型处理升级到对多个数据源的数据进行统一的组织,形成一个一体化的存储结构,为决策分析奠定基础。 数据仓库作为企业级应用,其涉及范围和投入成本常常是巨大的,它的建设很容易形成高投入、慢进度的大项目。这一切都是设计者和使用者所不希望看到和不能接受的,使用者要求在部门内部获得一种适合自身应用、容易使用且自行定向而方便高效的开放式数据接口工具。正是这种需求使数据集市应运而生。2 数据集市的概念 数据集市(data market)是一种更小、更集中的数据仓库。简单地说,原始数据从数据仓库流入不同的部门以支持这些部门的定制化使用。这些部门级的数据库就称为数据集市。一个数据集市就是一个部门的数据集合。数据集市是为特定部门的决策支持而组织起来的一批数据和业务规则,习惯上称它们为“主题域”。不同部门有不同的“主题域”,因而也就有不同的数据集市。例如,财务部门有自己的数据集市,市场部门也有自己的数据集市,它们之间可能有关联,但相互不同且在本质上互为独立。尽管数据集市与数据仓库在很多方面有类似之处,但它们之间却存在着区别。主要体现在:(1)面向的对象不同。数据仓库面向的是整个企业,为整个企业提供所需的数据;数据集市则面向各个部门。 (2)数据粒度不一样。数据仓库中的数据粒度非常小;数据集市中的数据主要是概括级的数据。 数据集市的数据源主要来自数据仓库,它主要从数据仓库中提取部门所需要的数据以满足部门级的需要。数据集市的部分数据由其他数据源供给3 数据集市的体系结构 数据集市的数据源主要来自数据仓库和其他数据源。实际上,如果先建数据集市,后建数据仓库,则数据集市的数据就不能来自数据仓库,因此在实际应用中数据集市最主要的数据源来自业务数据库。 实际应用中,考虑到业务数据库的服务器承担着繁忙的业务活动,所以我们将数据集市服务器与业务数据库的服务器分开。因此,有关系统以及web的开发,都是基于数据集市服务器的。它们的相互关系如下图所示。数据集市体系结构图4 数据集市技术的应用及其实现方法数据集市主要是为有关的决策提供支持的,它能够大大提高工作效率,降低建设风险,在较短的时间内取得较好的成果,因此得到广泛的应用。数据集市可以分为两类:独立型和依赖型。在独立型数据集市中,数据来自一个或多个操作系统或外部信息提供者,或者来自在一个特定的部门或地域局部产生的数据。依赖型数据集市中的数据直接来自企业数据仓库。目前,国内还是依赖型的数据集市居多。两者的区别就在于是否从一个中央数据仓库而来。因为国内的数据仓库项目在开始阶段多是国外厂商推进的,肯定有些不理智,大多直接从数据仓库的概念入手,整合分散的、异构的数据。而独立型数据集市是因为客户有分析需求,需要一些用于分析的数据支撑,所以在部分或者自己的区域内建立这种小型数据仓库。独立型数据集市是服务具体分析应用的。就应用而言,独立型和依赖型数据集市应该是相似的,因为目前对于数据集市的建模方法基本一致:使用建立面向主题的星型模式,服务于某项分析应用。二者主要的差别还是在扩展性方面,独立型数据集市还是会导致不一致的数据。因为它可能按照自己本地的方式来进行编码,当存在多个独立数据集市的时候,他们之间的数据很难共享。依赖型的数据集市则是按照中央数据仓库统一的编码方式,可以共享。要建立数据集市服务器,必须将业务数据库中的数据提取到数据集市数据库。但是从业务数据库提取来的数据是被设计用于日常的事物处理的,这种按传统方式组织的数据不适合支持因决策而经常进行的查询,故查询的效率比较低。为了提高查询效率,克服传统数据组织结构所带来的弊端,多维数据库是一种较好的解决方法。多维数据库是以多维数据存储形式来组织数据的数据管理系统,它不是关系型数据库,在使用时需要将数据从关系数据库中转载到多维数据库中方可访问。多维数据库在针对多维的分析应用时具有较好的效果数据集市技术可以方便快捷地建立面向部门的或面向主题的统计查询系统,在现代企业客户管理系统中,通过数据集市技术可以全面分析您的客户管理现状和发展目标,帮助您设计、开发和维护**和营销活动管理系统。从这一层面来看,“ecdms数据集市”所提供的数据库产品更能体现出数据集市技术在现代商务营销模式中的重要作用。综合以上所述也可以预见,数据集市技术将会在各行业领域得到越来越广泛的应用和更大的发展。 20210311
汇率兑换计算器

类似问答
  • 数据科学与大数据技术专业怎么样?
    • 2024-05-24 21:03:07
    • 提问者: 未知
    2016年,北京大学、对外经济贸易大学和中南大学3所高校首批获批开设这个专业,2017年32所...专业解读依据的是教育部最新颁布的《普通高等学校本科专业类教学质量**标准》。...
  • 高考填志愿:数据科学与大数据技术专业怎么样?
    • 2024-05-24 22:33:59
    • 提问者: 未知
    随着**对大数据日益重视,大数据已是**战略性新兴产业方向之一,在不远的未来将不再是单纯的it时代,…
  • 如何看待大数据bi技术?
    • 2024-05-24 12:36:00
    • 提问者: 未知
    大数据和bi(商业智能)有何本质的不同?两者技术上有什么...当前大数据可以产生价值的地方,从行业的角度看,互联网、制造业、公共服务、医疗保健、金融服务都有广阔前景。...
  • eia数据是什么意思啊?
    • 2024-05-24 21:39:11
    • 提问者: 未知
    eia是美国能源资料协会是美国能源部下属的能源信息署,...该数据一般每周公布一次,时间为每周三晚间11:30(夏令时10:30)公布,该数据对汇市以及贵金属市场都会造成一定的影响...
  • 数据科学与大数据技术是什么样的专业?
    • 2024-05-24 15:00:43
    • 提问者: 未知
    “数据科学与大数据技术”专业是培养以计算机科学、统计分析为基础,具备经济、金融、物流、商业、贸易、管理等相关学科的领域知识,能推动并引领未来全球“互联网+”、云...
  • 优创数据技术有限公司怎么样?
    • 2024-05-24 21:09:59
    • 提问者: 未知
    谢邀,作为一名在优创实习了几个月的实习生,楼主可以好好回答一下~楼主是在人力资源部门实习的小白,整…
  • 深圳市华傲数据技术有限公司怎么样?
    • 2024-05-24 14:51:28
    • 提问者: 未知
    简介:华傲数据是一家大数据技术公司,为互联网、金融、电信等行业提供数据质量、数据集成、大数据分析和复杂数据分析等方面的基础软件产品和全面解决方案。产品主要包括数据质量管理系统dqms、数据剖析系统profiler、数据集成及数据清洗系统etl大数据和复杂数据管理系统dums等。法定代表人:贾西贝成立日期:2011-01-28注册资本:1567.5499万元人民币所属地区:广东省统一社会信用代码:9...
  • 大数据技术有哪些?
    • 2024-05-24 04:38:21
    • 提问者: 未知
    能够以连续的流式传输方式,轻松地从您的日志、指标、web 应用、数据存储以及各种 aws ...zookeeper是一个分布式的,开放源码的分布式应用程序协调服务,提供数据同步服务。...
  • 大数据爬虫技术有什么功能
    • 2024-05-24 09:49:09
    • 提问者: 未知
    1、爬虫技术概述网络爬虫(web crawler),是一种按照一定的规则,自抓取万维网信息的程序或者脚本,它们被广泛用于互联网搜索引擎或其他类似网站,可以自动采集所有其能够访问到的页面内容,以获取或更新这些网站的内容和检索方式。从功能上来讲,爬虫一般分为数据采集,处理,储存三个部分。传统爬虫从一个或若干初始网页的url开始,获得初始网页上的url,在抓取网页的过程中,不断从当前页面上抽取新的url...
  • 什么是数控技术
    • 2024-05-24 10:16:28
    • 提问者: 未知
    就是数字控制 以达到要求的精密的技术
汇率兑换计算器

热门推荐
热门问答
最新问答
推荐问答
新手帮助
常见问题
房贷计算器-九子财经 | 备案号: 桂ICP备19010581号-1 商务联系 企鹅:2790-680461

特别声明:本网为公益网站,人人都可发布,所有内容为会员自行上传发布",本站不承担任何法律责任,如内容有该作者著作权或违规内容,请联系我们清空删除。