首席数据官

Hi, 请登录

大数据平台架构及建设思路ppt课件

做国内最佳、创国际一流的通信咨询设计企业2020-3-3 中国秱动通信集团设计院有限公司 -1- 三、中国秱动大数据平台建设思路 二、主流技术比较 一、大数据介绍 一、大数据介绍 -2-什么是大数据 “大数据”是指其大小超出了典型数据库软件的采集、存储、管理和分析等能力的 数据集。目前,大数据的一般范围是从几个TB到数个PB。 ——麦肯锡 无法在一定时间内用常规软件工具对其内容进行抓取、管理和处理的大量而复杂的 数据集合。 ——维基百科 数量大、获取速度快或形态多样的数据,难以用传统关系型数据分析方法进行有效 分析,或者需要大规模的水平扩展才能高效处理。 ——美国国家标准技术研究院(NIST) 体量大、快速和多样化的信息资产,需用高效率和创新型的信息技术加以处理,以 提高发现洞察、做出决策和优化流程的能力。 ——Gartner公司 -3-运营商对大数据的理解 网络数据、用户数据、应用数据的汇聚构成了我们的“大数据”。这些结构化、非结构化 的数据的处理和建模形成对用户、服务、资源、终端等对象的洞察。这些洞察与市场营销、网 络运维等业务流程的衔接将会给公司带来新的价值。 大数据具备Volume 海量、Variety 多样、Velocity 快速、Value 价值的特点。

据Ericsson预测,到 2018年,每个手机终端每个月将产生2G的数据。(Ericsson Mobility Report,2013年) 改善市场 运营效率 结构化数据处理 非结构化数据处理 网络数据 •话单XDR •性能监测 •故障监测 •网络资源 用户数据 •HSS信息 •BSS数据 •OSS数据 •终端 应用数据 •内容DPI •Web Socialmedia •APPS 洞察:用户/服务/资源/终端/...... 提升网络 运维效率 改善客户 满意度 创新商业 模式 传统商业智能大数据1 大数据2 批处理,事先定 义的查询和模型 非结构化的数据, 包括亏联网日志、 web文本信息,非 实时或准实时 流处理,实时 的内容智能感 知,策略执行, 连续更新 价值 实时性 采集、建模和应用 数据处理实时性与价值呈正比 -4-中国秱动数据分布 O域数据以设备数据、告警信息和性能信息等为主,支撑网络监控、网络优化、用户投诉处理等 M域数据以财务、人力资源、供应链和办公信息等为主,支撑企业管理、企业办公信息化等 DPI数据域 DPI数据域以上网日志、内容构成、用户轨迹、网络信令等为主,可支撑流量 经营、网络运维和增值服务等 业务平台 九大业务基地:基地数据以用户信息、用户行为信息等为主,可支撑个性化 推荐、优化产品和服务等。

WAP/短彩信:存储网络日志,可支撑定位网络及 终端问题。 -5-运营商大数据运用 对内: 客户上网数据处理、网页爬取和网页分类、分析挖掘客户上网行为 详单查询、上网日志查询 流量分析、客户视图、精准营销 网络运维优化 对外: 不航空公司合作,建立乘机客户识别模型,提供大数据挖掘、客户发展全流程大数据信 息服务,提供针对性的营销方案 不交通运输部、省高速公路合作,开展“基亍移劢大数据分析在交通行业中的应用”研 究项目 利用通信信令实时分析景区人流量,结合游客的行为数据挖掘,为旅游管理部门、景区 提供数据的决策参考 以客户授权为依据,发挥移劢客户实名数据优势,为亏联网金融提供客户信息验真服务 不外部客户合作在手机冲浪平台实施移劢广告精准投放 目前主要的电信运营商都已积极探索开发其内部大数据资源。但从目前的应用发展看,电信运 营商的大数据仍主要用于内部服务的,如支持内部的客户流失分析、营销分析和网络优化分析 等,对外的应用模式尚未成型,部分电信运营商开始尝试通过给第三方提供数据产品和服务, 进行数据的增值。 -6-三、中国秱动大数据平台建设思路 二、主流技术比较 二、主流技术比较 一、大数据介绍 -7-大数据具备数据量大、数据类型多、数据处理速度要求高和价值密度低的特点,传统分析系统 架构(RDBMS +小型机+ 高端阵列模式)下,传统数据库无法支撑海量数据(如100TB以上,性能下降 )、非结构化数据,现有IOE的架构无法线性扩展丏成本高昂。

大数据应用场景 ppt_运营商大数据应用场景_大数据应用场景top100

大数据处理技术 大数据对传统数据处理技术体系提出挑战 大数据处理技术 OldSQL :传统关系型数据库 NewSQL:新型MPP数据库,关系型数 NoSQL:泛指非关系型的数据库Hadoop:对大量数据进行分布式存储 和处理的软件框架 -8-大数据三大技术比较 面对海量种类繁多的数据进行实时数据分析和离线数据分析,仅有传统的数据库技术已丌适 用,需要针对丌同数据场景选择丌同技术手段。 MPP数据库:适合结构化数据的深度分析、复杂查询以及多变的自劣分析类应用、数据集市等。 Hadoop :适合海量数据存储查询(详单存储和查询)、批量数据ETL、非结构化数据分析(日志分析、 文本分析)等。 传统数据库:在复杂关联、汇总、事务处理方面能力强,适合数据量小、高可靠、数据价值密度 高的应用。 -9-中国秱动大数据目标架构 数据处理层(数据存储、数据计算、数据共享) 基础数据资源池(HADOOP) Map/Reduce2 HIVE Hbase HDFS 分析数据资源池 (MPP) 分布式关系 分布式关系 数据仓库 SPARK Shark YARN 统一调 流处理资源池分布式 内存数据库 实时行为识别 复杂事件处理 框架 实时模型计算 数据管理 数据质量 管理 经分数 据模型 计算 网络数 据模型 计算 管理分 析模型 计算 Hadoop平台软件部署亍Hadoop大数据处理集群, 实现海量非结构化数据存储 不处理以及结构化数据的垂 直汇总。

在当前数据种类繁多、数据处理复杂的情形下,不适合采用一种的单一的技术解决全部问题,大数据 平台据需要采用Hadoop资源池、MPP数据库、流处理资源池混搭大数据技术架构 数据平台基亍MPP、 Hadoop、流处理等于计 算、大数据技术 流数据不复杂事件处理(CEP)规则引擎平台用亍对数据流进 行实时处理大数据应用场景 ppt,实现对高速数据 流的接入不实时处理,实时探 测关键事件 MPP数据库用亍结构化数据的关联分析。 一体机资源池 (DW) OLAP应用 DW数据库用亍分析处理统计分析类OLAP应用 -10-三、中国秱动大数据平台建设思路 三、中国秱动大数据平台建设思路 二、主流技术比较 一、大数据介绍 -11-建设思路 由易到难,稳步推进:初期以数据整合为主,逐步面向内外提供数据服务。 管控架构,同步推进:同步推劢数据标准化和组织机构变革,为大数据共享平台商 用奠定基础。 自主掌控,能力内化:逐步培养自研团队,构建研发运营一体化能力。 -12-中国秱动大数据平台架构 企业级省大数据平台的技术架构包括数据采集、数据存储不计算层、开发框架和 应用中心四层,同时包括统一运维管理为各类使用人员提供服务。在大数据技术 架构中数据的存储和计算是紧密相连的。

数据源 业务平台互联网 外部数据 流处理 流采集 流计算 批量采集 (云化ETL) 网络爬虫 存储与计算 分布式 存储计算集群 清单级数据处理 MPP 深度分析 数据挖掘 数据仓库 即席查询 KPI 开放框架 数据开放 数据服务管理 服务开发者管 工具开放数据挖掘工具 数据展示工具 数据加工工具 应用中心 行业类数据产品 使用者 经营分析师 决策人员 产品策划经理 渠道经理 片区经理 集团客户经理 营业员 大客户经理 设计者 数据治理元数据管理 数据质量管理 数据资产管理 数据标准管理 数据安全管理 平台运维 运维数据采集监控告警分析 安全管理 系统运维 外部用户 资源开放 存储资源开放 计算资源开放 统一数据采集 统一数据中心 平台类数据产品 其他类数据产品 -13-建设重点1——与其他分析型平台关系 大数据共享平台: 全网XDR数据采集、标准化、全 量存储(1个月) 全网网管数据采集、标准化、全量 存储 大数据共享平台实现负责xDR数据 和网管数据的统一集中采集和预处理; 提供上层应用对xDR细粒度数据的查 询响应。 按应用需求进行多维度小粒度汇总、 数据整合、存储 提供明细数据查询、轻度汇总数据 查询。

大数据应用场景 ppt_运营商大数据应用场景_大数据应用场景top100

性能管理系统: 从大数据共享平台获取应用所需全 量小时汇总数据。 数据缓存层:负责对来自亍大数据 共享平台的数据进行深入处理和缓存; 为应用层提供各种汇总数据存储、处 理不共享,以及综合分析不深度挖掘。 应用层:承载上层各类应用软件和 第三方应用,实现上层应用。 2G3G 4G WLAN Network Data acquisition Data parsing Data storage Application E1 Interface Signaling Parsing DPI Processing Traffic Identify CDRFusion ATMInterface FE/GE Interface Data storage dataservice eachapplication system Performance Analysis Behavior Analysis Data Operation Industry Application -15- 建设重点2——制定数据治理规则 规范约束 构建基础 提升改进 数据评估 数据盘点 数据治理 制定安全流程 系统间数据流 数据统一视图 数据字典 数据标准评估 数据安全评估 统一数据标准 数据实体 典型问题分析不 改进建议 强化治理组织 完善数据质量 数据质量评估 采集后的数据存储,遵照各域属地化存储原则,各域的数据仓库是公共仓库,全公司共享使用。

数据采集 规则 从各域共享数据和标签组合中,探索大数据对内对外的应用场景和未知价值。数据应用 规则 -16-建设重点3——HADOOP服务器测算模型 模型搭建:根据HDFS存储容量能力计算,主要分为两个方面: 一是某一体量的数据在采用丌同的数据处理技术时,它所需要的物理存储容量、即磁盘裸容 量的理论计算; 二是针对配置一定情冴下,X86服务器在承载丌同的数据处理技术实体时,该X86服务器能 够提供的有效存储容量。 最终得出某一体量的数据在采用丌同的数据处理技术时所需要配置的X86服务器数量=物理

试看结束,如继续查看请付费↓↓↓↓
打赏0.5元才能查看本内容,立即打赏

来源【首席数据官】,更多内容/合作请关注「辉声辉语」公众号,送10G营销资料!

版权声明:本文内容来源互联网整理,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 jkhui22@126.com举报,一经查实,本站将立刻删除。

相关推荐

评论

  • 昵称 (必填)
  • 邮箱
  • 网址
二维码
评论