首席数据官

Hi, 请登录

关于数据采集技术,这几种你一定要知道!

如今,不论哪行哪业的信息化人员,无论是朋友聚餐还是商务会谈数据接入技术,提到“大数据”的频次就像“吃了吗?”、“今天天气不错” 一样平常。没错,你我已经身处数据时代,但还未到达大数据时代,差的是将海量数据有序融合并应用的距离。

各行各业,包括政府部门的信息化建设都是封闭的,海量数据被封在不同软件系统之中。要实现大数据,首先要实现众多关联系统间数据的自如交互,这是大数据应用的前提。

该如何实现?今天就和你一起探讨异构软件系统的3种数据采集方法,重点关注实现过程与各自优缺点。

一、软件接口方式

需要各系统的提供厂商提供数据接口,才能实现数据采集汇聚。

实现过程:

Step 1、协调多方软件厂商工程师到场,了解所有系统业务流程以及数据库相关的表结构设计等,细节推敲,确定可行性方案;

Step 2、编码

Step 3、测试、调试阶段

Step 4、交付使用

优势:接口对接方式的数据可靠性与价值较高,一般不存在数据重复的情况;数据可通过接口实时传输,满足数据实时应用要求。

缺点:接口开发费用高;需协调多个软件厂商,工作量大且容易烂尾;可扩展性不高,如:由于新业务需要各软件系统开发出新的业务模块,其和大数据平台之间的数据接口也需做相应修改和变动,甚至要推翻以前的所有数据接口编码,工作量大、耗时长。

二、开放数据库方式

数据的采集融合,开放数据库是最直接的一种方式。

系统分别有各自的数据库,而同类型的数据库之间数据融合是比较方便的:

1. 如果两个数据库在同一个服务器上,只要用户名设置得没有问题,就可以直接相互访问,需要在from后将其数据库名称及表的架构所有者带上即可。

select * from DATABASE1.dbo.table1

2. 如果两个系统的数据库不在一个服务器上,建议采用链接服务器的形式处理,或者使用openset和opendatasource的方式,这个需要对数据库的访问进行外围服务器的配置。

3、不同类型的数据库之间的连接就比较麻烦了,需要做很多设置才能生效,这里不做详细说明。

优势:开放数据库方式可以直接从目标数据库中获取需要的数据,准确性高数据接入技术,实时性也有保证,是最直接、便捷的一种方式。

缺点:开放数据库方式也需要协调各软件厂商开放数据库,这需要看对方的意愿,一般出于安全考虑,不会开放;

一个平台如果同时连接多个软件厂商的数据库,并实时获取数据,这对平台性能也是巨大挑战。

三、直接采集数据方式

以博为软件101异构数据采集技术为例:通过获取软件系统的底层数据交换、软件客户端和数据库之间的网络流量包,基于底层IO请求与网络分析等技术,采集目标软件产生的所有数据,将数据转换与重新结构化,输出到新的数据库,供软件系统调用。

技术特点如下:

1. 无需原软件厂商配合;

2. 实时数据采集,数据端到端的响应速度达秒级;

3. 兼容性强,可采集汇聚Windows平台各种软件系统数据;

4. 输出结构化数据,作为数据挖掘、大数据分析应用的基础;

试看结束,如继续查看请付费↓↓↓↓
打赏0.5元才能查看本内容,立即打赏

来源【首席数据官】,更多内容/合作请关注「辉声辉语」公众号,送10G营销资料!

版权声明:本文内容来源互联网整理,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 jkhui22@126.com举报,一经查实,本站将立刻删除。

相关推荐

评论

  • 昵称 (必填)
  • 邮箱
  • 网址
二维码
评论