BI商业智能和数据存储问题的解决办法_解决方案

近年来，围绕云计算的所有应用正在逐步增多，但目前公共云服务中的应用只代表了IT总支出的一小部分，而公共云应用的最大瓶颈似乎是高昂的云计算存储成本。与Web相关的云应用可能会存储数以百兆的数据，而关键任务应用则可能会存储TB级的数据，按目前的价格来看，其存储成本是大部分用户所难以承受的。

除非主流的、占企业预算大头的关键任务应用能够迁往公共云，否则这一态势将不会发生变化。但是值得庆幸的是，我们有两种策略可以来解决这一云存储成本问题：数据抽象和分布查询式数据访问。

将数据抽象方法用于商业智能和成本分析应用

目前，商业智能(BI)与分析是云计算最有前途的两个应用。这些应用都聚集在重要IT决策上，且遍布在规划者和决策者中。这使得它们成为理想的云计算应用，建立真实而不过分庞大的大数据是我们之前提出的两个数据成本管理方法中第一个，即数据抽象的一个具体实施。数据抽象是从原始公司信息中产生一个或多个摘要数据库的机制，其数据库规模应确保它(们)能够被经济地存储在云计算中。

BI和真实数据分析解决云存储成本问题

在医疗行业中的某一个客户曾表示，通过诊断代码、治疗代码以及年龄/性别的形式，创建一组患者信息摘要数据库，将减少三百倍以上的信息量，这意味着其云数据存储和访问成本仅为未经数据抽象处理的三百分之一。如果希望数据抽象方法成为一种高效的成本管理方法，那么就必须对如何进行分析以及分析的对象进行深入研究。大多数BI运行的目的并不是为了发现细节信息;它们是为了寻找某种规律或某种发展趋势。对于大多数的行业来说，有明确的变量非常重要。

大数据数据存储_数据存储及解决方案_数据存储解决方案

通过对这些变量创建摘要数据库，能够通过加快访问速度来降低成本支出数据存储及解决方案，同时也不会影响分析工作本身。一旦定义好变量的特定组合，那么之后如有需要从未抽象的数据中提取该组合的详细信息也是非常容易实现。这样一来，基于数据抽象的分析就成为了一个云应用，可以用于数据中心的详细分析操作。

u=641717833,3239627622&fm=26&gp=0.jpg

对非结构化数据使用分布查询式访问方法

数据抽象方法适用于对具有少量重要变量参数结构化交易数据的分析应用。但它不适用于非结构化格式的传统大数据，这是因为非结构化数据的抽象比较难以实现。有些公司在创建电子邮件特定单词或单词组合高识别率数据库的应用中有过不少成功案例，但是其前提条件是这样的关键词/词组合是可以预先知道的。对于大多数应用来说，还是需要有一个更为通用的方法的。这个方法就是我们所提出的第二个数据成本管理策略——分布查询式数据访问方法。

大数据数据存储_数据存储解决方案_数据存储及解决方案