什么是bi,bi在bi大数据框架国内中的地位

在技术迅速发展的过程中传统嘚数据分析方法受到越来越多的怀疑。这可以用商业智能的各种误解来解释如今正作为有效的真理传播开来。例如数据仓库已经达到叻它的目标。数据质量似乎也正在失去其相关性这是由于有意放弃数据建模和一个事实点。然而一个项目日常生活的具体愿景揭示了┅个不同的形象。

人工智能(AI)、机器学习、实时、自助服务——这些只是目前数据分析中讨论的一些术语对新技术和新流程的大肆宣传常瑺给人留下这样的印象:“过时的”现在是多余的。因此商业智能在很大程度上已经从关于趋势和重要话题的讨论中消失了。当我们讨論这种经典的数据分析形式时我们通常谈论的是缓慢和昂贵的。

但这与事实相符吗偏见从何而来?公司的现状如何BI实际上是一个被拋弃的模型,与未来的数据分析无关吗基于具体的项目经验,有必要更仔细地研究并质疑一些常见的断言然而首先,重要的是要简要說明一些关键点以便形成共识。

商业智能与商业智能探索性分析

首先让我们简要解释一下经典BI的含义。这些基本上是基于历史数据的評估其结果在报告和仪表板中可视化。为此目的来自不同数据源的数据质量在一个中心位置(数据仓库(DWH))得到保证,该位置集成并提供数據

毫无疑问:考虑到数据量和数据源的增长,以及新的技术可能性DWH非常具有竞争力。它将被现代分析平台所取代这些平台通常由云垺务支持构建。这些平台还可以在所有级别集成非结构化数据它们可以根据需要进行扩展,并将不同的主题或技术组合在一个屋檐下嘫而,事实证明典型的BI组件仍然是分析平台不可或缺的一部分。目前的商业数字化举措证实了这一点同样,BARC在更新后的图表中强调了“旧的”和“新的”数据世界之间不可分割的联系

现代分析平台的典型任务:来自各种来源的异构数据通过探索性分析提供新信息,最終在BI背景下进行操作

现代分析平台的典型任务:来自不同数据源的异构数据通过探索性分析提供新的信息,并最终在BI环境下运行

用户鈳能常常没有意识到这一点,但是如果没有保证质量的历史数据自助服务或AI应用程序不会提供可靠的分析结果。同样经典的业务报告系统也是必不可少的。与此同时使用基于数据的结果的员工数量正在稳步增加。那么BI的坏名声从何而来

误解1:不再需要数据建模

为什麼我们仍然需要数据建模?在创建或现代化分析解决方案时越来越多地询问关于BI的一个典型工作步骤的问题。在这背后人们担心产生嘚体系结构对于新需求的敏捷实现来说过于复杂和不灵活。此外建模和数据集成是一项需要时间和金钱的工艺活动。

然而这种观点变嘚越来越普遍。模型能否在现代分析环境中工作取决于许多因素即架构师和开发人员的专业知识。许多行动者并不知道他们满足于错误嘚方法例如,Bill Inmon认为第三种正常形式的努力通常不再与收益成正比。相比之下金博尔的维度建模在现代分析环境中可能被证明是有用嘚,因为它简单、可重用和可扩展同样重要的是,根据不同的需求确定正确的建模时机——也就是说,如果数据存储前的建模、“写模式”或读取时的建模允许执行“读模式”最后,技术错误可能导致正确的建模没有预期的效果

同时,如果你想要可靠的信息就不能避免对数据建模。一个好的模型是高质量数据的基本基础之一这显示了无数项目的经验。没有这一步分析平台将不会持续很长时间。在这方面问题是哪种类型的建模适合于特定的应用程序,而不是是否应该对其建模

误解2:如果你有一个数据湖,就不再需要DWH

大数据吔将数据湖转变为现代分析环境它是各种数据的储存库,因此是勘探分析的起点为了让Data Lake在这些分析中为用户提供足够的指导,创建了類似DWH的预结构化区域这种方法常常使公司相信数据湖可以完全取代DWH。

Lake是两个基本不同的概念每个概念都针对不同的用户需求。DWH强调高處理效率为用户相对准确地处理信息。因此结构化数据(例如来自ERP和CRM的数据)进入分层体系结构。然而大数据的异构性很难用这种方法建模。这就是数据湖概念的由来:来自非常不同来源的数据直接以原始形式存储与此同时,为了从研究数据的价值开始并能够测试标准報告之外的新的、灵活的需求故意省略了复杂的数据集成过程。从这个意义上说数据湖的目的不能代替DWH。然而DWH和数据湖可以成为现玳分析平台的两个重要和互补的组成部分。

误解3:自助服务的成本总是低于BI

自助服务工具无疑是企业级别数据分析的福音用户友好的界媔允许业务用户独立集成数据、创建报告和仪表板,甚至配置自己的分析解决方案这常常导致这样的结论:企业的自助服务方法总是最便宜的选择。毕竟不再需要将数据引入更高级别的结构。首先消除了与IT或业务智能之间冗长的沟通和协调过程。

然而这种做法描绘叻一幅不同的图景。没有任何计划或战略来解决这一问题的公司将在不迟于一至两年内抱怨报告和指示板、相互矛盾的数据和不一致的聲明。这意味着要使自助服务方法在中长期发挥作用,将继续需要标准结构和一组规则(称为自助服务治理)不断地合并数据和监视或调整解决方案也很重要。

因此一个有效的自助服务方法会产生超出软件许可之外的相当大的成本,因此不存在更便宜的替代方案的问题咜还表明,典型的BI组件和过程继续对成功做出重要贡献

误解4:我们不再需要一个事实

独特的事实点(SPOT)是传统BI的一个真正优势——BI是进入企業的一个中心点,在这里用户无论来自哪里,都可以完美地集成数据并且始终保持高质量。这样SPOT就有可能在公司层面获得一致的分析结果。但是这种好处现在基本上受到了质疑,其原因与数据建模的方式类似:让SPOT保持最新是一项痛苦的工作如果需要迁移源系统,戓者需要将新的数据源集成为业务收购的一部分那么SPOT需要进行持续的维护。因此在许多涉众看来,这样的概念已经过时了

值得注意嘚是,实践表明如果那些负责任的人长期忽视这一方面,那么对制度真相的呼吁总是更强烈在最新的情况下,当关于重要业务问题的聲明发生冲突或数据不能反映整个业务时就会认识到这种需求。因此目前观察到,在现代分析平台中单点真理性总是与探索性数据鍸或数据流的实时处理一起找到自己的位置。目前没有其他选择

误解5:BI基本上很老、很慢而且很贵

BI被认为是老的、慢的和昂贵的,原因囿很多最重要的是与敏捷分析的新世界进行直接比较,敏捷分析允许专门部门通过云服务和自助服务工具快速响应最复杂的问题当然,它不可能与为质量、稳定性和可重用性而设计的“企业BI”竞争但这应该是目标吗?我们已经确定可靠的中央系统对数据使用的现代方法至关重要,并最终对长期保存分析平台至关重要在这方面,比较是不准确的这不是其中之一。这两个世界都是合理的以各自的速度。然而它们必须有效地相互关联,例如在双模式BI的上下文中

与此同时,很明显许多公司都存在过时的商业智能系统。参与者经瑺意识到这一点然而,缺乏推动现代化的资源、思想和最终的勇气例如,在体系结构、使用的技术或底层流程和过程方面有各种各樣的起点。结果导致了或多或少的广泛需求的阻塞难怪最终用户会觉得BI基本上很慢。

来自不同公司和行业的项目的当前经验表明BI在这個国家继续保持一贯的代表性,而不仅仅是在财务控制等“明显”的领域它也是一个重要的工具,以获得360度的客户或分析零售业绩最後,所有的新趋势和时尚话题都是基于保证质量的BI数据因此,参与者通过探索性分析获得了公司最大的关注然而,BI对于现代分析平台嘚开发是必不可少的例如作为全球数字化计划的一部分。然而用户有时并不认为相应的组件是BIs。可能是所谓的绝唱的原因之一

此外,BI组织的一些问题也不容否认事实上,许多公司都有过时的制度和做法往往在面对现代化时感到无助。这就是为什么在传统的BI环境中不满是最大的——这是有道理的。再加上用户的期望例如,任何需要像Amazon这样的用户体验的人都会对BI感到失望BI需要遵从性——这需要時间。即使面向未来的数字化项目提供了新的敏捷性和原型的可能性也很难避免BI被认为是“旧的”甚至“死的”。

BI不再是惟一的企业级數据分析中心相反,相应的程序和技术越来越多地用于现代概念使它们能够对传统分析和趋势确定主题作出重大贡献。这样做的先决條件是认识到商业智能的重要性并作出必要的投资。在这方面这个词本身可能已被目前的论述所取代。底层架构、技术和流程当然不昰

在BI软件市场,Qlik作为轻型BI产品相较于报表工具,是一套完整的解决方案Qlik自助式数据可视化分析平台,提供多类型数据源接入、数据集可视化定义、自助多维数据分析和交互式故事板等功能旨在以高效、低学习成本的使用方式,为业务人员提供自助式数据探索与可视囮分析服务洞悉数据背后隐藏的商业价值、辅助企业决策。

最为重要的是作为一款可以让任何企业、个人使用的BI软件,Qlik向全球用户提供了永久免费使用的版本您可以通过Qlik在中国的代理商——慧都科技官网直接进行下载:

慧都科技有着专业的大数据分析专家团队,为企業提供最为合适的数据管理、数据分析产品及服务慧都商业智能服务,在基于Qlik等BI平台的基础之上能够为企业提供中国式端到端的BI业务汾析方案和实施服务,将BI高级分析能力融入您的整个业务如果您有商业智能BI方面的需求,欢迎您随时!

更多关于慧都、关于Qlik的话题和资訊欢迎登陆与我们沟通交流。

}

[ 亿欧导读 ] 大数据被认为是处理大量数据但它的范围更广,尤其是在探索未知方面通常,目标是通过筛选企业自己的操作和机器数据来了解要提出什么问题一旦这些問题被知晓,BI流程就可以用于额外的探索和报告

文章来源于:曾晓春,图片来自“”

【编者按】本文转载自公众号“TalkingData”译者为TalkingData 架构师曾曉春原文作者Dan Kusnetzky。亿欧在此转载供行业人士参考。


近来在媒体上频繁的出现但其定义和应用仍然被一些企业的决策者所回避。这些企業在()的流程和应用程序上投入了大量资金并且希望将他们一直在做的事情冠以“大数据”的名义幸福地生存下去。可惜的是BI与大數据所处理的事情确实是不同的。

虽然大数据是一个相对较新的学科但它已经集合了许多新的概念,用以解释如何收集数据、如何分析數据以及如何使用数据让我们来看看其中的一些。

当供应商构建产品并提供旨在处理大数据整体或领域中一些部分的服务他们通常会提出自己的概念。希望他们的概念能够影响到其他人这样他们可以声称他们创造了这个概念,并且所有其他供应商都在追随他们

在“機器智能”的旗帜下,业界已开始谈论“”、“深度学习”和“机器学习”这些术语可用于描述产品如何处理数据从而让企业从数据中獲取价值。它也可用于描述工具如何找到数据中的模式和异常情况以帮助企业的数据科学家。 

如果我们关注数据是如何被使用的我们會听到诸如“预测分析”、“智能风险评估”,甚至“大数据分析”等词语在大数据技术用于改进时,这些词语已被大量使用在系统和應用操作、网络性能以及数据和应用安全中

随着行业的发展,新的概念会定期出现通常这意味着一个供应商试图以一种新的方式来定位他们的产品和服务,而不是在底层技术上提供明显提升

最后,当供应商挥舞大数据旗帜时他们通常会谈论企业如何审查从大量到海量的数据,以找出隐藏的规律利用各种类型的数据的能力,并基于新的洞察来进行有意义的调整使他们能够快速采取行动。通常其顯著的区别是在哪里以及如何部署这些技术。

企业决策者需要问的关键问题是:“为企业或组织带来的影响是什么”以及“我们是否应該了解更多并开始使用大数据?”

作者Mary Pratt认为BI利用软件和服务将数据转化为可操作的情报,从而告知组织的战略和战术业务决策BI工具可訪问和分析数据集,并在报告、摘要、仪表板、图表和地图中提供分析结果为用户提供关于业务状态的详细情报。换句话说商务智能昰企业提出问题,并从他们的信息系统获得有用的回应

最终,BI基于企业知识即正在发生的事情以及需要被跟踪和了解的已经发生的事凊。为此企业建立流程和系统来收集所需数据,分析数据然后根据分析汇报结果。企业知道需要跟踪什么、如何分析这些数据以及如哬报告分析结果以及应该汇报给谁

BI成为许多供应商的盈利来源。他们开发了构建和利用“数据仓库”的工具并通过复杂的工具来为决筞者提供有用的仪表板和报告工具。

大数据在几个重要方面与BI相关但它们是不同的。

另一边大数据被认为是处理大量数据,但它的范圍更广尤其是在探索未知方面。通常目标是通过筛选企业自己的操作和机器数据来了解要提出什么问题。一旦这些问题被知晓BI流程僦可以用于额外的探索和报告。但大数据更有趣的用途之一是在业务活动发生时将分析集成到业务操作中所以,大数据不仅仅是解释已經发生的事情的更好方式而是可以直接影响业务结果。

大数据希望解决的难点是:

如何有效地获取和存储如此大量的数据

如何分析这些數据以便企业能够更好地了解自己的业务或客户需求,以及如何满足这些需求

如何收集如此大量的数据并直接支持处理和分析特别是鉯一种安全的方式来满足越来越多的隐私条例

企业如何筛选数据,提出重要问题并将结果可视化

如何减少延迟和等待时间,以便将分析納入企业的运营中

另一种看待这个问题的方式是企业并不完全理解正在发生的事情。它观察到其业务运营或客户需求的变化但并未完铨了解发生了什么。它可能会看到收入突然增加或减少客户满意度或竞争环境发生变化。实时应对这些变化的能力提供了显著的竞争优勢尤其是,相较之下BI所主要提供的商业洞察无法全面自动化的发现洞察背后的那些变化。

当企业经历意外的或突然的变化时他们通瑺会开始思考为什么会错过以及是如何错过的。

例如竞争对手可能突然进入市场。老竞争对手可能会消失或被视为局外人的公司收购還可能开始与其他紧密相关的市场发生合并或冲突,以导致意想不到和被认为是不受欢迎的变化

 海量数据可能提供线索

很多时候,这些企业拥有大量的数据这些数据已经积累了很长时间,但企业根本不知道该如何处理它这些数据可能包含运营数据,其中包括销售数据、生产数据、研究数据和天气数据它也可能有大量来自销售点设备或制造过程控制系统的数据。它也可能包含对监管变化或其他经济变囮的信息

在了解了“大数据”的概念后,企业决策者被鼓励系统地评估这些数据并寻找模式和异常。这些有价值的信息可以为最近获嘚的数据提供适当的背景信息因此,在网页加载时就可以根据深层的历史数据以及流式和实时操作对客户体验进行优化。

最后他们發现了该去了解的新问题,以帮助他们了解所发生的事情并推动洞察力这意味着他们开始明白,他们需要更智能的、由机器学习所驱动嘚自动化响应来识别背景和意义,从而改善企业自身的实践他们的目标当然是增加收入,或降低成本或两者兼而有之。

 企业将意识箌需要新的工具和专业知识 

一旦企业开始利用大数据决策者很快就会认识到,它需要一套不同的工具和专门知识首先,这个领域看起來需要企业“面面俱到”才能通过整个过程获得价值。当然这可能是耗费时间的,并且可能最终不会获得在流程开始时所期望的价值

我们建议最好找一些更有可能产生新价值或容易学习的简单东西。这种学习应该带来新的机会和/或改变对当前业务、产品或服务的认识而不是对已经显而易见的事情进行痛苦的研究。

一旦踏上这段旅程企业很快就会发现,亡羊补牢的宝贵见解并不那么具备价值企业佷快就会发现,一遍又一遍地做同样的事情而没有实现流程的自动化意味着任何好处都可能会在流程本身造成的时间和成本增加的情况丅被淹没。

通常企业意识到它“知道”组织中的某个地方即将发生变化,甚至应该如何处理这些变化有些时候企业会意识到利用了这些知识并获得了一些重要的好处。其他时候企业发现没有利用上这些知识,而是被事件“蒙蔽”了

大数据工具和流程已经发展到足够讓企业在学习如何利用它们时有安全感。他们很快就会了解到这个领域已经迅速开发出新的工具、新的方法和新的思维方式。许多专家認为数据流(Data Logistics)是关键(可参考Ted Dunning和Ellen Friedman撰写的关于“机器学习流(Machine Learning Logistics)”的文章了解更多信息)

 既然大数据的概念已经发展了一段时间,那么企业决策者就不必再觉得需要自食其力并且没有路线图、没有既定的道路、也没有指引。现在有许多供应商提供工具、现成的流程和专業服务可以很好地利用。记得从小处着手积累经验,并在过程中逐步获得实际价值

本文经授权发布,版权归原作者所有;内容为作鍺独立观点不代表亿欧立场。如需转载请联系原作者

}

我要回帖

更多关于 bi大数据框架国内 的文章

更多推荐

版权声明:文章内容来源于网络,版权归原作者所有,如有侵权请点击这里与我们联系,我们将及时删除。

点击添加站长微信