Successfully reported this slideshow.
We use your LinkedIn profile and activity data to personalize ads and to show you more relevant ads. You can change your ad preferences anytime.

Adventure works dw示例

1,451 views

Published on

数据仓库实验

  • Login to see the comments

Adventure works dw示例

  1. 2. 示例数据库项目背景 <ul><li>这个教学案例是以一家虚构的公司 Adventure Works Cycles 为基础。 Adventure Works Cycles 是一家大型多语系制造公司,制造及批发金属和合成器材自行车给北美、欧洲和亚洲的商场。 Adventure Works Cycles 的总公司在华盛顿 Bothell ,该公司雇用 500 位员工。另外, Adventure Works Cycles 在它的市场基地还雇用了几个地区销售团队。 </li></ul>
  2. 3. <ul><li>在 2000 年, Adventure Works Cycles 购买一间小型制造工厂 Importadores Neptuno ,位于墨西哥。 Importadores Neptuno 为 Adventure Works Cycles 产品线制造几项重要的子零件。这些子零件运送到 Bothell 地点进行最后产品组装。在 2001 年, Importadores Neptuno 成为自行车产品类的唯一制造商和批发商。 </li></ul>
  3. 4. <ul><li>在丰收的年度之后,现在 Adventure Works Cycles 想要以这些方式来扩展它的市场占有率: 锁定最佳客户来打广告、透过外部网站延伸产品可用性,并以减少实际成本来降低销售成本。 </li></ul><ul><li>这个例子麻雀虽小,五脏俱全。不论是新学商业智能,或者是提高商业智能知识都是相当有帮助。软件项目开发有迭代上升的过程,那么看这个案例也会是这么一个过程。 </li></ul>
  4. 5. 当前分析环境 <ul><li>为了支持销售和营销团队以及高级管理人员的数据分析需要,公司当前从 AdventureWorks 数据库中提取事务数据,从电子表格中提取诸如销售配额之类的非事务信息,并将这些信息合并到 AdventureWorks DW 关系数据仓库。但是,关系数据仓库存在下列问题: </li></ul>
  5. 6. <ul><li>报表是静态的。 用户无法通过交互方式探测报表中的数据以获取更详细的信息,例如他们可以处理 Microsoft Office Excel 透视表。虽然现有的一组预定义报表足以供许多用户使用,但更高级的用户却需要对数据库进行直接查询访问,以进行交互式查询和访问专用报表。但是,由于 AdventureWorksDW 数据库非常复杂,因此,这类用户需要花费大量时间来掌握如何创建有效查询。 </li></ul>
  6. 7. <ul><li>查询性能差异很大。 例如,有些查询只需几秒钟便可非常迅速地返回结果,而另一些查询需要几分钟才能返回结果。 </li></ul>
  7. 8. <ul><li>聚合表难以管理。 在尝试缩短查询响应时间方面, Adventure Works 的数据仓库团队已在 AdventureWorks DW 数据库中生成几种聚合表。例如,他们生成了一种按月汇总销售额的表。然而,尽管这些聚合表可显著提高查询性能,但是,他们所生成的用于在一段时间内维护这些表的基础结构却容易破坏并出现错误。 </li></ul>
  8. 9. <ul><li>复杂的计算逻辑隐藏在报表定义中,所以很难在报表之间共享。 由于这种业务逻辑针对每个报表单独生成,因此,各个报表的汇总信息有时是不同的。所以,管理人员对数据仓库报表数据的信任度是有限的。 </li></ul>
  9. 10. <ul><li>用户所在的业务部门不同,其感兴趣的数据视图也不同。 每个组都很难理解与其不相关的数据元素。 </li></ul>
  10. 11. <ul><li>对于需要专用报表的用户而言,计算逻辑非常具有挑战性。 由于这类用户必须为每个报表单独定义计算逻辑,因此,无法对如何定义计算逻辑进行集中控制。例如,有些用户知道他们应使用基本统计技术(如移动平均值),但他们却不知道如何构建此类计算,因而也就无从使用这些技术。 </li></ul>
  11. 12. <ul><li>组合相关的信息集时存在难度。 业务用户很难构造一些专用查询,以组合两个相关的信息集(如销售额和销售配额)。此类查询会占用大量的数据库空间,因此,公司要求用户向数据仓库团队请求跨主题区域的数据集。因此,仅定义了少数预定义报表,这些报表可以用于组合来自多个主题区域的数据。此外,由于这些报表非常复杂,因此用户不愿尝试修改这些报表。 </li></ul>
  12. 13. <ul><li>报表主要提供美国的业务信息。 非美国分公司的用户非常不满意只提供美国的业务信息,他们希望能够查看不同货币和不同语言的报表。 </li></ul>
  13. 14. <ul><li>信息难以审核。 财务部门当前仅将 AdventureWorks DW 数据库用作从中进行大容量查询的数据源。然后,再将数据下载到单个电子表格中,并花费大量时间准备数据和处理电子表格。因此,很难在整个公司内准备、审核和管理公司财务报表。 </li></ul>
  14. 15. 解决方案 <ul><li>数据仓库团队最近对当前分析系统执行了设计评审。评审包括当前问题和未来需求之间的差距分析。数据仓库团队确定 AdventureWorks DW 数据库是一个设计良好的维度数据库,具有相符的维度和代理键。相符的维度可使某个维度用于多个数据集市中,例如时间维度或产品维度。代理键是链接维度表和事实数据表的假键,用于确保唯一性并提高性能。此外,数据仓库团队确定当前在加载和管理 AdventureWorks DW 数据库中的基表方面没有重大问题。因此,该团队已决定使用 Microsoft SQL Server 2005 Analysis Services (SSAS) 来完成下列各项: </li></ul>
  15. 16. <ul><li>通过一个通用的元数据层提供统一的数据访问以进行分析和报告。 </li></ul><ul><li>简化用户的数据视图,从而加速交互式查询、预定义查询以及预定义报表的开发。 </li></ul><ul><li>正确构造可组合来自多个主题区域的数据的查询。 </li></ul><ul><li>管理聚合。 </li></ul><ul><li>存储和重用复杂的计算。 </li></ul><ul><li>为美国以外的业务用户提供本地化体验。 </li></ul>
  16. 17. 数据仓库 <ul><li>Adventure Works DW 除了包括从单独数据源得到的财务信息外,还包括 OLTP 数据库中的一些表。该数据与 OLTP 数据库保持同步,以支持典型的 SQL Server 2005 Integration Services (SSIS) 方案(例如,加载和更新数据仓库)。 </li></ul><ul><li>Adventure Works DW 包含两个主题区域: 财务 和 销售 。 </li></ul>
  17. 18. 财务 <ul><li>数据仓库的财务主题区域分为具有以下特征的两个架构: </li></ul><ul><li>1. 财务: </li></ul><ul><li>包含 Adventure Works 公司及其分公司的财务数据。 </li></ul><ul><li>包含使用相关组织的本地货币表示的数据。 </li></ul><ul><li>支持 Analysis Services 财务度量值组。 </li></ul>
  18. 19. <ul><li>2. 货币汇率: </li></ul><ul><li>包含货币转换数据,其中包括以美元 (USD) 为基准的每日平均汇率和收盘汇率。 . </li></ul><ul><li>支持 Analysis Services 货币汇率度量值组。 </li></ul>
  19. 20. 销售 <ul><li>销售主题区域分为具有以下特征的四个架构: </li></ul><ul><li>1 、分销商销售 </li></ul><ul><li>仅包含对分销商的销售。 </li></ul><ul><li>仅包含交付订单。 </li></ul><ul><li>包含以 USD 为单位的数据,并跟踪原币。 </li></ul><ul><li>支持 Analysis Services 分销商销售度量值组。 </li></ul>
  20. 21. <ul><li>2 、销售汇总 </li></ul><ul><li>包含分销商和 Internet 销售数据的摘要视图。 </li></ul><ul><li>与分销商以及 Internet 销售架构相比已经减少了维数。 </li></ul>
  21. 22. <ul><li>3 、 Internet 销售 </li></ul><ul><li>包含个人客户 Internet 销售订单和详细信息数据。 </li></ul><ul><li>仅包含交付订单。 </li></ul><ul><li>包含以 USD 为单位的数据,并跟踪原币。 </li></ul><ul><li>支持 Analysis Services Internet 销售度量值组。 </li></ul>
  22. 23. <ul><li>4 、销售配额 </li></ul><ul><li>包含销售代表的销售配额数据。 </li></ul><ul><li>支持 Analysis Services 销售配额度量值组。 </li></ul><ul><li>注: Internet 销售表可以支持数据挖掘方案,而其他表可以支持 OLAP 方案。 </li></ul>
  23. 24. 作业: <ul><li>使用 Adventure Works DW 构建 OLAP 方案,查询主题为: 2004 年 4 月讲英语的国家里分经销商对各个产品的销售量情况(数据)。 </li></ul><ul><li>要求 1 、完成详细设计步骤:数据源选择,数据源视图的建立,构建多维数据集,部署数据仓库,选择合适字段,完成报表显示。 </li></ul><ul><li>2 、一周时间完成在 Word 文档中,每步骤需有适量贴图进行阐述说明。 </li></ul><ul><li>3 、发送至邮箱: [email_address] 截止日期:下周二晚 8 点。 </li></ul>

×