云计算和大数据时代网络技术揭秘 pdf-饿鬼毛时代大饥荒揭秘pdf
云计算入门
了解什么是云计算以及它如何帮助组织找到规模经济并重新关注其核心竞争力。 如果愿意,您还可以使用云计算来重新发明旧的应用程序服务提供商 (ASP) 模型。 但是,真正的云计算产品在ASP模型上会有一些细微差别,即资源池、按需功能、多租户、快速弹性等。 这些特性意味着在使用云计算时,您可以通过将固定资本支出 (CapEx) 转换为可变运营支出 (OpEx) 来获得规模经济。
美国国家标准技术研究院(NIST)通过建立云服务模型和云部署模型,进一步定义了什么是云计算。 云服务模型是组织可以根据需要使用云计算的方法,包括基础架构即服务 (IaaS)、平台即服务 (PaaS) 或软件即服务 (SaaS)。 请注意,云计算用户通过 IaaS 获得最大的灵活性,而通过 SaaS 获得最少的灵活性。 然而,IaaS 提供的灵活性对云计算用户提出了管理、监控和管理环境的要求。 因此,对于IaaS,用户需要从操作系统层开始构建(虚拟)服务器。 对于PaaS,用户需要构建数据库、应用程序、业务规则和加载数据。 使用 SaaS,用户只需将数据加载到预构建的应用程序中。
NIST 还定义了云部署模型,其中包括公共云、私有云、混合云和社区云。 例如,Google Docs 是公共云模型的一个示例,其中应用程序和数据存储在 Google 数据中心的某个地方。 在这种模式下,用户实际上拥有谷歌“高层”公寓的一层。
大数据入门
除了云计算,大数据也是行业新范式。 Oracle 将大数据定义为从三个来源聚合的数据:传统数据(结构化数据)、传感器数据(日志数据、元数据)和社交数据(社交媒体)。 大数据通常使用一种新的方法(例如 NoSQL,Not only Structured Query Language)存储在非关系型分布式数据库中。 非关系数据库管理系统(non-RDBMS)有四种类型:列式、键值式、图式(Graph)和文件式。 这些非 RDBMS 聚合源数据,然后 MapReduce 等分析程序分析信息。 大数据经过汇总和分析后,组织可以将这些信息用于市场研究、供应链研究、流程优化、安全事件分析或趋势分析。
大数据增加价值的场景包括提供市场研究数据以支持有关外包或内包的决策、进行收购或合并、进入新市场或离开市场。 在被认为是为学术研究保留的技术之后,非 RDBMS 系统现在正在接近行业的临界质量。 Twitter 等领先的技术服务提供商开始使用它们,许多个人和公司也开始使用它们的产品。 由于这些平台的开源特性(可以节省成本),非 RDBMS 正在成为使用 Web 2.0 技术的组织的首选数据库架构,因为组织不需要投资于传统的关系数据库软件许可证或内部部署硬件。 根据您的预算,我认为组织应该创建新的角色来治理和管理大数据系统,而分析师、程序员、项目经理和传统 RDBMS 管理员都应该接受交叉培训。 如何完成所有这一切取决于组织的需求,但您会发现那些已经在利用大数据平台(Yahoo!、Facebook 等)的组织有一个特别的关注点。 如果您的组织决定将专门的资源整合到大数据中,请务必记住,使用这些系统会增加您现有的用于存储和分析大数据的 RDBMS 投资。
企业将继续使用 RDBMS 和非 RDBMS 系统。 尽管这两个系统之间有一些相似之处,但也有一些差异需要注意。 例如,跨多个计算机系统分布数据的非 RDBMS 可能会影响组织在数据跨越多个管辖区或在多个管辖区共享时遵守隐私权的状态。 非 RDBMS 通过应用程序编程接口 (API) 调用创建、读取、更新和删除数据,而不是像 RDBMS 系统那样通过数据库连接(例如云计算和大数据时代网络技术揭秘 pdf,Open Database Connectivity、Java™ Database Connectivity)。 非 RDBMS 在处理来自 RDBMS 的数据方面也有所不同。 例如云计算和大数据时代网络技术揭秘 pdf,非 RDBMS 中的表称为域或命名空间(如在 Amazon DynamoDB 中)。 此外,非 RDBMS 数据定义语言或元数据不像在 RDBMS 中那样容易查询。 此外,大多数非 RDBMS 不再使用 SQL 进行数据操作语言调用; 许多人使用 NoSQL。 最后,RDBMS 不需要运行的 API 服务应该针对数据库服务器实例运行,这通常会降低 OpEx。
备注:以上内容收集整理,网络整理。 更多内容请看我的博客