• 0

    用户访问量

  • 0

    注册用户数

  • 0

    在线视频观看人次

  • 0

    在线实验人次

分析工具Dremel两方面的技术支撑
一方面:统一的存储平台实现高效的数据存储,Dremel使用的底层数据存储平台是GFS另一方面:统一的数据存储格式存储的数据才可以被不同的平台所使用
作者:云创智学 来源:云创智学 发布时间:2022-06-09 13:47:57
Dremel支持的典型应用
Web文档的分析Android市场的应用安装数据的跟踪Google产品的错误报告Google图书的光学字符识别欺诈信息的分析Google地图的调试Bigtable实例上的tablet迁移Google分布式构建系统的测试结果分析磁盘I/O信息的统计Google数据中心上运行任务的资源监控Google代码库的符号和依赖关系分析
作者:云创智学 来源:云创智学 发布时间:2022-06-09 13:46:48
Dapper使用经验
1、新服务部署中Dapper的使用利用Dapper对系统延迟情况进行一系列的跟踪,进而发现存在的问题2、定位长尾延迟(AddressingLongTailLatency)端到端性能和关键路径上的网络延迟有着极大的关系3、推断服务间的依存关系(InferringServiceDependencies)Google的“服务依存关系”项目使用监控注释和DPAI的MapReduce接口实现了服务依存关系确定的自动化4、确定不同服务的网络使用情况利用Dapper平台构建了一个连续不断更新的控制台,用来显示内部集群网络通信中最活跃的应用层终端5、分层的共享式存储系统没有Dapper之类的工具的情况下对于这种共享式服务资源的争用也同样难以调试6、利用Dapper进行“火拼”(FirefightingwithDapper)Dapper用户可以通过和Dapper守护进程的直接通信,将所需的最新数据汇总在一起
作者:云创智学 来源:云创智学 发布时间:2022-06-09 13:44:17
Dapper存储API
Dapper的“存储API”简称为DAPI,提供了对分散在区域Dapper存储库(DEPOTS)的监控记录的直接访问。一般有以下三种方式访问这些记录。1、通过监控id访问(AccessbyTraceid)2、块访问(BulkAccess)3、索引访问(IndexedAccess)Dapper存储库支持单索引(SingleIndex)
作者:云创智学 来源:云创智学 发布时间:2022-06-09 13:42:08
Dapper轻量级核心功能库
小规模库:通用线程、控制流、RPC代码库最关键的代码基础是基本RPC、线程和控制流函数库的实现主要功能是实现区间创建、抽样和在本地磁盘上记录日志。将复杂的功能实现限制在一个轻量级的核心功能库中保证了Dapper的监控过程基本对应用层透明。
作者:云创智学 来源:云创智学 发布时间:2022-06-08 13:41:34
Dapper监控系统的三个基本概念
1、监控树(TraceTree)一个同特定事件相关的所有消息2、区间(Span)区间实际上就是一条记录3、注释(Annotation)注释主要用来辅助推断区间关系,也可以包含一些自定义的内容
作者:云创智学 来源:云创智学 发布时间:2022-06-08 13:39:33
Dapper监控系统的基本概念
在监控系统中记录下所有这些消息不难,如何将这些消息记录同特定的请求(本例中的X)关联起来才是分布式监控系统设计中需要解决的关键性问题之一。
作者:云创智学 来源:云创智学 发布时间:2022-06-08 13:37:47
监控系统设计三个基本设计目标
1、低开销这个是广泛可部署性的必然要求。监控系统的开销越低,对于原系统的影响就越小,系统的开发人员也就越愿意接受这个监控系统。2、对应用层透明监控系统对程序员应当是不可见的。如果监控系统的使用需要程序开发人员对其底层的一些细节进行调整才能正常工作的话,这个监控系统肯定不是一个完善的监控系统。3、可扩展性Google的服务增长速度是惊人的,设计出的系统至少在未来几年里要能够满足Google服务和集群的需求。
作者:云创智学 来源:云创智学 发布时间:2022-06-08 13:36:44
监控系统设计 两个基本要求
1.广泛可部署性(UbiquitousDeployment)设计出的监控系统应当能够对尽可能多的Google服务进行监控2.不间断的监控Google的服务是全天候的,如果不能对Google的后台同样进行全天候的监控很可能会错过某些无法再现的关键性故障
作者:云创智学 来源:云创智学 发布时间:2022-06-08 13:35:07
Megastore产品延迟情况的分布
应用程序的平均读取延迟在万分之一毫秒之内,平均写入延迟在100至400毫秒之间避免Megastore的性能下降,可采取以下三种应对方法:1、重新选择路由使客户端绕开出现问题的副本2、将出现问题副本上的协调者禁用,确保问题的影响降至最小。3、禁用整个副本
作者:云创智学 来源:云创智学 发布时间:2022-06-07 16:27:34
联系方式
企业微信