注册 登录  
 加关注
   显示下一条  |  关闭
温馨提示!由于新浪微博认证机制调整,您的新浪微博帐号绑定已过期,请重新绑定!立即重新绑定新浪微博》  |  关闭

金山印象

金山软件官方博客

 
 
 

日志

 
 

毒霸监控:错误报告90秒的快速响应  

2010-04-16 09:57:19|  分类: 默认分类 |  标签: |举报 |字号 订阅

  下载LOFTER 我的照片书  |

作者:张康宗   金山软件 · 珠海

随着毒霸专业版2010年3月5日开始公测,毒霸的质量监控平台也同步正式上线了。

在2009年的毒霸年终总结的时候,我们发现毒霸过去的质量监控体系是存在缺陷的,从用户碰到问题到研发得到反馈,这中间会经过较长的步骤,使得时效性很难保障。为了完善毒霸的质量监控,第一时间获知毒霸产品在用户使用的时候是否发生了一些异常情况,我们在毒霸专业版产品里面花了大力气打造了一套质量监控平台。随着毒霸专业版2010年3月5日开始公测,毒霸的质量监控平台也同步正式上线了。

在毒霸软件质量监控平台设计里面,分为2个部分:客户端部分和服务端部分。如果您的毒霸产品在使用的时候,由于软件冲突、特殊环境等原因导致的软件发生错误需要关闭的时候,位于客户端的毒霸的软件错误信息收集程序就会出现,如下图:

毒霸监控:错误报告90秒的快速响应 - 金山印象 - 金山印象

在点击了“发送错误信息”按钮之后,错误收集程序就会将当前发生错误的进程的内存转储文件(DUMP文件)发送到毒霸的质量监控平台。毒霸的质量监控平台会在90秒内完成这个错误报告的分析并给出相关的结果递送研发经理。

【名词解释】内存转储文件:这个内存转储文件里面只包括发生错误的进程,在发生错误的那一刻相关的CPU指令信息,不会包含任何的用户隐私信息。

下图是毒霸的质量监控平台的一个架构设计图

毒霸监控:错误报告90秒的快速响应 - 金山印象 - 金山印象

当您点击“发送错误报告”按钮以后,您的内存转储文件(DUMP文件)会经过下面一些关键步骤:

实时:位于前端的内存转储文件(DUMP文件)收集服务器实时响应你的发送请求

60秒:您发送的文件会在60秒内被同步到金山内网里面,并保存到毒霸的崩溃转储文件存储集群里面。与此同时,这个新增的文件会立即被毒霸的崩溃转储分析服务器所捕获,然后会通过一个负载调度组件通知毒霸崩溃转储分析引擎进行错误原因的分析

30秒:一个新增的未被分析过的内存转储文件(DUMP文件)分析大概需要30秒时间,30秒以后毒霸 崩溃转储分析引擎就可以准确的得出导致软件错误的原因,并结合代码库服务器,直接定位到具体是哪一行代码发生了错误。

实时:完成一个分析过程以后,相关的数据会被记录到毒霸的数据库服务器里面并通知相关的研发经理。

整个过程只需要90秒。90秒,一个错误报告被分析并会直接将相关结果呈送研发经理。

这个系统上线以后,得到了不少用户的积极支持。毒霸产品发生问题以后,大量的用户都点击了发送错误信息的按钮,在这些用户的积极支持下,毒霸的产品质量得到了很好的控制。

下图是在过去的15天内,毒霸专业版由于各种原因发生异常情况的次数。在毒霸研发部门不断的完善之下,毒霸专业版由于各种原因而导致异常的数量已经持续降低,毒霸专业版质量得到了很大的改善。毒霸越来越稳定了。

毒霸监控:错误报告90秒的快速响应 - 金山印象 - 金山印象

如果您的毒霸产品出现问题,请点击“发送错误信息”按钮,只需90秒,完成和研发经理的直接互动!您的一次点击,将使得上千上万的用户因为您的一次点击而受益。

  评论这张
 
阅读(229)| 评论(2)
推荐 转载

历史上的今天

评论

<#--最新日志,群博日志--> <#--推荐日志--> <#--引用记录--> <#--博主推荐--> <#--随机阅读--> <#--首页推荐--> <#--历史上的今天--> <#--被推荐日志--> <#--上一篇,下一篇--> <#-- 热度 --> <#-- 网易新闻广告 --> <#--右边模块结构--> <#--评论模块结构--> <#--引用模块结构--> <#--博主发起的投票-->
 
 
 
 
 
 
 
 
 
 
 
 
 
 

页脚

网易公司版权所有 ©1997-2017