你好,欢迎来到川北在线
微信
腾讯微博
新浪微博
搜狗输入法测试们的“大数据”
时间:2015-07-19 08:21   来源:川北在线   责任编辑:毛青青
  原标题:搜狗输入法测试们的“大数据”

    测试工作中,不知道大家是否遇到过这种情况:有时遇到一些问题、BUG,提交之后开发会遇到项目时间紧、暂时难以解决、问题影响可能较少优先级低等原因被一再的遗留,慢慢的当再次见到这些问题,大家渐渐的麻木了,很自然的就继续遗留,遗留多了欠下的债就大了,但是到底是否到了该修改的时候呢?怎么去评估呢?用数据说话!
1
  相信很多公司都有用户反馈信息,这些反馈的信息就是一笔宝贵的财富,它能帮助你评估你的产品做的怎么样、有什么问题甚至用户会主动给你提出一些建议,因此测试应该多关注这部分信息,用以帮助优化测试方案、流程,那么怎么处理这些信息呢?
 
  举一个例子:
 
  作为测试,可能不怎么知道自然语言处理的知识、大数据处理的各种算法,但是依然能够处理它们。首先,给这些留言划分关键字,将N条数据拆成名词、动词等等各种片段关键字,然后对它们进行统计,对所有关键字进行排序,可能有M个,取前边一部分关键字就能够反映出主要的问题了,但是关键字可能依然很多,此时将取出来的关键字两两成对进行正则表达式匹配,此时将匹配的数量进行排序,相信用两个关键字索引出来的会更有说服力,此时人工进行分类、统计得到粗略的数量占比,例如下图:
 
  可能之前你找报资源、输入法消失等问题时,会被推迟,但是看到它们占比很靠前、很重要的时候,就会被重视,专门抽出时间去解决。
 
  当然这仅仅是开启问题兜底的第一步,面对各种问题,不是找到问题就丢给开发去解决,尽量给别人比较明确的问题,才会更容易被接收,比如占用什么资源了?占用多少? 是否能够帮助提前找到哪些功能占用?例如占用的是内存:
 
  这个图是某个进程的内存占用,使用PerformanceMonitor画的,很容易得到占用的大小,并且还能知道需要解决的是那个峰值,此时如果对于这个进程熟悉的人来讲,就会容易定位问题的所在,如果依然不知道问题出在哪,还应当做下深入调研,比如HOOK HeapAlloc,在内存满足什么情况时生成dmp文件,之后就可以去分析原因了。如此流程,就可以把问题从大的分类到具体原因逐渐分析出来,当然只是能分析出部分问题。

   投稿邮箱:chuanbeiol@163.com   详情请访问川北在线:http://www.guangyuanol.cn/

川北在线-川北全搜索版权与免责声明
①凡注明"来源:XXX(非在线)"的作品,均转载自其它媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责,本网不承担此类稿件侵权行为的连带责任。
②本站所载之信息仅为网民提供参考之用,不构成任何投资建议,文章观点不代表本站立场,其真实性由作者或稿源方负责,本站信息接受广大网民的监督、投诉、批评。
③本站转载纯粹出于为网民传递更多信息之目的,本站不原创、不存储视频,所有视频均分享自其他视频分享网站,如涉及到您的版权问题,请与本网联系,我站将及时进行删除处理。



图库
合作媒体
IT袋 绿植迷 金宠物 领啦网
法律顾问:ITLAW-庄毅雄律师