我又开始思考,怎样能够做一张更好的表。我昨天参加北理工校庆的时候在思考,前天摘葡萄的时候在思考,甚至晚上理发的时候也在思考。终于在理发的时候我想出了一个可以定量的给出分析结果的表,兴奋了一把。今天来了拿实际数据一做,发现远不是我要的效果。于是我调整横轴的单位,不等分横轴,把每个数据点做成离散型,这样出来一张X离散Y连续的图。希望这样的一张偏态分布图能够说明情况。
去年,我做了一年的表,终于做成了表哥。当我今年领到Innovation Award的时候,当我向大家讲我的Excel经验的时候,谁都不能相信我去年的3月份还不会合并单元格。当时我第一次看到AutoFilter后出来的下拉框兴奋不已,哇,我们编程才能做的COMBO,这个都可以啊!
EXCEL的Sheet一个最多容纳65536行,我一直以为那是很多很多行,结果去年我做100万行的数据分析时,我才可恨那个太少太少了。这就意味着,一个表要拆开做很多很多遍,同样的鼠标轨迹和动作···终于有一天夜里2点,我觉得再也不能容忍这种生活。我觉得我这样做下去我会锈掉的。于是我开始研究VBA,就是在EXCEL里面写段小的程序控制EXCEL做重复的工作。幸好我写过几万行VB的数据库代码,看了看VBA的语句,轻松上手。但是我做的第一个程序就不是VBA的。因为当时在做6西格玛项目,不是我一个人在做数据分析,如果我把VBA分发到表妹那里,她们会疯了的。好在我了解一些COM技术,用VB调用EXCEL,获得EXCEL控制权,EXCEL不需要任何改动,我做了两个按钮,一个读入,一个操作,界面很傻瓜。程序发行后就看到表妹们看着屏幕直乐,后来就沮丧。我说你们乐什么?她们说我们终于解放了,每天都做同样的工作,真烦。你这个连颜色、字体都做好了,直接就可以发给老板。我说那又沮丧什么呢?表妹们大声告诉我,这意味着我们离下岗不远了···于是我把那个东西叫做AutomationTool,然后很认真的对老板说,这个东西局限性很大的,只能替代一部分重复性的劳动,智慧性的工作还是要表妹们来完成···于是皆大欢喜。
今年,我终于不用考虑一百万行的问题。我开始想,怎么能把这个表用图展示出来,如何在提供清晰的定性分析之外,还能尽可能的提供多一些的定量信息。毕竟很多图都把定量的信息丢失掉了。我去年讲了近一年的绿带课程,最喜欢讲的就是数据分析这块,坚实的数据分析结果永远胜过基于经验的事前拍脑袋然后事后拍拍屁股走人。
明天下午,我做的数据分析将被小猫讲给整个公司大猫小猫层,上次我兴冲冲的做了一个回归分析配上Fitted Line Plot,结果猫们说,“哇,太麻烦了,不看”。于是,我就开始想,怎样专业而又简单。于是我把这些基于六西格玛技术的分析统统作为Backup Slide,然后尽可能的用最直观的图表达出来,终于被大猫接受。
准备写门课,叫做六西格玛分析技术与实战,已经有很多同事预定了。分享是快乐的~