林荟,女,杜邦先锋总部市场部统计师,毕业于 Iowa State University统计系,生年不详卒年尚无法预测。

译者:黄俊文(主要),潘岚锋(勘误),高涛(勘误)。

简介:Scott Iverson,Sr. Marketing manager, Marketing information, DuPont Pioneer (HQ), 在先锋从事数据分析工作 27 年,现任杜邦先锋全球总部市场信息高级经理。

杜邦先锋国际良种公司:杜邦先锋公司是世界 500 强企业,美国杜邦公司旗下的全资子公司,成立于 1926 年,是世界上最早的玉米种业公司,总部设在美国爱荷华州。

Hui: 你吃牛排吗?

Scott: 不,我不吃红肉的。

Hui: 然后……我就不用问你你喜欢怎样煎牛排了。你喜欢萝卜么?

Scott: 喜欢。

Hui: 你什么时候开始数据分析的工作的?

Scott: 我从 Iowa State University 统计系本科毕业后在一家农业保险公司工作了 3 年。 我发现他们用的统计学方法很少,这个发现挺让我吃惊。于是我在 1986 跳槽到先锋(现在的 DuPontPioneer,那时先锋还没有被杜邦集团收购),成为一个市场分析师。就职不久,先锋的副总裁告诉我,那个职位在探索阶段,他们对一个我这样一个从事定量分析的人在市场部能扮演的角色还不是很清楚。另外在 1986 年的时候,市场部所谓的数据分析还很基础,只是报告一些描述性的统计量,没有什么更深入的统计方法。比如说在特定的基础上提供市场大小,市场定位方面的信息,诸如此类的工作。之后我们渐渐才开始有一些特别的项目。比如建立统计模型决定先锋全球计划中下一个想要扩展市场的国家。我们使用统计方法有主成份分析,聚类分析等等。在那个年代,这些项目算是与众不同的。对于市场分析来说,深入的定量分析是从基础的描述统计量开始的。

Hui: 那么你们是使用 SAS?

Scott: 是的,我们那时候使用 SAS。

Hui: 它是不是出现得比微软更加早?

Scott: 是的。当时还在使用 VAX 机,没错,应该是这个名字。SAS 在当时是跑在大型机上的。

Hui: 你为什么选择这个领域?

Scott: 我喜欢数字。我从一开始就喜欢数字。在高中的时候,我就是一个非常“量化”的人,并且一如既往地喜欢。

Hui: 这是因为你的父母影响吗?

Scott: 不是。我父母是农民。而且他们对数据没有什么感觉。只有我是这样。

Hui: 你的工作中哪一方面是最吸引你?

Scott: 我喜欢创造新事物。在先锋,直到我最近的几个职位,其余我做过的职位都是全新的,意思是在我接手之前本来没有那个职位的。所以每一次都是一个挑战,是创造性工作。这样的职位,我需要自己定义要做什么(而不像传统职位有现成的职位说明)。这对我来说很有趣。

Hui: 你认为,在过去的 20 年中,统计所扮演的角色有什么变化么?我们获取数据的方式变化了如此之多。

Scott: 肯定有变化!我不仅单指市场营销(注:意思是统计在很多领域的角色都发生了变化)。市场营销与所有人都有关,它又以统计学为武器。你可以去问问在市场部里从事相对技术性工作的雇员,在过去 10 年里他们评估产品性能和优点的手段有巨大的变化。多年前,在这里(先锋)除了研发部门,你再也看不到有博士学位的员工。现在,我们市场部这栋楼里有 4 个博士。此外,其实我不管你是不是统计学专业的博士。在我看来, 如果你是博士文凭,你一定经过相应分析能力的特别训练。我相信你有那个技能。我们在(用统计知识)做收成建模,市场建模等等(预测模型)。精细农业(注:Precision Agriculture,参见这里)也开始普及,(使我们能收集更多的农业数据)。

Hui: 我们说的商业、市场都是关于消费者的,是和人有关的。这和在实验室做科研有很大不同。在这个领域有没有统计无法帮助解决的问题?

Scott: 这个问题很有意思。我认为只要有足够的有效的数据,统计有可以做到任何事情。重点在于你手头上有什么样的数据。上个问答中我们说了现在统计的应用越来越广泛。存储空间越来越便宜,你可以保留更多的数据,因此你有更多(与需要解决的问题)相关的数据。所以……我不知道统计的应用的界限在哪里,这取决于能获取的有效数据。如果你有合适的数据,你就可以掌握发展趋势和更多信息。但我们能掌握所有事情吗?当然不是。或者对整个现实世界建模?当然也不行。不过我们应该能够对大部分事物获得有用的信息。比如说我们已经完成的一个和顾客分类有关的项目,你能够说某个特定顾客一定有相应的情绪和行为方式吗?嗯……我不认为我们能够做到这样。不过我们能够获得有用的信息(针对一个消费者群体的宏观信息),并且根据它们指定商业策略吗?当然可以。

Hui: 你认为,将统计知识从学校转移到商业应用上面,有着什么样的挑战?以及更进一步地,从商业应用转移到真正的商业价值上面,有着什么样的挑战?

Scott: 如果一个人是“书呆子”的话,这是很危险的。“书呆子”表明你能够通过测验获得好成绩,能够在学校里保持超级高分但是不知道怎样把知识应用到现实生活。学术、研发和商业应用三者之间有着很大的不同。学术和研发(注:这里指产品的研发)通常有着特定的对象,你能够控制你的研究对象所处的环境,你有很好的“参照组”。在此基础上你可以发表论文,讨论任何你的发现和结论。但是,对于商业,底线和目标都是盈利。而且商业环境绝大部分是客观不可控制的。有时很难解决你想解决的问题因为很难获得想获得的信息。因为要花费很多成本去获得收益量/估量/变量等你觉得有用的数据。难点在于怎样找到那些能够跳出限制的环境从而处理无法控制的市场元素的人。我刚从学校出来的时候觉得那些课本上学到的统计模型要求的假设(在现实生活中)是不可能满足的,我不认为可以在很多地方应用很多统计。后来我从经验中学到的一件事情是你可以违反一些模型的假设,你的所有损失只是一些精确度。理论上说你做错了,但是应用到实际商业上效果还是不错的。如果你在做化学研究,你可能要求结果有 99.99% 的精确度。在科学研究中,你或许还要很精确地知道某个方案在其余情况下会发生的事情。简单的说就是你要很高的精确度。但是如果我们在商业决策中有着 70% – 80% 的命中率,我们就已经很开心了。在发布学术论文,科学公式和市场环境中,对“合适的”正确率的定义有着很大的不同,注意是很大的。如果能够说对 4 个人中 3 个人的某些总体行为特征的而且可以制定有针对的策略来吸引他们,那就已经是一个大胜利了!

Hui: 你是否同意,“所有的统计模型在某种程度上说都是错误的,但是某些是有用的”这一说法?这是一个统计师职业成熟度的关键所在。

Scott: 当然同意。如之前所说,你不是在对整个的现实世界进行建模,你也不需要。你要做的是挖掘有着最大的影响的“因子”。如果你能多些了解这些有影响力的“因子”,你就可以在这些挖掘出的信息的基础上(更好的)进行你的工作了。同样地,你不能改变很多客观的环境。我们(只是)在我们能够改变的一些因素上下功夫。如果我们在重要的因素的基础上开展工作,我们就有望在 3/4 的顾客中有有效的营销了。

Hui: 你认为统计学和数据科学有什么不同?

Scott: 统计和数据科学有着很大的不同。我对于数据科学没有很具体的了解。不过就我而言,数据挖掘有助于很好地理解数据是什么。我觉得,数据挖掘是得到描述性质的统计量。而统计是对问题进行建模。对我来说那有着很大的不同。

Hui: 你是否认为,某一天起,比起 SAS 等,人们会用着更加多的类似 R 的开源工具?

Scott: SAS 的确很贵。但在商业上的应用来说,SAS 有着一些除了统计分析之外的功能,它们非常有用。比如它的数据管理功能非常强大。如果你有合适的接口,你可以检索所有的数据集。你可以使用 SAS 来做报告。 我认为这些优点支撑着 SAS 继续存在并被使用下去。它可以把信息通过 Excel 导出。如果你使用 SAS 来处理数据,你可以提供并且用 Excel 的格式进行输入,SAS 可以处理那些数据,并且把结果放进 Excel 中,提供给那些没有技术背景的人。当他们打开生成的 Excel 文件之后,里面已经设置好了筛选器、偏好、加粗、相应的颜色、单元格的计算公式等等。

Hui: 在一些工业领域,比如说银行、信托公司、保险公司,数据分析有着广泛应用。你是否认为,类似先锋这样传统行业的市场商业部门,也会有越来越多的专业数据分析,直到和保险公司差不多的地步?

Scott: 我认为迟早会的。不只是我们(市场信息部)一直在谈论这个趋势。楼下市场部负责IT的主管是从保险公司跳槽过来的。他来之后常常谈到在市场营销中的预测模型。当然他是从 IT 的角度。他们组在尝试着使用预测模型决定应该为现有顾客以及潜在客户提供哪些技术服务。

Hui: 你倾向于外包统计的工作,还是创立一个在市场营销中的统计分析队伍?

Scott: 我的观点是我们要有一些聪明到足以理解这些统计模型的内部人员。那么是否需要雇足够多做定量分析的人来建模呢?我认为不是的。不过你必须有一些内部的人能够维护、更新那些与模型有关的东西,并且任何时候都能使用那些模型和汇报结果。我认为在完全外包和完全内部搞定之间,有一条比较合适的界线。尝试去聘请所有的人会使我们失去战斗力。因为你不能够长期地维持这种状态。一旦模型建立好,你所有要注意的事情是技术资源。不过如果你有一些统计学家,他们就能够帮助与该专业领域的同行进行沟通。这样就有能力内部自己去运行并且维护模型了。所以我认为你既要外包一部分工作,从外部寻找新的技能和新的想法,同时也要有足够的能力在内部处理好必需的部分。

Hui: 你对于数据可视化有什么想法?

Scott: 在我们的组织中,我们和很多非技术背景的人员共同工作。如果我们不能够将答案用可视化方法展现出来,我们就很难让别人搞清楚我们干了什么。可视化很重要。我现在很注重用可视化方法来展现工作结果。或许你能够用可视化更好的探索你的数据,但我并不认为可视化能够用来解决问题。可视化是交流的工具。

Hui: 作为一个负责招聘的人,你在寻找着什么样的统计师?

Scott: 我们需要,呃…具有足够专业技能是当然的。不过也需要足够的灵活。你必须能够克服困难, 你必须能够理解商业领域,要知道你的专业知识的落脚点是商业的土壤,很多模型的假设是没法满足的,所以必须要灵活。你需要那些不仅仅有着数学能力,而且有商业的知识,能够将专业知识融入商业环境的人。懂得有效交流在商业环境中很重要的技能。如果你在做研究,你可以呆在一个封闭的场所中,不需要和除了技术人员之外的人有着很多的交流。但是在这里,99% 的人是非技术人员,你需要学会(用非技术的语言)和别人交流,注意从商业角度出发,比如说,卖出更加多的产品,提高盈利和市场份额,吸引着回头客等等。这才是关键。重点不是进行分析的工作,重点是盈利的增长。同样,好的数据可能是缺乏的,我们很难控制数据获取的环境。在这点上需要很有耐心。问题并不是定义好的,你要在“怎样做”之前搞清楚“做什么”。

Hui: 在你的非工作时间你喜欢做什么?

Scott: 钓鱼、徒步旅行、爬山等等的户外活动。

发表/查看评论