简介 黄建华教授现任美国德州A&M大学统计系教授及数据科学研究所副主任,并为Arseven/Mitchell Astronomical Statistics讲席教授。黄教授于1985-1992年在北京大学概率统计系学习并获得概率统计学士及硕士学位,于1997年获加州大学伯克利分校统计学博士学位。他是美国统计协会资深会员(Fellow), 国际数理统计学会资深会员(Fellow), 国际统计学会当选会员(Elected Member),及国际泛华统计协会会员。 曾任A&M大学统计系研究生项目主任、理学院代理研究生项目副院长、统计系代理系主任等职务。研究方向包括统计学习,大数据分析及计算,非参数和半参数统计,函数型数据和纵向数据分析,以及统计学在工程、生物、天文、商业等领域中的应用。自1998年以来共发表学术论文100余篇,为统计学的发展做出了重大贡献。
早年经历
问:黄老师您好,今天我们代表统计之都,对您进行访问。对于您现在来讲,在求学过程中是否有哪些事情对现在产生较大的影响?
黄:很难说具体哪件事情对现在有较大影响。应该是整个求学的经历影响了我现在的职业生涯。1985年我考入北大数学系概率统计专业,入学不久北大概率统计系成立,我就成为了概率统计系第一届正式的本科生。我在北大读本科和硕士一共经历了7年,然后前往加州大学Berkeley分校攻读博士学位。现在回头看,北大对我职业生涯最重要的影响有两条,一是让我打下了坚实的数学基础,二是让我学到了严谨的学风。北大数学系和概率统计系的好风气潜移默化地影响着我,让我终身受益。概率统计系成立时教员不多,几乎每个老师我们都能接触到。老师们的敬业精神给我树立了好的榜样。我在北大的导师程士宏老师就是他们中的代表。他是一个特别认真的学者,做事严谨,也从来不允许学生打马虎眼瞎糊弄,他的工作态度给我一辈子做学问定下了基调。另外,我们师兄弟之间的交流也很多,他们追求上进的精神也深深影响了我。
在Berkeley 的求学经历主要是打开了我的眼界,让我获取了各方各面的信息。我的博士导师Chuck Stone 教授是个很严谨的学者。由于我在北大时受到程老师的熏陶,我跟Chuck Stone教授做科研很对路子。由于他在自己的研究领域是走在前沿的,我跟着他做科研自然就做到了前沿。Berkeley 的教授们做学问的品味高,我从其他教授那里也学到很多东西。比如,我现在喜欢做应用就受Terry Speed教授的影响,即使我在Berkeley并没有上过Terry Speed教授的课(旁听过几节),在研究上也没有什么交集。Berkeley 学术氛围很浓,对我很多长远的影响是在不知不觉中产生的,比如通过大家平时的接触,讲座时的发言,等等。
问:黄老师您当年都是如何度过您的课余时间?
黄:我在北大的那几年,学校里很热闹,发生了不少事情,涨了很多见识。我课余会参加一些社团活动和各种讲座,属于凑热闹的一类。当年没有互联网,去图书馆翻翻书和杂志是我课余一个不可缺少的节目。我在Berkeley的时候,也保留了乱翻书的习惯。Berkeley数学图书馆就在统计系楼下,我没事干的时候,就到那去翻翻书,翻翻杂志。我觉得这是个好习惯。那时候查文献没有互联网,所以我们都是在图书馆,杂志期刊一本一本查阅。此外,我课余也很喜欢出游。北京及周边可去的地方很多,给我的周末提供了去处。我喜欢骑自行车逛北京,北京的很多地方我都骑车去过。到美国有了汽车后,立马增加了我的自由度,空闲时间少不了开车到处走动。加州那里户外活动条件好,我和中国学生一起出去骑车、远足、滑雪,带着帐篷去野营,过得挺有乐趣的。
对统计学的看法
问:在了解了您早年的一些经历后,我们接下来想问您一些关于统计学的看法。现在整个数据科学领域都非常的火,甚至都带动了一些行业的发展,那么您对数据科学的未来有什么看法与预期?
黄:其实我现在不敢对未来妄加预测,因为现在社会发展的太快,我不太可能说得对。比如,我当年大学毕业的时候根本无法想象我现在做什么。我认为很多事情要顺其自然。社会的发展遵循自己的逻辑或者规律,而我对这些逻辑的认识还是很肤浅的。
当然,虽然不敢预测,我还是可以谈谈我的看法。我觉得统计学科的未来取决于它和其它的学科,和社会实践,和业界应用的各种互动。这些互动将决定统计学科及数据科学领域的发展。数据科学是个交叉学科,范围太大了,和应用数学、统计学、计算机、电机工程等学科都有关系。这些学科怎么进行交互作用,这种交互作用是什么形式的,或者交互后是否能变成一个大的学科,是很复杂且有很多可能性的。
任何学科都不是固定不变的。我们要用变化发展的眼光来看问题。统计学20年以后肯定不是现在的统计学,数据科学以后也不会是今天这个样子。学科之间总是互相借鉴,不断演化,经常交叉和吸取对方的能量。这些互动的结果是,有些学科可能就会变窄了,有些变宽了。
问:您是指未来有可能统计学会变大,也有可能被其他学科吞并吗?
黄:这些当然都是有可能的, 但是说被吞并不太合适,应该说是统计学可能会和其它学科融合,最终汇成新的学科。比如,数据科学也许会成为包括统计学的一个独立学科,一些原来的学科成为它的分支,比如统计学,应用数学的一部分,计算机学科的一部分,等等。
问:我们知道您一直致力于跟其它学科进行合作。可以说一说在跟这些学科合作的过程中,您觉得有什么我们能从其它学科中学习借鉴的优点?
黄:我和不少学科的学者有合作,比如工程,天文,生物等。通过这些合作,我发现其它学科的工作方式确实有很多值得学习的东西。
比如,工程领域利用专业会议来训练学生的办法就值得借鉴。工程领域通常是任务导向。比如一个任务来了,导师会安排一个小组来做,然后设定好这个任务的截止日期,两个月、三个月或者更长一点时间,任务目标是某个会议。他们一年有很多的专业会议,这些会议都是训练学生的好机会。比如一个学生,写一篇文章,花了几个月投出去了,会接到很多评审意见,这些意见能帮助学生改进其工作。学生也会参加评审的过程,在这个过程中他要对别人的工作发表意见。参加评审不仅能让学生了解到前沿的工作,也能通过点评其他人的工作来培养他的品味及对学术标准的认识,以及从别人犯的错误中学习。学生参与学术会议的过程是一个科研训练的过程。我发现工程领域学生的写作能力一般比较强,因为他总在写。如果他写得不好,投到会议会被打回来,被拒掉。被拒稿没关系,因为它说明文章没达到标准,同时可以得到很多反馈,这是学习的一部分。工程领域学生的沟通能力一般也比较强,因为他们经常参加各种会议和同行讨论。此外,我感觉工程领域的学生比较成熟。成熟是什么?首先是负责任,其次是领导能力和协调能力。这可能跟他们常常做团队项目有关。当然我们统计系的学生也有自己的优势,我就不提了,这里我们在谈论向其它学科学习什么。
我们从天文学家那里也能学到好多东西。他们所有的项目都是大科学项目,都是需要一大堆人合作的。他们怎么合作?我前一段时间参加了一个他们的会议亲自见识了他们的合作方式。在一星期内,他们聚在一起,随意组合,互相聊天,尝试发现共同感兴趣的东西。所有的讨论你都可以参加,看哪个项目你能做贡献。对有趣的想法,他们会马上跟进,非常有执行力。他们有专门的软件做记录,方便大家合作。比如说我们几个人经过讨论,对某个问题都感兴趣。怎么推动这个事儿呢?需要赶快制定下计划,当天就去做。比如需要建立一个账号,需要把这个数据给到某人,他们会马上写下来,一会就去做。他们做的都是大项目,但总会把它分成小的东西,于是存在很多小组,你可以参加任何一个小组,然后贡献你所能贡献的,不能贡献就淡出小组。
学科之间的交流和碰撞是非常有益的。我们统计学者能在互动中学到很多东西,应该把有益的做法引进到我们的工作中来。当然不是说要照搬。如果我们努力吸收别人的长处,我们也会成长。如果不求进取,我们就会被淘汰。如果人家都能干我们的活,我们又不能干别人的活,到最后统计这个学科就没了。所以我们得汲取其它学科的经验,这样的话才能让统计学更好地成长。
问:您谈了很多其它学科的经验,您觉得统计学自己核心的东西是什么?
黄:这个问题问得好,要回答好这个问题需要去读一读统计学的历史。我对统计史了解得很不全面,我的粗浅的想法肯定受我的阅历所局限,只能用来抛砖引玉。从统计学发展的历史来看,这个学科和实际的紧密接触是有传统的。很多经典的东西都是从解决实际问题来的。比如,统计学的奠基者之一R.A. Fisher是从遗传学来的。又比如实验设计和抽样调查,它们都是为了解决实际问题而产生的。我认为和实际的紧密结合这个理念是统计学最核心的东西。
对学生发展的建议
问:您对自己的学生或者一些其他统计专业的学生,有什么培养方式上的一些建议吗?
黄:教育讲究因材施教,我很难笼统地给出具体的普遍适用的建议,我就讲点虚的吧。这些年我通过对教育的一些思考,及和学生尤其是一些中国学生的接触,逐渐形成了一个概念,这个概念叫自主教育。 自主教育通俗的讲就是你的教育你做主。自主就是说,无论你处于什么环境里,你总能选择做你自己该干的事情,或者你认为对的事情。当然要对自己选择的后果来负责。社会上经常强调的好学校好老师好资源等等其实都是外部因素。外因是通过内因起作用的, 而内因包括了你自己的选择,努力,等等。比如对我的学生来说,我的指导只能是外因。我对他们的发展和成长有多少影响,是由他们自己决定的。
外部环境因素很多,其中不利的因素也可能很多,但是总有有利的因素,你可以尽量利用它们。现在在中国生存应该没有问题,只要能生存,其实每个人都有很大的发展空间,所以不需要那么焦虑。比如博士毕业后去了高校工作但觉得自己就职的学校达不到自己的预期,我会说没关系,任何学校都有它可以利用的资源,校外也有资源。只要好好利用,总能发展。而且现在社会互联网那么发达,资源都是互通的,你还可以交到很多朋友,和志同道合的人互相支持。又比如一个学生,自己学校的资源不够,怎么办?网上有很多比赛,通过参加比赛可以学习到新东西,也能结交朋友。总之,事在人为。自己创造条件,就总能找到好多机会,对不对?只要自己愿意努力,办法还是很多的。做自己命运的主人嘛!
问:我记得之前您指导过我们:我们首先要做到的是生存,然后在满足生存需要之后,我们应该去干自己感兴趣的东西。但是,要满足生存需要的话,是不是免不了做一些功利的事情来让自己先活下来?
黄:我无法泛泛地回答这个问题。对于什么时候选择做什么事情,必须具体问题具体分析。而且,每个人都应该自己去摸索怎样实现自己理想和现实的辩证统一,我这里没有一个标准公式可用。生存第一既是现实的需要,也符合唯物主义。但是,如果不把生存的标准定得很高的话,生存其实没那么难。如果把在北上广必须有房子当作生存的条件,那可能就永远没机会去干自己有兴趣的事情了。我觉得生存的条件其实可以没有那么高的。如果把生存的条件定得太高了,把很多其实没有必要的东西看得太重了,过于追求这些东西,结果会损失了更宝贵的东西。这其实是一个怎样做出明智选择的问题。
问:您对学生怎样做选择有何建议?
黄:这是个仁者见仁智者见智的事情,我就谈谈我的一家之言吧。要是想做出明智的选择,第一要明确自己的原则或者说选择的标准,也就是清楚什么东西对自己重要。第二要对世界发展的趋势有个判断。比如,如果要关心现在的选择会让20年以后的自己成为什么样子,那么就要考虑, 20年以后中国会变成什么样子?20年以后的世界会变成什么样子?20年以后的中国和世界肯定和过去和现在都不一样,所以如果按照过去或者现在的社会习惯去做出选择就不一定能达到预期的结果。
在社会急剧变化的时候,谁能跳出思维的惯性,谁就能跟上时代的发展。比如,有个常见的说法是不输在起跑线上。这个说法自有其道理,但是如果把它绝对化作为所有人的指导思想,它就会成了一个束缚。人生又不是体育比赛,不好谈输赢。如果偏要把它看作比赛,也更像场马拉松,在起跑线上的表现不重要,在比赛的过程中,总是一会儿超过别人,一会儿落后于别人。所以在很多情况下,起跑不是决定性的,这个道理其实很简单。可是如果所有的信息渠道都在整天给你灌输“不输在起跑线上”这个观念,你会不会就把它当成很自然的事情接受了?所以说能不被惯性思维所左右是很不容易的。有时候要问一问自己, 大家都这样说都这样做,难道就对吗?
对于博士生学习的建议
问:下面我们想问黄老师您一些博士生在学习过程中比较关心的问题。首先,您对写博士论文有何建议?
黄:学生在博士阶段写论文主要就是为了训练自己的各种能力。为了博士毕业,至少要完成一篇论文。可能过了几年这篇文章就不重要了, 但是在做文章的过程中学到的本领与技能使你受用终生。写篇论文,需要查文献的能力,综合文献的能力,发现问题的能力,解决问题的能力,试错的能力,写文章的能力等等。写完之后还要通过同行的评审。他们给你提出批评意见,怎样回复这些批评意见, 怎么来解决他们提出的可能很尖锐的问题,怎么改进论文?怎样对待拒稿?还有,研究中间碰到挫折怎么办?有时候需要坚持,有时候需要转向,有时候需要放弃。如何处理这些情况都是需要学习的东西。
问:您说过求学时不需要那么焦虑,那么着急。现在竞争那么激烈,怎样才能做到不焦虑?
黄:这涉及到读博士的目的是什么,是个观念问题。 我对博士生的建议就是在博士期间不要太关注发表几篇论文。比如说做一个项目是因为它有意思,你对它有好奇,或者权当科研训练。不要在做之前先问我这个东西明天能不能发表一篇文章。我觉得发文章应该是顺理成章的事儿,问题解决得好,文章总能发出来。所以不必太着急。我所知道的北美所有统计系都给博士生5年资助。这说明当学生的时候实际上是被保护起来的,不用担心没饭吃。 这5年让你衣食无忧,让你自由,让你安心去尝试,这样你才能成长。如果老是整天担心得很,能做出好东西吗?不可能的。因为创新是需要自由的,没有自由怎么能创新? 当然,这自由不是说把时间混过去。要好好利用求学期间的自由, 利用它给自己留出的成长空间。毕业以后你就会很快发现,你无法再享受学生时的自由了。
问:在国内做到老师说的自由是很难的。现在毕业论文要盲审,要见刊,博士生的压力都很大,导师也要面对很多评估。 对此您怎么看?
黄:我也听到有人说国内评估机制有些问题。因为我不了解具体情况,评估机制有没有问题我不做评论。根据我的经验,评估总是必要的,国外也有评估,博士生也有压力,但是凡事要有个合适的度。我觉得可以这样对待,评估可以要这个要那个, 但不能让评估要的东西占了自己百分之百的时间。如果评估需要这个你就只干这个,不要的你就不干,这是不是有点问题?总要留点时间做自己的东西。我认为每个人都应该给自己留点空间做自己爱做的、有意义的、和挣工资无关的事情。
问:您觉得博士生在读博期间,最需要培养的能力是什么?如何做才能成为一个合格的博士生?
黄:对于这个问题,我觉得可以换一个方式来考虑。先问一问自己博士毕业后想干什么。到业界工作,到政府机关工作,到学校工作,还是到研究机构专职做研究工作。然后就可以再问一问,当毕业的时候,能不能具备想做的工作所需要的技能。这些技能就是在博士期间需要注重培养的东西。每个人对于未来的目标是不一样的,所以需要培养的能力其实也不同。比如说,如果毕业后想去学术界到高校工作,那么就不要忽视教学能力的培养,因为在学术界不能只搞好科研,也要能够搞好教学,毕竟学校的一个重要作用是培养人才。此外,能与学术界同行业人员自如进行学术交流,也是博士生毕业时应该具备的能力,因为很多创新的想法是交流出来而不是独自一人坐在屋里想出来的。简言之,怎样算一个合格的博士生?就是毕业了以后,能做你想干的事儿,而且有人愿意付给你工资。
在读博期间,要学会去观察,并和不同的人交谈。在观察和交谈中能学到很多东西。每个人都是有局限性的。和不同的人交流或合作,能学到各种各样的本领。你所在的学校提供给了你一个环境,这个环境是有很多养分的。要学会怎么在这个的环境里吸收各种营养,从而让自己成长起来,而不是仅仅跟在导师后面做论文。导师提供的也只是学校这个大环境中的一种营养成分而已。在好的学术氛围里面应该是充满着各种各样的营养成分的,它们都有助于你成长,所以你要善于吸收各方面的营养。比如多参加一些讲座,包括本系的和外系的,并在讲座中发言提问。不要低估发言的用处。可能最开始别人认为你这个家伙怎么什么都不懂,但是你基于好奇发问了,久而久之,善于提问题就成为你的本事了。本事都是锻炼出来的。
对国内统计学发展的建议
问:你怎么看待国内统计学的现状及未来?
黄:我有些毕业的学生在国内高校工作,我也认识一些国内统计学界的同行,所以我对国内统计学有些了解。但是总体来说,我对国内统计学界的了解是非常不全面的。所以,如果我的看法不合适,也请大家原谅。
首先,我注意到现在国内同行在国外的统计学杂志(包括顶级杂志)上面能发表数量不少的文章,这和30年前比是一个巨大的变化。但是中国统计学的现状和它在国际上应该有的地位比还不够。中国目前社会经济的发展到达了一个阶段,有大量的需求,完全可以发展自己的统计学了。怎样去利用中国发展提供的机会是一个重要的问题。还有,光想着怎么发展壮大中国自己的统计学还不够,也要考虑怎样对国际统计界做出更大的贡献,比如提供像R或者Python这样的公共产品。
统计学的应用是非常广泛的,而且每个应用方向都需要人才。现在统计学的人才远远不能满足现实的需要,我们培养出的人才也不够全方位,培养这些人才的教师就更缺了。所以说中国统计学还有很长的路需要走。
但是我们要看到现在在中国发展统计是有优势的。首先,中国的经济、社会在迅速地发展,存在很多的实际问题需要解决,而实际问题是催生创新的一个源泉。统计的精髓是和实际问题紧密结合。创新简单说起来其实就是根据实际需要定义自己的问题,然后把问题解决了。解决了新问题,统计学就有了发展。因为解决新问题,必然会提出新的概念,新的理论,新的方法。 其次,中国学生普遍数理基础好,一旦训练出来,然后再去解决新问题,实际上发展潜力是无穷的。第三,就是中国的外力因素是很好的, 这个外力就是在海外的华人统计学家。 海外华人统计学家这个群体做得很好,他们的成绩是有目共睹的。如果有办法把这三个有利因素充分利用并有机地结合起来,那么中国的统计学在20年后就会变得不得了。这是一个巨大的系统工程。然而具体现在应该怎么做? 我还没有想出一个很圆满的方案。我提出这个想法是希望能对有志之士尤其是年轻人起到抛砖引玉的作用。
问:现在国内的很多学校正逐步开始建立统计学科,但是经验和人力资源比较少,也比较分散,您对这些学校有什么建议?我们该如何去建立一个统计学教育体系?
黄:建立一个现代化的国内的统计学教育体系是非常复杂的事情,牵扯到千头万绪,需要很多人群策群力并在实践中探索出来。我在这里只从一个非常小的侧面来说明一件我觉得很重要的事情。国内统计学发展,目前阶段最重要的应该是想办法形成合力,即形成合作,而不是去竞争。大家要形成合力,先考虑怎么把一个健康的生态环境建立起来,学校间互相借力,互相促进,让大家都变强大。国内统计学需要一个整体的发展,而不是几所学校的发展, 比如说能够使得50到100所学校中都有师资充沛的统计学科。要达到这个目标,需要一个系统的规划和协调发展。
问:您理想中的统计系应该是什么样子的?
黄:在一个学科的发展中,各个方面各个层次的人才都需要。不同的学校应该有不同的侧重点,绝对理想的统计系不存在。但是我可以讲讲我希望自己工作的统计系是什么样子的。我理想中的统计系是一个比较大的统计系。大就是说专业比较齐全,教师也是各类人才都有;有做理论的,有做计算的,有做方法的,还有做应用的。应用包括各个层次的应用,和各个学科交叉研究的应用,还有业界的应用。由于比较多元化,比较全面,就提供了无穷多的机会。这样一个生态系统让老师们很方便进行合作。比如做理论的人,有时也需要做一些应用的东西。如果这不是他的专长,他不想花费很多时间把应用领域相关的事情都搞清楚,或者不喜欢干某些事情,那么合作就可以帮他解决这个问题。又比如从事应用的老师将实际问题抽象出来,最后得到了一个理论问题,就可以请做理论的专家帮忙。我还要补充一条,我理想的统计系应该在一个综合大学里,那里会更容易找到和其它学科的专家进行合作的机会。
这种统计系对学生也是有益处的。一位学生在求学期间不可能什么领域都做,而且每个人的特点不一样,基础不一样,兴趣爱好也不一样。在这样一个全面的统计系里,他总能找到合适的导师,做自己喜欢的事情。
对于统计学应用及普及的看法
问:在统计学中,除了统计学教授、博士生等专业科研人员,还有大部分的非专业或者其他学科的人在工作或者科研中会对统计学产生需求,但他们对统计学这门学科还不够了解。黄老师,您觉得应该如何来推广和促进统计学在这个群体中的发展?
黄:统计学的应用普及对于统计学在中国的成长和发展非常重要。这种应用普及的工作,不但能帮助其他学科或者业界解决问题,同时也能促进统计学自身的发展。普及统计,我认为目前可以一方面普及统计学教育,在非统计系开设各种层次的、针对各种领域的统计课程。另一方面统计专业人士应该积极参与到各种实际项目中,利用统计学解决实际问题。在普及统计学知识及应用方面,中国的一些机构组织,比如统计之都,已经做出了很多贡献。但是整体上来说,中国目前对统计学知识的普及力度还很不够,应该有更多的人来做一些这方面的工作。在我看来,中国需要很多像统计之都这样的民间机构或者交流社区,它们慢慢发展成长,吸引更多的学生学者、业界从业者、学校、公司来加入。大家互相学习互相促进,一起创造一个更好的中国统计学的生态环境。
对于统计之都的寄语
问:非常感谢您对统计之都工作的支持,在繁忙中抽时间接受我们的采访。最后您有没有对统计之都的寄语?
黄:统计之都几年前就找过我做采访,很抱歉我一直没有给出个具体时间,今天就算我“还账”吧。我一直没完成采访主要是感觉自己的认识有很大的局限性,对国内的情况也很不了解,不太适合在统计之都这个在国内有影响的平台上发表看法。但是,今年是一个很特殊的年份,它将标志着世界的大变化,每个人也都会改变自己的行为方式。所以我也来做个改变,不怕说错话,大胆把自己的看法讲出来给大家听听,供大家开阔思路。请务必提醒大家,我的看法不一定对,我的建议也可能不合适,只为抛砖引玉。
统计之都作为一个民间团体对中国统计学的发展做出了贡献,取得了巨大的成绩。统计之都的理念很好。祝统计之都能够发扬自己的传统,并与时俱进,越办越好,对中国统计学的发展起到更大的作用,也对世界统计学的发展做出贡献。
发表/查看评论