高校与企业开展科研合作,既有利于高校的科研成果落地,又能够帮助企业提高技术竞争力,是典型的双赢。但在实践中,往往遇到各种各样的困难,使合作的效果打折扣。本文根据笔者有限的经验,试图探讨当前校企科研合作中存在的问题,并给出一些建议,供计算机领域的同仁们参考。 1. 校、企间的合作类型 为方便起见,我们把中国高校简单地划分为两大类:一类是重点高校(主要包括985、211大学),科研实力比较强;另一类是普通高校,科研实力弱一些。企业也简单地划分为两大类:一类是大型企业(如大型互联网企业、跨国公司),其自身的研发能力很强;另一类是中小企业,自身的研发能力较弱。 两种类型的高校对两种类型的企业,构成四种校企合作的组合: (1)重点高校与大型企业:这属于强强联手,最有希望产生突破性的成果,笔者的经验主要在这种类型的合作上,也是本文讨论的重点。 (2)重点高校与中小企业:重点高校获得国家科技项目的机会比较多,国拨经费很充足,重点高校中的科研人员也都非常忙,而中小企业的资金有限,愿意投给大学做研发的经费更少。因此,当中小企业找上门来请求技术支援时,重点高校中的主力科研人员,往往响应迟钝,因为缺乏足够的动力和时间。 重点高校的科研成果要为中小企业服务,一个可行的方式是提供通用的核心技术,以封装好的技术模块的形式,甚至以“云服务”的方式,提供给中小企业。笔者所在的实验室用10多年的时间研发的中文处理基础技术工具集“语言技术平台LTP”,就是以开源、云服务等方式提供给中小企业的。 (3)普通高校与大型企业:大型企业自身的研发实力很强,普通高校掌握的技术很难领先于大型企业,只有在大型企业进入一个新的领域时,普通高校中某些积累了多年的优势技术才有可能被大型企业采用,但总的来说,这种合作的机会不多。 (4)普通高校与中小企业:中小企业有很多具体的技术问题,不一定需要多么前沿的技术,现有的成熟技术就能够解决,恰好可以由普通高校提供技术上的指导。 2.校、企间的合作层次 笔者在过去15年间,笔者接触更多的是重点高校与大型企业的合作。重点高校和大型企业之间的合作有两种,一种是浅层合作,一种是深度合作。 浅层合作通常有两种情形:一种是大型企业为了做高校关系而推动的科研合作。企业醉翁之意不在酒,科研合作是手段,拉近与高校专家们的心理距离,在学术界树立更好的企业形象,以及招聘到更多的优秀毕业生是企业的目的。因此,这类项目中,企业对高校完成课题的情况一般并不做特别严格的验收。另一种是在申请政府项目时,政府撮合某些高校和企业开展合作,有时这些高校和企业并不熟悉,在合作中虽然指定由企业牵头,但企业碍于情面也不好意思对高校太严格地要求,以至合作主要起到了技术交流的目的,高校的技术并没有实实在在地被企业用起来。虽然如此,浅层合作仍然是有价值的,促进了高校和企业之间的技术交流,让高校师生更充分地了解了企业的需求和工作方式,也让企业更多地了解学术前沿的进展,并在合作中物色到合适的学生。 深度合作是指企业确实遇到了自身难以解决的技术难题,或者企业看到了未来的商机,而通过其自身的技术力量难以解决,或者成本太高,于是企业通过与高校的密切合作,向高校提出明确的科研任务,投入资金,提供数据,高校根据自身多年的技术积累,经过与企业研发人员的不断沟通、协作,最终帮助企业解决实际问题。 3.校、企深度合作的必要性 高校要不要与企业开展深度的科研合作? 对这个问题,高校教师们内心的答案并不是一致的。国内重点大学的领导们需要按照“教育部学科评估”和“国际学科评估”两个指挥棒来引导教师们的工作方向。由于度量的方便性和统一性,SCI论文及影响因子、引用数等目前仍在评估中占据非常重要的位置,国家级科研项目经费是教育部学科评估的一项重要指标,而横向科研经费则被忽视。为什么在国家高度强调科研成果转化的今天,来自企业的经费在学科评估中仍然不被重视呢?原因是多方面的:有人认为国家项目是经过激烈的全国招标竞争的,含金量更好;有人认为来自企业的项目往往非常重视工程实践,技术水平不高。的确,横向课题的来源很多,其科研价值的高低参差不齐,目前没有得到充分认可也是可以理解的。但从长远看,“技术上的发明创造最终是否在工业界产生影响力,将成为评价科研成果的越来越重要的指标”,应该至少得到与论文评价相当的地位。 在计算机领域,高校中的学者有一小部分是研究理论的,大多数学者是从事应用研究,或应用基础研究的,他们试图解决应用中出现的通用问题,这些学者从事科研工作的态度、方式、评价标准直接决定了高校科研工作的未来。现在,让我们抛开功利性的指标要求,单纯一点儿,看看互联网时代、大数据时代,重点大学里从事计算机应用研究或应用基础研究的科研人员们,如果不与企业深度合作,能否做出真正有价值的研究,能否保持对大企业的技术领先优势,能否使大企业在当下或未来真的需要借鉴,甚至购买高校的技术成果。 目前,大型企业的研发部门(典型企业如BAT)拥有技术人才、数据、用户等方面的优势。 人才:十几年前,研发人才的优势在高校,但如今,大企业里到处都是各高校(尤其是重点高校)培养出来的优秀人才,都是成手,他们带着在校门里掌握的技术加入企业。而高校里老师们要一批一批地培养新人,毕业后能留下的学生越来越少,所以,研发人才的优势在从高校向大企业转移。 数据:高校在数据方面的不足将直接导致一些需要大数据支撑的科研工作,在高校里做出的成果对企业无意义,这又分两种情况:一种是高校在小数据上做出的结果很好,但到企业大数据上一跑,失效了;另一种是高校在小数据上做的效果不佳,而企业使用同样的方法在大数据上却取得了很好的效果。如此,高校成果对企业的借鉴意义降低了,这也是国外一些著名的学者,如Hinton、LeCun等,纷纷离开高校,加盟企业的主要原因。 用户:大企业能够直接与用户接触,海量用户每天提供大量用户行为数据,这是群体智慧之源,而这个宝贵的资源是绝大多数高校实验室完全没有的。百度首席科学家吴恩达在2014年的百度世界大会上讲述了“人工智能正循环”的思想,讯飞研究院院长胡郁提出“涟漪效应”,都指出了一个同样的研发模式:把一个不成熟的系统放到互联网上让用户使,用户在使用过程中会贡献大量的群体智慧,这种群体智慧会快速地帮助提高系统的技术指标。任何一个系统的能力提升,都必须有外界知识、能量的注入,互联网大企业有海量用户,每天可以吸收到大量的知识,而高校由于与用户脱节,只有靠人工标注的小规模的数据,加上教师学生们在算法上下的功夫来改进系统,这就失去了当前人工智能研发范式中极其重要的一环。 在很多研讨会上,都看到高校的老师在问企业到底能够向学术界开放多少数据?其实,数据有两种,一种是用户贡献的内容数据(UGC),一种是用户行为数据,前者由于微博等开放数据平台的存在,是可以支持高校做不少研究的,但更为重要的是用户行为数据,用户查询了什么,点击了什么,最重要的是用户怎样使用你开发的系统,给出了什么样的具体反馈。而用户行为数据,一方面有隐私问题,另一方面由于其价值非常高,企业是很难开放的。 时代变了,研究模式变了,高校的科研人员必须适应这种变化。大数据,尤其是用户大数据,为大企业的研发提供了取之不尽用之不竭的巨大能源,高校教师如果不能充分认识到这个变化,仍在脱离用户的小数据上做实验,其价值将大打折扣。 经过上述的探讨,我们对校企科研合作的必要性得出结论:在当前条件下,高校从事互联网应用研究的学者,必须与企业紧密结合,或者自己做出能够吸引一定数量用户使用的原型系统,才能获得用户行为大数据,做出符合市场需求的研究,并借助群体智慧提升技术指标。最好在企业已经搭建起来的大平台、高平台上开展企业暂时做不好或无暇去做的研究,保底也要自己拿到足够的真实的用户行为数据,如此才有可能在某个很聚焦的点上做出真正有价值的应用技术来。 4.校、企深度科研合作中存在的问题及对策 当前校企合作中存在哪些具体问题?解决的对策是什么?由于涉及到的问题很多,而文章篇幅有限,本文仅针对5 个主要问题展开探讨。 (1) 高校不合适做工程,而适合做技术探索 高校与企业在开展实质性深度合作有三种类型:技术授权、工程开发和技术研发。技术授权是把高校以往长期开展的技术研发工作所产生的成熟技术直接授权企业使用;工程开发是基于高校现有技术,面向企业具体需求进行开发;技术研发是高校根据企业对未来的技术需求,进行新技术的研发。技术研发是面向未来的,技术授权是过去某个时间点启动的面向未来的研发,两者都是前瞻性的技术探索,是与面向当前需求的工程开发不同的。 工程里当然也有很多学问,但是工程里面有很多根据实际情况而做出的权衡,容易陷入很多琐碎的,难以规律化的,但是又有很大工作量的技术细节中去,而很难用统一的理论和单纯的技术去解决全部问题。这些细节难以提炼为理论,对研究工作来说是费了力,而收效甚微。 工程的特异性强,普遍性差,在一时一地很好的经验,换一个时间换一个地点就不一定好用了,这样不容易产生积累效应,在老师和学生们精力比较分散,学生流动性大的客观条件下,必须积累技术,而不只是积累经验,因此学校更应该做积累技术的事情,也就是多研究核心技术,尽可能不做工程。 二十年前,中国企业的开发团队实力较弱,高校在教学科研之外不得不分出一部分力量来帮助企业做工程开发。今天,以国内几大互联网公司为代表的本土企业中云集了各个高校培养的优秀毕业生,高校能做的短期开发工作企业几乎都能做,高校再去寻求“产学研”的同步融合就无法产生互补效果。 从另一个角度看,虽然大企业集中了很多优秀人才,但企业受成本控制的约束,以及要不断地面对当前激烈的市场竞争,一般难以做长线的自由技术探索,而要产生较为重大的技术突破有赖于人们在相对自由而稳定的环境中,不太计较失败成本时的勇敢探索。与企业相比,高校的优势在于:“自由探索,长线研究,不怕失败,对学术前沿的视野更开阔,对学术动态的了解更全面细致”。高校需要回归基础研究以及长远的应用研究,走在企业的前面去探索技术,积累技术。 (2)校、企合作中科研课题的选择要注意实用性、前瞻性和明确性 实用性:很多新的课题是从应用中来的,并且要经过市场检验的,有些课题的动机源于“伪需求”,这样的课题有可能起步时很热,但只要它并非真的切中用户的痛点,并非真有用,就无法被市场所接受,慢慢地也就无法得到国家和工业界持续的经费支持,而只能昙花一现。反之,如果高校的科研人员能够有对远期市场需求的准确洞察,就不但能够更好地和企业界合作,而且能够为自己找出真正有价值的研究课题。 前瞻性:上面已经谈到高校更适合做面向未来的技术探索,而不适合做立即解决眼前问题的工程开发。技术探索类的课题需要有一定的前瞻性,能够对未来的市场需求进行预测,对未来的技术、产品使用环境和支撑环境进行预判,同时也要注意不宜过于超前,以至于多年做不出满意的结果来,企业会丧失信心。太超前的科研还是在国家基础研究项目的支持下开展为宜。 明确性:企业里的研发人员需要有能力,也要花精力从自己遇到的复杂的实际问题中提炼出相对单纯的研究型技术问题,这样的问题要有“非常明确的输入和输出,评价标准非常清晰”,把这样的问题交给高校,有利于激发高校科研人员的热情,也有利于双方评估技术进展。 (3)高校向企业提供的是技术原理和系统原型 企业对高校的输入是问题、数据,高校的产出是技术原理和系统原型。按照社会分工,高校是进行技术探索的,高校输出的成果形式应该是系统原型,只要把技术原理搞通,把技术指标在真实的大规模数据集上提高上去,就完成了任务。有的企业人士对高校的成果过分苛求,尤其指责高校研制的系统稳定性差、运行速度慢等,这样的指责是对校企科研合作中的分工缺乏正确的认识。企业应该耐心地吸收高校成果中原理性的进步,再经过企业的二次开发保证新技术的稳定性和运行速度。而高校在选择企业合作伙伴时,也要有意识地选择那些对核心技术具有很强消化能力的企业,以免在成果交付的过程中付出太高的时间、精力成本。 (4)面向企业合作调整高校科研队伍的组织形式 学校的成果难以产业化,还有一个因素是学校的教师常常精力分散,他们要讲课,要写论文,要指导学生,有的还有一些行政事务,精力的分散会影响了研发的质量和进度。学生的问题更多,学生是在学习阶段,不是成手,研发的技术存在这样那样的问题在所难免,而且学生的目标是毕业,硕士生认为自己怎样都可以毕业,博士生担心自己的毕业问题,但是解决毕业问题的办法不是开发,而是搞研究,写论文。这样,在校企合作中,需要老师非常好地激发学生们的热情、责任心,才能够确保合作顺利推进。 我介绍一下我们实验室研发“语言技术平台LTP”的经验:我们先设计好系统的架构和各个层面交换数据的格式,进而把研究生的工作封闭在一个模块内,把这个模块的输入输出说清楚,这个研究生就可以独立地工作了,他的输入输出轻易不会改变,因为他做的是一项很专门的技术,不受外界项目开发和产品开发的干扰,这样他就能够把这项技术的研究和开发统一起来。首先他可以根据输入输出的要求开发一个基本的软件提供给大系统使用,然后他以及他下届的研究生都可以通过深入的研究一步步地改进这个模块的性能指标。这个模块的性能测试必须是在大规模真实条件下进行的,因此如果测试结果表明指标提升了,则表明这项研究是有真实价值的,对发表学术论文有利;同时,这个技术模块对于整个系统的贡献必然加大了,对实际应用也有利,如此把研究生的个人学术目标与实验室完成应用系统研发的目标统一起来了。 (5)稳定的联合实验室模式有利于校企合作 在高校和企业合作的诸多要素中,人与人的合作是至关重要的。在合作中人与人之间的相互理解、磨合需要一个过程,如果高校与一个企业合作一个项目就结束了,又需要与另一个企业开启新的项目,则校企之间的沟通成本很高,而且高校会产生不稳定感。 通过一两个项目的磨合,如果校企双方都希望开展长期的合作研究,则宜采取联合实验室的模式,一般3年一个合作周期,在合作期内合作经费是固定的,具体的研发内容和目标在每年年初由双方共同商定,联合实验室有稳定的共同工作环境,以及严格的例会制度,确保合作顺畅有效。实践证明:联合实验室模式,对于推进校企科研合作是一种非常有效的模式。 5.结语 当前,计算机领域,尤其是互联网应用领域的研究,迫切需要有价值的前瞻性课题和大数据,尤其是用户大数据。高校只有与企业深度合作,才能始终保持研究成果的真实性、可靠性、实用性和领先性。在合作中,高校应发挥自身的创新优势,根据企业对未来市场需求的研判,开展前瞻性的技术探索,而不是面向企业眼前的需求做定制性的工程开发。 尽管问题很多,但中国高校与企业的科研合作已经取得了很多丰硕的成果,我们有理由对过去的合作成果感到自豪,对未来的合作充满信心。富有长远眼光的企业家应该更加重视与高校的合作,借助高校的科研力量提升企业自身的核心技术竞争力,降低企业的研发成本;渴望做出真正有价值的技术成果的学者们,应该不断地倾听企业界的需求,耐心地与企业人士沟通,寻找有价值的前瞻性课题,借助企业的数据和应用平台,把自己的研究成果做精做实,并推广开来,实现顶天立地的梦想。 作者简介 刘挺,哈尔滨工业大学教授,社会计算与信息检索研究中心主任,2010-2014年任哈工大计算机学院副院长。多次担任国家863重点项目总体组专家、973项目专家组成员,是教育部新世纪人才入选者。中国计算机学会(CCF)理事、CCF哈尔滨主席,曾任CCF YOCSEF总部副主席;中国中文信息学会常务理事、社会媒体处理专业委员会主任;多次担任全国学术会议(SMP、CCIR)的大会主席、程序委员会主席;担任Springer CCIS编委,曾任国际顶级会议ACL、EMNLP领域主席。主要研究方向为自然语言处理和社会计算,是国家973课题、国家自然科学基金重点项目的负责人。2010年以来的所发表论文的总引用数为3570余次,H-index为36。曾获国家科技进步二等奖、省技术发明二等奖、钱伟长中文信息处理科学技术一等奖。 |