大数据时代的运筹学决策

大数据时代的数据价值无法充分发挥,并不仅仅是数据质量问题或是数据分析能力问题。问题的关键原因之一,还在于一门重要学科——运筹学 (Operations Research)在国内业界的稀缺。而运筹学,恰恰是专门研究由数据到决策的科学。


“数据科学、统计学的应用方向在于理解数据中的规律,而非利用数据做出最后的决策。理解规律固然重要,但是如果理解的规律不能为了最后的决策服务,不能给决策者带来真正的效益,那么其价值便无从体现。”24岁即获斯坦福博士学位、目前在美国明尼苏达大学任教的王子卓教授介绍说,“数据越多,就越要以问题为中心,用数据作驱动,才能发挥数据的价值。”

一个典型的例子来自于国内最大的互联网电商企业之一的核心问题:动态定价。在初期的“野蛮生长”之后,企业投以重金,请国外某顶级咨询公司分析数据,为其定价策略做了系统的分类和战略指导。然而,传统的定价方法、定价模式和咨询公司的定性分析,都无法高效和量化地回答企业决策中的具体问题——基于历史销售数据、外部竞争价格、商品替代与互补效应,以及种种促销影响等各种复杂因素,某个具体的SKU到底价格应该设定多少?

斯坦福运筹科学家领衔的杉数团队对这个问题作出了回答,效益明显的提升让企业看到了希望,千万级的合同将探索进一步推进了“深水区”:发展一套基于数据驱动的高效动态定价系统。

那么到底什么是运筹学?在实际应用中能发挥什么样的作用?简单说来,运筹学是一门用量化分析的方法做预测和决策的科学。 斯坦福大学的讲席教授(Chair Professor)叶荫宇介绍说:“中国有句古话‘运筹帷幄之中,决胜千里之外’。运筹学是用量化的方法来分析数据,从而帮助决策。到了现在,有人觉得运筹学这个名字不好,应该叫做商业分析——但这太‘小’了,运筹学是深入各个领域的。”

在现代金融业中,买卖股票的多少、时机,很多是通过运筹学的优化方法来决定的,又比如工业中的生产线设计、库存管理、运输、工程等等,也都离不开运筹学。叶荫宇教授是运筹学最高奖项“冯•诺依曼理论奖”唯一的华人获奖者,他在业界的合作方就包括波音、FICO、运通、美国卫生部、美国科学基金、美国能源部等等,还主持了美国空军科研部门等多个科研项目。

运筹学发源于第二次世界大战,最先被英美两国应用到军队的布阵、调度的管理中,从而充分发挥出有限部队的效用。在战争中效果卓著的运筹学在战后进入了各个领域,今日海外很多企业都有自己的运筹学团队,而且每年都会以高额投资与高校的运筹学教授合作。大多数北美高校中,运筹学或者相关的学科都有非常完备的科系架构,如OR(运筹学)、IE(工业工程)、OM(运营管理),为教学、科研和工业界合作提供多重服务。

但在国内,学界和业界的合作尚未启步。作为学术水平要求较高的交叉学科,国内运筹学长期面临着人才匮乏的尴尬。上海财经大学的江波老师说,多年来,中国都没有自己的优化求解器(solver),主要靠海外购买,或者使用海外的开源求解器。叶荫宇多次指导上海财经大学的LEAVES并行优化求解器项目 ,就是希望这个团队可以“为中国尽一份力,开发出自己的solver”。

互联网+的风行开启了大数据时代,运筹学也变得日趋重要,直接地影响人们的生活。以一个电商企业为例,通常其核心业务包括:

在这三个阶段中,企业需要解决的重要问题,都与运筹学密不可分。

1.商品组合与定价

消费者搜索某件产品时,应该展示哪些商品?商品应该如何定价?这需要权衡每种产品和消费者搜索信息的匹配程度、产品的价格以及所有展示产品之间的替代互补性。当代信息技术的发展使得商家可以获得海量消费者对不同商品的喜好数据、产品之间互相影响的数据、以及不同消费者对价格敏感程度的数据。但是数据距离决策仍有很大距离,要攻克这段距离,就需要运筹学学科中几个重要课题的知识,如产品组合优化问题(Assortment Optimization Problem)、最优匹配问题 (Optimal Matching Problem)、产品(动态)定价问题(Dynamic Pricing Problem)等等

2.库存管理与货物运输

电商的物流网络通常包括几个大型仓储中心、一些二级配送中心以及最后的送货部分(下图为1号店的全国物流网络):一定量的货物一开始储存在仓储中心,当消费者购买一个商品时,货物先由其中的一个仓储中心运到离消费者最近的二级配送中心,然后再由配送中心送货到消费者手中。这里面的问题就包括:这些仓库应该建立在何处,容量应该设为多少?大型仓储中心中每种货物应该预留多少,什么时候应该补充?何时启动库存的预警?从二级配送中心送货给附近的消费者需要多少送货员,路线应该如何规划?

解决这些问题又涉及到了运筹学里面另外的一些基本问题:如何设立仓储中心是运筹学中枢纽选址问题的研究对象 (Hub Location Problem)。每种货物应该预留多少、什么时候应该补充则属于库存管理问题 (Inventory Management Problem)。从配送中心送到消费者手里需要多少送货员、路线如何规划,则属于车辆路线设计问题 (Vehicle Routing Problem)。

3.人力资源配置

为了在销售过程中和售后阶段为消费者提供及时的服务,电商的客服中心往往规模巨大。是否可以雇佣更少的客服人员来满足客户的需求?是否可以更合理地安排客服人员的时间?如何将客服人员按照用户的需求进行划分以提供最有效的服务?这里便涉及到运筹学中的排队论(Queueing Theory)、呼叫中心排班问题(Call Center Staffing Problem)等等。

可以看到,在电商企业的业务链上,几乎每一环都涉及到了大量的运筹学问题。而电商企业只是互联网+企业的一个例子。运筹学之所以能够应用于各个领域,是因为运筹学研究的是“决策”,也就是在一定约束条件下如何做到更好的决策。因此,只要一个问题能转化为决策性问题,就可以用运筹学来解决,这也就是数据驱动决策的核心。

如果把未来的商业比喻成一架高速前进的飞机,那么数据是原始的能源,统计学和数据科学可以将数据转化为高效的燃油,而运筹学则是这架飞机的引擎——将燃油转化为前进的动力。飞机没有引擎是不能飞行的,为了能使这架飞机飞得更快更远,我们需要更多的能源(更多的数据)、更高效的转化(统计),与此同时,我们也需要更好的引擎——运筹学。

发表评论

:?: :razz: :sad: :evil: :!: :smile: :oops: :grin: :eek: :shock: :???: :cool: :lol: :mad: :twisted: :roll: :wink: :idea: :arrow: :neutral: :cry: :mrgreen: