Beta

It’s a beautiful thing when free data meets free algorithm.

1. 研究背景

1988 年 11 月,California 发起了一项名为”99 号提案“的选民倡议,该提案是美国第一个现代大规模烟草控制项目(次年 1 月正式生效)。在该法案的有两项主要内容:

  1. California 的每包香烟香烟的消费税(cigarette excise tax)提高了 25 美分;
  2. 法案的所得收入专项用于控烟的教育与媒体宣传。

P.S. California 香烟消费税现在是每包 87 美分,为美国最高的州之一。

该法案在后续引发了一系列关于室内清洁空气的地方立法。那问题来了:

在 California 该项法案的实施,对烟草控制是积极的还是消极的?影响有多大?

阅读全文 »

运筹学(Operational Research)是一门应用于管理有组织系统的科学,最早的朴素思想在中国的古文献中多有记载,比如耳熟能详的田忌赛马的故事。运筹的一般思想是:在各项资源条件优先的情况下,如何确定一个方案,使得预期目标最优;或者为了达到预期目标,确定资源消耗最小的方案。在二次世界大战之后,组织和企业的活动规模更大,信息系统化空前完备(想象一下水晶报表的诞生多么让人兴奋),加之各类数学算法模型层出不穷,研究如何做好决策的运筹学也有了极大的发展。

运筹学方向很多,比如线性规划、非线性规划、整数规划、目标规划、动态规划、排队论、对策论等。笔者偷个懒,找一些在整数规划体系下的例子,让大家感受一下在日常企业中这些方法的应用。

1. 一个简化问题

公司有 4 条生产线,每条生产线的月产量分别为 0.56, 3.11, 3.04, 2.11。近期因为经济不景气,需要将月产量总和控制在 5 以内,但出于总成本摊销的考虑,又要保证产出尽可能的大,那么哪几条产线需要被关闭。我们盲猜结果:3 和 4 需要被关闭。当然这个问题手指头可以掰过来,超过十个手指头怎么办?

阅读全文 »

话说在遥远的 2012 年的某天,我突然感慨:作为一名数据挖掘工程师,要做好本职工作非常不易。 于是在微博上吐槽了一句,刚好被“数据挖掘和数据分析”的大 V 转发,引发了数据科学圈的广泛转发和讨论, 很多位大佬都给出了自己对于数据科学所需要能力的理解。

话题的争议性体现在一千多个转发上,放在今天必然是一篇 10 万+ 的文章。不扯别的,看看当时吐槽的是什么?

几个关键词:技术、市场、工具、战略、管理、沟通影响力…… 当然数据挖掘的内核已经随着 21 世纪最性感的数据科学家这一职业变的更加与时俱进了,然而我们依然还是有困惑。

阅读全文 »

距离上一篇《好地段是怎么选出来的-从北京地铁看区域的重要性》已经过去八年有余,一直念叨着重新更新一下北京的地铁数据。话说 deadline 是第一生产力,春节前立了 flag,今天利利索索地把它拔了。

读者可以从本文得到什么信息呢?

  1. 从全新的 2024 年北京地铁规划,识别以北京(地铁)交通便利视角的关键区域。
  2. 获取这些关键地段的二手房产信息,通过供给量和均价两个角度,帮助大家找到可能的价值洼地。

1. 构建地铁的网络

首先重新认识一下 2024 年的北京地铁线路规划图:

至 2024 年全北京一共 422 个地铁站点(约数,有些懒得调整,比如 13 号线会拆分,没有做调整)。回想二十年前北京只有1号线、2号线两条地铁线,北京的发展速度也确实让人咂舌(回龙观最初房价 2000,一声叹息)。

阅读全文 »

本篇文章 2900 字,预计阅读时间为 12 分钟,建议找一个安静的时间阅读,以及隔一段时间翻出来再看。

在任何一家公司,每一个对自己职业生涯有规划的员工都希望在更短的时间内晋升,这意味着更多的关注和资源倾斜,更大的责任和职责范围。当然,与之匹配的收益必然也是同步提高的。

对于晋升这件事情本身,我们应该怎样理解?有哪些误解需要澄清,我们需要做什么准备?今天就花一些时间和大家聊一聊你为什么会被提名晋升,或者晋升成功。

阅读全文 »
0%