Beta

It’s a beautiful thing when free data meets free algorithm.

距离上一篇《好地段是怎么选出来的-从北京地铁看区域的重要性》已经过去八年有余,一直念叨着重新更新一下北京的地铁数据。话说 deadline 是第一生产力,春节前立了 flag,今天利利索索地把它拔了。

读者可以从本文得到什么信息呢?

  1. 从全新的 2024 年北京地铁规划,识别以北京(地铁)交通便利视角的关键区域。
  2. 获取这些关键地段的二手房产信息,通过供给量和均价两个角度,帮助大家找到可能的价值洼地。

1. 构建地铁的网络

首先重新认识一下 2024 年的北京地铁线路规划图:

至 2024 年全北京一共 422 个地铁站点(约数,有些懒得调整,比如 13 号线会拆分,没有做调整)。回想二十年前北京只有1号线、2号线两条地铁线,北京的发展速度也确实让人咂舌(回龙观最初房价 2000,一声叹息)。

阅读全文 »

本篇文章 2900 字,预计阅读时间为 12 分钟,建议找一个安静的时间阅读,以及隔一段时间翻出来再看。

在任何一家公司,每一个对自己职业生涯有规划的员工都希望在更短的时间内晋升,这意味着更多的关注和资源倾斜,更大的责任和职责范围。当然,与之匹配的收益必然也是同步提高的。

对于晋升这件事情本身,我们应该怎样理解?有哪些误解需要澄清,我们需要做什么准备?今天就花一些时间和大家聊一聊你为什么会被提名晋升,或者晋升成功。

阅读全文 »

本篇关键内容(阅读需要约 15 分钟):

  1. 分析师的职责范围
  2. 重定义:数据科学合作伙伴
  3. 数据需求的标准流程
  4. 工欲善其事,必先利其器 - tapd

为什么写这篇文章?起因是分析师团队的 leader 离职了,作为大老板,我只能选择暂代管理一段时间。在帮团队成员梳理工作内容的过程,我抽象了其中一些关键的要素,以及需要澄清的认知误区。这些总结我不想仅仅封闭在自己的团队内部,还希望能帮到正在职业生涯迷茫的分析师们。

阅读全文 »

各位看官在平时用 R 处理网页的过程中,一定会被各种乱码、转码所困扰,这里做一些小型的总结,会涉及到:

  1. encode 和 decode
  2. md5 加密
  3. 字符集转换
  4. 繁体转化为简体
  5. 字体的指定

逐个解释如何处理:

Encode 和 Decode 处理最为简单,因为在 R 中自带的 utils 就存在方法,具体函数是 URLencodeURLdecode

阅读全文 »

国庆期间闲逛知乎,恰巧碰到一则问题 2019年你的书单有什么书?,这个问题有

988 个回答,18326 个关注者,284 万的浏览量

接近 1000 个回答,全部翻完且不说时间会爆炸,脑子里能不能记住这些信息更是问题。如果能抓取每个回答列出来的书名,汇总以后便是这 988 个回答者的书目投票。方法虽说暴力,但也算是变相了解大家在 2019 年的阅读倾向。工具呢?当然是我擅长使用的 R 了,哈哈!

闲话不多说,直接给出结果(大于 10 位回答者提及的书目):

阅读全文 »
0%