Beta

It’s a beautiful thing when free data meets free algorithm.

拜川普总统所赐,今年的国庆节国人过的非常振奋。

此生无悔入华夏,来世愿在种花家

这句话说出了很多人的心声。

情怀归情怀,我们从建国以来到底 成长的怎样 呢?闲话不说,直接上图,数据来源这里

改革开放 40 年我们取得了非常傲人的经济成就,作为 80 后亲历者,图形化的结果还是震撼了我。从 04 年附近,人均 GDP 的增幅突然爆发出了一个向上的拐点,全球第二大经济体,这么巨大的体量居然还能做到如此,真心不容易!我们大部分普通老百姓即便是什么也没有做,生活水平也在跟着水涨船高,感谢我的政府!

阅读全文 »

随着我们注册的网站和 App 越来越多,有一个问题一直困扰着我:

我的密码真心不够用!

经常几个可能密码重复的尝试,时不时网站就报超过尝试次数。以及还有一个更为可怕的风险:如果所有的网站如果使用同样的密码,任意一个网站只要发生安全泄露(这几年发生次数不少),那基本你在其他网站就属于裸奔了,其他人可以利用你的统一密码作出一系列你不能想象的行为。

1Password 给我了一些启发,它可以保证你每个网站的密码都不同。这款软件安全性怎样,收费多少先不提,我们简单思考一下这个软件的原理貌似是容易实现的,基本要素和逻辑猜测有以下要点:

  1. 不同的网站或者 app 会导致密码的不同
  2. 自己有一个私钥种子,这是唯一要保存的
  3. 将 1 和 2 的信息加密之后返回加密信息
  4. 将加密信息的内容通过一定的规则给出显式密码
  5. 显式密码包含特殊字符,英文的大小写字母

这样做的最大好处是,我只需要记住 2 的种子,即便暴露了 4 的规则,也不担心密码会被反向破译。

阅读全文 »

sharingan 是非常优秀的幻灯片演示工具,作为一款 网页工具,它本身也支持各种 CSS 的特效,这里罗列几种 CSS 特效,供读者参考。(本篇博客基本照抄团队杜亚磊的原创,我只是知识的搬运工,笑)

放大图片的特效

我们在使用写轮眼些幻灯片时,会遇到展示庞大网络图或者架构图,比如全力的游戏的人物图谱

可以想象,当使用幻灯片呈现这些关系图时,是很难比较清楚的将细节展示给观众的。如果我们能够使用 zoom in 的方式放大图片,那就完美了。这里给到了一种使用 jquery-zoom.js 来实现的机制。

阅读全文 »

十月份在公司的技术中心分享了《数据思维、技术到商业价值》,从数据科学的重要基石之一统计学开讲,帮大家串了一下数据科学到底是什么东西。其中有一页幻灯片,讲到我心目中数据科学 milestone 的时间轴,这里分享给大家,以及怎么使用 R 包绘制。啥也不说,先看图:

阅读全文 »

Bayesian Personalized Ranking 是基于隐式反馈数据的非常通用的个性化模型,一般实现使用的是 matrix factorization 机制,利用随机梯度下降来求解。

假设用来表达训练集的三元组为 \((u,i,j)\),只需要找到“最优化”的用户的 f 维向量表征 \(w_{uf}\),positive item i 的 f 维向量表征 \(h_{if}\),negative item j 的 f 维向量表征 \(h_{jf}\),则建模完毕。

它有以下几点优势:

  • 不关注于拟合的具体数值损失最小,而是关注于 item 的排序关系
  • 由于特殊的负采样策略,导致它的结果相对偏 High-Precision & Low-Recall
  • 因为是潜变量模型,预测只是向量的相乘,工程化性能优异
阅读全文 »
0%