用 Emacs 编辑 markdown

发表于 2013-09-09 分类于工具技巧

后面不用读了：VS code 真香！

陆陆续续尝试使用 Emacs 已经该有7、8回了，每次都受不了它繁琐的 Ctrl 和 Meta 组合键，但最近不知道哪根筋出了问题，不但编辑器迅速的切换到了Emacs，甚至操作系统也从Win 7平滑到了Ubuntu。以下记录一些关于Emacs、markdown、Ubuntu、ssh乱七八糟的东东。

开源体系下，我的软件之路差不多是下面这样的：

R->LaTeX->imagemagic->Emacs->Ubuntu->github(git,svn)->markdown->pandoc->putty

当走到 putty 这一步，基本上也能称之为半个合格的码农了，囧。

Emacs 是非常好用的文本编辑器，是著名黑客 stallman 的作品，同vi并称为 linux 体系同两大神器。用它来编辑任意文本有大量的定制扩展，试用起来非常方便，而最近老板也在推行用 markdown 来记录技术文档，并且在内网构建了基于 markdown 的 git wiki 系统。刚好自己也一直在用md，比如现在的这个搭建在 github 上的静态页面博客。

阅读全文 »

矩阵分解的一般性解法

发表于 2013-07-07 分类于算法

矩阵分解技术是推荐系统常用的技术之一，它的变种出现在很多算法都有涉及。这里先不做展开，对于最基本的矩阵分解技术做一些原理和代码解释。

1. 矩阵分解的数学原理

首先约定一下符号，对于用户（users）的集合 \(U\)，以及商品的集合 \(D\)，用 \(R\) 来表示用户商品信息的共现（ \(U \times D\) ）矩阵。我们现在想找出 K 个潜在的特征，即：找到两个新矩阵P（ \(U \times K\) ），Q（ \(D \times K\) ），使得：

\[R = P \times Q^T = \hat{R}\]

这时，P包含了所有的用户（U）的相关信息（特征），而 Q 则包含了商品的相关信息（特征）。那如何找到这两个矩阵呢？

阅读全文 »

用 OpenBLAS 加速 R 的矩阵运算

发表于 2013-06-29 分类于 R 技巧

话说 2010 年我和鸟兄去豆瓣做一个技术交流，阿稳现场展示了并行化计算的 R 环境，矩阵运算瞬间跑满了所有的 CPU，当时让我羡慕不已。多年之后在第六届 R 语言会议上，张先轶为大家展示了他们负责跟进研发的开源线性代数计算库 OpenBLAS，这个库建立在已经停止开发的 GotoBLAS2 上，对 Intel Sandy Bridge 有非常好的支持（性能上甚至同 MKL 不相上下）。

线性代数库是 R 底层天然的并行运算的极好支持（Revolution R 使用的 MKL 库的支持），可以有效的提高 R 的计算效率。这里要再次感谢中科院张先轶的贡献！