Beta

It’s a beautiful thing when free data meets free algorithm.

好久不写博客,文债太多。其实写了好几篇,不过没润色好,暂时没有放出来。

这两天搞了搞深度神经网络,顺带玩了玩公司的晒单图片,不过需要人工审核每个文件夹(对应一个sku)下面的图片是否可以用于模型。 人工审核的意思就是自己一张一张图片的看,然后删……真是对人性的折磨啊~~

为了加快效率,所以又让R不务正业了一把。大致逻辑是:

  1. 获得所有需要人工审核的子目录
  2. 将这些子目录下的图片全部拼接成一张照片,第一张是晒单的,后面的商品原图
  3. 人工筛选拼装图片,保留可利用的图片
  4. 根据剩下的图片id索引原始图片子目录
阅读全文 »

注:gollum 是很好的 wiki 系统,但还有其他更好的 wiki 系统,比如 docsify 引擎。

gollum 是什么?

gollum的readme上有句最简单的描述很直白:A git-based Wiki。

个人认为github,jekyll,gollum可以并称为码农的三大神器,github用来敲代码,jekyll用来写技术博客,gollum用来搭建自己的知识管理wiki系统。很巧合的是部门用gollum也有两年时间了,不过以前都是直接用,没有仔细看过手册,趁十一期间有时间简单搭了一套玩玩。

简单来讲gollum有以下四个优点:

  • 轻量级,但结构和功能完整
  • 使用Markdown语法
  • 可提供网页服务
  • 使用git进行内容控制

尤其是第四点,完全没有抵抗力啊~

阅读全文 »

每年年底的时候都说要写一个年终总结,但每年都各种原因的推托。几年再不写实在说不过去,至少写一些流水账来。

做过的事情

秦皇岛团建

唯一以帝王命名的城市,5 月份部门团建,地点翡翠岛,没擦防晒霜居然被晒掉一层皮,囧。但玩的很开心。

  • 放飞孔明灯
  • 滑沙
  • 海边烧烤

北京

5 月份的 R 语言会议,分享了一个机器学习的例子。各位老师、同仁、学弟学妹的合影(吴喜之老师、Hadley Wickham、David Smith 的单独合影就不放出拉仇恨了)

这里还是忍不住感谢一下学弟学妹们!

阅读全文 »

趁着中秋期间,终于能抽一些闲暇的时间(感谢我的太太),集中整理了一下邮件。有朋友邮件问到自己正在从事、或即将进入数据科学领域时,碰到的困惑。再回想,这几年也经常面试候选人,每当我以抱歉结束时,很多为候选人也问过很多类似的问题。那我在这篇博文里集中回答一下。

阅读全文 »

redis作为强大的Key-Value服务,如何和R进行结合,这里做一些简单的记录

redis安装

redis安装非常简单,几乎不用管什么依赖关系:

1
2
3
4
5
6
wget http://download.redis.io/releases/redis-x.x.x.tar.gz
tar xzf redis-x.x.x.tar.gz
cd redis-x.x.x
make
make-test
sudo make install

官网上有足够的资料介绍。安装完毕后,生成redis-server、redis-cli、redis-benchmark、redis-stat。

阅读全文 »
0%