最近duoshuo社会化评论崩溃了,上千条评论就这么没了,各种手段恢复无果。只能怪我太懒,不爱经常做备份。果断将博客评论迅速转移到disqus,希望以后不会有事(后来还是有事了,所有评论都没了,额)。
前天下班浏览朋友圈,雪晴数据网转发了一篇译文,大数据工具比较:R 语言和 Spark 谁更胜一筹?,原作者测试了在限定为单机环境下,使用Kaggle提供的手写识别的数据在R和Spark平台运行不同算法的对比速度,结论有一下几个:
1 | # input dataset |
好久不写博客,文债太多。其实写了好几篇,不过没润色好,暂时没有放出来。
这两天搞了搞深度神经网络,顺带玩了玩公司的晒单图片,不过需要人工审核每个文件夹(对应一个sku)下面的图片是否可以用于模型。
人工审核的意思就是自己一张一张图片的看,然后删……真是对人性的折磨啊~~