grep -a -B 50 -A 60 'some string in the file' /dev/sda1 > results.txt 说明: 关于grep的-a意为–binary-files=text,也就是把二进制文件当作文本文件。 -B和-A的选项就是这段字符串之前几行和之后几行。 /dev/sda1,就是硬盘设备, > results.txt,就是把结果重定向到results.txt文件中。
- Andre
评论中说:既然是從Wikipedia上翻譯過來的,應該也會在文內看到這一段吧 http://en.wikipedia.org/wiki... “the rolling checksum of bytes n+1 through n+s can be computed from R, byte n, and byte n+s without having to examine the intervening bytes.” 把這關鍵的設計漏掉,這篇文章等同於宣稱rsync是個暴力到不行的低效率解法。
- Andre
微信并不是奔着泡妞来的,但它毕竟也是有副作用的嘛,会引入一些陌生人到你的通讯录里面。但是,就像KK写的《失控》,最终用户群有群体效应,会产生自己的一种方向。我们有时候做产品也没有办法做个预测,把这个东西放在群体里以后会产生什么样的效应。 互联网先知、《连线》杂志前主编凯文·凯利写了《失控:机器、社会与经济的新生物学》一书,发现蜂群思维会产生“卡夫卡式噩梦”效应。 做了这么多年工作以后,说老实话,我感觉对人性的把握是最重要的,因为资源很丰富的时候想做的事情都可以做到。但是我现在越来越难判断什么是好的、什么是坏的。很多人通过微信去找到一夜情,我甚至不能判断这样是做对了还是做错了。我没法把这个放在道德层面上想。这个确实也会跟做这个行业的人观念有关系,就像在微博上大家会看日本的AV女星,她也是在解放人的心态,也有积极作用。
- Andre
第一,用于分类所需要的类别体系是预先确定的。 现在一说到文本分类,大部分人想当然的将这个问题简化为判断一篇文章说的是什么,这只是文本分类的一小部分应用,我们可以称之为“依据主题的分类”。实际上,文本分类还可以用于判断文章的写作风格,作者态度(积极?消极?),甚至判断作者真伪(例如看看《红楼梦》最后二十回到底是不是曹雪芹写的)。总而言之,凡是与文本有关,与分类有关,不管从什么角度出发,依据的是何特征,都可以叫做文本分类。
- Andre
针对英文纯文本的实验结果表明:作为特征选择方法时,开方检验和信息增益的效果最佳(相同的分类算法,使用不同的特征选择算法来得到比较结果);文档频率方法的性能同前两者大体相当,术语强度方法性能一般;互信息方法的性能最差(文献[17]) 但开方检验也并非就十全十美了。回头想想A和B的值是怎么得出来的,它统计文档中是否出现词t,却不管t在该文档中出现了几次,这会使得他对低频词有所偏袒(因为它夸大了低频词的作用)。甚至会出现有些情况,一个词在一类文章的每篇文档中都只出现了一次,其开方值却大过了在该类文章99%的文档中出现了10次的词,其实后面的词才是更具代表性的,但只因为它出现的文档数比前面的词少了“1”,特征选择的时候就可能筛掉后面的词而保留了前者。这就是开方检验著名的“低频词缺陷“。
- Andre
康德在代表作《纯粹理性批判》中主张:我们所认识的世界是我们用自己拥有的理论对自己观察到的现象做出的解释。纸上的一条墨迹,数学家把它看成是平面上的直线,中国人把它看成汉字的“一”。我们对现象的观察都是受“意图”(intent)影响的,不同的意图会带来不同的观察结果。做科学研究时也是一样,如果不是带着一个强烈的新意图去观察现象,是不会有新发现的。科学研究的成果必须是客观的,而科学研究的过程却是主观带动的。这是一个非常有趣的事实,也说明科学研究中,磨炼自己悟性的重要。
- Andre
最近有幸读了两本克莱·舍基的书。第一本是《未来是湿的》,相信大家都知道,《认知盈余》是第二本。作者不愧为“互联网革命最伟大的思考者”,他对互联网给人类所带来的行为举止以及文化的变迁洞若观火。这两本著作一脉相承,它们所探讨的是这样几个问题:随着全球用户接触互联网的门槛变得越来越低,互联网用户数量变得更加庞大,它们将形成什么样的社会形态?我们又该如何顺应这种变化?而作为互联网的从业者们,该如何从中寻找自己的机会?
- Andre
我所有的工作都基于一个简单的方法论,“目标–策略–行动–能力–验证”,依据能力,找对目标,选好策略,立即行动,小心求证,做项目管理,玩网络推广,写PPT书籍等等,都是如此。 对普通人而言,了解一个方法论很容易,但变成自己的习惯就得不断训练,反复用上几十次,最好是不同的事情都用上几十次,才能成为自己的心法。只靠看书听课交流,始终不能成为自己的武功。
- Andre