使用Linux的命令行工具做简单的文本分析
Contents
Basic Text Analysis with Command Line Tools in Linux | William J Turkel
这篇文章非常清楚的介绍了如何使用Linux的命令行工具进行文本分析,统计一本书中每个词出现的频率。
使用了如下的命令:
- wget
- file
- head
- tail
- cp
- ls
- less
- sed
- wc
- grep
- tr
- sort
- uniq
对于Windows用户,可以通过cygwin在Windows下安装linux的这些强大的命令。