系统之家 - Windows操作系统&装机软件下载网站!

当前位置: 首页  >  教程资讯  >  Linux教程 一天一个shell命令 linux文本内容操作系列-cut命令详解

一天一个shell命令 linux文本内容操作系列-cut命令详解

时间:2024-04-16 16:49:01 来源: 人气:

说明:

cut 按列切分文件,你可以指定分隔每列的定界符。在cut的术语中,每列都是一个字段,就是有时候说第一列,可能表述称第一个字段。

实战:

假设有文件data.txt,格式如下

NO Name Mark Percent
1 Sarath 45 90
2 Alex 49 98
3 Anu 45 90

分隔符(定界符)为Tab 制表符

如果我要取得第二列,所有人的名称,有什么好的办法吗?此时cut该大显身手了。

1. 取得2,3列 即name,和mark

$cut ?f 2,3 data.txt

2. 取得除第3列以外所有列

$cut ?f3 ?complement data.txt

3. 采取其他定界符,可以用-d改变。

假设data_comma.txt:



NO,Name,Mark,Percent 

 1,Sarath,45,90 

 2,Alex,49,98 

 3,Anu,45,90

则:
$cut ?f2 -d"," data_comma.txt

解读—help

用法:cut [选项]... [文件]...
从每个文件中输出指定部分到标准输出。

长选项必须使用的参数对于短选项时也是必需使用的。
-b, --bytes=列表 只选中指定的这些字节
-c, --characters=列表 只选中指定的这些字符
-d, --delimiter=分界符 使用指定分界符代替制表符作为区域分界
-f, --fields=列表 只选中指定的这些域;并打印所有不包含分界符的
行,除非-s 选项被指定
-n (忽略)
--complement 补全选中的字节、字符或域
-s, --only-delimited 不打印没有包含分界符的行
--output-delimiter=字符串 使用指定的字符串作为输出分界符,默认采用输入
的分界符
--help 显示此帮助信息并退出
--version 显示版本信息并退出

仅使用f -b, -c 或-f 中的一个。每一个列表都是专门为一个类别作出的,或者您可以用逗号隔
开要同时显示的不同类别。您的输入顺序将作为读取顺序,每个仅能输入一次。
每种参数格式表示范围如下:
N 从第1 个开始数的第N 个字节、字符或域
N- 从第N 个开始到所在行结束的所有字符、字节或域
N-M 从第N 个开始到第M 个之间(包括第M 个)的所有字符、字节或域
-M 从第1 个开始到第M 个之间(包括第M 个)的所有字符、字节或域

当没有文件参数,或者文件不存在时,从标准输入读取

解读:

1.取得某一列的字符或者字节 可以用-c, -b等

2.可以取得某个范围

1和2综合例子:

有文件range_data.txt,内容如下

abcdefghijklmnopqrstuvwxyz 

 abcdefghijklmnopqrstuvwxyz 

 abcdefghijklmnopqrstuvwxyz 

 abcdefghijklmnopqrstuvwxyz

运行:$cut range_data.txt -c-2

打印字符1-2列

再复杂一点:

$cut range_data.txt -c1-3,6-9 --output-delimiter ","

打印1-3行,6-9行,并且用逗号分隔。

命令比较简单,主要还是借鉴书籍《linux shell脚本攻略》,从附件中会看到一排格式很差的字母,尝试用-s过滤掉他。

一天一个shell命令 linux文本内容操作系列-sed命令详解
说明:sed是streameditor(流编辑器)的缩写。它能够完美匹配正则表达式。sed和awk是文件编辑最重要的两个命令了。尤其涉及到了很多正则表达式的问题,笔

一天一个shell命令 linux文本内容操作系列-awk命令详解
简介awk是一个强大的文本分析工具,相对于grep的查找,sed的编辑,awk在其对数据分析并生成报告时,显得尤为强大。简单来说awk就是把文件逐行的读入

一天一个shell命令 linux文件内容操作系列-cat命令详解
注:在awk命令之后,没有太多复杂命令,都是一些基础命令。说明:cat,是单词concatenate的缩写,把文件的内容输出到stdout.当与重定向操作符(或结合使用

教程资讯

Linux教程排行

系统教程

系统主题