当前位置：首页 > 教程资讯 > Linux教程 Linux shell编程中IO和条件及循环处理的细节问题讨论

Linux shell编程中IO和条件及循环处理的细节问题讨论

时间：2024-04-19 11:37:19 来源：人气：

> ? < 差在哪？
谈到I/O redirection，不妨先让我们认识一下File Descriptor（FD）。程序的运算，在大部份情况下都是进行数据（data）的处理，这些数据从哪读进？又，送出到哪里呢？这就是File descriptor（FD）的功用了。

在shell程序中，最常使用的FD大概有三个，分别为：

0: Standard Input（STDIN） 1: Standard Output（STDOUT） 2: Standard Error Output（STDERR）

在标准情况下，这些FD分别跟如下设备（device）关联：

stdin（0）：keyboard stdout（1）：monitor stderr（2）：monitor

我们可以用如下下命令测试一下：

$ mail -s test root
this is a test mail.
please skip.

^d（同时按crtl跟d键）
很明显，mail程序所读进的数据，就是从stdin也就是keyboard读进的。不过，不见得每个程序的stdin都跟mail一样从keyboard读进，因为程序作者可以从档案参数读进stdin，如：

$ cat /etc/passwd

但，要是cat之后没有档案参数则又如何呢？哦，请您自己玩玩看???^_^

$ cat

（请留意数据输出到哪里去了，最后别忘了按^d离开…）至于stdout与stderr，嗯…然后，让我们继续看stderr好了。

事实上，stderr没甚么难理解的：说穿了就是“错误信息”要往哪边送而已…比方说，若读进的档案参数是不存在的，那我们在monitor上就看到了：

$ ls no.such.file
ls: no.such.file: No such file or directory

若，一个命令同时产生stdout与stderr呢？那还不简单，都送到monitor来就好了：

$ touch my.file
$ ls my.file no.such.file
ls: no.such.file: No such file or directory
my.file

okay，至此，关于FD及其名称、还有相关联的设备，相信你已经没问题了吧？那好，接下来让我们看看如何改变这些FD的预设数据信道，我们可用<来改变读进的数据信道（stdin），使之从指定的档案读进。我们可用>来改变送出的数据信道（stdout，stderr），使之输出到指定的档案。比方说：

$ cat < my.file

就是从my.file读进数据

$ mail -s test root < /etc/passwd

则是从/etc/passwd读进…

这样一来，stdin将不再是从keyboard读进，而是从档案读进了…严格来说，<符号之前需要指定一个FD的（之间不能有空白），但因为0是<的预设值，因此<与0<是一样的!okay，这个好理解吧？

那，要是用两个<<又是啥呢？这是所谓的HERE Document，它可以让我们输入一段文本，直到读到<<后指定的字串。比方说：

$ cat < 
这样的话，cat会读进3行句子，而无需从keyboard读进数据且要等^d结束输入。 
okay，又到讲古时间~~~当你搞懂了0<原来就是改变stdin的数据输入信道之后，相信要理解如下两个redirection就不难了：1> 2> 。前者是改变stdout的数据输出信道，后者是改变stderr的数据输出信道。两者都是将原本要送出到monitor的数据转向输出到指定档案去。 
由于1是>的预设值，因此，1>与>是相同的，都是改变stdout。用上次的ls例子来说明一下好了： 
$ ls my.file no.such.file 1>file.out
ls: no.such.file: No such file or directory
 
这样monitor就只剩下stderr而已。因为stdout给写进file.out去了。 
$ ls my.file no.such.file 2>file.err
my.file
 
这样monitor就只剩下stdout，因为stderr写进了file.err。 
$ ls my.file no.such.file 1>file.out 2>file.err
 
这样monitor就啥也没有，因为stdout与stderr都给转到档案去了… 
呵~~~看来要理解>一点也不难啦?是不？没骗你吧？^_^ 不过，有些地方还是要注意一下的。
 首先，是同时写入的问题。比方如下这个例子： 
$ ls my.file no.such.file 1>file.both 2>file.both
 
假如stdout（1）与stderr（2）都同时在写入file.both的话，则是采取“覆盖”方式：后来写入的覆盖前面的。让我们假设一个stdout与stderr同时写入file.out的情形好了： 首先stdout写入10个字元 然后stderr写入6个字元 
那么，这时候原本stdout输出的10个字元就被stderr覆盖掉了。那，如何解决呢？所谓山不转路转、路不转人转嘛，我们可以换一个思维：将stderr导进stdout或将stdout导进sterr，而不是大家在抢同一份档案，不就行了?bingo?就是这样啦： 2>&1就是将stderr并进stdout作输出 1>&2或>&2就是将stdout并进stderr作输出 
于是，前面的错误操作可以改为： 
$ ls my.file no.such.file 1>file.both 2>&1
 
或
  
$ ls my.file no.such.file 2>file.both >&2
 
在Linux档案系统里，有个设备档位于/dev/null。许多人都问过我那是甚么玩意儿？我跟你说好了：那就是“空”啦?没错?空空如也的空就是null了….请问施主是否忽然有所顿误了呢？然则恭喜了~~~ ^_^ 这个null在I/O Redirection中可有用得很呢： 若将FD1跟FD2转到/dev/null去，就可将stdout与stderr弄不见掉。 若将FD0接到/dev/null来，那就是读进nothing。 
比方说，当我们在执行一个程序时，画面会同时送出stdout跟stderr， 
假如你不想看到stderr（也不想存到档案去），那可以： 
$ ls my.file no.such.file 2>/dev/null
my.file
 
若要相反：只想看到stderr呢？还不简单?将stdout弄到null就行： 
$ ls my.file no.such.file >/dev/null
ls: no.such.file: No such file or directory
 
那接下来，假如单纯只跑程序，不想看到任何输出结果呢？哦，这里留了一手上次节目没讲的法子，专门赠予有缘人?…^_^ 除了用>/dev/null 2>&1之外，你还可以如此： 
$ ls my.file no.such.file &>/dev/null
 
（提示：将&>换成>&也行啦~~！） 
okay？讲完佛，接下来，再让我们看看如下情况： 
$ echo "1" > file.out
$ cat file.out
1
$ echo "2" > file.out
$ cat file.out
2
 
看来，我们在重导stdout或stderr进一份档案时，似乎永远只获得最后一次导入的结果。那，之前的内容呢？呵~~~要解决这个问提很简单啦，将>换成>>就好： 
$ echo "3" >> file.out
$ cat file.out
2
3
 
如此一来，被重导的目标档案之内容并不会失去，而新的内容则一直增加在最后面去。easy？呵…^_^ 
但，只要你再一次用回单一的>来重导的话，那么，旧的内容还是会被“洗”掉的?这时，你要如何避免呢？----备份?yes，我听到了?不过….还有更好的吗？既然与施主这么有缘份，老纳就送你一个锦囊妙法吧： 
$ set -o noclobber
$ echo "4" > file.out
-bash: file: cannot overwrite existing file
 
那，要如何取消这个“限制”呢？哦，将set -o换成set +o就行： 
$ set +o noclobber
$ echo "5" > file.out
$ cat file.out
5
 
再问：那…有办法不取消而又“临时”盖写目标档案吗？哦，佛曰：不可告也?啊~开玩笑的、开玩笑的啦~ ^_^唉，早就料到人心是不足的了? 
$ set -o noclobber
$ echo "6" >| file.out
$ cat file.out
6
 
留意到没有：在>后面再加个“|”就好（注意：>与|之间不能有空白哦）… 呼…（深呼吸吐纳一下吧）~~~ ^_^再来还有一个难题要你去参透的呢： 
$ echo "some text here" > file
$ cat < file
some text here
$ cat < file > file.bak
$ cat < file.bak
some text here
$ cat < file > file
$ cat < file
 
嗯？！注意到没有？！！----怎么最后那个cat命令看到的file竟是空的？?why？why？why？当当当~上课?? ^_^
 前面提到：$ cat < file > file 之后原本有内容的档案结果却被洗掉了?要理解这一现像其实不难，这只是priority的问题而已： 
在IO Redirection中，stdout与stderr的管道会先准备好，才会从stdin读进数据。也就是说，在上例中，> file会先将file清空，然后才读进< file，但这时候档案已经被清空了，因此就变成读不进任何数据了…哦~原来如此~~ ^_^ 
那…如下两例又如何呢？ 
$ cat <> file
$ cat < file >> file
 
嗯…同学们，这两个答案就当练习题???陆诳沃?扒虢蛔饕旦u好了，I/O Redirection也快讲完了，sorry，因为我也只知道这么多而已啦~嘻 ^_^ 不过，还有一样东东是一定要讲的，各位观众（请自行配乐~！#@！$%）：----就是pipe line也！ 
谈到pipe line，我相信不少人都不会陌生：我们在很多command line上常看到的“|”符号就是pipe line了。不过，究竟pipe line是甚么东东呢？别急别急…先查一下英汉字典，看看pipe是甚么意思？没错?它就是“水管”的意思…那么，你能想像一下水管是怎么一根接着一根的吗？又，每根水管之间的input跟output又如何呢？嗯？？灵光一闪：原来pipe line的I/O跟水管的I/O是一模一样的：上一个命令的stdout接到下一个命令的stdin去了!的确如此…不管在command line上你使用了多少个pipe line，前后两个command的I/O都是彼此连接的?（恭喜：你终于开窍了?^_^） 
不过…然而…但是……stderr呢？好问题?不过也容易理解：若水管漏水怎么办？也就是说：在pipe line之间，前一个命令的stderr是不会接进下一命令的stdin的，其输出，若不用2>导到file去的话，它还是送到摄像头上面来?这点请你在pipe line运用上务必要注意的。那，或许你又会问：有办法将stderr也喂进下一个命令的stdin去吗？（贪得无厌的家伙?）方法当然是有，而且你早已学过了?^_^ 我提示一下就好：请问你如何将stderr合并进stdout一同输出呢？若你答不出来，下课之后再来问我吧…（如果你脸皮真够厚的话…） 
或许，你仍意尤未尽?或许，你曾经碰到过下面的问题： 
在cm1 | cm2 | cm3…这段pipe line中，若要将cm2的结果存到某一档案呢？ 
若你写成cm1 | cm2 > file | cm3的话，那你肯定会发现cm3的stdin是空的?（当然啦，你都将水管接到别的水池了?）聪明的你或许会如此解决：cm1 | cm2 > file; cm3 < file 是的，你的确可以这样做，但最大的坏处是：这样一来，file I/O会变双倍?在command执行的整个过程中，file I/O是最常见的最大性能杀手。凡是有经验的shell操作者，都会尽量避免或降低file I/O的频率。那，上面问题还有更好方法吗？有的，那就是tee命令了。 
所谓tee命令是在不影响原本I/O的情况下，将stdout复制一份到档案去。因此，上面的命令行可以如此打： 
cm1 | cm2 | tee file | cm3
 
在预设上，tee会改写目标档案，若你要改为增加内容的话，那可用-a参数达成。
 基本上，pipe line的应用在shell操作上是非常广泛的，尤其是在text filtering方面，
 凡举cat，more，head，tail，wc，expand，tr，grep，sed，awk，…等等文字处理工具，搭配起pipe line来使用，你会惊觉command line原来是活得如此精彩的?常让人有“众里寻他千百度，蓦然回首，那人却在灯火阑珊处?”之感…^_^ 
你要 if ?是 case 呢？
 放了一个愉快的春节假期，人也变得懒懒散散的…只是，答应了大家的作业，还是要坚持完成就是了~~~ 
还记得我们在第10章所介绍的return value吗？是的，接下来介绍的内容与之有关，若你的记忆也被假期的欢乐时光所抵消掉的话，那，建议您还是先回去温习温习再回来… 
若你记得return value，我想你也应该记得了&&与||是甚么意思吧？用这两个符号再配搭command group的话，我们可让shell script变得更加聪明哦。比方说： 
comd1 && {
  comd2
  comd3
  :
} || {
  comd4
  comd5
}
 
意思是说：假如comd1的return value为true的话，然则执行comd2与comd3，否则执行comd4与comd5。 
事实上，我们在写shell script的时候，经常需要用到这样那样的条件以作出不同的处理动作。
 用&&与||的确可以达成条件执行的效果，然而，从“人类语言”上来理解，却不是那么直观。
 更多时候，我们还是喜欢用if….then…else…这样的keyword来表达条件执行。在bash shell中，我们可以如此修改上一段代码： 
if comd1
then
  comd2
  comd3
else
  comd4
  comd5
fi
 
这也是我们在shell script中最常用到的if判断式：只要if后面的command line返回true的return value（我们最常用test命令来送出return value），然则就执行then后面的命令，否则执行else后的命令;fi则是用来结束判断式的keyword。 
在if判断式中，else部份可以不用，但then是必需的。（若then后不想跑任何command，可用:这个null command代替）。当然，then或else后面，也可以再使用更进一层的条件判断式，这在shell script设计上很常见。 
若有多项条件需要“依序”进行判断的话，那我们则可使用elif这样的keyword： 
if comd1; then
  comd2
elif comd3; then
  comd4
else
  comd5
fi
 
意思是说：若comd1为true，然则执行comd2;否则再测试comd3，然则执行comd4;倘若comd1与comd3均不成立，那就执行comd5。 
if判断式的例子很常见，你可从很多shell script中看得到，我这里就不再举例子了…接下来要为大家介绍的是case判断式。 
虽然if判断式已可应付大部份的条件执行了，然而，在某些场合中，却不够灵活，尤其是在string式样的判断上，比方如下： 
QQ() {
  echo -n "Do you want to continue?(Yes/No):"
  read YN
  if [ "$YN" = Y -o "$YN" = y -o "$YN" = "Yes" -o "$YN" = "yes" -o "$YN" = "YES" ]
  then
    QQ
  else
    exit 0
  fi
}
QQ
 
从例中，我们看得出来，最麻烦的部份是在于判断YN的值可能有好几种式样。聪明的你或许会如此修改： 
if echo "$YN" | grep -q '^[Yy]([Ee][Ss])*$'
 
也就是用Regular Expression来简化代码。（我们有机会再来介绍RE）只是…是否有其它更方便的方法呢?有的，就是用case判断式即可： 
QQ() {
  echo -n "Do you want to continue?(Yes/No):"
  read YN
  case "$YN" in
    [Yy]|[Yy][Ee][Ss])
      QQ
      ;;
    *)
      exit 0
      ;;
  esac
}
QQ
 
我们常用case的判断式来判断某一变量在不同的值（通常是string）时作出不同的处理，比方说，判断script参数以执行不同的命令。若你有兴趣、且用Linux系统的话，不妨挖一挖/etc/init.d/*里那堆script中的case用法。如下就是一例： 
case "$1" in
  start)
    start
    ;;
  stop)
    stop
    ;;
  status)
    rhstatus
    ;;
  restart|reload)
    restart
    ;;
  condrestart)
    [ -f /var/lock/subsys/syslog ] && restart || :
    ;;
  *)
    echo $"Usage: $0 {start|stop|status|restart|condrestart}"
    exit 1
  esac
 
（若你对positional parameter的印像已经模糊了，请重看第9章吧。）okay，十三问还剩一问而已，过几天再来搞定之….^_^ 
for what？while与until差在哪？ 
最后要介绍的是shell script设计中常见的“循环”（loop）。所谓的loop就是script中的一段在一定条件下反复执行的代码。bash shell中常用的loop有如下三种：for while until 
for loop是从一个清单列表中读进变量值，并“依次”的循环执行do到done之间的命令行。例： 
for var in one two three four five
do
  echo -----------
  echo '$var is '$var
  echo
done
 
上例的执行结果将会是： 
for会定义一个叫var的变量，其值依次是one two three four five。
 因为有5个变量值，因此do与done之间的命令行会被循环执行5次。
 每次循环均用echo产生三行句子。而第二行中不在hard quote之内的$var会依次被替换为one two three four five。
 当最后一个变量值处理完毕，循环结束。
 我们不难看出，在for loop中，变量值的多寡，决定循环的次数。然而，变量在循环中是否使用则不一定，得视设计需求而定。倘若for loop没有使用in这个keyword来指定变量值清单的话，其值将从$@（或$*）中继承： 
for var; do
…
done
 
（若你忘记了positional parameter，请温习第9章…） 
for loop用于处理“清单”（list）项目非常方便，其清单除了可明确指定或从positional parameter取得之外，也可从变量替换或命令替换取得…（再一次提醒：别忘了命令行的“重组”特性！） 
然而，对于一些“累计变化”的项目（如整数加减），for亦能处理： 
for ((i=1;i<=10;i++))
do
  echo "num is $i"
done
 
除了for loop，上面的例子我们也可改用while loop来做到： 
num=1
while [ "$num" -le 10 ]; do
  echo "num is $num"
  num=$(($num + 1))
done
 
while loop的原理与for loop稍有不同：它不是逐次处理清单中的变量值，而是取决于while后面的命令行之return value： 
若为ture，则执行do与done之间的命令，然后重新判断while后的return value。
 若为false，则不再执行do与done之间的命令而结束循环。
 分析上例： 在while之前，定义变量num=1。 然后测试（test）$num是否小于或等于10。 结果为true，于是执行echo并将num的值加一。 再作第二轮测试，此时num的值为1+1=2，依然小于或等于10，因此为true，继续循环。 直到num为10+1=11时，测试才会失败…于是结束循环。 
我们不难发现：若while的测试结果永远为true的话，那循环将一直永久执行下去： 
while : ;do
  echo looping…
done
 
上例的:是bash的null command，不做任何动作，除了送回true的return value。因此这个循环不会结束，称作死循环。死循环的产生有可能是故意设计的（如跑daemon），也可能是设计错误。若要结束死循环，可透过signal来终止（如按下ctrl-c）。（关于process与signal，等日后有机会再补充，十三问暂时略过。） 
一旦你能够理解while loop的话，那，就能理解until loop： 
与while相反，until是在return value为false时进入循环，否则结束。
 因此，前面的例子我们也可以轻松的用until来写： 
num=1
until [ ! "$num" -le 10 ]; do
  echo "num is $num"
  num=$(($num + 1))
done
 
或是： 
num=1
until [ "$num" -gt 10 ]; do
  echo "num is $num"
  num=$(($num + 1))
done
 
okay，关于bash的三个常用的loop暂时介绍到这里。在结束本章之前，再跟大家补充两个与loop有关的命令：break continue 
这两个命令常用在复合式循环里，也就是在do…done之间又有更进一层的loop，当然，用在单一循环中也未尝不可啦…^_^ 
break是用来打断循环，也就是“强迫结束”循环。若break后面指定一个数值n的话，则“从里向外”打断第n个循环，预设值为break 1，也就是打断当前的循环。
 在使用break时需要注意的是，它与return及exit是不同的： break是结束loop return是结束function exit是结束script/shell 
而continue则与break相反：强迫进入下一次循环动作。若你理解不来的话，那你可简单的看成：在continue到done之间的句子略过而返回循环顶端…与break相同的是：continue后面也可指定一个数值n，以决定继续哪一层（从里向外计算）的循环，预设值为continue 1，也就是继续当前的循环。
  
 分享一个入门级可控多线程shell脚本代码
 说到shell可控多线程，网上分享的大部分是管道控制的方案。这种方案，张戈博客也曾经实战并分享过一次：《Shell+Curl网站健康状态检查脚本，抓出中  
 Linux Shell+Curl网站健康状态检查脚本，抓出中国博客联盟失联站点
 一开始搭建中国博客联盟，既有博友提醒我，做网址大全这类网站维护很麻烦，需要大量的精力去Debug一些已夭折的网站，更是拿松哥的博客大全举例。  
 CCKiller：Linux轻量级CC攻击防御工具，秒级检查、自动拉黑和释放
 张戈博客很久以前分享过一个CC攻击的防御脚本，写得不怎么样，不过被51CTO意外转载了。博客从此走上了经常被人拿来练手的不归之路。当然，还是有

Linux shell编程中IO和条件及循环处理的细节问题讨论

相关推荐

教程资讯

Linux教程排行

系统教程

系统主题

装机软件