Sophie

Sophie

distrib > Mandriva > 2010.0 > i586 > media > contrib-release > by-pkgid > d667a145d78a93cee78c5358ca99c039 > files > 142

howto-text-nl-2006-5mdv2010.0.noarch.rpm


Unix shell scripting

Daniel C. von Asmuth

   Copyright © 2000 D.C.von Asmuth
     _________________________________________________________________

   Inhoudsopgave
   [1]Unix en de shell
   [2]elementair shell programmeren
   [3]enkele Unix tools

   Dit is een uitgebreide inleiding over het gebruik van de Unix shell en
   bijbehorende hulpmiddelen om scripts te schrijven. Het veronderstelt
   enige kennis van de Unix commandoregel, bijvoorbeeld de
   bash-prompt-howto. Het bevat wat meer voorbeelden dan de officiële
   handleidingen.
     _________________________________________________________________

Unix en de shell

   De shell is de Unix `commandostip', die opdrachten van de gebruikers
   inleest van het toetsenbord, ze uitvoert en het resultaat op het
   scherm zet. In de simpelste vorm bestaat een opdracht uit de naam van
   een programma; de shell zal dat programma dan opstarten, dat de
   beschikking over het toetsenbord en beeldscherm krijgt, en laat een
   nieuwe prompt zien als het programma beëindigd is.

   Het Unix besturingssysteem wordt wel eens voorgesteld als bestaande
   uit een harde kern oftewel kernel, die de hardware aanstuurt en
   hardware aanstuurt en dat de shell een schil erom heen is, die de
   kernel van de gebruikers afschermt. Het is echter de taak van de
   kernel om de hardware af te schermen, terwijl de shell dient om
   toegang tot het systeem te geven. Gebruikersprogramma's hoeven geen
   gebruik van de shell te maken; de C-bibliotheek heeft bijvoorbeeld wel
   de functie van een schil om de kernel.
     _________________________________________________________________

inleiding

   Dit verhaal gaat ervan uit dat u enige ervaring met Unix hebt en dus
   met het typen van commando's in de shell. Het kan nooit kwaad om de
   uitgebreide informatie over een besproken commando op te vragen met
   man commando of (op GNU systemen) info commando.

   Er zijn verschillende varianten op het Unix besturingssysteem; alle
   besturingssystemen die de hier besproken commando's bezitten worden
   hier voor het gemak met Unix aangeduid, ook al zijn ze niet gebaseerd
   op de originele code van A T & T. Op een Unix systeem zijn vaak
   verschillende shells te vinden. Het is ook mogelijk om een shell te
   draaien op Windows NT(TM). De voorbeelden bij dit verhaal zijn getest
   onder Linux en zullen op andere systemen soms aanpassing behoeven.

   De oorspronkelijke /bin/sh is de Bourne shell, en de andere zijn
   daarvan afgeleid. De nummer twee was de C-shell, die handige features
   had om processen te besturen, maar minder handig om ermee te
   programmeren, en dus niet verder aan de orde zal komen. De nieuwere
   Korn shell lijkt weer meer op de Bourne shell, met de features van de
   C-shell, plus een hele reeks eigen uitbreidingen voor interaktief
   gebruik en programmeren. De Bourne Again Shell van het GNU projekt
   heeft eveneens een wijde verbreiding gekregen.
     _________________________________________________________________

Mijn eerste scriptje

   Het bijzondere aan de shell is dat hij zowel een handige
   commandoverwerker is voor interaktief gebruik als een programmeertaal.
   Verschillende delen van een Unix besturingssysteem bestaan uit shell
   scripts, omdat deze gemakkelijk door de gebruiker aan diens behoefte
   kunnen worden aangepast, wat vooral systeembeheerders waarderen. Shell
   scripts worden ook vaak gebruikt als een schil om een complexe
   applicatie.

   Het is een kleine moeite om een korte reeks veel gebruikte commando's
   samen te voegen tot een scriptje: maak met vi (c.q. uw favoriete
   editor) een file voorbeeld aan met de volgende, vrij willekeurige,
   inhoud:

date
uname -a
who

   Vervolgens typt u chmod ugo+rx voorbeeld waarmee het tekstbestand tot
   programma wordt gepromoveerd, dat met ./voorbeeld kan worden
   uitgevoerd. De kernel is zelf in staat te bepalen of een uit te voeren
   file een script of binair programma bevat.

   In het voorbeeld is de directory waar het programma zich bevindt
   expliciet opgegeven. Als die wordt weggelaten zal de shell de lijst
   van directory's doorzoeken die in de speciale variabele $PATH staat.
   Het is enigszins riskant om de aktuele directory (.) in het zoekpad op
   te nemen.

   Een standaard vergissing is om eigen programma's de naam test te
   geven. Helaas is test een ingebouwd commando van de shell. De shell
   heeft niet zoveel ingebouwde commando's: het meeste werk wordt door
   externe programma's gedaan.
     _________________________________________________________________

hallo

   Als volgende voorbeeld de nederlandstalige versie van het
   onvermijdelijke nutteloze programma hello, bekend van Kernighan &
   Ritchie.

#!/bin/sh
# dit programma zegt vriendelijk goedendag

echo Hallo, allemaal! ; exit 0

   Dit lijkt al iets meer op een programma. In de eerste regel staat
   achter #! aangegeven welk programma het script moet uitvoeren.
   Normaliter is dat de shell waarmee u inlogt; u kunt hiermee voorkomen
   dat een programma niet werkt als het bijvoorbeeld vanaf de C-shell
   wordt gestart. Aan de andere kant zal een script dat begint met
   #!/bin/bash niet werken op een systeem waar die shell in
   /usr/local/bin staat of afwezig is. Deze eigenschap is vooral handig
   voor scripts in andere talen, bijv.:

#!/usr/bin/perl
print "Hallo, allemaal!\n"

   De programmeertaal Perl wordt hier niet verder behandeld. Voor de rest
   geeft een hekje aan dat de rest van de regel kommentaar is. Een lege
   commandoregel is toegestaan. Behalve het einde van de regel kan ook
   een puntkomma worden gebruikt om opdrachten te scheiden die na elkaar
   worden uitgevoerd.

   De opdracht echo is een ingebouwde functie van de shell, net als
   trouwens exit. Echo zorgt ervoor dat de resterende woorden op het
   standaard uitvoerkanaal (bijv. het scherm) worden afgedrukt. Shell
   commando's, argumenten en vlaggen moeten atlijd van elkaar worden
   gescheiden door spaties of andere scheidingstekens.

   De opdracht exit beëindigt het script, ook als er nog opdrachten
   volgen; het gebruik ervan is niet verplicht. Net als de exit functie
   in een C programma wordt er een foutcode geretourneerd, die 0 bedraagt
   als er geen fout is opgetreden. Typ maar eens de volgende regels in
   achter de prompt.

true
echo $?
false
echo $?

   De variabele $? krijgt de exit status van het laatst uitgevoerde
   commando of script. Na exit of het einde van een script gaat de shell
   verder met het aanroepende script of vraagt de gebruiker om invoer.
   True en false zijn externe programma's die niets doen en alleen in
   shell programma's nut hebben. Het resultaat verschilt nogal van
   Boolean types in andere programmeertalen.

   Als u inlogt zal de shell eerst het script /etc/profile uitvoeren,
   waarin zich algemene instellingen bevinden, gevolgd door .profile in
   uw eigen directory, waarin u uw persoonlijke instellingen kwijt kunt.
   Bash en ksh kennen ook initialisatie files ~/.bashrc en ~/.kshrc die
   iedere keer uitgevoerd worden als een interactieve shell start,
   bijvoorbeeld bij het openen van een xterm.
     _________________________________________________________________

een herhalingsoefening

   De rest van dit hoofdstuk wordt besteed aan Unix en de shell, zonder
   dat er verder programmeren bij komt kijken. De behandeling zal erg
   oppervlakkig blijven; in [4]paragraaf enkele Unix tools komen we er
   uitgebreid op terug.

   Het centrale concept in Unix is de file oftewel het bestand. Files
   worden voortdurend gebruikt waar informatie voor min of meer lange
   tijd moet worden bewaard. Een file is een reeks bytes, die meestal op
   een schijf wordt bewaard. De belangrijkste operaties zijn het lezen of
   schrijven van een aantal bytes. Daarbij wordt de file pointer of
   bladwijzer om het aantal gelezen of geschreven bytes verplaatst.
   Verder is het mogelijk om de file pointer naar een opgegeven punt te
   verplaatsen en de lengte van het bestand in te krimpen tot
   bijvoorbeeld nul bytes.

   De inhoud van een bestand ligt niet vast. Unix maakt vaak gebruik van
   tekstbestanden. Een byte staat dan voor een letterteken (karakter) van
   het ASCII alfabet. Het teken <LF> oftewel 0xa oftwel ^J oftewel \n
   geeft het einde van een regel aan. Er is geen teken nodig om het einde
   van een bestand te markeren, maar ^D kan worden gebruikt om invoer van
   de terminal te beëindigen.

   Veel tools gaan ervan uit dat een bestand tekst bevat. Bijvoorbeeld
   zal cat voorbeeld de inhoud van het bestand over het scherm laten
   lopen. Als het bestand echter geen tekst bevat, dan kan de terminal de
   kluts kwijt raken van de stuurcodes; doe dus geen /bin/cat /bin/cat.
   Met cat -v loopt u geen gevaar.

   In sommige Unices kunt u de schade repareren met het commando reset.
   De oude methode is de terminal uit en weer aan te zetten. De schade is
   te voorkomen. Het kommando file hallo zou iets moeten geven als hallo:
   Bourne shell script text.

   Als file een frase met het woord `executable' erin retourneert, hebben
   we te maken met een binair programma. Een binair programma kun je
   alleen uitvoeren: dat werkt wel een stuk sneller dan een ingewikkeld
   shell script. File kan zich ondanks zijn `magic' uiteraard vergissen.

   Verder zijn er speciale files, waarmee bijvoorbeeld apparaten kunnen
   worden afgelezen of beschreven alsof het files waren; een tape wordt
   bijvoorbeeld bediend als een hele lange pseudo-file, waarvan de
   grootte aan een vast maximum is gebonden. Deze worden vaak in de /dev
   directory gevonden.

   Tekst die naar /dev/tty wordt geschreven, wordt wel zichtbaar gemaakt,
   maar niet opgeslagen. Een poging om /dev/tty uit te lezen retourneert
   niet de geschreven tekst, maar van het toetsenbord ingevoerde tekens.
   Unix zal u laten wachten totdat er een regel is ingevoerd, c.q. op de
   return-toets is gedrukt.

   Om een tekstbestand uit te printen zou je cat hallo >/dev/lp0 of iets
   dergelijks kunnen doen, maar Unix staat dat enkel aan de user root
   toe. De juiste manier om een bestand te printen is via het printer
   spoolprogramma met lpr hallo

   Een ander bestand dat in scripts gebruikt kan worden is /dev/null, ook
   wel de bittenbak genoemd, omdat alle data die er naartoe worden
   geschreven direkt worden weggegooid in tegenstelling tot de vuilnisbak
   van de Macintosh(TM). Lezen uit /dev/null is toegestaan, maar er zal
   niets uit komen.

   De directory's kunnen worden beschouwd als een speciaal soort bestand,
   dat alleen met speciale opdrachten als ls, cp, mv, rm en ln kan worden
   gemanipuleerd. Directory's bevatten weinig anders als de namen van
   files en directory's. Daarom is voor een opdracht als rm -f
   ./voorbeeld schrijfpermissie op de aktuele directory vereist, maar
   geen permissie op het bestand. In scripts gebruiken we vaak de -f
   optie, zodat Unix niet nog eens vraagt of we het wel zeker weten.

   Een file kan meerdere namen of links hebben; met het commando ln wordt
   een nieuwe link naar een bestaand bestand gelegd. ln /bin/ls /bin/dir
   maakt een nieuw commando, dir geheten, dat hetzelfde doet als ls. Met
   rm wordt het aantal links met één verminderd. Pas wanneer dat tot nul
   is gedaald en het bestand niet in gebruik is, zal Unix het bestand
   daadwerkelijk verwijderen.

   Het is niet mogelijk naar een link te maken naar een directory of een
   bestand op een andere schijf. Deze beperking wordt opgeheven door de
   symbolic link of snelkoppeling, die je maakt met ln -s. Een
   snelkoppeling loopt het gevaar dat het bestand waar hij naar verwijst
   niet bestaat of dat een circulaire keten van links ontstaat. Vergelijk
   de uitvoer van ls -lL eens met ls -l.

-rwxr-xr-x 1 daniel users 769 Mai 29 example
-rwxr-xr-x 1 daniel users 769 Mai 29 voorbeeld

lrwxrwxrwx 2 daniel users   3 Jun 6 example -> wie
lrwxrwxrwx 2 daniel users   3 Jun 6 voorbeeld -> wie
     _________________________________________________________________

processen en hun in- en uitvoer

   We zagen al dat een programma in Unix wordt opgeslagen in een bestand.
   Een Unix proces is een lopend programma, met zijn data en de context
   waarin het draait zoals de huidige directory. Moderne
   besturingssystemen kunnen een proces verdelen in zgn. threads; en
   programma kan daarmee meerdere taken tegelijk uitvoeren, die hun data
   delen, wat al snel in een chaos kan ontaarden.

   De shell zal, met uitzondering van ingebouwde opdrachten, commando's
   uitvoeren door er aparte processen voor te starten. Shell scripts
   worden doorgaans in afzonderlijke processen (subshells) uitgevoerd.
   Ondanks dat Unix' multi-tasking efficiënter werkt dan huis-, tuin- en
   keuken besturingssystemen, maakt het voortdurende maken en opruimen
   van processen shell scripts een stuk langzamer dan andere
   programmeertalen.

   Als een extern programma is opgestart zal de shell gewoon wachten
   totdat hij een seintje ontvangt van de kernel dat het kindproces is
   gestorven c.q. beëindigd.

   Door een `ampersand' achter een commando te zetten als in voorbeeld&,
   zal het `in de achtergrond' worden verwerkt, en de shell onmiddellijk
   om de volgende opdracht vragen.

   Een voorbeeld van een ingebouwde opdracht is het commando cd.
   Beginners verbazen zich er soms over dat een cd opdracht binnen een
   shell script wel wordt uitgevoerd, maar het effekt ervan vergeten is
   als het script beëindigd is en terug keert naar de interactieve shell.

   Commando's in een script kunnen ook worden uitgevoerd met bijv. .
   ./voorbeeld. Hiermee worden de opdrachten in het bestand voorbeeld
   binnen de lopende shell uitgevoerd en werkt cd bijvoorbeeld wel. Een
   minder gebruikte mogelijkheid is om programma's (niet alleen scripts)
   te starten met de opdracht exec ervoor. Er wordt dan geen apart proces
   gemaakt, maar het nieuwe programma wordt in het lopende proces geladen
   en vervangt het, zodat het oorspronkelijke programma na afloop niet
   verder kan gaan.

   Tot de context van een proces behoren ook de standaard invoer-,
   uitvoer- en error-kanalen. Voor een interactieve shell verwijst de
   standaard invoer naar het toetsenbord en de uitvoer en error kanalen
   naar het beeldscherm. Als u bent ingelogd via een modem of netwerk,
   dan verwijzen deze kanalen naar uw scherm en toetsenbord in plaats van
   dat van de computer waarop de shell draait.

   Met ./voorbeeld <data >resultaat worden de kanalen omgeleid zodat de
   inhoud van het bestand data zal worden gelezen en de uitvoer in het
   bestand resultaat komt. Eventuele foutmeldingen komen nog op het
   scherm.

   De notatie ./voorbeeld <data > >resultaat 2>&1 & zegt dat het script
   in de achtergrond moet draaien. We zien toch geen resultaten. Het
   dubbele `groter dan' teken geeft aan dat de uitvoer achter de
   bestaande inhoud van resultaat moet komen in plaats van het bestand
   eerst te wissen.

   De aanduiding 2>&1 geeft aan dat het standaard error-kanaal (de tweede
   file-descriptor) een kopie is van nummer 1 (standaard uitvoer), dus
   foutmeldingen en resultaten verschijnen door elkaar heen in het
   bestand resultaat; het standaard-invoerkanaal heeft file-descriptor
   nummer 0. Kind processen erven file-descriptors (open bestanden); de
   standaard kanalen zijn altijd open. Als de standaard kanalen zijn
   omgeleid naar bestanden zijn toetsenbord en beeldscherm toch te
   benaderen door om te leiden naar het pseudo-bestand /dev/tty.

   Een here-document is een bijzonder geval van omleiding waarin de te
   verwerken gegevens in het script-bestand zelf staan.

fox=dog; dog=fox
cat < <woord
The quick brown $fox jumps over the lazy $dog.
...
woord

   De rest van het script tot aan woord wordt dan als invoer gebruikt
   voor het commando (bijv. cat). Het woord dat als markering dient moet
   letterlijk worden herhaald op een aparte regel. De shell zal wel
   eventuele substituties uitvoeren op de data.
     _________________________________________________________________

een les over `ls': jokertekens

   Het volgende commando is een eenvoudige vervanging voor ls.


echo * | tr  " " "\n" | column

   Het illustreert hoe de shell jokertekens of wildcards behandelt. Als
   er in een woord een jokerteken voorkomt, dan zal de shell dat woord
   vervangen door alle bestandsnamen in de huidige directory die
   overeenkomen met dat zoekpatroon.

   De * staat voor iedere reeks van nul of meer tekens, dus ls a*z geeft
   de lijst van alle bestanden waarvan de naam begint met een a en
   eindigt op z, zoals `alcatraz' (onder DOS/Windows kunt u de * alleen
   aan het eind gebruiken). Als er geen corresponderende bestanden zijn
   dan blijft de asterisk staan, bijv. echo Wie*dit*leest*is*gek 

   Het is mogelijk te voorkomen dat jokertekens worden vervangen door ze
   tussen aanhalingstekens te zetten of door er een backslash (\) voor te
   zetten; ls \* komt van pas, want een bestand met de naam * is niet
   uitgesloten.

   Een . corrrespondeert met een willekeurig teken, zodat de shell p?n
   kan vervangen door pan pen pin pon. Een reeks van tekens tussen rechte
   haken kan worden vervangen door één van die tekens, bijv. ls
   fig-[123456789].jpg door ls fig-1.jpg fig-2.jpg

   Let erop dat ls * ook de inhoud van subdirectory's weergeeft. ls geeft
   alleen files in de huidige directory en ls */ geeft de inhoud van alle
   subdirectory's.
     _________________________________________________________________

pijpleidingen

   Twee processen kunnen gemakkelijk via een pijp gekoppeld worden, zodat
   data die uit de standaard uitvoer van het eerste proces komen, door de
   standaard invoer van het tweede proces worden verwerkt, bijv.: ps -ef
   | sort

   Het eerste commando geeft een lijst van alle processen die momenteel
   draaien en het sort commando sorteert ze (op de inlognaam van de
   gebruiker; werkt helaas niet op alle Unix versies gelijk). Als in een
   pijp een commando wordt gebruikt dat een filenaam als argument nodig
   heeft, dan kan meestal `-' worden gebruikt om de standaard invoer aan
   te duiden; veel commando's gebruiken automatisch de standaard invoer
   als ze geen bestandsnaam meekrijgen.

   Een programma dat data van het standaard invoerkanaal leest en na een
   eenvoudige bewerking naar het standaard uitvoerkanaal schrijft noemen
   we een filter. Het eenvoudigste filter is cat, dat data onveranderd
   kopieert; sort is ingewikkelder.

   Een ander filter is dd;. Voor details zie [5]paragraaf split en dd;
   hier volgt een voorbeeld hoe je een bestand kunt converteren naar
   hoofdletters: dd conv=ucase <voorbeeld >gesorteerd 2>/dev/null

   Dd wordt onder Unix wel gebruikt om een floppy disk te kopiëren met dd
   if=/dev/fd0 of=image-file Vervolgens verwissel je de disks en kopiëert
   de image file terug naar floppy.

   Vergelijk het resultaat van find /bin | sort eens met ls -1 /bin/* en
   u ziet dat ls de gewoonte heeft de uitvoer te sorteren. Bij gebruik
   van een pijp wordt de uitvoer van het eerste proces opgeslagen in een
   kleine hoeveelheid buffergeheugen. Als dat vol is, wordt de producent
   stilgezet totdat de consument deze data heeft verwerkt.

   Om de uitvoer van een commando op het scherm te bekijken en tegelijk
   een kopie in een bestand te bewaren gebruikt men iets als ./voorbeeld
   2>&1 | tee resultaat

   Als u beschikt over het tooltje [6]netcat dan kunt u ook op eenvoudige
   wijze gegevens over een netwerk versturen. In plaats van prog1 | prog2
   start u op machine host netcat -v -l -p 1234 | prog2 en op de andere
   machine doet u prog1 | netcat host 1234 Hierin is 1234 de gebruikte IP
   poort: een min of meer willekeurig nummer, mits de betreffende poort
   nog ongebruikt is, en prog1 en prog2 zijn willekeurige commando's.
   Netcat fungeert hierin als een pijp tussen processen op verschillende
   computers.

   Alle Unix versies kennen de bovengenoemde anonieme pijp; sommige
   kennen ook een pijp die als een speciale file in het bestandssysteem
   voorkomt. Een pijp kan worden aangemaakt met mkfifo pijp of mknod pijp
   p Het mknod commando wordt ook gebruikt om speciale files van het
   block of character type aan te maken. Probeer maar eens welke output
   het file commando op een speciale file geeft.
     _________________________________________________________________

elementair shell programmeren

   In dit artikel wordt de shell geprogrammeerd met behulp van script
   files. Moderne shells bezitten bovendien de mogelijkheid om korte
   macro's te definiëren met de alias opdracht bijv. alias l='ls -alg '

   Aliassen kunnen ingewikkelde commando's vervangen door eenvoudiger te
   onthouden namen. Ze worden vaak gedefinieerd in ~/.profile, een shell
   script dat elke keer als iemand inlogt wordt uitgevoerd. Met unalias
   wordt de definitie weer verwijderd.
     _________________________________________________________________

variabelen

   De werking van de shell is vrij ingewikkeld. Er zijn verschillende
   manieren waarop de shell reeksen tekens zal vervangen door andere. Een
   daarvan is de expansie van aliassen: het kommando l ~/*/a* kan worden
   uitgeschreven tot bijvoorbeeld /bin/ls -alg /home/gast/agf/aardappel
   /home/gast/agf/aardbei /home/gast/agf/appel /home/gast/autos/audi

   De alias kwamen we zojuist tegen; aan 'ls' is hier het pad toegevoegd.
   De tilde staat voor de home directory, waarop de gebruiker `gast'
   inlogt; de uitdrukking `a*' wordt door de shell vervangen door een
   lijst van filenamen die met een a beginnen.

   Een variabele is een naam, die door de shell aan een reeks tekens
   wordt gekoppeld met bijv. L='ls -alg '

   Het kommando set zonder argumenten geeft een lijst van alle op dat
   moment gedefinieerde variabelen met hun waarden. De shell heeft zelf
   een aantal ingebouwde variabelen en andere variabelen worden bij het
   inloggen gedefinieerd, zoals $HOME, de home directory van de gebruiker
   en $PWD, de huidige directory.

   We zijn ook al de variabele $PATH tegengekomen, ook wel het zoekpad
   genoemd. De waarde van $PATH is een lijst van directory's, gescheiden
   door dubbele punten. Als een commando dat geen slash (/) in de naam
   heeft, niet is ingebouwd in de shell of als alias is gedefinieerd,
   wordt gezocht of het commando overeenkomt met de naam van een file in
   een van deze directory's.

   Hetzelfde kunt u doen met het which commando, dat echter niet op alle
   Unix systemen bestaat, of waarvoor soms een alternatief whence voor
   bestaat. Voorbeeld: which find

   De shell zal een dollarteken gevolgd door de naam van een variabele
   vervangen door de waarde van de betreffende variabele. Nu kunnen we
   hetzelfde effekt als voorheen krijgen met $L.

   Hadden we echter L de waarde `l' gegeven, dan zou het resultaat
   geweest zijn: l: command not found Bash en ksh brengen ons in dit
   geval verder met eval $L Hiermee wordt de uitdrukking `l' nog eens
   geëvalueerd, nadat de shell de waarde van L heeft gesubstitueerd. Een
   opdrachtregel als $apenkool zal niets doen en ook geen foutmelding
   opleveren als de betreffende variabele niet gedefinieerd is.

   We krijgen de waarde van de variabele L terug met echo $L. Het
   dollarteken maakt eigenlijk geen deel uit van de naam. Als we nu een
   script of ander programma aanroepen waarin de waarde van variabele L
   gebruikt wordt, zal die echter ongedefinieerd zijn, tenzij we eerst de
   opdracht export L geven om een lokale variabele te exporteren naar de
   programma-omgeving. Echo en export zijn ingebouwde functies van de
   shell.
     _________________________________________________________________

aanhaling

   In de vorige paragraaf werd de waarde die aan L werd toegewezen
   omgeven door enkele aanhalingstekens. Deze zijn nodig om van de
   uitdrukking één woord te maken, inclusief de spaties. Dubbele
   aanhalingstekens hadden ook voldaan. Het verschil is, dat binnen
   dubbele aanhalingstekens de variabelen nog steeds worden vervangen
   door hun waarde, en alleen tekst tussen enkele aanhalingstekens
   letterlijk wordt overgenomen.

   Tussen dubbele aanhalingstekens bestaat nog de mogelijkheid om aan te
   geven dat een enkel teken exact moet worden gekopiëerd; dit gebeurt
   door er een backslash voor te zetten als escape symbool.

   De programmeertaal C definieert een aantal escape symbolen, die ook in
   de shell kunnen worden gebruikt.

   \a (alert)
          <BELL> (laat een pieptoon horen)

   \b (backspace)
          <BS> verplaatst de cursor een stap terug. (`x\bx' kan worden
          gebruikt om een x vet af te drukken.)

   \f (formfeed)
          <FF> geeft een nieuwe pagina

   \n (newline)
          <LF> geeft een nieuwe regel

   \r (carriage return)
          <CR> verplaatst de cursor terug naar het begin van de regel

   \t (tabulator)
          <TAB> verplaatst de cursor naar de volgende tab-stop

   \t (vertical tab)
          <VT> verplaatst de cursor een stap omlaag

   Verder kunnen ASCII tekens worden aangeduid in octale notatie,
   bijvoorbeeld \007 (ook \a) voor het <BELL> teken.

   Hierbij zij aangetekend dat de echo opdracht van de shell van zichzelf
   een <LF> (regeleinde) toevoegt, tenzij er echo -n is gebruikt;
   gebruikers van bash moeten echo de -e vlag meegeven om de escapes te
   laten werken. Het resultaat kan verschillen als er oktale codes boven
   0200 worden gebruikt.

   Een speciale functie van de shell is de commando substitutie,
   aangegeven door achterwaartse aanhalingstekens, bijv. L=`l` Hier wordt
   een aparte subshell gestart, waarin het commando ls -alg wordt
   uitgevoerd; het resultaat is weer te zien met echo "$L"

   Probeer nu maar eens wat er gebeurt als de dubbele aanhalingstekens
   worden weggelaten. Een alternatieve notatie is om de te substitueren
   opdracht tussen $( en ) te zetten. Daarmee kunnen gesubstitueerde
   processen bovendien genesteld worden. Let op het verschil tussen de
   notaties $( lijst;van;commando's) en (lijst;van;commando's): beide
   voeren de opgegeven opdrachten uit in een aparte subshell, maar waar
   de uitvoer van de tweede variant gewoon tussen de standaard uitvoer
   verschijnt, wordt de uitvoer in het eerste geval een deel van de
   opdrachtregel.

   Om een variabele af te scheiden van de rest van de tekst kan deze
   worden omgeven door dubbele aanhalingtekens of door accolades, zodat
   de volgende uitdrukkingen alle de waarde van de variabele L evalueren
   en er de letters `OVE' achter plakken.

echo "$L"OVE
echo ${L}OVE
echo "${L}OVE"

   De beperkingen van de shell als programmeertaal worden duidelijk als
   je bij de variabele i 1 wilt optellen. Rekenen is mogelijk met behulp
   van het hulpprogramma expr, bijv. i=$(expr $i + 1) Let erop dat de
   shell spaties nodig heeft om de woorden te onderscheiden.
     _________________________________________________________________

parameters

   We hebben inmiddels enkele manieren gezien waarop de shell ingevoerde
   tekens bewerkt, zoals de substitutie van variabelen en verwijderen van
   aanhalingstekens. Vervolgens wordt een commando in woorden opgeknipt,
   waarbij witruimte de scheiding tussen de woorden aangeeft. De
   variabele IFS bevat de tekens die hierbij als scheidingsteken worden
   gebruikt, standaard zijn dit <SP>, <TAB> en <LF>. Let erop dat een
   uitdrukking tussen enkele of dubbele aanhalingstekens altijd als een
   woord wordt gezien, ook al bevat ze spaties. Twee aanhalingstekens
   direkt achter elkaar tellen als een woord met lengte nul (0).

   In een shell script zijn de parameters (c.q. argumenten en vlaggen)
   beschikbaar via de speciale variabelen $0 t/m $9 (en zonodig ook ${10}
   en hoger). $0 is de naam van het programma zelf. Daarmee is het
   mogelijk om bijvoorbeeld gunzip een link naar gzip te laten zijn en
   het programma verschillend te laten werken afhankelijk van de naam
   waarmee het is aangeroepen.

   De shell kent nog een aantal speciale parameters; we zijn $? al
   tegengekomen, dat telkens de exit status van het laatste uitgevoerde
   commando krijgt. $$ bevat het Unix proces nummer van de shell die uw
   script draait. Dit kan ook handig zijn om unieke filenamen te maken
   voor tijdelijke bestanden.

   De parameters $* en $@ leveren de complete parameterlijst op, met
   uitzondering van $0. Tussen dubbele aanhalings tekens gezet zal "$*"
   een woord opleveren dat overeenkomt met "$1 $2 $3...", terwijl "$@"
   een reeks woorden "$1" "$2" "$3"... geeft. De variabele $# geeft het
   aantal argumenten.

   Hieronder volgt een scriptje om met het gebruik van parameters door de
   shell te experimenteren. De shift opdracht gooit de eerste parameter
   weg en schuift de rest een positie op, met uitzondering van $0. De
   regel met while wordt nader toegelicht in [7]paragraaf herhalingen.

#!/bin/sh

echo "Script $0 aangeroepen met $# parameters:"

while [ $# -gt 0 ]
do
  echo -n "\"$1\" "
  shift
done
echo
exit

   Het verwerken van de parameterlijsten kan nog wat ingewikkelder
   worden. Zo kan met de notatie ${parameter:-woord} een standaardwaarde
   (default) worden aangegeven voor een weggelaten parameter of met
   {$parameter:?woord} een foutmelding worden gegeven als de parameter
   verplicht is, bijvoorbeeld

cp ${1:?"De eerste parameter is verplicht"} \
   ${2:-"."}

   Zoals gezegd wordt een opdracht beëindigd door een puntkomma of
   regeleinde. Hier is een backslash gebruikt om aan te geven dat de
   opdracht nog niet afgelopen is.
     _________________________________________________________________

als-dan

   De meest elementaire programma-constructie laat één of meer opdrachten
   al of niet uitvoeren, afhankelijk van de uitkomst van een test,
   bijvoorbeeld:

if /usr/bin/test "A" = "a"
then
  echo "Gelijk"
else
  echo "Verschillend"
fi

   Eerst wordt de opdracht achter if uitgevoerd. Er wordt dan gekeken
   welke exit status die opdracht oplevert. De meeste programma's geven
   standaard 0 terug, en 1 of een andere foutcode als er problemen zijn,
   /bin/true of : is altijd 0, en /bin/false altijd 1. echo 1 zal
   weliswaar 1 als output geven, maar het resultaat is 0.

   De opdracht(en) achter then worden enkel uitgevoerd als de if-opdracht
   0 oplevert, anders wordt het deel achter else uitgevoerd, maar het
   opnemen van een else-tak is niet verplicht. De if-constructie wordt
   pas uitgevoerd als het sleutelwoord fi is gelezen. In een interactieve
   shell krijg je een prompt string te zien om aan te geven dat de shell
   op de volgende opdracht wacht. Deze prompt wordt bepaald door de
   variabele PS1. Als een opdracht niet afgesloten is, krijgt u de prompt
   string PS2 te zien. De voorwaardelijke opdrachtregels worden hier
   ingesprongen om de leesbaarheid te verbeteren.

   De Bourne shell is een vrij beperkt programma. Voor eenvoudige
   berekeningen kan het hulpprogramma expr worden gebruikt en test voor
   testen en vergelijken. Moderne shells als ksh, bash of tcsh hebben
   deze faciliteiten vaak ingebouwd. In plaats van de notatie test
   expressie gebruiken ze [ expressie ]. De shell wil spaties zien tussen
   de verschillende onderdelen van een expressie, terwijl in de opdracht
   variabele=waarde juist geen spaties voor of na het =-teken mogen
   komen. Voor uitgebreidere informatie zie [8]paragraaf expr en
   [9]paragraaf test.

   Bovenstaand voorbeeld zal aangeven dat de strings "A" en "a"
   verschillend zijn. Hetzelfde geldt voor test "1" = "01" terwijl test
   "1" -eq "01" moet opleveren dat beide uitdrukkingen hetzelfde getal
   voorstellen. De opdracht test -e "$file" komt op hetzelfde neer als ls
   "$file" >/dev/null 2>&1. Zet variabelen tussen dubbele
   aanhalingstekens, anders zal het fout gaan als de variabele niet
   bestaat of leeg is.

   Er bestaan nog twee beknopte voorwaardelijke opdrachten: commando1 &&
   commando2 en commando1 || commando2 . In beide gevallen wordt eerst
   commando1 uitgevoerd. In het eerste geval wordt commando2 alleen
   uitgevoerd als het eerste exit status 0 (nul) oplevert, in het tweede
   geval als het resultaat van commando1 ongelijk is aan nul. Het
   resultaat is dus true als commando1 en c.q. of commando2 true
   opleveren.
     _________________________________________________________________

meerkeuze tests

   Om de waarde van een uitdrukking in de standaard uitvoer te krijgen
   wordt de echo opdracht gebruikt. Om een waarde van de standaard invoer
   te lezen en toe te kennen aan een of meer variabelen wordt read naam1
   naam2... gebruikt. De variabelen krijgen dan elk een woord van de
   invoer als waarde. Als er geen variabelen worden opgegeven, wordt er
   een regel gelezen en in z'n geheel toegekend aan REPLY.

   De if constructie kan met meerdere tests worden uitgebreid:

if test1
then
  commando1
else
  if test2
  then
     commando2
  else
  ...
  fi
fi

   Dit kan ook korter worden genoteerd.


if test1
then
  commando1
elif test2
then
  commando2
else
  ...
fi

   Om de inhoud van een variabele met meerdere waarden te vergelijken
   gebruiken we de case constructie, zoals in het volgende voorbeeld.

echo -n $vraag          # variabele moet gedefinieerd zijn
read antwoord
antwoord=$(expr substr "$antwoord" 1 1 | tr \
  "[a-z]" "[A-Z]")
case $antwoord in
[YJDOS] )
  exit 0 ;;
N )
  exit 1 ;;
* )
  echo "Ongeldig antwoord!" 1>&2
  exit 2 ;;
esac

   Hier wordt een vraag gesteld en een antwoord van de gebruiker
   ingelezen, waarvan de eerste letter wordt genomen en kleine letters in
   hoofdletters vertaald. De case constructie vergelijkt antwoord met een
   aantal patronen en voert de reeks bijbehorende opdrachten uit, die
   wordt afgesloten met een dubbele puntkomma.

   Y (yes), J (ja), D (da), O (oui) of S (si) retourneren exit status 0
   (true), N (nein of njet) retourneren 1 (false) en alle andere invoer
   komt overeen met de asterisk en resulteert in 2 met bijbehorende
   foutmelding op het standard error kanaal.

   Een variant hierop is de select constructie, die niet in de originele
   Bourne shell voorkomt, waarmee eenvoudige menu's kunnen worden
   gemaakt.

echo -n $vraag
select woord in ja nee
do
  if /usr/bin/test "$woord" != ""
  then
    break
  fi
done

   Hier wordt de keuze van de gebruiker beperkt tot 1 (ja) of 2 (nee).
   Let op dat "$woord" hier tussen aanhalingstekens moet staan omdat de
   vergelijking anders niet goed gaat als de waarde van de variabele een
   lege string is (gebruiker heeft ongeldige invoer gepleegd).
     _________________________________________________________________

herhalingen

   In het voorbeeld hierboven wordt de invoer zo lang herhaald, totdat de
   gebruiker een geldige waarde heeft ingevoerd. Een meer algemene
   herhaling wordt geschreven als

while test
do
  opdracht1
  ...
  opdrachtn
done

   Hierin wordt telkens de opdracht achter while herhaald en zo lang als
   het resultaat 0 of true oplevert wordt de reeks opdrachten tussen do
   en done herhaald, wat dus ook nul keer het geval kan zijn en de test
   (inderdaad is dat vaak het test commando) wordt altijd een keer meer
   uitgevoerd dan de opdrachten. Een voorbeeld van het gebruik van while
   zagen we in [10]paragraaf parameters.

   De until constructie lijkt hier sterk op. Hierin wordt de lijst van
   opdrachten herhaald zolang als het resultaat ongelijk is aan 0. De
   uitvoering van het script gaat dan verder met de opdracht na `done'.

until test
do
  opdracht1
  ...
  opdrachtn
done

   De for constructie wordt ook vaak gebruikt.

for variabele in lijst
do
  opdracht1
  ...
  opdrachtn
done

   Achter for staat de naam van een variabele zonder dollarteken. Bij
   elke doorgang krijgt de variabele de waarde van het volgende woord in
   de lijst. We geven enkele voorbeelden.

for file in *
do
  if [ -f "$file" ]
  then
    wc "$file"
  fi
done

   Hier wordt voor elke file in de huidige directory het commando wc
   uitgevoerd, dat het aantal regels, woorden en tekens in het bestand
   telt. Gebruik van wc * is niet zo netjes omdat dan ook directory's en
   speciale files worden meegenomen.

for i in 1 2 3 4 5 6 7 8 9 10
do
  for j in 1 2 3 4 5 6 7 8 9 10
  do
    echo -n $( expr $i '*' $j) " "
  done
  echo
done

   Herhalingsopdrachten kunnen prima genest worden zoals in bovenstaand
   voorbeeld, dat de tafels van vermenigvuldiging afdrukt. Let op de
   enkele aanhalingstekens rond het sterretje. Er staat -n achter echo om
   de tafels op één regel te houden en er wordt een spatie tussenruimte
   ingevoegd.

   Als het woord in en de volgende lijst afwezig zijn dan krijgt de
   variabele achtereenvolgens de parameters toegewezen waarmee het script
   werd aangeroepen, zodat we het programma van [11]paragraaf parameters
   kunnen herschrijven als

echo "Programma $0 is aangeroepen met $# parameters"
for i
do
  echo $i
done

   Een while lus kan oneindig doorlopen als voor de test : of /bin/true
   wordt ingevuld. Een lus kan voortijdig worden verlaten met de break
   opdracht; met break 2 wordt in geval van twee geneste lussen de
   buitenste verlaten, enzovoorts. De opdracht continue zorgt ervoor dat
   de lijst opdrachten niet verder wordt afgewerkt en het script verder
   gaat met de test.
     _________________________________________________________________

samenstellingen

   Tot de samengestelde commando's behoren if, case, select, while, for,
   until en de functies, die verderop aan bod komen. Het simpelste
   samengestelde commando is

{
  opdracht1
  ...
  opdrachtn
}

   Het groep commando zal de commando's in de groep na elkaar uitvoeren.
   De exit status van de laatste opdracht is tevens het resultaat van de
   groep. Zo kan bijvoorbeeld een pijplijn als een opdracht worden
   behandeld met { opdracht1 | opdracht2; }.

   Als een lijst commando's in plaats van accolades tussen ronde haken ()
   wordt gezet, worden die binnen een aparte subshell uitgevoerd. Dit
   geldt ook voor $( lijst ). In het laatste geval wordt de uitvoer van
   de lijst als deel van het script gebruikt.
     _________________________________________________________________

functies

   De definitie van een functie bestaat uit diens naam met een paar haken
   erachter, doorgaans gevolgd door een lijst commando's.

functie-naam()
{
  opdracht1
  ...
  opdrachtn
}

   Een functieaanroep bestaat uit de naam van de functie gevolgd door de
   eventuele argumenten gescheiden door spaties. De betreffende
   commando's worden dan één voor één in de huidige shell uitgevoerd,
   waarna het script verder gaat waar het gebleven was. Binnen de functie
   zijn de argumenten beschikbaar als $1 ...

   De uitvoering van de functie stopt bij de afsluitende accolade of na
   een return opdracht, die bij voorkeur de laatste opdracht binnen de
   functie vormt. Achter return kan eventueel een exit status volgen, die
   aan het aanroepende script beschikbaar komt in $?. De exit status is
   altijd een geheel getal. Als een string als resultaat gewenst is, kan
   dat resultaat bijvoorbeeld met echo worden uitgevoerd en de functie
   via commando substitutie worden aangeroepen. In plaats van for i in 1
   2 3 4 5 6 7 8 9 10 kan for i in `range 1 10` worden geschreven met de
   volgende functie:

range()
{ typeset i i

  i=$1
  while [ "$i" -le "$2" ]
  do
    echo $i
    i=`expr "$i" + 1`
  done
  unset i
}

   Het kan handig zijn om functiedefinities in een apart bestand functies
   te zetten en die met ./functies of source functies in te lezen. Bash
   zal een naam eerst proberen te koppelen aan een alias, dan een functie
   en als laatste een bestand met dezelfde naam gaan zoeken in zijn pad.

   Binnen de functie zijn dezelfde variabelen als in de rest van het
   script te gebruiken en gewijzigde waarden blijven ook na afloop
   bestaan. In de Korn en Bash shell kunnen ook lokale variabelen worden
   gedeclareerd met de typeset opdracht, die alleen binnen de
   functiecontekst bestaat. In Bash kan hetzelfde ook met local worden
   bereikt. Een lokale variabele maskeert een eventuele globale variabele
   met dezelfde naam.
     _________________________________________________________________

enkele voorbeelden

   Het volgende voorbeeldprogramma geeft de namen van de ingelogde
   gebruikers. Na een tweetal functiedefinities volgt het hoofdprogramma,
   dat bestaat uit een pijp van vijf segmenten.

word()
{ if [ "$#" -gt 1 ]
  then
    i=0; n=$1; shift
    for j in $@
    do
      if [ $i = $n ]
      then
        echo "$j"
        break
      else
        i=$(expr $i + 1)
      fi
    done
  fi
}

item()
{ OFS=$IFS; IFS=":"
  NR=$1; shift

  word $NR "$@"
  IFS=$OFS
}

# het hoofdprogramma 
who \
| while read LINE1
  do
    while read LINE2
    do
      if [ "$(word 0 "$LINE1")" =
           "$(item 0 "$LINE2")" ]
      then
        echo -e "$(item 0 "$LINE2")\011$(item 4
          "$LINE2")"
      fi
    done </etc/passwd
  done \
| sort \
| uniq -c

   De functie word retourneert het 1^e argument, dat wordt gebruikt om
   een regel in woorden te splitsen; handiger dan daar awk voor te
   gebruiken. De functie item maakt handig gebruik van de ingebouwde
   shell variabele IFS om de dubbele punt in plaats van de spatie als
   scheidingsteken te gebruiken. Het hoofdprogramma doet niets anders dan
   uit de uitvoer van who de username te knippen en die te vergelijken
   met het corresponderende veld uit /etc/passwd. De uitvoer wordt dan
   gesorteerd en dubbele regels verwijderd.

   Deze functies worden ook weer gebruikt in het volgende script voor
   systemen die niet over een which commando beschikken (zie
   [12]paragraaf variabelen). Dit script houdt echter geen rekening met
   aliassen en ingebouwde functies van de shell.

which_p()
{ f=0
  while :
  do
    f=`expr $f + 1`
    dir=`item "$f" "$PATH"`
    if [ "$dir" = "" ]
    then
      break
    fi
    path=$dir/$1
    if [ -f "$path" ]
    then
      echo "$path"
      break
   fi
done
}

# het hoofdprogramma `which'
if [ `expr match "$1" '.*/.*` -gt 0 ]
then
  if [ -f "$1" ]
  then
    echo "$1"
  fi
else
  echo `which_p "$1"`
fi

   Het volgende programma toont verschillen tussen twee bestanden, maar
   het is een stuk beperkter dan het diff commando. Hier wordt zoals
   uitgelegd in [13]paragraaf processen en hun in- en uitvoer het
   standaard invoerkanaal omgeleid naar het bestand dat als eerste
   argument op de commandoregel is meegegeven en er het tweede bestand
   wordt gekoppeld aan het derde invoerkanaal.

doit()
{ LINE=0
  while read EEN<&0
  do
    LINE=`expr $LINE + 1`
    read TWEE<&3
    if [ "$EEN" != "$TWEE" ]
    then
      echo "$LINE""c""$LINE"
      echo "< $EEN"
      echo "---"
      echo "> $TWEE"
    fi
  done
}

# hoofdprogramma                                        
if [ "$#" -ne 2 ]
  then
  echo "Usage: $0 file1 file2"
  exit 1
fi
if [ -r "$1" -a -r "$2" ]
then
  doit 0<$1 3<$2
  exit 0
else
  echo "Invoerbestand(en) onleesbaar"
  exit 1
fi
     _________________________________________________________________

een voorbeeld van een recursieve functie

   Een functie mag ook zichzelf aanroepen (recursie), waarbij je moet
   voorkomen dat dat proces oneindig doorgaat. In onderstaand voorbeeld
   voor bash en ksh vindt de recursie alleen plaats als $1 > 0 en wordt
   het argument verlaagd om te zorgen dat na een aantal stappen $1 gelijk
   wordt aan 0.

Hanoi()
{ typeset i aantal

  if [ "$1" -gt "0" ]
  then
    aantal=$(expr $1 - 1)
    Hanoi "$aantal" "$2" "$4" "$3"
    echo "Verplaats een schijf van $2 naar $3"
    Hanoi "$aantal" "$4" "$3" "$2"
  fi
}
# Aanroepen met: 
Hanoi 4 "A" "B" "C"

   Voor wie het spel de Torens van Hanoi nog niet kent: je hebt een toren
   van 4 (of 64, maar dan duurt het spel erg lang) gouden schijven van
   verschillende diameter, die je één voor één van stapel A naar B moet
   verplaatsen, waarbij nooit een grotere schijf bovenop een kleinere mag
   komen te liggen. De optimale oplossing is om de bovenste drie schijven
   eerst recursief van A naar C te verplaatsen, waarna de onderste schijf
   van A naar B kan worden verplaatst en de rest weer recursief van C
   naar B.

   Om te bewijzen dat een recursief algorithme korrekt is, is inductie
   nodig. Het is triviaal in te zien dat het algorithme een stapel van
   nul schijven van A naar B verplaatst door niets te doen. Voor n > 0
   verplaats je eerst de bovenliggende (n - 1) schijven van A naar C en
   na het verschuiven van de ne, weer van C naar B. Als we mogen aannemen
   dat het verplaatsen van (n - 1) schijven korrekt wordt uitgevoerd, dan
   gaat werkt het op deze manier ook voor een toren van n schijven.

   De inductieregel stelt, dat aangezien het algorithme het gewenste
   effekt heeft voor n = 0 en dat voor elke n >= 0 geldt, dat als het
   goed gaat voor n, ook een toren van (n + 1) schijven korrekt wordt
   verwerkt. Op dezelfde manier is te bewijzen dat als elke schijf groter
   is dan de schijf erboven, het algorithme nooit een grotere schijf
   bovenop een kleinere zal leggen: de toren van (n - 1) schijven is
   altijd kleiner dan de onderste en de onderste schijf komt nooit ergens
   bovenop te liggen.

   Uit het algorithme volgt een recurrente betrekking voor het aantal
   verplaatsingen:

   V(0) = 0
   V(n) = 2 × V(n-1) + 1

   Door een tabel te maken van de waarden voor verschillende n zie je al
   snel dat dit overeenkomt met V(n) = 2^n-1, wat vervolgens geverifiëerd
   kan worden.

   V(0) = 2^0-1 = 0
   V(n) = 2 × (2^n-1-1) + 1 = 2^n - 1

   Bewijzen dat er geen snellere weg bestaat, is moeilijker. Het kritieke
   pad is het verplaatsen van de onderste schijf van A naar B. Voor dat
   het zover is, moeten de schijven erboven eerst op één of andere manier
   naar C worden verplaatst en daarna weer naar B. Een van de weinige
   alternatieven is om eerst van A naar C te verplaatsen, en daarna van C
   naar B, maar dat maakt het enkel langer. Welke keuze je ook maakt, het
   heeft geen invloed op het verplaatsen van de resterende schijven.
     _________________________________________________________________

signalen

   We hebben al gezien hoe we processen in de achtergrond kunnen starten
   en kennis gemaakt met een manier om de manier om twee processen te
   coördineren door middel van een pijp: het eerste proces mag zolang in
   de pijp schrijven totdat de kleine buffer vol is; dan zal Unix het
   stoppen totdat er weer voldoende ruimte vrij is. Het lezende proces
   wordt telkens als de pijp leeg is in de wacht gezet.

   De meeste vormen van interprocescommunicatie vergen een hogere
   programmeertaal. Voor de shell programmeur zijn de signalen het
   belangrijkst. Unix heeft twintig tot dertig voorgedefinieerde signalen
   plus twee vrij definieerbare. Met de opdracht kill signaal proces
   stuur je een signaal naar het opgegeven proces. De nummers van de
   processen zijn met ps te achterhalen. Het nummer van het proces zelf
   is te vinden in de variabele $$ en in bash zit het ouderproces in
   $PPID. De nummers van de signalen verschillen enigszins per Unix
   versie; de signalen kunnen ook met symbolische namen worden aangeduid;
   voor bash beginnen die met de letters SIG, maar in de korn shell moet
   dit voorvoegsel worden weggelaten.

   Het effekt van een signaal is in de meeste gevallen dat het opgegeven
   programma onmiddellijk wordt beeindigd. Voor SIGKILL (9) is dit altijd
   het geval. Het ligt voor de hand dat alleen root het recht heeft om
   andermans processen te doden. Het besturingssysteem kan zelf besluiten
   een proces een signaal te geven. Als een programma stopt met
   segmentation violation, bus error, floating point exception of illegal
   instruction duidt dat meestal op een programmeerfout; shell scripts
   veroorzaken deze fouten zelden.

   De gebruiker heeft een snellere manier om signalen naar het proces op
   de voorgrond te sturen. Deze kunnen vrij worden veranderd met het
   commando stty. Met stty -a krijg je een lijst van de ingestelde
   waarden, bijvoorbeeld Ctrl-D voor SIGHUP, Ctrl-C of Del voor SIGINT,
   Ctrl-\ SIGQUIT. Met Ctrl-Z wordt een lopend programma tijdelijk
   onderbroken. Onder bash kan een script zichzelf onderbreken met de
   suspend opdracht. De ingebouwde opdrachten met fg en bg zetten een
   onderbroken job voort in de voor- resp. achtergrond.

   Met de opdracht sleep seconden wordt een programma tijdelijk
   onderbroken en zal het na het opgegeven aantal seconden met SIGALRM
   worden gewekt. De wait opdracht onderbreekt een proces zolang totdat
   het van Unix het signaal SIGCHLD krijgt dat het opgegeven kind proces
   of job in de achtergrond beëindigd is. Wait zonder argumenten wacht
   totdat alle kinderen afgestorven zijn. Als een proces in de voorgrond
   gestart is, wacht de ouder zonder expliciet wait commando.

   Een proces kan ervoor kiezen bepaalde signalen gewoon te negeren, met
   uitzondering van SIGKILL en SIGSTOP. Het SIGHUP signaal dat aangeeft
   dat een terminalgebruiker de (telefoon)verbinding heeft opgehangen
   wordt genegeerd met nohup commando&. De standaard uitvoer en error
   kanalen worden dan omgeleid naar het bestand nohup.out.

   Signalen worden asynchroon verwerkt, onafhankelijk van waar een proces
   mee bezig was en na afloop gaat het programma verder waar het gebleven
   was, tenzij het beëindigd is.

   Met het commando trap commando signa(a)l(en) wordt aangegeven dat een
   bepaald commando moet worden uitgevoerd als het volgende signaal c.q.
   één van de signalen wordt ontvangen. Dit zal vaak de naam van de
   functie zijn die het betreffende signaal moet afhandelen. Als een
   script voortijdig moet worden afgebroken zal zo'n functie bijvoorbeeld
   tijdelijke bestanden verwijderen.

   Trap heeft geen effekt op kind processen. Als het commando - luidt of
   ontbreekt, dan wordt de oorspronkelijke handelwijze hersteld. Als het
   commando een lege string is, dan zal de lijst van signalen door het
   script worden genegeerd.
     _________________________________________________________________

enkele Unix tools

   De Unix shell is van oudsher de enige programmeertaal zonder
   ingebouwde optelling. Optellen en een eindeloze reeks andere functies
   kunnen echter gerealiseerd worden door externe programma's. De
   verzameling van tools die standaard met Unix worden geleverd vormen
   een k rachtig en flexibel geheel. Dit hoofdstuk behandelt er een paar
   die vooral geschikt zijn voor gebruik in scripts; het pretendeert niet
   volledig te zijn.

   Een modale Unix commandoregel begint met de naam van het programma,
   gevolgd door de opties, die met een min-teken beginnen, met daarna de
   overige parameters, die vaak bestanden zijn. Veelal mogen er ook
   meerdere bestanden voorkomen. De opties mogen in willekeurige volgorde
   worden gebruikt en opties van één letter gecombineerd van prog -a -b
   file tot bijv. prog -ab file. Verder kunnen argumenten aan opties
   worden gekoppeld met iets als prog -a -variabele=waarde -b ... of prog
   -a -variabele waarde -b ...; let op wanneer je wel of geen spaties
   moet gebruiken.
     _________________________________________________________________

expr

   Wie een rekenmachine zoekt gebruikt meestal bc of xcalc. Expr is
   speciaal voor shell scripts. Elk argument is een getal of een
   operator, en moet door spaties gescheiden worden; speciale tekens
   moeten door backslashes worden voorafgegaan. Expr kent geen
   variabelen; daarvoor zijn shell variabelen. Om een getal met drie te
   vermenigvuldigen gebruiken we iets als i=`expr "3" \* "$i"`

   De rekenkundige operatoren + voor optellen, - voor aftrekken, * voor
   vermenigvuldigen, / voor delen en % voor rest werken met gehele
   getallen. De vergelijkingsoperatoren >, <, >=, <=, = (in GNU expr ook
   ==) en != kunnen ook voor strings worden gebruikt. In tegenstelling
   tot de shell retourneren ze een 1 als de vergelijking waar is en
   anders 0, evenals de operatoren | (logische `of') en & (logische
   `en'). In plaats van een nul mag de lege string worden gebruikt en
   expressies kunnen tussen haakjes ( ) gezet worden. Let op dat in if
   $(expr "$i" = "") de aanhalingstekens om de variabelenaam niet gemist
   kunnen worden.

   De Korn shell en bash hebben ook een ingebouwde rekenfunctie: de te
   berekenen uitdrukking wordt omgeven door $(( en )). Hier worden geen
   aanhalingstekens gebruikt en de spaties zijn niet vereist. Er zijn
   extra operatoren: = staat voor toewijzing, dus voor vergelijking wordt
   == gebruikt. Behalve in de decimale notatie kunnen getallen ook octaal
   worden genoteerd door ze met 0 te beginnen of hexadecimaal door er 0x
   voor te zetten. Het gebruik van de ingebouwde functie bespaart Unix de
   tijd voor het maken van het `expr' proces.

   Expr kent ook een patroonherkenning operator : die een string
   vergelijkt met een reguliere expressie (zie [14]paragraaf grep en
   reguliere expressies). Deze operator levert het aantal tekens dat
   overeenkomt op.

   Modernere versies van expr bezitten een aantal string functies.

   match string regexp 
          een alternatieve notatie voor patroonherkenning

   substr string begin lengte 
          retourneert een deel van de string van lengte tekens vanaf
          positie begin; posities worden vanaf 1 geteld

   index string tekens 
          retourneert de eerste positie in de string waar één van de
          reeks tekens voorkomt

   length string 
          retourneert het aantal tekens in de string
     _________________________________________________________________

test

   Het test commando, dat wordt gebruikt in voorwaardelijke opdrachten,
   zijn we al tegengekomen. Let op dat test een ingebouwde functie van
   moderne shells als bash of ksh is, die erg lijkt op /usr/bin/test. Die
   ingebouwde test functie kan ook worden genoteerd als [ expressie ]. De
   eerste toepassing is om te testen of een bestand bestaat.

   -d file 
          waar als de file een directory is

   -f file 
          waar als de file een normaal bestand is

   -r file 
          waar als je het recht hebt om de file te lezen

   -w file 
          waar als je het recht hebt om naar de file te schrijven

   -s file 
          waar als het bestand niet leeg is

   -t kanaal 
          waar als het kanaal (file descriptor) aan een terminal
          gekoppeld is. Unix koppelt elk bestand dat geopend wordt aan
          een nummer. Om te lezen of te schrijven verwijs je naar dat
          nummer. een bestand kan evt. dubbel geopend zijn. De shell zal
          bij het inloggen kanaal 0 openen voor invoer van de terminal en
          1 en 2 openen voor uitvoer naar de terminal; voor commando
          <file zal de shell het bestand openen met nummer 3 of hoger,
          het commando uitvoeren en de file weer sluiten.

   Hedendaagse Unices hebben wat meer opties. De tweede groep tests
   vergelijkt strings.

   string1 = string2 
          waar als beide strings gelijk zijn

   string1 != string2 
          waar als beide strings verschillen

   string1 
          waar als de string niet de lege string "" is

   -n string1 
          waar als de lengte van de string gen nul bedraagt

   Om in plaats van strings gehele getallen te vergelijken worden de
   operaties -eq, -ne, -gt, -ge, -lt, -le gebruikt. Getallen worden als
   strings weergegeven. Het verschil is dat test "02" -eq "2" 0 (true)
   zal opleveren en /usr/bin/test "02" = "2" 1 (false). Dit resultaat
   krijgt u te zien met echo $?. /usr/bin/expr "02" = "2" zal op de
   standaard uitvoer 1 (true) schrijven en de exit status 0 (true)
   retourneren.

   De vierde groep zijn de verbindingen. ! expressie staat voor logische
   negatie, expressie1 -a expressie2 vormt een logische en en expressie1
   -o expressie2 een logische of. Verder kunnen subexpressies tussen ( )
   haakjes worden gezet.
     _________________________________________________________________

grep en reguliere expressies

   Grep is een tool om in tekstbestanden te zoeken; met binaire bestanden
   kunnen veel van de hier besproken tools problemen geven. U kunt het
   strings commando gebruiken om leesbare tekstfragmenten te vissen uit
   alle soorten files.

   Sinds het ontstaan van Unix zijn er veel versies met verschillende
   kenmerken in omloop en bovendien zijn er egrep, fgrep en agrep bij
   gekomen. Ten behoeve van de portabiliteit zijn egrep of fgrep aan te
   bevelen.

   Hieronder volgt de syntaxis van de fgrep opdracht. De rechte haken
   geven aan dat een onderdeel optioneel is en worden in een echte
   opdrachtregel niet opgeschreven, evenmin als cursieve termen
   letterlijk worden genomen.

   fgrep [ optie ...] string ... [ file ...]

   Fgrep is het beperktste en tevens snelste lid van de familie. Als er
   een enkele string als argument wordt meegegeven functioneert het als
   een filter dat van de regels in de invoer degene doorlaat die de
   opgegeven string bevatten.

   Er kan op meerdere strings worden gezocht, die dan worden gescheiden
   door een regeleinde. De strings moeten dan tussen aanhalingstekens
   worden gezet om een argument te vormen en alle regels die één van de
   strings bevatten worden afgedrukt. Fgrep kent de volgende opties.

   -v
          alle regels afdrukken, behalve degene die de gezochte strings
          bevatten

   -c
          alleen het aantal regels afdrukken

   -l
          de namen van de files afdrukken, die de gezochte strings
          bevatten

   -i
          geen onderscheid maken tussen hoofd- en kleine letters

   -w
          regels waarin de zoekstring een deel van een woord vormt tellen
          niet mee

   -x
          alleen regels die helemaal gelijk zijn aan de zoekstring tellen
          mee

   Er bestaan meer opties, maar die verschillen per systeem. Als je wilt
   testen of een bepaalde string in een bepaalde file voorkomt kun je de
   -s (silent) optie gebruiken (BSD), of -q (quiet, GNU) om de standaard
   uitvoer te onderdrukken.

   Het volgende voorbeeld geeft een lijst van al je processen. (de juiste
   opties van ps hangen af of je OS tot de System V of BSD familie
   behoort)

   ps -al | fgrep `fgrep $USER /etc/passwd | cut -f 3 -d ':'`

   De binnenste fgrep selekteert de regel van de ingelogde gebruiker uit
   het wachtwoordbestand. Cut knipt daaruit het derde veld, waarbij de
   dubbele punt als scheidingsteken wordt gebruikt. De buitenste fgrep
   selecteert de regels met dit User ID uit de uitvoer van ps. Vergelijk
   met het voorbeeld uit [15]paragraaf enkele voorbeelden.

   De functionaliteit van grep zelf verschilt nogal per systeem, en
   daarom wordt hier het uitgebreidere egrep besproken. De opties zijn
   hetzelfde, maar het zoekt naar reguliere expressies in plaats van
   alleen letterlijke strings. Reguliere expressies lijken op de
   wildcards (jokertekens, zie [16]paragraaf een les over `ls':
   jokertekens) * en ? die de shell gebruikt om naar bestandsnamen te
   zoeken, maar de notatie verschilt sterk. Denk eraan de zoekstring
   tussen enkele aanhalingstekens te zetten om verhaspelen door de shell
   te voorkomen. Het kan geen kwaad om zelf eens wat te proberen op een
   grote woordenlijst.

egrep -i 'abc
def' /usr/share/dict/words

   Hiermee zoeken we naar alle woorden waarin de letters abc en/of def
   direkt achter elkaar staan. De woordenlijst zou ook in bijv.
   /usr/dict/words kunnen staan.

   Reguliere expressies moeten voldoen aan de volgende regels.

     * Een enkel teken dat geen speciale functie heeft, komt overeen met
       dat teken zelf
     * Om te zoeken naar een teken dat een speciale functie heeft, moet
       je er een \ voorzetten, bijv. egrep '\\'
     * Een reeks tekens tussen vierkante haken wordt gebruikt om te
       zoeken naar een enkel teken uit deze reeks, zo correspondeert
       [0123456789] met een enkel cijfer.
     * Tussen vierkante haken kan een reeks tekens worden aangegeven met
       een koppelteken tussen het eerste en laatste teken, bijv. [0-9].
     * Een punt correspondeert met een willekeurig teken, bijv.
       .a.b.c..de met `barbecuede'.
     * De reguliere expressie exp1exp2 correspondeert met string1string2
       als exp1 correspondeert met string1 en exp2 correspondeert met
       string2, waarbij string1 de langst mogelijke string is waarvoor
       nog een correspondentie met exp2 mogelijk is.
     * De reguliere expressie (exp) correspondeert met alle strings die
       corresponderen met exp.
     * De reguliere expressie exp1|exp2 correspondeert met alle strings
       die corresponderen met exp1 of exp2. Iets handiger dan een
       regeleinde.
     * De reguliere expressie exp1* correspondeert met alle strings die
       nul of meer keer corresponderen met exp1. Zo komt a.*b.*c.*d.*e
       overeen met o.a. `Abcoude' en blijkt bijv. egrep `(bla)*(bla)'
       dezelfde output op te leveren als fgrep bla.
     * De reguliere expressie exp1+ is equivalent met exp1(exp1)*.
     * De reguliere expressie exp1? is equivalent met exp1|().
     * De reguliere expressie exp1\{aantal1\} is equivalent met exp1
       aantal1 keer achter elkaar.
     * De reguliere expressie exp1\{aantal1,\} is equivalent met exp1
       aantal1 of meer keer achter elkaar.
     * De reguliere expressie exp1\{aantal1,aantal2\} is equivalent met
       exp1 minstens aantal1 en hoogstens aantal2 keer achter elkaar.
     * De reguliere expressie ^exp1 correspondeert met alle regels waarin
       exp1 aan het begin van de regel voorkomt.
     * De reguliere expressie exp1$ correspondeert met alle regels waarin
       exp1 aan het eind van de regel voorkomt.

   Een uitbreiding op de Reguliere Expressies, die oudere Unices missen,
   zijn de karakter klassen die een uitbreiding vormen van de lijsten
   karakters.

   [[:alpha:]]
          de letters van het alfabet

   [[:upper:]]
          de hoofdletters

   [[:lower:]]
          de kleine letters

   [[:digit:]]
          de cijfers

   [[:xdigit:]]
          de hexadecimale cijfers

   [[:punct:]]
          de leestekens

   [[:graph:]]
          de zichtbare tekens

   [[:print:]]
          de afdrukbare tekens (zichtbare tekens plus de spatie

   [[:blank:]]
          de spatie en het tabulatie-teken

   [[:space:]]
          alle witruimte ([[:blank:]] plus vertical tab en form feed

   [[:cntrl:]]
          de stuurtekens

   Welke tekens tot deze klassen behoren is afhankelijk van uw locale.
   Als Unix uw moedertaal is, dan typt u export LANG=C of export
   LANG=POSIX. De klasse [:upper:] bevat dan alleen de ASCII tekens A -
   Z, maar met export LANG=nl_NL worden ook de diakritische tekens als
   ÄÛÉÒÑÅßÇijROOEIi met ASCII nummers boven 127 toe gerekend. Ook de
   volgorde van de output van sort -d -f is afhankelijk met de ingestelde
   locale.

   De equivalentie klassen zijn eveneens afhankelijk van de locale en
   worden door GNU nog niet goed ondersteund. De notatie [[=letter=]]
   duidt de verzameling van tekens aan die in het woordenboek op de
   zelfde plaats komen, zoals hoofdletters en letters met een accent.

   De GNU versie heeft weer een uitgebreidere set van regels, waaronder
   de mogelijkheid om terug te refereren naar een eerdere RE tussen
   haakjes met een backslash gevolgd door het nummer van die expressie,
   bijv. ([a-z]) is een \1.*" correspondeert met regels als `a is een
   aapje, dat eet uit zijn poot', `b is een bakker, die bakt voor ons
   brood'.

   Nog uitgebreider dan egrep is [17]agrep, een algorithme van Sun Wu en
   Udi Manber. Hiermee kun je zoeken op strings die ongeveer gelijk zijn
   aan het zoekpatroon.

   De belangrijkste extra optie is het maximum toegestane aantal fouten
   (letters die je moet wijzigen, toevoegen, vervangen om ze met het
   zoekpatroon te laten overeenkomen). Als eerste optie wordt dan -1, -2,
   ... aangegeven.

   Een andere extra optie is mogelijkheid te zoeken naar alle strings die
   een uitbreiding van het zoekpatroon bevatten. In plaats van egrep
   'a.*b.*c.*d.*e' schrijf je dan agrep -p 'abcde'.
     _________________________________________________________________

find en xargs

   Een van de meest voorkomende taken van shell scripts is het zoeken
   naar bepaalde bestanden en het bewerken ervan. Script programmeurs
   gebruiken hiervoor liever find dan ls. Find zoekt een directory en
   diens subdirectory's recursief af en levert als uitvoer een reeks
   padnamen (namen van bestanden plus directory's) die aan bepaalde
   criteria voldoen. De uitvoer wordt niet gesorteerd.

   Om een commando uit te voeren op elk van de gevonden bestanden zou je
   iets kunnen doen als

for bestand in `find ....`
do
  commando $bestand
done

   Dit heeft het nadeel dat de output van find potentieel enorm lang kan
   zijn, terwijl shells maar een beperkte lengte voor een commandoregel
   kunnen accepteren. Deze maximale lengte kun je vinden met het commando
   find /usr/include -name limits.h -follow -exec grep ARG_MAX \{\} \;
   2>>/dev/null 

   De oplossing is de xargs opdracht, die het commando naar wens
   herhaalt, bijvoorbeeld tien keer met telkens honderd argumenten, als
   er duizend bestanden zijn gevonden. De syntaxis van deze opdrachten
   luidt:

   find [ file ...] [ expressie ] | \
   xargs [ optie ...] [ commando ] [ argument ...]

   Het volgende voorbeeld zoekt alle core dumps in uw home directory en
   subdirectory's. find ~ -name "core" -print | xargs file 

   De lijst van argumenten begint met een reeks directory's die worden
   doorzocht, gevolgd door een optionele reeks van tests en een of meer
   akties. De akties worden alleen uitgevoerd als alle opties true
   opleveren; er mag ook -a tussen worden gezet. Als meerdere opties
   worden verbonden door -o dan zal de combinatie waar (0) opleveren als
   één ervan waar is. Het resultaat van een optie kan worden omgekeerd
   door er een ! voor te zetten en opties mogen tussen ( ) haakjes worden
   gegroepeerd. De haakjes moeten door een backslash worden beschermd
   tegen substitutie door de shell.

   Find kent de volgende tests:

   -name "string"
          waar als de naam van de file overeenkomt; de string mag
          wildcards bevatten mits er haakjes omheen of backslashes voor
          staan

   -perm getal
          waar als de permissie bits overeenkomen met het oktale getal.
          man chmod geeft meer informatie over deze numerieke modes.

   -type t
          waar als het bestand van het type t is; f staat voor een gewone
          file, d voor een directory, b voor een block special file en c
          voor character special file. Nieuwere systemen kennen ook p
          voor named pipes, s voor sockets en l voor symbolic links
          (snelkoppelingen).

   -links n
          waar als het bestand n links bezit.

   -user naam
          waar als het bestand eigendom is van gebruiker naam; dat mag
          een login naam of nummer zijn.

   -group naam
          waar als het bestand eigendom is van groep naam; dat mag een
          groep naam of nummer zijn.

   -size n
          waar als de grootte van het bestand n disk blocks bedraagt. Een
          disk block is 512 bytes groot, niet te verwarren met de blokken
          van 1024 bytes van df.

   -inum n
          waar als het bestand inode nummer n heeft.

   -atime n
          waar als het bestand gedurende de laatste n dagen is gebruikt.

   -mtime n
          waar als het bestand gedurende de laatste n dagen is gewijzigd.

   -newer file
          waar als het bestand recenter is gewijzigd dan de opgegeven
          file

   In de voorafgaande opties kan gehalve n om een aantal aan te duiden
   ook de notatie +n worden gebruikt voor aantallen groter dan n of -n om
   aantallen kleiner dan n aan te duiden.

   Het volgende voorbeeld zoekt naar andermans files in uw home
   directory. find ~ \! -user $USER -type f -print | xargs ls -l 

   Find kent de volgende akties:

   -print
          drukt de naam van het huidige bestand af op de uitvoer. In de
          GNU versie kan deze aktie worden weggelaten.

   -exec commando
          waar als de exit status van het commando gelijk is aan nul. Het
          commando moet worden beëindigd met een puntkomma. Als het
          commando {} bevat, dan zal dat worden vervangen door de huidige
          filenaam.

   -ok commando
          waar als de exit status van het commando gelijk is aan nul.
          Find vraagt dan eerst om bevestiging en voert het commando
          alleen uit als er y wordt ingevoerd.

   De GNU versie heeft nog veel meer opties, onder andere:

   -follow
          volg symbolische links

   -mount
          sla gemounte filesystemen over

   -maxdepth nivo
          daal de directoryboom slechts tot het opgegeven aantal nivo's
          af.

   Hieronder een iets andere manier om core files te zoeken. Let op de
   backslashes. find ~ -name core -exec file \{\}\; -print | grep core
   Een handige manier om de inhoud van directory origineel met alle
   subdirectory's te kopiëren naar directory bestemming gebruikt de
   pass-through optie van cpio: find origineel -print | cpio -pdm
   bestemming. SCO Unix heeft hiervoor een copy commando.
     _________________________________________________________________

directory's doorlopen met du

   De du utility geeft een overzicht van de hoeveelheid schijfruimte die
   een bepaalde directory samen met de onderliggende subdirectory's in
   beslag neemt. Behalve als een uitgebreide versie van df kun je het ook
   beschouwen als een snelle variant op find, die alleen directory's
   weergeeft. De syntaxis luidt:

   du [-a ] [-k ] [-s ] [-x ] [ directory ...]

   Als er geen directory's opgegeven zijn, bekijkt du de huidige
   directory. De opties zijn als volgt:

   -a (all)
          geef de grootte van alle files, niet alleen directory's

   -k (kilobyte)
          rapporteer de schijfruimte in kilobytes; de standaardeenheid
          kan 512 bytes of 1024 bytes zijn.

   -s (summary)
          geef slechts één regel per directory

   -x (exclude)
          sla directory's op gemounte schijven over
     _________________________________________________________________

sed, editen vanuit een script

   Met behulp van egrep kun je informatie zoeken in een tekstbestand. Om
   regels te wijzigen is er de stream editor sed, een broertje van de ed
   editor, die weer een voorloper van vi is, die speciaal gemaakt is voor
   gebruik in scripts. Sed kopiëert telkens een volgende regel van de
   invoer naar de patroonbuffer, voert de opdrachten in zijn edit script
   één voor één uit en kopiëert de buffer naar de uitvoer. De syntaxis
   luidt:

   sed [-n ] [-e script ] [-f sfile ] [ file ...]

   Als de filenaam of -namen ontbreken dan zal sed de standaard invoer
   verwerken. Het edit script kan op de commandoregel achter de -e vlag
   tussen aanhalingstekens worden meegegeven of worden gelezen uit de
   file die met de -f vlag wordt aangeduid. Als de -n vlag wordt
   gebruikt, dan wordt er alleen uitvoer gegeneerd door de print
   opdracht.

   Onderstaand scriptje print de regels uit het wachtwoordbestand die de
   letters rot of root bevatten, net als egrep. Zonder de -n vlag zouden
   deze dubbel worden geprint. sed -n -e '/ro\+t/p' /etc/passwd 

   Sed scripts zien er nog cryptischer uit dan shell scripts; ze bestaan
   in het algemeen uit regels van de vorm

   [ adres1 [, adres2 ] ] [! ] [ argument ...]

   Een scriptregel zonder adres wordt toegepast op elke regel in de
   invoer, met één adres wordt de functie toegepast op elke regel die met
   adres1 overeenkomt, en met twee adressen op de regels vanaf de eerste
   die overeenkomt met adres1 tot de volgende die overeenkomt met adres2.
   Als dat niet geworden wordt, tot aan het eind van de file. Als achter
   het adres een uitroepteken staat wordt de functie toegepast op alle
   regels die niet geselecteerd zijn.

   Een adres kan een decimaal regelnummer zijn, cat vanaf 1 geteld wordt,
   $ voor de laatste regel of een reguliere expressie tussen schuine
   strepen. De GNU versie staat toe de reguliere expressie te begrenzen
   met een ander teken dan de slash. Het volgende voorbeeld retourneert
   de regels tussen 'root' en `bin' uit hter wachtwoordbestand. sed -e
   '\#root#,\#bin#!d' /etc/passwd 

   Sed kent onder andere de volgende functies:

   p (print)
          kopiëer de inhoud van de patroonbuffer naar de uitvoer; zonder
          de -n optie kan dat resulteren in dubbel afgedrukte regels.

   n (next)
          drukt de inhoud van de patroonbuffer af op de uitvoer en leest
          de volgende regel van de invoer in de patroonbuffer.

   d (delete)
          maak de patroonbuffer leeg en ga verder met de volgende regel.

   a \
          tekst

          plaats een regel tekst in de uitvoer voordat de volgende regel
          wordt gelezen.

   c \
          tekst

          Maak de patroonbuffer leeg, schrijf de tekst naar de uitvoer en
          lees de volgende regel in.

   i \
          tekst

          plaats een regel tekst in de uitvoer. Append en insert hebben
          hooguit één adres.

   q (quit)
          beëindig het programma zonder de rest van de invoer te lezen.
          Quit gebruikt hooguit één adres.

   = (regelnummer)
          schrijf het regelnummer naar de uitvoer op een aparte regel.

   w file
          voeg de inhoud van de patroonbuffer toe aan het opgegeven
          bestand.

   r file
          lees de inhoud van het opgegeven bestand en schrijf die naar de
          uitvoer alvorens de volgende invoerregel te lezen.

   h (hold)
          vervang de inhoud van de houdbuffer door die van de
          patroonbuffer.

   g (get)
          vervang de patroonbuffer door de inhoud van de houdbuffer.

   x (exchange)
          verwissel de inhoud van de patroonbuffer en de houdbuffer.

   y/string1/string2/ (yield)
          vervang tekens uit string1 door overeenkomstige tekens van
          string2; beide strings moeten even lang zijn.

   N (next)
          voeg de volgende regel toe aan de patroonbuffer met een
          regeleinde (\n) ertussen. Normaliter bevat de buffer geen \n.

   D (delete)
          Verwijder de eerste regel van de patroonbuffer en ga verder met
          de volgende invoerregel.

   G (get)
          plaats een regel text in de uitvoer voordat de volgende regel
          wordt gelezen.

   P (print)
          kopiëer de eerste regel van de patroonbuffer naar de standaard
          uitvoer.

   H (hold)
          voeg de inhoug van de patroonbuffer toe aan de houdbuffer.

   # commentaar
          Na een hekje wordt de rest van de regel genegeerd, net als een
          lege regel

   { functie1
          functie2 ...
          }

          In plaats van een functie wordt de hele groep uitgevoerd.
          Functies op één regel mogen ook door puntkomma's worden
          afgesloten.

   s/regul. expressie/vervanging/[flags] (substitute)
          zoek tekst en vervang die. Als voor het adres reeds een
          zoekexpressie is gebruikt, kan achter de s een lege expressie
          staan. De flags kunnen een g omvatten als er meerdere
          substituties in een regel kunnen voorkomen, een p om de
          patroonbuffer te printen als er een vervanging is gemaakt en w
          file om de inhoud van de patroonbuffer naar de file te
          schrijven als er iets is vervangen.

   :naam (label)
          doet niets, maar markeert een positie om naar toe te springen.

   b [naam] (branch)
          ga verder met de volgende functie achter het label naam. Als de
          naam is weggelaten, spring naar het eind van het script en ga
          verder met de volgende invoerregel.

   t [naam] (test)
          ga verder met de volgende functie achter het label naam als er
          sinds het inlezen van de invoerregel of sinds de vorige test
          opdracht een succesvolle substitutie heeft plaatsgevonden. Als
          de naam ontbreekt wordt er naar het eind van het script
          gesprongen.

   Het volgende voorbeeld zet regelnummers voor de invoer; BSD en gnu
   systemen bereiken hetzelfde met cat -n. Omdat de regelnummers op
   aparte regels komen, wordt een tweede sed commando gebruikt om ze
   samen te voegen en de regeleinden te vervangen door spaties.

   sed -n -e '=; p' | sed -n -e 'N; s/\n/ /p'

   De volgende variant illustreert hoe met tweetal adressen meerdere
   regelbereiken worden gevonden.

ls /bin | sed -n -e '/name/,/t/{=;p;}' | \
  sed -n -e 'N; s/\n/ /p'

   Het volgende voorbeeld zet een spatie achter ieder teken en een lege
   regel achter iedere regel en vervangt alle kleine letters door
   hoofdletters.

sed -e 's/\(.\)/\1 /g
y/abcdefghijklmnopqrstuvwxyz/ABCDEFGHIJKLMNOPQRSTUVWXYZ/
G'

   Voor meer informatie en voorbeelden, zie [18]the seders' grab-bag.
   Hierna volgt een wat uitgebreider shell script dat gebruik maakt van
   sed om commentaar in C^++ stijl te veranderen in standaard C code. Het
   maakt gebruik van ledige substituties om te testen of een bepaald
   patroon in de invoerregel voorkomt. De functie extension behoeft
   wellicht verbetering voor namen als app-1.0.0.tar.gz.

subst()
{ sed -e '
         //\*/s/$//
         t loop
         b cont

:loop
         /\*//s/$//
         t cont
         n
         b loop
:cont
         /\/\//s/$//
         t found
         b
:found
         /\".*\/\/.*\"/s/$//
         t
         /\*\/\/\*/s/$//
         t
         /\/\*.*\/\/.*\*\//s/$//
         t
         /\/\//s/$/ \*\//
         /\/\/.*\/\*.*\*\//s/\*\///
         /\/\//s//\/\*/
         t
         ' $1
}

stringlen()
{ if [ "$1" = "" ]
  then
    echo "0"
  else
    expr length "$1"
  fi
}

substring()
{ if [ "$1" = "" ]
  then
    echo ""
  else
    expr substr "$1" "$2" "$3"
  fi
}

lastindex()
{ name="$1"
  DotPos1=0
  DotPos2=`expr index "$name" "$2"`
  while [ "$DotPos2" -gt "0" ]
  do
    DotPos1=`expr $DotPos1 + $DotPos2`
    DotPos2=`expr $DotPos2 + 1`
    name=`substring "$name" $DotPos2 999`
    DotPos2=`expr index "$name" "$2"`
  done
  echo $DotPos1
}

extension()
{ DotPos=`lastindex "$1" "."`
  if [ "$DotPos" -gt "0" ]
  then
   substring "$1" `expr $DotPos + 1` `stringlen "$1"`
  else
    echo ""
  fi
}

# main loop - find files to be modified 
find . -print \
| while read i
  do
    if [ -f "$i" ] && [ -r "$i" ]
    then
      if [ -w "$i" ]
      then
        if [ "`extension $i`" = "c" ] || \
           [ "`extension $i`" = "h" ]
        then
          if grep '//' $i > >/dev/null
          then
            echo "File $i is modified."
            mv "$i" "$i"~
            subst "$i"~ >$i
          fi
        fi
      else
        echo "File $i is not writable!"
      fi
    fi
  done
     _________________________________________________________________

tabellen verwerken met awk

   De scripttaal awk (klinkt als `look awk`) is genoemd naar haar makers,
   Aho, Weinberger en Kernighan van A, T & T. Awk is uitgebreider dan sed
   en vooral geschikt voor het verwerken van tabellen. Veel Unix
   commando's als ls, ps, en who produceren tabellen, platte tekstfiles
   bestaaande uit kolommen met een vaste breedte. De syntaxis luidt:

   awk [ optie ...] [ -f sfile ] 'script' [ file ...]

   De belangrijkste optie is -Ft, waarmee het teken t als field separator
   wordt ingesteld. Het script zelf kan weer als een groot argument op de
   commandoregel worden meegegeven of in een aparte file met -f, en als
   er geen verdere filenamen zijn meegegeven, dan zal awk de standaard
   invoer verwerken. Awk scripts hebben over het algemeen de vorm
[BEGIN {actie}]
[patroon] [{actie}]
...
[END     {actie}]

   Net als bij sed zal elke invoerregel één voor één met de patronen
   worden vergeleken en voor elk patroon dat overeenkomt zal de
   bijbehorende actie worden uitgevoerd. Als er geen patroon is opgegeven
   wordt de actie altijd uitgevoerd en als er geen actie staat, dan wordt
   de invoerregel afgedrukt. De eventuele actie achter begin wordt voor
   het inlezen van de eerste regel uitgevoerd en de actie achter end na
   het eind van de laatste regel. Het eerste voorbeeld verwijdert lege
   regels uit de invoer: awk '$0' 

   Hierin staat $0 voor de invoerregel. De invoerregel wordt door awk
   gesplitst in velden, gescheiden door witruimte of een ander
   scheidingsteken, genaamd $1, $2, .... NF is het aantal velden en NR
   het aantal records c.q regelnummer. Het toevoegen van regelnummers aan
   de input gaat met awk eenvoudiger dan met sed: awk '{print NR " " $0}'
   
   De patronen kunnen boolese combinaties van reguliere expressies en /
   of relationele expressies zijn. De boolese combinatoren zijn ! (niet),
   && (en), || (of) en de ( ) haakjes; de reguliere expressies zijn
   eerder besproken; de relationele combinatoren zijn < (kleiner), >
   (groter), <= (kleiner of gelijk), >= (groter of gelijk), == (gelijk),
   != (ongelijk), ~ (komt overeen met reguliere expressie) en !~ (komt
   niet overeen met RE).

   Expressies kunnen verder bestaan uit variabelen, numerieke constanten
   (gehele getallen of drijvende komma) en string constanten (tussen
   dubbele aanhalingstekens) en de rekenkundige operatoren + (optellen),
   - (aftrekken), * (vermenigvuldigen), / (delen), % (rest), ^ of **
   (machtsverheffen), ++ (1 optellen) en -- (1 aftrekken) als in de
   programmeertaal C en de string operator ' ' (samenvoeging).

   Behalve enkelvoudige patronen kunnen net als bij sed reeksen regels
   worden opgegeven met een tweetal patronen. De volgende regel
   selecteert de regels 10 t / m 20 van een bestand. awk 'FNR==10,
   FNR==20' /etc/hosts 

   Een awk script kan ook variabelen aanmaken; declareren is niet nodig.
   Een variabele kan zowel als string als getal worden gebruikt en wordt
   automatisch geïnitialiseerd met waarden 0 en "". De operatoren bepalen
   het type van het resultaat: zo levert ("3x" + 1) 4 op maar ("x3" + 1)
   1. Behalve een constante tussen schuine strepen kan ook een variabele
   als reguliere expressie worden gebruikt. De eenvoudigste acties zijn
   variabele = expressie en print expressie. Het is ook mogelijk om de
   veldvariabelen $1, $2,... een andere waarde toe te kennen.

   Moderne awk varianten kennen associatieve arrays. Arrays hoeven niet
   gedeclareerd te worden: het is voldoende een element van een array een
   waarde te geven met naam[ index] = waarde. Voor de index kunnen gehele
   getallen of willekeurige strings worden gebruikt, zelfs meerdere
   getallen zijn toegestaan om pseudo-multidimensionale arrays te maken.
   De waarden van de index hoeven niet opeenvolgend te zijn.

   Awk kent een aantal rekenkundige functies.

     * sin(x)

   berekent de sinus van x, met x in radialen

     * cos(x)

   berekent de cosinus van x

     * exp(x)

   berekent de e-macht van x

     * int(x)

   berekent de entier van x

     * log(x)

   berekent de natuurlijke logarithme van x

     * sqrt(x)

   berekent de wortel van x

     * rand

   berekent een toevalsgetal tussen 0 en 1

     * srand(x)

   maakt x tot generator van een reeks toevalsgetallen

   Awk kent verschillende string functies.

     * gsub(r,s,t)

   vervangt in de string t overal de substring r door s en retourneert
   het aantal malen dat de substitutie is uitgevoerd

     * index(s,t)

   retourneert de positie van substring tin s of 0 is die niet is
   gevonden

     * length(s)

   retourneert de lengte van de string

     * substr(s,p,n)

   retourneert de substring van s, vanaf positie p van n tekens lang

     * tolower(s)

   retourneert s met alle hoofdletters vervangen door kleine

     * toupper(s)

   retourneert s met alle kleine letters vervangen door hoofdletters

   Awk lijkt een beetje op C. Acties c.q. statements worden gegroepeerd
   door accolades en afgesloten door een puntkomma of nieuwe regel. Een
   lang statement kan worden voortgezet door de regel met een backslash
   te beëindigen. Na een # hekje wordt de rest van de regel als
   commentaar beschouwd. Het if-statement heeft de volgende syntaxis.
   if( expressie ) statement1 [else statement2]

   Als de expressie ongelijk is aan 0 c.q. "", dan wordt het eerste
   statement uitgevoerd en anders het optionele tweede. Voor herhaling
   bestaan er twee varianten van while en de for-lus.

while( expressie) statement
do statement while (expressie)
for( expressie1; expressie2; expressie3) statement

   De eerste expressie achter for initialiseert de lus, de tweede test of
   de lus beëindigd moet worden en de derde wordt na elke doorgang
   uitgevoerd. Om tot tien te tellen gebruik je awk 'BEGIN {} {} END
   {for( i = 1;i <= 10;i++) print i}'

   De volgende vorm van de for-lus loopt alle elementen van een array af:
   for (variabele in array) statement

   Met break kan een lus voortijdig worden verlaten; met continue wordt
   de rest van de inhoud van de lus overgeslagen en met exit wordt de
   rest van de invoer overgeslagen en gaat awk verder met de eventuele
   actie achter end; in de end-sectie kan weer een exit opdracht volgen
   met een exit status.

   In moderne versies van awk kunnen in een script eigen functies
   gedefinieerd worden met
   function naam( parameter1, ... ) { statements }

   Functies moeten worden gedeclareerd voordat ze kunnen worden gebruikt.
   Met de return opdracht kunnen ze een waarde teruggeven. Als in een
   functie de waarde van een parameter gewijzigd wordt, dan zal dit geen
   effekt hebben op de waarde van een variabele die als argument is
   meegeven, behalve voor arrays.

   Het is mogelijk om met print naar een willekeurige file te schrijven
   met de notatie

print waarde >"file"

   Zonder de aanhalingstekens is file een variabele die de naam van het
   bestand bevat. Om de uitvoer achter de bestaande inhoud van het
   bestand te plakken wordt het volgende gebruikt:
   print waarde > >"file"

   Het is ook mogelijk om binnen een awk script een extern commando te
   starten dat de uitvoer van print leest met de notatie
   print waarde | "commando"

   Om de output van een extern commando in te lezen kun je iets als
   system( "commando" | getline) gebruiken.

   Om nette tabellen te maken wordt het printf statement gebruikt met de
   volgende syntaxis:
   printf "formaat", expressie1, ...

   De formaat string wordt gewoon afgedrukt, afgezien van formaat
   specificaties, die worden vervangen door één van de volgende
   expressies. Anders dan voor print moet de formaat string worden
   afgesloten met een regeleinde (\n). Een formaat specificatie geeft aan
   in welk formaat de bijbehorende expressie moet worden afgedrukt en
   heeft de vorm
   %[-][0][breedte[.precisie]]type

   De expressie wordt afgedrukt in breedte kolommen, mits het daarin
   past, en eventueel aangevuld met spaties, maar als de breedte met 0
   begint, worden er voorloopnullen gebruikt. Een eventueel min-teken
   geeft aan dat de waarde links moet worden aangelijnd. Voor getallen
   geeft de precisie het aantal cijfers achter de komma c.q. decimale
   punt weer; voor strings is dat de lengte waarop de string wordt
   afgekapt, waarna het resultaat wordt aangevuld tot de opgegeven
   breedte. Het afkappen van relevante informatie kan een bug in een
   script vormen. De volgende formaattypen zijn mogelijk.

     * %%

   een enkel procentteken

     * %c

   een enkel letterteken

     * %c

   een enkel letterteken

     * %s

   een string

     * %d

   een geheel getal; breuken worden niet afgerond

     * %o

   een positief geheel getal in octale stelsel

     * %x

   een positief geheel getal in hexadecimale stelsel

     * %f

   een decimale breuk

     * %e

   een getal in drijvende-komma notatie

     * %g

   de best leesbare notatie voor het getal

   Zo zullen de volgende opdrachten

{ printf "%10.3s\n", 3.1415692}
{ printf "%10.3f\n", 3.1415692}

   als output geven:
       3.1
     3.142
     _________________________________________________________________

expect en andere scripttalen

   De behandeling van awk is hier vrij kort gehouden ondanks de vrij
   complexe materie. De clou is dat een van de belangrijkste redenen om
   awk binnen een shell script te gebruiken, de printf functie, ook in de
   korn en bourne again shells is ingebouwd. Ook de andere scripttalen
   als Perl, TCL, PHP3 en Python, zijn te uitgebreid om hier te
   behandelen. Perl lijkt enigszins op awk, met nog meer mogelijkheden.
   Tk maakt in combinatie met TCL of Perl GUI scripts mogelijk.

   C programmeurs gebruiken make files, die aangeven welke source files
   met welke opties moeten worden gecompileerd om binaries en libraries
   te maken. Make files bevatten weer shell commando's. De m4
   macroprocessor is een geval apart, dat te vergelijken is met de C
   preprocessor, en handig is voor assembly programmeurs. Een m4 file kan
   willekeurige tekst bevatten plus macrodefinities en macro's. M4
   vervangt dan de macro's door hun definitie.

   Postscript(TM) van Adobe wordt een paginabeschrijvingstaal genoemd.
   Postscript programma's worden geschreven door opmaakprogramma's en
   uitgevoerd door printers, resulterend in een of meer pagina's gedrukt
   tekst. Elementen die op elke pagina terugkomen worden eenmalig als een
   functie gedefinieerd. Verder heeft het wat van Forth weg. Het voordeel
   is dat de taal onafhankelijk van het type printer is.

   Om een script te schrijven dat interactie, zowel in- als uitvoer,
   pleegt met een ander programma, kun je gebruik maken van [19]Expect,
   dat weer gebruik maakt van John Ousterhout's Tool Command Language. De
   syntaxis luidt

   expect [ -di ] [ -c script ] [ -f sfile ] ...

   De -d optie geeft een hoop diagnostische uitvoer. Met de -i optie
   gedraagt expect zich als een interactieve shell. Achter -c kan in een
   heel script (tussen aanhalingstekens) worden opgegeven en met -f kan
   de naam van de file met het script worden meegegeven. Hieronder volgt
   een voorbeeld waarin expect wordt gebruikt om een bestand te
   downloaden via ftp, wat met de shell niet zou lukken.

                                                #!/usr/bin/expect -f
                                

# zoals aangegeven in paragraaf 1.3 wordt hierboven
# expect gestart en de rest zijn expect commando's              

spawn ftp localhost
                                                                # Met spawn wor
dt een extern programma gestart                         

expect -re "Connected.*\n"
expect -re "220.*\n"
expect -re "Name.*:.?"
                                                                # Het expect co
mmando laat expect wachten totdat het
# het externe programma de opgegeven strings uitprint
# of er een time-out of end-of-file optreedt.
# Na de -re optie volgt een reguliere expressie.
# \n staat voor een nieuwe regel en \r voor return.             

send "anonymous\r"
expect "anonymous\r\n"

                                                                # Het send comm
ando stuurt de user naam naar het ftp
# proces. Dat zal de invoer terug echoen.                       

expect  {
          -re 331.*\nPassword: {
                                 expect_user -re.*\n
                               }
         }

                                                                # We wachten op
 de password-prompt van de ftp server
# en dan vraagt het script de gebruiker om zelf
# het wachtwoord in te vullen.                                  

send "$expect_out(0,string)\r"
expect "\r\n"

                                                                # We sturen de
invoer van de gebruiker naar de ftp
# server. Die zal het wachtwoord niet laten zien.               

expect  {
        -re (230.*\n)+.*\n.*\n  {}
        -re (530.*.n)+.*\n      exit
        }
}

                                                                # Nu zijn er tw
ee mogelijk heden: 230. User anonymous
# logged in, of 530. Login incorrect; in het eerste
# geval doen we niets en in het tweede geval stoppen
# we de expect sessie.                                          

expect -re "ftp>.?"
send "cd pub\r"
expect "cd pub\r\n"
expect -re "(250.*\n)*250.*successful.*\n"

                                                                # We wachten op
 de ftp prompt en sturen "cd pub"
                                                                
expect -re "ftp>.?"
send "ls\r"
expect "ls\r\n"
expect -re "200.*\n150.*\ntotal(.*\n)+226.*\n"

                                                                # We sturen "ls
" en krijgen een aantal regels terug,
# en na de prompt sturen we "get README"                        

expect -re "ftp>.?"
send "get README\r"
expect "get README\r\n"
expect {
 -re local.*\n200.*\n150.*\n226.*\n.*received.*\n {}
 -re local.*\n200.*\n550.*\n                       exit

}

   De rest van dit hoofdstuk wordt besteed aan een korte beschrijving van
   enkele handige Unix commando's.
     _________________________________________________________________

at en batch

   De at faciliteit zorgt ervoor dat opdrachten op een later tijdstip
   worden uitgevoerd. De syntaxis luidt:

   at [ -m ] [ -l ] [ -f file ] [ -q letter ] [ -r job ] tijdstip

   De -f optie wordt gevolgd door de naam van het uit te voeren script;
   als deze optie ontbreekt, dan worden commando's van de standaard
   invoer gelezen. De uitvoer van het script wordt de gebruiker
   toegemaild, dus die hoeft op het moment van uitvoering niet ingelogd
   te zijn. Op de meeste systemen hebben ook gewone gebruikers
   toestemming om at te gebruiken.

   De -m optie zorgt ervoor dat er ook mail wordt verzonden als de
   opdracht geen uitvoer produceerde. Er wordt voor gezord dat de
   commando's dezelfde omgevingsvariabelen meekrijgen als op het moment
   dat at werd aangeroepen.

   Het batch commando doet hetzelfde als at, behalve dat commando's pas
   worden uitgevoerd wanneer de belasting van het systeem voldoende laag
   is. Die belasting krijg je te zien met uptime. De -q vlag geeft aan in
   welke queue (wachtrij) de job terecht komt. De queue bepaalt de
   prioriteit waarmee een taak wordt uitgevoerd: a is de default at
   queue, b de default batch queue.

   De tijd kan worden opgegeven als uumm of uu:mm, desgewenst met am of
   pm erachter. De liefhebber mag ook now, midnight, noon of teatime
   gebruiken. Daarachter komt de eventuele datum, die bijvoorbeeld today
   of tomorrow mag luiden. Als het tijdstip al voorbij is, wordt
   aangenomen dat het morgen moet zijn en als de dag al geweest is, dan
   zal de gebruiker wel volgend jaar bedoelen. Enkele voorbeelden:

at 0815am Jan 24, 2002
at 8:15am Jan 24
at now + 1 day
at 5 pm Friday next week

   Met de -l optie krijg je een lijst van de geplande taken te zien. Met
   de -r optie kun je een taak verwijderen. Alleen root mag andermans
   taken annuleren.
     _________________________________________________________________

cron

   Cron is een Unix daemon, een systeemprogramma dat op de achtergrond
   loopt, die op gezette tijden opgegeven programma's start, terwijl at
   voor eenmalige opdrachten is; op sommige systemen start cron elke
   minuut een programma dat kijkt of er nog at jobs te doen zijn. Cron
   wordt meestal gebruikt door de systeembeheerder om bijvoorbeeld 's
   nachts backups te draaien, maar is vaak ook voor de andere gebruikers
   beschikbaar.

   Net als at zal cron eventuele uitvoer van een opdracht naar de
   opdrachtgever mailen, tenzij je de standaard uitvoer omleidt; er wordt
   doorgaans een regel in een log file geschreven voor uitgevoerde jobs.
   Een nadeel van cron is dat taken die niet op het aangegeven tijdstip
   uitgevoerd kunnen worden, bijvoorbeeld omdat de computer down is,
   zullen worden overgeslagen. Een ander verschil met at is dat je de
   omgevingsvariabelen mist die worden ingesteld als je inlogt.

   De gebruiker maakt gebruik van de crontab opdracht om zijn/haar lijst
   met cron taken te wijzigen. De syntaxis luidt:

   cron [ -u user ] [ -e | -l | -r ]

   De verticale balk | geeft in onze syntaxis-notatie aan dat of de -e
   vlag, of -l of -u moeten worden gebruikt: u dient het evenmin als de
   rechterhaken over te typen. Met de -u optie kan root andermans cron
   tabel wijzigen; deze optie kan ook handig zijn in combinatie met su.
   Met de -r optie wordt een cron tabel verwijderd. Met de -e optie wordt
   de cron tabel gewijzigd; voor dit doel wordt vi opgestart tenzij de
   inhoud van de omgevingsvariabele $EDITOR iets anders vermeldt.

   Een cron tabel bestaat uit een aantal regels, die afgezien van blanco
   of commentaarregels een zestal velden bezitten.

     * minuut

   (0 - 59)

     * uur

   (0 - 23)

     * datum

   (1 - 31)

     * maand

   (1 - 12)

     * dag

   (maandag = 0, zondag = 0 of 7)

     * opdracht

   (gewone /bin/sh commandoregel)

   De dag van de week of de dag van de maand moeten overeenkomen; het
   volgende voorbeeld zal op elke vrijdag de 13^e tussen elf uur en
   middernacht elke minuut de inhoud van de /tmp directory wissen en op
   13 november ongeacht de dag van de week. In de plaats van een getal
   mogen er meerdere voorkomen met komma's, maar zonder spaties ertussen.


# een voorbeeld cron tabel                              
* 23 13 11 5 find /tmp -exec rm -f {} 2>/dev/null
     _________________________________________________________________

basename en dirname

   Het basename commando verwijdert het directory pad uit een filenaam en
   eventueel de extensie. De syntaxis luidt:

   basename padnaam [ extensie ]

   Als de filenaam niet eindigt op de extensie dan wordt de hele naam
   weergegeven en ook als de filenaam gelijk is aan de extensie. Die
   extensie kan een willekeurige string zijn. Er wordt niet gecontroleerd
   of de file bestaat. Het volgende voorbeeld geeft de voornaam van alle
   html-bestanden.

for file in `find . print | fgrep .html`
do
  basename $file .html
done

   Het dirname commando geeft het directory pad van een filenaam. De
   syntaxis luidt:

   dirname padnaam

   Als er geen slash (/) in de padnaam voorkomt, wordt de huidige
   directory (.) geretourneerd. Het volgende voorbeeld geeft alle
   directory's die html-bestanden bevatten, met dien verstande dat alleen
   de naam en niet de inhoud van de file wordt getest.

   find . -print | fgrep .html | xargs -l1 dirname | uniq -c
     _________________________________________________________________

clear

   Het commando clear wist de inhoud van het scherm en zet de cursor in
   de linker bovenhoek. De omgevingsvariabele TERM bevat het type van uw
   terminal; als clear niet werkt, kijk of uw terminal wordt ondersteund.
     _________________________________________________________________

sort en uniq

   Met sort kunnen bestanden worden gesorteerd en / of samengevoegd. De
   sorteervolgorde wordt bepaald door de ingestelde taal en de
   standaardinstelling is dat de hele regel als sorteersleutel wordt
   gebruikt. De syntaxis luidt:

   sort [ -c ] [ -m ] [ -u ] [ -tteken ] [ +pos1 [ -pos2 ] ]
   [ -o file ] [ -T directory ] [ file ...]

   De volgende opties zijn mogelijk:

   -c (check)
          alleen controleren of de invoer reeds gesorteerd is

   -m (merge)
          samenvoegen van bestanden die reeds gesorteerd zijn

   -u (unique)
          neem identieke regels slechts één keer op in de uitvoer

   -t (tab)
          het volgende teken wordt gebruikt om velden te scheiden;
          gebruik een teken dat niet in de invoer voorkomt als u puur op
          positie wildt sorteren. Standaard worden tabs en spaties
          gebruikt om velden te scheiden en na een spatie worden volgende
          spaties als deel van een veld beschouwd.

   -o (output)
          hiermee wordt aangegeven naar welk bestand de uitvoer wordt
          geschreven; de uitvoer mag een invoerbestand overschrijven

   -T (temporary)
          hiermee kan de directory voor tijdelijke bestanden worden
          opgegeven

   Verder kan worden opgegeven dat de velden vanaf pos1 tot en zonder
   pos2 de sorteersleutel vormen. Als pos2 ontbreekt dan vormt de hele
   rest van de regel de zoeksleutel. Er wordt geteld vanaf 0. Regels
   waarvan de eerste i velden gelijk zijn worden gesorteerd op basis van
   het i + 1^e veld. De posities kunnen van de vorm m.n zijn, waarin m
   het veldnummer is en n de positie binnen het veld. De volgende opties
   zijn globaal geldig als ze voor pos1 staan, maar als ze achter een
   positie staan hebben ze betrekking op dat veld.

   -b (blanks)
          negeer voorloopspaties

   -d (check)
          alleen letters, cijfers en spaties zijn bepalend voor de
          volgorde

   -i (ignore)
          negeer tekens die niet tot het 7-bits ASCII alfabet behoren

   -f (fold)
          verander hoofdletters in kleine letters; hoofdletters
          verschijnen wel gewoon in de uitvoer

   -n (numeric)
          de invoer sorteren op getalswaarde i.p.v. alfabetische
          volgorde; dit maakt de b optie automatisch aktief. De invoer
          moet rechts aangelijnd zijn, wat met printf kan, zie
          [20]paragraaf 3.7.

   -r (reverse)
          sorteer in omgekeerde volgorde

   Het volgende voorbeeld sorteert het wachtwoordbestand op Group ID en
   binnen een groep worden de User IDs in omgekeerde volgorde gezet en
   per UID op het GCOS alias comment veld, dat vaak de volledige naam van
   de gebruiker en evt. kamernummer en telefoontoestel bevat.

   sort -bdft: +3n +2nr -5 /etc/passwd

   Het uniq commando kan in veel gevallen worden weggelaten en `sort -u'
   worden gebruikt om dubbele regels te verwijderen. De syntaxis luidt:

   uniq [ -u | -c | -d ] [ -kolommen ] [ +tekens ] [ in [ uit ] ]

   De -u optie zorgt ervoor dat enkel de regels die niet dubbel voorkomen
   worden afgedrukt, terwijl de -d optie elke vaker voorkomende regel een
   keer in de uitvoer verschijnt en met -c worden alle regels
   voorafgegaan door het aantal keren dat ze voorkomen.

   Achter het - teken komt een eventueel aantal kolommen dat voor de
   vergelijking wordt overgeslagen; achter het + teken komt een aantal
   tekenposities dat wordt overgeslagen, nadat de voorafgaande kolommen
   zijn overgeslagen.

   Veel commando's geven eerst een titelregel, die we niet mee willen
   sorteren. In plaats van head (zie [21]paragraaf head en tail) en tail
   te gebruiken kan het ook met het scriptje `knip'.

read LINE
echo "$LINE" 1>&2
while read LINE
do
  echo "$LINE"
done

   Dit leidt de eerste regel om naar het standaard error kanaal; na het
   sorteren kunnen we beide kanalen weer samenvoegen. Het w commando
   geeft een tabel van ingelogde gebruikers met twee titelregels.

   w | knip | knip | sort -f 2>&1
     _________________________________________________________________

cmp, comm en diff

   Met het cmp commando kunnen twee files worden vergeleken. De syntaxis
   luidt:

   cmp [ -l | -s ] file1 file2

   Standaard wordt het nummer en de inhoud van het eerste byte getoond
   dat verschilt als octaal getal. Met de -s (silent) optie is er geen
   uitvoer en kan slechts de exit status worden getest, terwijl -l alle
   bytes die verschillenden weergeeft.

   Cmp is geschikt voor binaire files; comm vergelijkt twee bestanden
   regel voor regel. De bestanden dienen gesorteerd te zijn. De syntaxis
   luidt:

   comm [ -1 ] [ -2 ] [ -3 ] file1 file2

   Zonder vlaggen wordt de uitvoer weergegeven in drie kolommen: in de
   eerste regels die alleen in file1 voorkomen, in de tweede regels die
   in file2 voorkomen, en in de derde kolom de gemeenschappelijke regels.
   De kolommen worden gemarkeerd door de regel met nul, een of twee
   tab-tekens te beginnen; de uitvoer is niet bijster overzichtelijk. De
   vlaggen geven de optie een of meerdere kolommen weg te laten, bijv.
   comm -12 ... om alleen gemeenschappelijke regels te zien.

   Het diff commando zoekt naar de verschillen tussen twee bestanden. De
   syntaxis luidt:

   diff [ -b ] [ -r ] [ -e ] file1 file2

   Met de optie -b worden spaties aan het eind van een regel genegeerd.
   Met de optie -r worden--als file1 en file2 directory's zijn--alle
   files in die directory's vergeleken. Met de optie -e wordt de uitvoer
   in de vorm van commando's voor de ed editor (grootvader van vi)
   geschreven.

   De uitvoer van diff kan worden gebruikt om met het patch tool file1 te
   veranderen in file2 of andersom. Als een programmeur aan een groot
   programma een paar regels heeft veranderd, hoeft hij / zij slechts de
   patch te verspreiden. De uitvoer van diff heeft de volgende vorm:
n1a n3,n4       (regels toevoegen)
n1,n2d n3       (regels verwijderen)
n1,n2c n3,n4    (regels wijzigen)

   Achter een edit commando volgt een lijst van de betroffen regels in
   file1 met telkens een < ervoor en een lijst regels uit file2
   voorafgegaan door een >; bijv. als in de ene file op regel 13 een
   fiets staat waar de andere een rijwiel heeft:
13c13
< fiets

---

> rijwiel
     _________________________________________________________________

column

   Het column commando (BSD, Linux) kan tekst in kolommen verdelen om een
   nette uitvoer te geven. De syntaxis luidt:

   column [ -t ] [ -x ] [ -c kolommen ] [ -s teken ] [file...]

   De opties zijn:

   -c (count)
          hiermee geef je de breedte van het scherm op. In de meeste
          gevallen is dat niet nodig omdat de omgevingsvariabele $COLUMNS
          de juiste breedte bevat.

   -s (separator)
          geeft het scheidingsteken tussen de kolommen (bijv : voor
          /etc/passwd)

   -x (cross)
          vult de uitvoer regel voor regel op in plaats van kolom voor
          kolom

   -t (table)
          bepaalt het aantal kolommen in de invoertekst in maakt deze
          netjes op

   Op de volgende manier kan de uitvoer van find op een ls-achtige manier
   in kolommen worden gezet.

find . -mindepth 1 -print | xargs -l1 basename | \
  sort -u | column

   In het volgende voorbeeld wordt de uitvoer van ls van een titelregel
   voorzien.

( printf \
  "PERM LINKS OWNER GROUP SIZE MONTH DAY HH:MM/YEAR NAME\n"
  /bin/ls -l | sed 1d
) | column -t
     _________________________________________________________________

colrm, cut, paste, join

   Het colrm commando van BSD Unix verwijdert kolommen uit elke regel van
   de standaard invoer. Met kolommen worden hier tekenposities bedoeld.
   De syntaxis luidt:

   colrm [ startpositie [eindpositie ] ]

   De posities worden geteld vanaf 1. Als alleen de startpositie wordt
   opgegeven wordt de rest van de regel verwijderd, anders van start tot
   en met eind.

   System V Unix kent een cut commando dat ongeveer hetzelfde doet, met
   de volgende syntaxis:

   cut [ -b | -c | -f ] lijst [-d teken ] [ file ...]

   De opties zijn als volgt:

   -b (bytes)
          de kolommen worden opgegeven als byte-posities

   -c (character)
          de kolommen worden aangegeven als tekenposities; in
          Oostaziatische en Unicode alfabetten kan een teken meer dan een
          byte lang zijn

   -f (field)
          de kolommen zijn velden gescheiden door tabulatie-tekens

   -d (delimiter)
          geeft een alternatief scheidingsteken aan; alleen toegestaan in
          combinatie met de -f optie

   Achter de -b, -c of -f optie volgt een lijst met veldnummers die in de
   uitvoer moeten worden meegenomen. Dit kan een reeks nummers zijn,
   gescheiden door komma's zonder spaties ertussen. Voor een enkel getal
   kan ook een bereik start-eind staan, waarbij de start of het eind ook
   mogen worden weggelaten om de rest van de regel aan te duiden. Zo doen
   de volgende twee regels hetzelfde

ls -al | colrm 42 54
ls -al | cut -b -41,55-

   De volgende opdrachten doen niet hetzelfde, omdat de uitvoer van ls
   niet door tabulatie-tekens gescheiden is, maar door rijen spaties.

ls -al | awk '{ print $9}'
ls -al | cut -f 9 -d ' '

   Om het effekt van de awk regel te bereiken doe je

   ls -al | sed -e 's/[ ][ ]*/ /g' | cut -f 9 -d ' '

   Op de volgende manier kun je een directory listing sorteren op
   extensie, waarbij functies uit een voorbeeld in [22]paragraaf sed,
   editen vanuit een script worden gebruikt. Voor bash is de optie -e
   vereist.

# optioneel argument: directory naam

  ls $1 | while read
          do
            echo -e "`extension "$REPLY"`""\t""$REPLY"
          done | sort -df | cut -f 2

   Het omgekeerde van cut is paste. Hiermee worden regels uit meerdere
   files samengevoegd tot een regel, gescheiden door tabs. Paste is wat
   beperkter dan het join commando. De syntaxis luidt:

   paste [ [ -s ] -d lijst ] file ...

   De opties zijn als volgt:

   -d (delimiter)
          gebruik een element uit de lijst als veld-scheidingstekens; er
          wordt telkens een volgend teken uit de lijst gebruikt, om aan
          het eind weer het eerste te nemen

   -s (serial)
          geeft een alternatief scheidingsteken aan; alleen toegestaan in
          combinatie met de optie -f

   Het volgende voorbeeld geeft een lijst bestanden in drie kolommen.

   ls | paste - - - | column -t

   Met join worden twee tekstbestanden samengevoegd, die vooraf
   gesorteerd moeten zijn. Join voegt regels uit beide bestanden samen
   met dezelfde inhoud van het sleutelveld. Het sleutelveld is standaard
   het eerste veld; velden worden gescheiden door spaties of
   tabulatie-tekens. Join is een standaard operatie voor databases.

   De uitvoer bevat alle velden van beide bestanden, en het sleutelveld
   wordt maar één keer gekopieerd. Als een sleutelveld in de eerste file
   n keer voorkomt en m keer in de tweede, dan zal de uitvoer n × m
   regels met deze waarde bevatten. De syntaxis luidt:

   join [ -a filenr | -v filenr ] [-e string ] [-o lijst ] [-t teken ]
   [ -j [filenr] veldnr | -1 veldnr -2 veldnr ] file1 file2

   Join bezit een aantal opties:

   -a (all)
          produceer ook een regel in de uitvoer voor iedere regel in
          filenr die geen corresponderende regel in het andere bestand
          heeft; filenr is een 1 of 2

   -e (empty)
          vul lege velden met de opgegeven string

   -j (join)
          geef het nummer op van het veld, dat als sleutelveld moet
          worden gebruikt; filenr is een 1 of 2

   -1, -2
          -1 is een synomiem voor -j1 en -2 voor -j2

   -o (output)
          geeft een lijst van velden die in de uitvoer moeten komen, wat
          een cut bespaart; een veld wordt aangeduid met filenr.veldnr en
          velden worden gescheiden door komma's

   -t (tab)
          geeft aan welk teken wordt gebruikt om de velden te scheiden
          (helaas is Unix niet erg consequent in de naamgeving van de
          opties)

   -v
          produceer uitsluitend een regel in de uitvoer voor iedere regel
          in filenr die geen corresponderende regel in het andere bestand
          heeft; filenr is een 1 of 2

   Met behulp van join maken we een korte variant op het voorbeeld van
   [23]paragraaf enkele voorbeelden.

# sorteer de wachtwoord file op login naam              
sort </etc/passwd >een
# knip de titelregels uit lijst van gebruikers,
        # scheid de velden door dubbele punt en sorteer         
w | ( read; read; cat) | sed -e 's/[ ][ ]*/:/g' \
| sort >twee
# voeg de bestanden samen en maak er nette tabel van
(echo "USER:FULL NAME:TTY"; join een twee -t ':' \
  -o 1.1,1.5,2.2 ) | column -t -s ':'; rm -f een twee
     _________________________________________________________________

head en tail

   Na een aantal opdrachten die velden uit bestanden manipuleren, zijn er
   nog een paar die regels uit tekst filteren. Naast grep hebben we head
   en tail die respectievelijk de eerste en de laatste paar regels van
   een bestand laten zien; standaard zijn dat tien (10) regels. De
   syntaxis luidt:

   head [ -aantal | -n aantal ] [ file ...]
   tail [ [ + | - ] aantal [ l | b | c ] ] [-f ] [-r ] [file ]
   tail [ -c aantal | -n aantal ] [file ]

   De opties zijn als volgt:

   -n (number)
          het aantal regels dat wordt weergegeven; dit is hetzelfde als
          de optie -aantal

   +aantal[l|b|c]
          alleen voor tail; er wordt nu vanaf het begin van de file
          geteld in plaats vanaf het eind: dit is hetzelfde als -n
          +aantal, terwijl -n -aantal equivalent is met -n aantal en head
          geen teken voor het aantal krijgt

          de optionele l achter het aantal betekent dat er regels geteld
          worden; als er c staat worden bytes geteld en een b staat voor
          disk blokken van 512 bytes

   -c (character)
          Een alternatieve notatie voor + / -aantalc

   -r (reverse)
          de regels worden in omgekeerde volgorde afgedrukt; alleen voor
          BSD Unix

   -f (follow)
          laat het programma niet beëindigen als het eind van het bestand
          is bereikt, maar kijkt om de zoveel seconden of de file is
          gegroeid en drukt nieuwe regels af; handig voor log files.

   De GNU versie van head kent een aantal van de opties van tail. Het
   eerste voorbeeld geeft alleen de namen van de bestanden; het tweede is
   equivalent met (read; read; cat).

head -0 *
tail -n +3l
     _________________________________________________________________

split en dd

   Een heel andere manier om een bestand in regels te splitsen is split,
   dat meerdere output files aanmaakt van gelijke lengte. De syntaxis
   luidt:

   split [ - [l]aantal | [-b]aantal [k | m]] [file [prefix ] ]

   De namen van de output files beginnen met de opgegeven prefix. Zonder
   prefix heten ze xaa, xab, ... De opties zijn:

   -l (lines)
          geeft het aantal regels per uitvoer file; de letter l mag
          worden weggelaten; standaard worden files van 1000 regels
          gemaakt

   -b (bytes)
          maakt files met het opgegeven aantal bytes; als er k achter
          staat, worden het kilobytes en met m megabytes: handig als de
          uitvoer een vaste grootte moet hebben voor bijvoorbeeld floppy
          disks.

   Een gesplitste file kan worden samengevoegd met cat x* >file.

   De functie van dd wordt omschreven als `convert and copy', maar omdat
   cc al bestond, is voor `disk dumper' gekozen. Het wordt vooral
   gebruikt voor direkte in- en uitvoer naar een fysiek randapparaat,
   omdat het niet regels maar records met vaste lengte kopieert. De
   syntaxis luidt:

   dd [ optie=waarde...]

   Zonder verdere argumenten lijkt het op cat, maar dd kent een
   respektabele lijst opties:

   if=file
          lees van de opgegeven file c.q. randapparaat

   of=file
          schrijf naar de opgegeven file c.q. randapparaat

   ibs=bytes[w|b|k]
          geeft het aantal bytes dat in één keer gelezen wordt (record
          grootte) op, standaard 512 bytes; als achtervoegsel kan de
          eenheid worden opgegeven: een woord is twee bytes, een
          disk-blok 512 bytes, een kilobyte 1024 bytes

   obs=bytes[w|b|k]
          geeft het aantal bytes dat in één keer weggeschreven wordt
          (record grootte) op

   bs=bytes[w|b|k]
          geeft het aantal bytes dat in één keer gelezen en geschreven
          wordt; ibs en obs worden genegeerd als bs is opgegeven

   cbs=bytes
          geeft de grootte van de conversie-buffer aan voor conversie
          naar of van IBM of EBCDIC formaat

   skip=records
          geeft het aantal records dat van de invoer wordt gelezen maar
          niet naar de uitvoer wordt geschreven

   seek=records
          geeft het aantal records in de uitvoerfile dat wordt
          overgeslagen voordat dd begint met kopiëren

   iseek=records
          net als skip, maar dd springt over de records heen, wat tijd
          bespaart

   oseek=records
          net als seek

   count=aantal
          kopieert slechts een aantal records

   files=aantal
          voegt een aantal bestanden met EOF ertussen samen; alleen
          handig voor tape

   conv=code,...

          + ascii

   converteer van EBCDIC naar ASCII
          + ebcdic

   converteer van ASCII naar EBCDIC
          + ibm

   converteer van IBM EBCDIC naar ASCII
          + block

   converteer tekstbestand met regels van variabele lengte naar records
   van cbs bytes door regels aan te vullen met spaties
          + unblock

   haal spaties aan het eind weg en sluit regel af met newline
          + lcase

   vervang hoofdletters door kleine letters
          + ucase

   vervang kleine letters door hoofdletters
          + swab

   verwissel even en oneven bytes
          + sync

   als het invoer record kleiner is dan ibs, dan wordt het aangevuld met
   NULL bytes of--als de optie block gekozen is--bytes
          + noerror

   ga door als er een fout optreedt
          + notrunc

   maak het uitvoer bestand niet leeg alvorens ernaar te schrijven

   De GNU versie kent de opties files=, iseek= en oseek= niet. Het
   volgende voorbeeld misbruikt dd voor string manipulatie.

   echo "Hello, world" | dd bs=1 skip=7 count=6 2> >/dev/null
     _________________________________________________________________

env

   Het commando env is een aanvulling op set, waarmee een
   omgevingsvariabele kan worden ingesteld voor de duur van één commando.
   De syntaxis luidt:

   env [ - | -i ] [ naam=waarde...] [programma [argumenten ] ]

   Env start het programma, dat de opgegeven namen met de bijbehorende
   waarden als omgevingsvariabelen meekrijgt. Met de optie - alias -i
   worden de bestaande omgevingsvariabelen ontzichtbaar voor het
   programma.

   Env zonder argumenten geeft de waarde van alle omgevingsvariabelen,
   net als het commando printenv (zie [24]paragraaf printenv).
     _________________________________________________________________

expand, unexpand en tabs

   Expand is een hulpmiddel om tabulatie-tekens in een tekstbestand te
   vervangen door spaties met behoud van paginaindeling. Programmeurs
   gebruiken het bijvoorbeeld als een printer tabs niet goed verwerkt.
   Unexpand vervangt reeksen spaties door tab-tekens, wat ruimte
   bespaart. De syntaxis luidt

   expand [ - [t]tabstops] [ file ...]
   unexpand [ -a | -t tabstops ] [ file ...]

   Posities worden geteld vanaf 1. Standaard wordt een tabstop om de 8
   posities aangenomen. Met de optie -t kan een andere waarde worden
   opgegeven. Het is ook mogelijk om de lijst van tabstops expliciet op
   te geven, gescheiden door komma's, als ze op ongelijke afstanden
   voorkomen. Unexpand vervangt alleen de spaties totaan het eerste
   afdrukbare teken, of alles als de optie -a is gespecificeerd.

   In vi kun je de tabstops zetten met :set ts=n; gerelateerde
   instellingen zijn :set ai (automatisch inspringen) en :set sw=m
   (inspringdiepte). Om de tab-instellingen te wijzigen op terminals die
   dit ondersteunen wordt het commando tabs gebruikt, met de syntaxis:

   tabs [ -code | -n | n1,...] [-Tterm ] [+mn ]
   tabs [-Tterm ] [+m [n]] n1 [,n2...]

   De opties zijn als volgt:

   -T (terminal)
          geef het terminaltype op, als Unix dat niet in de
          omgevingsvariabele TERM vindt

   +m (margin)
          geef de linker marge op; in de tweede notatie mag m zonder
          getal gebruikt worden voor de standaardwaarde van 10

   -n
          geef een repeterende tabstop op. In de tweede vorm wordt de -
          weggelaten

   n1,...
          geef de lijst van tabstops expliciet op

   code
          een aantal sets tabstops zijn voorgedefinieerd, bijv. -a voor
          S/370 assembler, -c voor Cobol, -f voor Fortran, etc.
     _________________________________________________________________

file

   Het commando file onderzoekt het begin van een file en probeert
   daaruit af te leiden wat voor type bestand het is. Dit is iets
   betrouwbaarder dan op de extensie van de filenaam af te gaan, maar het
   blijft gissen. Als uw systeem een bepaald soort document niet herkent,
   kunt u zelf patronen toevoegen aan /etc/magic. De syntaxis luidt:

   file [ -c ] [ -f ffile ] [ -m mfile ] [file ...]

   De opties zijn als volgt:

   -c (check)
          controleer het formaat van de magic file

   -f (files)
          onderzoek de files waarvan de namen in ffile staan

   -m (magic)
          lees de zoekpatronen uit mfile in plaats van de standaard
          locatie
     _________________________________________________________________

fold en fmt

   Fold breekt lange tekstregels af, zodat de rest op de volgende regel
   terechtkomt. De syntaxis luidt:

   fold [-bs ] [-w lengte ] [file ...]

   De volgende opties worden herkend:

   -b (backspace)
          de speciale behandeling van backspace, tab en carriage return
          wordt opgeheven, zodat ze als gewone tekens met breedte 1
          tellen

   -s (spaces)
          breek de regel af na een spatie in plaats van midden in een
          woord

   -w (width)
          hanteer de opgegeven regellengte in plaats van de
          standaardwaarde 80

   Fmt is een simpel programma uit BSD Unix om een tekstbestand wat
   netter op te maken met een standaard regellengte van 72 (75 voor GNU).
   Blanco en ingesprongen regels blijven behouden. Het programma pr is
   gemaakt om tekst in kolommen te zetten met kop- en voetregels voor het
   afdrukken. Voor C code is er indent, dat de lay-out van een programma
   helemaal kan omgooien. De syntaxis luidt:

   fmt [-opties ] [file ...]

   De oude BSD versie kent geen opties; de GNU versie heeft o.a.:

   -c (crown-margin)
          de inspringing van de eerste twee regels van elke alinea blijft
          bewaard en de rest springt evenveel in als de tweede regel;
          bedoeld voor wie alinea's begint met in te springen

   -t (tagged)
          als de optie -c, maar de eerste twee regels moeten verschillend
          inspringen

   -u (uniform)
          vervangt meervoudige spaties door een enkele, behalve aan het
          eind van een regel, waar een enkele spatie blijft staan, maar
          meerdere spaties door twee worden vervangen

   -w=lengte (width)
          geeft de regellengte op
     _________________________________________________________________

install

   Het commando install commando wordt het meest gebruikt in make files
   om bestanden naar hun bestemming te kopiëren. De vergelijking van de
   man pages laat zien dat de System V en GNU uitvoeringen sterk
   verschillen. De syntaxis luidt ongeveer:

   install [-f ] [-m mode ] [-u user ] [-g groep ] file directory

   Enkele van de opties:

   -f (force)
          overschrijf een eventueel bestaand bestand in de doeldirectory

   -m (mode)
          de toegangsrechten van de kopie worden ingesteld op de
          opgegeven mode, die zowel als octaal getal als in symbolische
          vorm kan worden opgegeven (voor meer info: man chmod)

   -u (user), -o (owner)
          stelt de eigenaar van de kopie in: dit mag een naam of nummer
          uit /etc/passwd zijn; install wordt doorgaans door root
          uitgevoerd

   -g (groep)
          geeft de groep op die de kopie zal bezitten
     _________________________________________________________________

look

   Look print alle regels in een gesorteerd tekstbestand die met de
   opgegeven string beginnen. Het maakt gebruik van een binair
   zoekalgorithme, waardoor het veel sneller is dan fgrep, maar ook
   beperkter in zijn functionaliteit. De syntaxis luidt:

   look [-d ] [-f ] string [file ]

   Tenzij een bestand is opgegeven, kijkt look in het
   standaardwoordenboek, bijv. /usr/dict/words of /usr/share/dict/words.
   Enkele opties zijn:

   -d (dictionary)
          houdt lexigrafische volgorde aan en vergelijkt enkel letters,
          cijfers en witruimte

   -f (fold)
          maakt geen onderscheid tussen hoofd- en kleine letter
     _________________________________________________________________

mail

   Mail is het standaard interactieve e-mail programma voor Unix
   gebruikers. Er zijn inmiddels e-mail clients met heel wat meer
   features, maar mail kan gebruikt worden om berichten te versturen
   vanuit een programma. De sterk vereenvoudigde syntaxis luidt:

   mail [-s onderwerp ] [adres ...]

   Als het adres ontbreekt, dan wordt mail gebruikt om interactief te
   binnengekomen post te lezen en eventueel te wissen; met een adres zal
   mail een bericht van de standaard invoer lezen en versturen met de
   eventuele onderwerp-regel (graag tussen aanhalingstekens als er
   spaties in voorkomen). Als er meerdere ontvangers zijn, moeten de
   adressen met komma's worden gescheiden.
     _________________________________________________________________

mesg

   Mesg wordt meestal in ~/.profile (zie [25]paragraaf hallo) gebruikt om
   het ontvangen van berichten op de terminal met talk of write toe te
   staan of te blokkeren. De syntaxis luidt:

   mesg [ n | y ]

   Met y worden berichten aan u doorgegeven, met n niet. Zonder argument
   geeft mesg de momentane instelling. De volgende listing laat zien dat
   er van twee ingelogde gebruikers een mesg aan heeft staan en de ander
   uit.
crw-rw-rw- 1 root  root  3, 0 Jun  5 19:29 /dev/ttyp0
crw--w---- 1 daniel tty  3, 1 Jun  5 19:26 /dev/ttyp1
crw------- 1 radical tty 3, 2 Jun  5 19:31 /dev/ttyp2
crw-rw-rw- 1 root   root 3, 3 May 18 00:44 /dev/ttyp3
     _________________________________________________________________

od en strings

   Od wordt gebruikt om de inhoud van binaire files in octaal of andere
   formaten weer te geven. De vereenvoudigde syntaxis luidt:

   od [- [ b ] [ c ] [ d ] [ h ] [ o ] [ x ] ] [-A radix ] [-j bytes ]
   [-N bytes ] \
   [-t formaat ] [file ]

   Er zijn onder andere de volgende opties:

   -b (bytes)
          bytes worden weergegeven als octaal getal

   -c (character)
          bytes worden weergegeven in ASCII, met onzichtbare tekens als
          escape (zie [26]paragraaf aanhaling)

   -d (decimal)
          woorden van twee bytes worden weergegeven als positief decimaal
          getal

   -x (hexadecimal)
          woorden worden weergeven in hexadecimale notatie

   -v (verbose)
          als een regel meerdere keren herhaald wordt, dan wordt-ie ook
          net zo vaak afgedrukt

   -A (address)
          geef het getallenstelsel op dat voor de adressen moet worden
          gebruikt

   -j (jump)
          geeft aan dat een aantal bytes moet worden overgeslagen
          alvorens de rest af te drukken; het aantal wordt in het
          decimale stelsel genoteerd, tenzij het met een 0 (octaal) of 0x
          (hexadecimaal) begint;

          achter het aantal kan nog de eenheid b (blokken van 512 bytes),
          k (1024 bytes) of m (1048576 bytes) volgen; oudere versies van
          od zetten dit aantal achter de filenaam met een + ervoor in
          octale notatie of decimaal met een punt achter het getal

   -N (number)
          geef het aantal bytes aan dat van iedere file moet worden
          afgedrukt; achter het aantal kan nog de eenheid b (blokken van
          512 bytes), k (1024 bytes) of m (1048576 bytes) volgen

   -t (type)
          een alternatieve manier om het formaat aan te geven: het type
          kan met a, c, d, f, o, u of x worden aangeduid, waarin a staat
          voor ASCII, f voor floating point, d voor decimaal en u voor
          een positief decimaal getal; achter de letter kan nog de lengte
          worden opgegeven met 1, 2, 4 of 8 bytes

   Strings is een ruw tooltje om tekstfragmenten uit binaire bestanden,
   met name programma's, te filteren. De syntaxis luidt:

   strings [- [a] ] [- [n]lengte] [-t d | o | x ] [ file ...]

   De opties luiden:

   -a (all)
          doorzoek hele bestand in plaats van alleen de data sectie van
          een programma; deze optie kan worden afgekort tot een enkel
          min-teken

   -n (number)
          geeft aan dat alle strings met minimum lengte worden
          geretourneerd in plaats van de standaard waarde 4; deze optie
          mag worden afgekort tot -lengte

   -t (type)
          zorgt ervoor dat voor elke gevonden string de positie in de
          file wordt afgedrukt in decimale, octale, of hexadecimale
          notatie
     _________________________________________________________________

printenv

   Printenv drukt de waarde van omgevingsvariabelen af. De syntaxis
   luidt:

   printenv [ variabele ...]

   Zonder argumenten worden alle variabelen afgedrukt, net als met set;
   als de namen van variabelen worden meegegeven, dan worden die
   afgedrukt. printenv TERM doet vrijwel hetzelfde als echo $TERM.

   De exit status is 0 (true) als alle variabelen bestaan en 1 (false)
   als er één ongedefinieerd is.
     _________________________________________________________________

sleep

   Sleep onderbreekt de uitvoering van een programma tijdelijk. De
   syntaxis luidt:

   sleep seconden

   Sleep wordt vooral gebruikt om in een oneindige lus de processor niet
   nodeloos te belasten in de trant van

while true
do
  if [ er_is_post ]
  then
    lees_post
    break
  sleep 10
done
     _________________________________________________________________

su

   Met het substitute user kan een nieuwe shell worden opgestart onder
   een andere naam; standaard is dat root, ook wel eens als superuser
   aangeduid. Na een exit commando komt u weer terug in de oude shell. Su
   vraagt uiteraard om het wachtwoord, tenzij het door root wordt
   uitgevoerd. Het wordt ook vaak gebruikt om een programma juist minder
   privileges te geven voor de veiligheid. De syntaxis luidt:

   su [- ] [naam ] [-c commando ]

   Standaard erft de nieuwe shell de oude omgeving (directory en
   variabelen), maar de - optie maakt een login shell en voert ~/.profile
   uit e.d. Met de -c optie wordt in plaats van een interactieve shell
   een enkel commando uitgevoerd. Vergelijk eens de volgende twee
   opdrachten.

su -c "whoami "
su -c "who am i"
     _________________________________________________________________

tee

   Tee vormt een t-stuk in een pijpleiding. Het is een eenvoudig filter
   dat de standaard invoer behalve naar de uitvoer ook naar de opgegeven
   files kopieert. Zie ook [27]paragraaf pijpleidingen. De syntaxis
   luidt:

   tee [-a ] [-i ] [ file ...]

   De opties luiden:

   -a (append)
          plakt de uitvoer achter de file(s) in plaats van ze te
          overschrijven

   -i (ignore)
          Negeer een eventueel SIGINT signaal
     _________________________________________________________________

time

   Time kan zowel een intern shell commando als extern programma zijn.
   Het voert een programma uit en geeft weer hoeveel tijd het gekost
   heeft als verstreken tijd en het aantal seconden dat de computer eraan
   heeft besteed in de user en system modus. De syntaxis luidt:

   time commando [ argument ...]
     _________________________________________________________________

tr

   Tr is een eenvoudig filter waarmee tekens in een tekstbestand door
   andere vervangen kunnen worden zonder de kracht of complexiteit van
   bijvoorbeeld sed; de bewerkte standaard invoer verschijnt op de
   standaard uitvoer. De Sytem V, BSD en GNU versies lopen nogal uiteen.
   De syntaxis luidt ongeveer:

   tr [-c ] [-s ] [-d ] string1 [string2 ]

   De opties zijn:

   (geen)
          Vervang alle tekens in de verzameling string1 door het
          corresponderende teken in string2, die even lang moeten zijn,
          bijvoorbeeld tr '[:upper:]' '[:lower:]' om alle hoofdletters
          door kleine te vervangen

   -c (complement)
          Vervang alle tekens in string1 door tekens die niet in string1
          voorkomen; het resultaat kan per besturingssysteem verschillen

   -d (delete)
          Verwijder alle tekens die voorkomen in string1

   -s (squeeze)
          als een teken uit string1 meerdere keren achter elkaar
          voorkomt, dan blijft er maar één over in de output,
          bijvoorbeeld tr -s '\000-\040' verwijdert dubbele spaties, lege
          regels e.d.

   De opties kunnen ook gecombineerd worden. In de strings mogen de
   backslash escapes van [28]paragraaf aanhaling en de karakter klassen
   van [29]paragraaf grep en reguliere expressies worden gebruikt. Tevens
   kunnen reeksen tekens worden aangegeven met begin-eind en
   [teken*aantal].
     _________________________________________________________________

wc

   Wc is een eenvoudig tooltje om de lengte van een tekst te tellen. De
   syntaxis luidt:

   wc [-l ] [-w ] [-c ] [ file ...]

   De opties zijn:

   -l (lines)
          tel het aantal regels

   -w (words)
          tel het aantal woorden

   -c (characters)
          telt het aantal bytes; sommige versies hebben een optie -m die
          karakters telt

   Standaard worden regels, woorden en bytes of tekens geteld. Als er
   meerdere files worden opgegeven, dan volgt nog een regel met het
   totaal over alle files (verwarrend als u een bestand total hebt :-)
     _________________________________________________________________

yes

   Yes is een simpel programmaatje, dat zolang y of een andere string
   produceert totdat het wordt afgebroken. De syntaxis luidt:

   yes [string ]

   Het wordt vooral gebruikt in pijpleidingen, zoals yes n | fsck / Fsck
   zal vragen of u wel zeker weet dat u het root file systeem wilt
   controleren; omdat dat riskant is op een aktief systeem wordt die
   vraag automatisch met n(ee) beantwoord.

References

   1. file://localhost/tmp/Unix-Shell-Script-HOWTO-NL/Unix-Shell-Script-HOWTO-NL.html#SHELL
   2. file://localhost/tmp/Unix-Shell-Script-HOWTO-NL/Unix-Shell-Script-HOWTO-NL.html#PROGRAMMEREN
   3. file://localhost/tmp/Unix-Shell-Script-HOWTO-NL/Unix-Shell-Script-HOWTO-NL.html#TOOLS
   4. file://localhost/tmp/Unix-Shell-Script-HOWTO-NL/Unix-Shell-Script-HOWTO-NL.html#TOOLS
   5. file://localhost/tmp/Unix-Shell-Script-HOWTO-NL/Unix-Shell-Script-HOWTO-NL.html#SPLIT
   6. http://199.103.168.8:4984/web1/hak/netcat.html
   7. file://localhost/tmp/Unix-Shell-Script-HOWTO-NL/Unix-Shell-Script-HOWTO-NL.html#HERHALINGEN
   8. file://localhost/tmp/Unix-Shell-Script-HOWTO-NL/Unix-Shell-Script-HOWTO-NL.html#EXPR
   9. file://localhost/tmp/Unix-Shell-Script-HOWTO-NL/Unix-Shell-Script-HOWTO-NL.html#TEST
  10. file://localhost/tmp/Unix-Shell-Script-HOWTO-NL/Unix-Shell-Script-HOWTO-NL.html#PARAMETERS
  11. file://localhost/tmp/Unix-Shell-Script-HOWTO-NL/Unix-Shell-Script-HOWTO-NL.html#PARAMETERS
  12. file://localhost/tmp/Unix-Shell-Script-HOWTO-NL/Unix-Shell-Script-HOWTO-NL.html#VARIABELEN
  13. file://localhost/tmp/Unix-Shell-Script-HOWTO-NL/Unix-Shell-Script-HOWTO-NL.html#PROCESSEN
  14. file://localhost/tmp/Unix-Shell-Script-HOWTO-NL/Unix-Shell-Script-HOWTO-NL.html#GREP
  15. file://localhost/tmp/Unix-Shell-Script-HOWTO-NL/Unix-Shell-Script-HOWTO-NL.html#VOORBEELDEN
  16. file://localhost/tmp/Unix-Shell-Script-HOWTO-NL/Unix-Shell-Script-HOWTO-NL.html#WILDCARDS
  17. http://www.tgries.de/agrep/
  18. http://seders.icheme.org/
  19. http://expect.nist.gov/
  20. file://localhost/tmp/Unix-Shell-Script-HOWTO-NL/Unix-Shell-Script-HOWTO-NL.html#PRINTF
  21. file://localhost/tmp/Unix-Shell-Script-HOWTO-NL/Unix-Shell-Script-HOWTO-NL.html#HEAD
  22. file://localhost/tmp/Unix-Shell-Script-HOWTO-NL/Unix-Shell-Script-HOWTO-NL.html#SED
  23. file://localhost/tmp/Unix-Shell-Script-HOWTO-NL/Unix-Shell-Script-HOWTO-NL.html#VOORBEELDEN
  24. file://localhost/tmp/Unix-Shell-Script-HOWTO-NL/Unix-Shell-Script-HOWTO-NL.html#PRINTENV
  25. file://localhost/tmp/Unix-Shell-Script-HOWTO-NL/Unix-Shell-Script-HOWTO-NL.html#HALLO
  26. file://localhost/tmp/Unix-Shell-Script-HOWTO-NL/Unix-Shell-Script-HOWTO-NL.html#AANHALING
  27. file://localhost/tmp/Unix-Shell-Script-HOWTO-NL/Unix-Shell-Script-HOWTO-NL.html#PIJPLEIDINGEN
  28. file://localhost/tmp/Unix-Shell-Script-HOWTO-NL/Unix-Shell-Script-HOWTO-NL.html#AANHALING
  29. file://localhost/tmp/Unix-Shell-Script-HOWTO-NL/Unix-Shell-Script-HOWTO-NL.html#GREP