Vous êtes ici : Bienvenue à Team IT Training Limited » Formations à Distance » workbooks » Solaris » Solaris 10 » Solaris - Les Fondamentaux » SO102 - Outils de Manipulation de Fichiers Texte

Dernière mise-à-jour : 2020/01/30 03:28

SO102 - Outils de Manipulation de Fichiers Texte

Expressions Régulières

La manipulation de fichiers textes utilise des expressions régulières. Sous Linux il existe deux types d'expressions régulières :

expressions régulières basiques, appelées ERb,
- utilisées par les commandes vi, grep, expr et sed,
expressions régulières étendues, appelées ERe,
- utilisées par les commandes egrep ( grep -E ) et awk.

Les expressions régulières utilisent des caractères spéciaux. Certains caractères sont communs aux Erb et aux Ere :

Caractère spécial	Description
^	Trouver la chaîne au début de la ligne
$	Trouver la chaîne à la fin de la ligne
\	Annuler l'effet spécial du caractère suivant
[ ]	Trouver n'importe quel des caractères entre les crochets
[^]	Exclure les caractères entre crochets
.	Trouver n'importe quel caractère sauf à la fin de la ligne
*	Trouver 0 ou plus du caractère qui précède
\<	Trouver la chaîne au début d'un mot
\>	Trouver la chaîne à la fin d'un mot

ERb

Certains caractères spéciaux sont spécifiques aux ERb :

Caractère spécial	Description
\{a,b\}	Trouver de a à b occurrences de ce qui précède
\{a\}	Trouver exactement le nombre a d'occurrences de ce qui précède
\{a,\}	Trouver le nombre a ou plus d'occurrences de ce qui précède
\(ERb)	Mémoriser une ERb
\1	Rappeler la première ERb mémorisée
\2, \3 …	Rappeler la deuxième ERb mémorisée, rappeler la troisième ERb mémorisée etc

ERe

Certains caractères spéciaux sont spécifiques aux ERe :

Caractère spécial	Description
?	Trouver 0 ou 1 occurrence de ce qui précède
+	Trouver 1 ou n d'occurrences de ce qui précède
{a,b}	Trouver de a à b occurrences de ce qui précède
{a}	Trouver exactement le nombre a d'occurrences de ce qui précède
{a,}	Trouver le nombre a ou plus d'occurrences de ce qui précède
()	Faire un ET des expressions régulières entre les paranthèses
\|	Faire un OU des expressions régulières se trouvant de chaque côté du pipe

La Commande grep

La commande grep peut être utilisée pour rechercher des lignes contenant une chaîne de caractères dans un jeu de fichiers.

Par défaut, la commande grep est sensible à la casse. Pour rendre cette commande insensible à la casse, il faut utiliser l'option -i.

La commande grep peut être aussi utilisée pour faire l'inverse, autrement dit de montrer les lignes qui ne contiennent pas la chaîne recherchée. Dans ce cas, il faut utiliser l'option –v.

La commande grep peut être utilisée avec des Expressions Régulières basiques. Ceci est utile pour rechercher dans le contenu de fichiers.

<note> Téléchargez le fichier greptest de la section Fichiers partagés de cette leçon et placez-le dans le répertoire /tmp. </note>

Le contenu du fichier greptest est :

greptest

fenestrOS
fenestros
555-5555
f
.fenestros
.fe
£

Recherchez maintenant toute ligne du fichier /tmp/greptest contenant au moins une lettre :

# grep '[a-zA-Z]' /tmp/greptest
fenestrOS
fenestros
f
.fenestros
.fe

Recherchez maintenant toute ligne contenant au moins une lettre ou un chiffre :

# grep '[a-zA-Z0-9]' /tmp/greptest
fenestrOS
fenestros
555-5555
f
.fenestros
.fe

<note important> Notez la présence de la ligne 555-5555. </note>

Recherchez maintenant toute ligne contenant un numéro de téléphone au format NNN-NNNN :

# grep '[0-9]\{3\}-[0-9]\{4\}' /tmp/greptest
555-5555

Recherchez maintenant toute ligne contenant exactement un caractère :

# grep '^.$' /tmp/greptest
f
£

<note important> Notez l'utilisation des caractères spéciaux le début de ligne : ^, n'importe quel caractère : . et la fin de ligne : $. </note>

Recherchez maintenant toute ligne commençant par un point :

# grep '^\.' /tmp/greptest
.fenestros
.fe

<note important> Notez l'utilisation du caractère d'échappement \ pour annuler l'effet du caractère spécial . </note>

La Commande egrep

Avec la commande egrep, l'utilisation des expressions régulières est étendue aux ERe.

Éditez maintenant votre fichier /tmp/greptest ainsi :

greptest1

# Commentaire du début
fenestrOS
fenestros
# Un autre commentaire
555-5555
f
 
.fenestros
 
.fe
 
£
# Commentaire de la fin

Utilisez la commande egrep pour envoyer le contenu du fichier /tmp/greptest, sans commentaires et sans lignes vides, dans le fichier /tmp/greptest1 :

[root@centos ~]# egrep -v '^(#|$)'  /tmp/greptest > /tmp/greptest1
[root@centos ~]# cat /tmp/greptest1
fenestrOS
fenestros
555-5555
f
.fenestros
.fe
£

<note important> Cette commande est particulièrement utile face à un fichier de configuration de plusieurs centaines de lignes dont certaines contiennent des directives activées d'autres sont vides ou en commentaires. De cette façon vous pouvez généré facilement un fichier ne contenant que les directives activées. </note>

La Commande fgrep

Avec la commande fgrep, la recherche concerne une chaîne de caractères interprétés dans un sens littéral sans utilisation de caractères spéciaux ni d'expressions régulières.

Éditez maintenant votre fichier /tmp/greptest ainsi :

greptest2

# Commentaire du début
^ voici une ligne pour la recherche fgrep
fenestrOS
fenestros
# Un autre commentaire
555-5555
f
 
.fenestros
 
.fe
 
£
# Commentaire de la fin

Utilisez maintenant la commande fgrep pour rechercher la ligne commençant par le caractère ^ :

# fgrep '^' /tmp/greptest
^ voici une ligne pour la recherche fgrep

Comparez le résultat ci-dessus avec celui de la commande grep :

# grep '^' /tmp/greptest
# Commentaire du début
^ voici une ligne pour la recherche fgrep
fenestrOS
fenestros
# Un autre commentaire
555-5555
f

.fenestros

.fe

£
# Commentaire de la fin

En effet, la ligne de commande en utilisant la commande grep devrait être :

# grep '^\^' /tmp/greptest
^ voici une ligne pour la recherche fgrep

Le Commande sed

La commande sed ou Stream EDitor est un éditeur de texte non-intéractif. Les actions spécifiées par la commande sed sont exécutées par défaut sur chaque ligne du fichier. La commande sed ne modifie pas le fichier d'origine et sa sortie standard est le canal 1.

Si plusieurs actions sont spécifiées dans la ligne de commande, chacune doit être précédée par l'option -e.

La syntaxe de la commande sed est la suivante :

sed [adresse] commande [arguments]

L'adresse permet de stipuler les lignes concernées par la commande.

La syntaxe d'une adresse peut être :

adresse	Lignes concernées
a	La ligne numéro a
$	La dernière ligne
/ERb/	Les lignes qui correspondent à l'ERb
a,b	De la ligne numéro a jusqu'à la ligne numéro b
/ERb1/, /ERb2/	Toutes les lignes entre la première occurrence correspondant à l'ERb1 jusqu'à la première occurrence correspondant à l'ERb2

Le commandes de sed sont :

commande	Description
d	Ne pas afficher la ou les ligne(s)
p	Afficher la ou les ligne(s)
s	Effectuer une substitution
w	Ecrire le ou les ligne(s) dans un fichier
=	Afficher le numéro de la ligne spécifiée
!	Exécuter la commande ci-dessus sur toutes les lignes sauf celle spécifiées dans l'adresse

La Commande d

La commande d de sed permet de ne pas afficher certaines lignes à l'écran. Dans l'exemple qui suit, les 10 premières lignes du fichier /etc/services ne sont pas affichées à l'écran :

# sed '1,10d' /etc/services | more
echo            7/udp
discard         9/tcp           sink null
discard         9/udp           sink null
systat          11/tcp          users
daytime         13/tcp
daytime         13/udp
netstat         15/tcp
chargen         19/tcp          ttytst source
chargen         19/udp          ttytst source
ftp-data        20/tcp
ftp             21/tcp
ssh             22/tcp                          # Secure Shell
telnet          23/tcp
smtp            25/tcp          mail
time            37/tcp          timserver
time            37/udp          timserver
name            42/udp          nameserver
whois           43/tcp          nicname         # usually to sri-nic
domain          53/udp
domain          53/tcp
bootps          67/udp                          # BOOTP/DHCP server
bootpc          68/udp                          # BOOTP/DHCP client
--A suivre--

Dans l'exemple qui suit, sed n'affiche pas de lignes de commentaires, c'est-à-dire les lignes commençant par le caractère # :

# sed '/^#/d' /etc/services | more
tcpmux          1/tcp
echo            7/tcp
echo            7/udp
discard         9/tcp           sink null
discard         9/udp           sink null
systat          11/tcp          users
daytime         13/tcp
daytime         13/udp
netstat         15/tcp
chargen         19/tcp          ttytst source
chargen         19/udp          ttytst source
ftp-data        20/tcp
ftp             21/tcp
ssh             22/tcp                          # Secure Shell
telnet          23/tcp
smtp            25/tcp          mail
time            37/tcp          timserver
time            37/udp          timserver
name            42/udp          nameserver
whois           43/tcp          nicname         # usually to sri-nic
domain          53/udp
domain          53/tcp
--A suivre--

<note important> Notez que l'ERb est entourée des caractères / et /. </note>

La Commande p

La commande sed vous permet d'afficher à l'écran certaines lignes spécifiées en utilisant la commande p :

# sed '1,2p' /etc/passwd
root:x:0:0:Super-User:/:/sbin/sh
root:x:0:0:Super-User:/:/sbin/sh
daemon:x:1:1::/:
daemon:x:1:1::/:
bin:x:2:2::/usr/bin:
sys:x:3:3::/:
adm:x:4:4:Admin:/var/adm:
lp:x:71:8:Line Printer Admin:/usr/spool/lp:
uucp:x:5:5:uucp Admin:/usr/lib/uucp:
nuucp:x:9:9:uucp Admin:/var/spool/uucppublic:/usr/lib/uucp/uucico
smmsp:x:25:25:SendMail Message Submission Program:/:
listen:x:37:4:Network Admin:/usr/net/nls:
gdm:x:50:50:GDM Reserved UID:/:
webservd:x:80:80:WebServer Reserved UID:/:
postgres:x:90:90:PostgreSQL Reserved UID:/:/usr/bin/pfksh
svctag:x:95:12:Service Tag UID:/:
nobody:x:60001:60001:NFS Anonymous Access User:/:
noaccess:x:60002:60002:No Access User:/:
nobody4:x:65534:65534:SunOS 4.x NFS Anonymous Access User:/:

<note important> Notez que sed affiche également tout le contenu du fichier. Ceci implique que les lignes 1 et 2 s'affichent deux fois. </note>

Pour n'afficher que les lignes spécifiées, il convient d'utiliser l'option -n :

# sed -n '1,2p' /etc/passwd
root:x:0:0:Super-User:/:/sbin/sh
daemon:x:1:1::/:

La Commande w

La commande w permet d'écrire dans un fichier. Par exemple pour écrire dans le fichier /tmp/sedtest toutes les lignes du fichier /etc/services ne commençant pas par le caractère #, il convient d'utiliser la commande suivante :

# sed -n '/^#/!w /tmp/sedtest' /etc/services
# more /tmp/sedtest
tcpmux          1/tcp
echo            7/tcp
echo            7/udp
discard         9/tcp           sink null
discard         9/udp           sink null
systat          11/tcp          users
daytime         13/tcp
daytime         13/udp
netstat         15/tcp
chargen         19/tcp          ttytst source
chargen         19/udp          ttytst source
ftp-data        20/tcp
ftp             21/tcp
ssh             22/tcp                          # Secure Shell
telnet          23/tcp
smtp            25/tcp          mail
time            37/tcp          timserver
time            37/udp          timserver
name            42/udp          nameserver
whois           43/tcp          nicname         # usually to sri-nic
domain          53/udp
domain          53/tcp
--A suivre--(11%)

La Commande s

La commande s permet de procéder à une substitution :

# echo "user1,user2,user3" > /tmp/sedtest1
# cat /tmp/sedtest1
user1,user2,user3
# cat /tmp/sedtest1 | sed 's/,/ /g'
user1 user2 user3

<note important> Notez que dans cet exemple, la commande s est suivi par un argument qui prend la forme /ce qui est à remplacer (caractère, chaîne ou ERb)/chaîne de remplacement/g. Le caractère g force le remplacement de toutes les occurrences. Sans elle, uniquement la première occurrence serait remplacée. Dans le cas de l'exemple, on remplace donc les virgules par des espaces. </note>

La Commande awk

Présentation

Le processeur de texte awk est un filtre. Une action awk est fournie sur la ligne de commande entourée de ' ou de “ :

awk [-F séparateur] 'critère {action}' [fichier1 ... fichiern]

<note important> Le couple critère {action} s'appelle une clause. </note>

Dans le cas de l'utilisation d'un script awk, la syntaxe de la commande devient :

awk [-F séparateur] -f script [fichier1 ... fichiern]

Découpage en champs

awk sait identifier les champs de la ligne soit parce que ceux-ci sont séparés par un espace ou par une tabulation soit parce que la ligne de commande lui a identifié le séparateur grâce à l'option -F.

awk stocke les informations de la ligne dans des variables :

Variable	Description
$0	Contient toute la ligne
$1, $2 …	Contient le premier champ de la ligne, contient le deuxième champ de la ligne …

Par exemple :

# pwd
/Documents
# ls -l | awk '{print $8 $3 $4}'

15:54rootroot
15:54rootroot
15:54rootroot
15:54rootroot

Comme vous pouvez constater, awk a extrait du résultat de la commande ls-l les champs nom de l'élément, le propriétaire et le groupe.

Afin de le rendre un peu plus lisible, saisissez la commande suivante :

# pwd
/Documents
# ls -l | awk '{print $8 " " $3 " " $4}'

15:54 root root
15:54 root root
15:54 root root
15:54 root root

Critères

Les critères conditionnent l'exécution d'une action dans une clause.

Plusieurs types de critères sont possibles. Les plus utilisées sont les suivantes :

Une expression régulière valide pour la ligne

Format:
/expression régulière/ {instruction}
Exemple:
/ERe/ {print $0}

Une expression régulière valide pour un champ

Format:
$n ~/expression régulière/ {instruction}
$n!~/expression régulière/ {instruction}
Exemple:
$1 ~/ERe/ {print $0}
$1!~/ERe/ {print $0}

awk sélectionne des lignes en utilisant un opérateur de correspondance ou de non-correspondance :

Opérateur	Condition
~	Correspondance
!~	Non-correspondance

Une comparaison

Format:
$n opérateur critère de comparaison {action}
Exemple:
$1 > 20 {print $0}

Les opérateurs sont :

Opérateur	Condition
<	Inférieur
<=	Inférieur ou égal
==	Egal
!=	Différent
>	Supérieur
>=	Supérieur ou égal

Un opérateur logique

Format:
test1 opérateur logique test2 {action}
Exemple:
$1 ~/ERe/ && $2 > 20 {print $0}

Les opérateurs sont :

Opérateur logique	Condition
\|\|	OU
&&	ET
!	NON

Une variable interne

Format:
expression1, expression2 {action}
Exemple:
NR==7, NR==10 {print $0}

Les variables sont :

Variable	Description
NR	Nombre total de lignes
NF	Nombre total de champs
FILENAME	Le nom du fichier en entrée
FS	Le séparateur de champs en entrée. Par défaut un espace ou une tabulation
RS	Le séparateur de lignes en entrée. Par défaut une nouvelle ligne
OFS	Le séparateur de champs en sortie. Par défaut un espace
ORS	Le séparateur de lignes en sortie. Par défaut une nouvelle ligne
OFMT	Le format numérique. Par défaut ”%.6g“

Scripts awk

Quand un programme awk comporte plusieurs clauses composées de critères et d'actions, il convient de d'écrire un script awk. Ce script comporte trois sections :

La section BEGIN
- Cette section est exécutée avant la lecture du script
La section principale
- Cette section contient les clauses
La section END
- Cette sectione est exécutée une fois à la fin du script

</note>

Par exemple :

[root@centos ~]# cd /tmp 
[root@centos tmp]# cat > scriptawk
BEGIN {
  print "Liste des systèmes de fichiers montés"}
{print $0}
END {
  print "====================================="} [Entrée]
[^D]

<note important> Dans l'exemple ci-dessus, la ligne [^D] indique que vous devez appuyer simultanément sur les touches CTRL et D. </note>

Ensuite saisissez la commande suivante :

# awk -f scriptawk /etc/vfstab
Liste des systèmes de fichiers montés
#device         device          mount           FS      fsck    mount   mount
#to mount       to fsck         point           type    pass    at boot options
#
fd      -       /dev/fd fd      -       no      -
/proc   -       /proc   proc    -       no      -
/dev/dsk/c0d0s1 -       -       swap    -       no      -
/dev/dsk/c0d0s0 /dev/rdsk/c0d0s0        /       ufs     1       no      -
/dev/dsk/c0d0s7 /dev/rdsk/c0d0s7        /export/home    ufs     2       yes    -/devices        -       /devices        devfs   -       no      -
sharefs -       /etc/dfs/sharetab       sharefs -       no      -
ctfs    -       /system/contract        ctfs    -       no      -
objfs   -       /system/object  objfs   -       no      -
swap    -       /tmp    tmpfs   -       yes     -
=====================================

<note important> Notez l'utilisation de l'option -f qui applique le script awk au fichier donné en argument. </note>

La Fonction printf

La fonction intégrée printf permet de formater des affichages. Elle a la syntaxe suivante :

printf ("chaine",expression1,expression2,...,expressionn)

chaine contient autant de formats qu'il y a d'expressions.

Les formats de printf sont, par exemple :

Format	Description
%30s	Affichage d'une chaîne (s=string) sur 30 positions avec cadrage à droite
%-30s	Affichage d'une chaîne (s=string) sur 30 positions avec cadrage à gauche
%4d	Affichage d'un entier sur 4 positions avec cadrage à droite
%-4d	Affichage d'un entier sur 4 positions avec cadrage à gauche

Structures de Contrôle

awk peut utiliser des structures de contrôle.

if

La syntaxe de la commande if est la suivante :

if condition { 

    commande
    commande
    ...
}

else {

    commande
    commande
    ...
}

ou dans le cas d'une seule commande :

if condition

    commande

else

    commande

for

La syntaxe de la structure de contrôle for est la suivante :

for variable in liste_variables {

    commande
    commande
    ...

}

ou dans le cas d'une seule commande :

for variable in liste_variables

    commande

ou dans le cas d'un tableau :

for clef dans tableau {

    print clef , tableau[clef]

}

while

La syntaxe de la structure de contrôle while est la suivante :

while condition {

     commande
     commande
     ...

}

do-while

La syntaxe de la structure de contrôle do-while est la suivante :

do {

     commande
     commande
     ...

} while condition

Tableaux

Pour illustrer l'utilisation des tableaux, créez le fichier ventes_materiel. Ce fichier contient des statistiques de vente par type de PC et par département :

ventes_materiel

# FenestrOs.com
# Ventes annuelles par département
# 83
Desktops§100
Portables§50
Serveurs§21
Tablettes§4
 
# 06
Desktops§99
Portables§60
Serveurs§8
Tablettes§16
 
# 13
Desktops§130
Portables§65
Serveurs§12
Tablettes§56

Créez maintenant le script awk ventes.awk. Ce script a pour but de calculer le nombre total de PC vendus dans les trois départements cités dans le fichier ventes_materiel :

ventes.awk

# BEGIN
BEGIN {
        FS="§"
        }
# TABLEAU
$1 !~ /^#/ && $1 !~ /^$/ {
        ventes[$1]+=$2
}
# END
END {
        for (pc in ventes)
        printf("Type PC :  %s \t Ventes (06+13+83) : %10d\n",pc,ventes[pc]);
}

Ce fichier comporte 13 lignes :

     1	# BEGIN
     2	BEGIN {
     3		FS="§"
     4	}
     5	# TABLEAU
     6	$1 !~ /^#/ && $1 !~ /^$/ {
     7		ventes[$1]+=$2
     8	}
     9	# END
    10	END {
    11		for (pc in ventes)
    12		printf("Type PC :  %s \t Ventes (06+13+83) : %10d\n",pc,ventes[pc]);
    13	}

Dans ce script vous noterez :

La ligne 3,
- Cette ligne se trouve dans la section BEGIN. Elle spécifie le séparateur de champs.
La ligne 6,
- Cette ligne évite le traitement de toute ligne commençant par le caractère # ainsi que toute ligne vide.
La ligne 7,
- Ce tableau a pour clef la valeur de $1, c'est-à-dire, les noms des différents types de PC. Le valeurs du tableau sont le nombre de PC vendus, ici représenté par $2. Les caractères += indique qu'à chaque traitement de ligne, le nombre de PC vendus sur la ligne doit être rajouté à la valeur déjà présente dans le tableau.
La ligne 11,
- Cette ligne démarre une boucle for.7
La ligne 12,
- Cette ligne utilise printf afin d'imprimer à l'écran les valeurs calculées et stockées dans le tableau.

Appliquez maintenant votre script awk au fichier ventes_materiel :

# awk -f ventes.awk ventes_materiel
Type PC :  Serveurs      Ventes (06+13+83) :         41
Type PC :  Tablettes     Ventes (06+13+83) :         76
Type PC :  Portables     Ventes (06+13+83) :        175
Type PC :  Desktops      Ventes (06+13+83) :        329

La Commande cut

Chaque ligne est divisée en colonnes. Dans une ligne le premier caractère est dans la colonne numéro un, le deuxième dans la colonne deux et ainsi de suite. Dans une ligne il peut y avoir des champs séparés par des tabulations.

La commande cut permet de sélectionner des colonnes et des champs dans un fichier. La commande permet aussi d'utiliser une critère de séparation de champs autre que la tabulation en spécifiant cette critère en utilisant l'option -d.

Par exemple, pour sélectionner les 7 premières colonnes du fichier /etc/passwd la commande est :

# cut -c1-7 /etc/passwd
root:x:
daemon:
bin:x:2
sys:x:3
adm:x:4
lp:x:71
uucp:x:
nuucp:x
smmsp:x
listen:
gdm:x:5
webserv
postgre
svctag:
nobody:
noacces
nobody4
test:x:

Pour sélectionner les colonnes 1 à 5, les colonnes 10 à 15 et les colonnes 30 et après, il convient d’utiliser la commande suivante :

# cut -c1-5,10-15,30- /etc/passwd
root:0:Supe/sh
daemo1:1::/
bin:x::/usr
sys:x::/:
adm:x:Admin
lp:x::Line /usr/spool/lp:
uucp:5:uucpb/uucp:
nuucp:9:uucpool/uucppublic:/usr/lib/uucp/uucico
smmsp5:25:Se Submission Program:/:
liste37:4:Nusr/net/nls:
gdm:x50:GDM/:
websex:80:8served UID:/:
postgx:90:9eserved UID:/:/usr/bin/pfksh
svcta95:12:D:/:
nobod60001:ymous Access User:/:
noaccx:6000ess User:/:
nobod:65534.x NFS Anonymous Access User:/:
test:0:1:Tee/test:/bin/ksh

Pour sélectionner les champs 2, 4 et 6 du fichier, il convient d'utiliser la commande suivante :

# cut -d: -f2,4,6 /etc/passwd
x:0:/
x:1:/
x:2:/usr/bin
x:3:/
x:4:/var/adm
x:8:/usr/spool/lp
x:5:/usr/lib/uucp
x:9:/var/spool/uucppublic
x:25:/
x:4:/usr/net/nls
x:50:/
x:80:/
x:90:/
x:12:/
x:60001:/
x:60002:/
x:65534:/
x:1:/export/home/test

La Commande uniq

La commande suivante permet d'extraire du fichier /etc/passwd les GID utilisés en tant que groupes principaux des utilisateurs :

# cut -d: -f4 /etc/passwd | sort -n | uniq
0
1
2
3
4
5
8
9
12
25
50
80
90
60001
60002
65534

<note important> Notez l'utilisation de la commande uniq qui permet de supprimer les doublons dans la sortie triée. </note>

La Commande tr

La commande tr permet de substituer des caractères pour d'autres. Cette commande n'accepte que des données en provenance de son entrée standard et non en provenance d'un fichier.

# cat /etc/passwd | tr "[a-z]" "[A-Z]"
ROOT:X:0:0:SUPER-USER:/:/SBIN/SH
DAEMON:X:1:1::/:
BIN:X:2:2::/USR/BIN:
SYS:X:3:3::/:
ADM:X:4:4:ADMIN:/VAR/ADM:
LP:X:71:8:LINE PRINTER ADMIN:/USR/SPOOL/LP:
UUCP:X:5:5:UUCP ADMIN:/USR/LIB/UUCP:
NUUCP:X:9:9:UUCP ADMIN:/VAR/SPOOL/UUCPPUBLIC:/USR/LIB/UUCP/UUCICO
SMMSP:X:25:25:SENDMAIL MESSAGE SUBMISSION PROGRAM:/:
LISTEN:X:37:4:NETWORK ADMIN:/USR/NET/NLS:
GDM:X:50:50:GDM RESERVED UID:/:
WEBSERVD:X:80:80:WEBSERVER RESERVED UID:/:
POSTGRES:X:90:90:POSTGRESQL RESERVED UID:/:/USR/BIN/PFKSH
SVCTAG:X:95:12:SERVICE TAG UID:/:
NOBODY:X:60001:60001:NFS ANONYMOUS ACCESS USER:/:
NOACCESS:X:60002:60002:NO ACCESS USER:/:
NOBODY4:X:65534:65534:SUNOS 4.X NFS ANONYMOUS ACCESS USER:/:
TEST:X:100:1:TEST:/EXPORT/HOME/TEST:/BIN/KSH

La commande tr peut être utilisée pour isoler une chaîne. Par exemple pour isoler l'adresse IP de la carte eth0 dans la sortie de la commande ifconfig :

# ifconfig -a
lo0: flags=2001000849<UP,LOOPBACK,RUNNING,MULTICAST,IPv4,VIRTUAL> mtu 8232 index 1
        inet 127.0.0.1 netmask ff000000
e1000g0: flags=1004843<UP,BROADCAST,RUNNING,MULTICAST,DHCP,IPv4> mtu 1500 index 2
        inet 10.0.2.15 netmask ffffff00 broadcast 10.0.2.255
        ether 8:0:27:42:1d:38
# ifconfig e1000g0
e1000g0: flags=1004843<UP,BROADCAST,RUNNING,MULTICAST,DHCP,IPv4> mtu 1500 index 2
        inet 10.0.2.15 netmask ffffff00 broadcast 10.0.2.255
        ether 8:0:27:42:1d:38
# ifconfig e1000g0 | grep "inet"
        inet 10.0.2.15 netmask ffffff00 broadcast 10.0.2.255
# ifconfig e1000g0 | grep "inet" | tr -s " " ":"
        inet:10.0.2.15:netmask:ffffff00:broadcast:10.0.2.255
# ifconfig e1000g0 | grep "inet" | tr -s " " ":" | cut -d: -f2
10.0.2.15

<note important> Notez l'utilisation de l'option -s avec la commande tr. Cette option permet de remplacer une suite de x caractères identiques par un seul caractère. </note>

La Commande paste

La commande paste concatène les lignes de n fichiers. Par exemple :

# paste -d: /etc/passwd /etc/shadow
root:x:0:0:Super-User:/:/sbin/sh:root:D24f5zPurB8qI:6445::::::
daemon:x:1:1::/::daemon:NP:6445::::::
bin:x:2:2::/usr/bin::bin:NP:6445::::::
sys:x:3:3::/::sys:NP:6445::::::
adm:x:4:4:Admin:/var/adm::adm:NP:6445::::::
lp:x:71:8:Line Printer Admin:/usr/spool/lp::lp:NP:6445::::::
uucp:x:5:5:uucp Admin:/usr/lib/uucp::uucp:NP:6445::::::
nuucp:x:9:9:uucp Admin:/var/spool/uucppublic:/usr/lib/uucp/uucico:nuucp:NP:6445::::::
smmsp:x:25:25:SendMail Message Submission Program:/::smmsp:NP:6445::::::
listen:x:37:4:Network Admin:/usr/net/nls::listen:*LK*:::::::
gdm:x:50:50:GDM Reserved UID:/::gdm:*LK*:::::::
webservd:x:80:80:WebServer Reserved UID:/::webservd:*LK*:::::::
postgres:x:90:90:PostgreSQL Reserved UID:/:/usr/bin/pfksh:postgres:NP:::::::
svctag:x:95:12:Service Tag UID:/::svctag:*LK*:6445::::::
nobody:x:60001:60001:NFS Anonymous Access User:/::nobody:*LK*:6445::::::
noaccess:x:60002:60002:No Access User:/::noaccess:*LK*:6445::::::
nobody4:x:65534:65534:SunOS 4.x NFS Anonymous Access User:/::nobody4:*LK*:6445::::::
test:x:100:1:Test:/export/home/test:/bin/ksh:test:kFNaFtSX26m4Q:15568::::::

La Commande split

La commande split est utilisée pour découper de grands fichiers en petit morceaux d'un taille fixe ou d'un nombre de lignes fixe.

Créez d'abord un fichier d'une taille de 250Mo :

# dd if=/dev/zero of=/file bs=1024k count=250
250+0 enregistrements entrants
250+0 enregistrements sortants

Utilisez maintenant la commande split pour diviser ce fichier en morceaux de 50 Mo :

# split -b 50m /file filepart
# ls -l | grep filepart
-rw-r--r--   1 root     root     52428800 août 16 12:00 filepartaa
-rw-r--r--   1 root     root     52428800 août 16 12:00 filepartab
-rw-r--r--   1 root     root     52428800 août 16 12:00 filepartac
-rw-r--r--   1 root     root     52428800 août 16 12:00 filepartad
-rw-r--r--   1 root     root     52428800 août 16 12:00 filepartae

<note important> Notez que cinq morceaux ont été créés dans le répertoire courant. </note>

La Commande diff

La commande diff indique les modifications à apporter à deux fichiers pour que ceux-ci soient identique.

Pour commencer, créez l'utilisateur test :

# useradd -d /export/home/test -m -s /bin/ksh -c "Test" test
64 blocs

Puis utilisez la commande passwd pour créer son mot de passe :

# passwd test
Nouveau mot de passe : test
Entrez de nouveau le mot de passe : test
passwd: mot de passe correctement modifié pour test

<note important> Notez que le mot de passe saisi ne sera pas visible. </note>

Copiez le fichier /etc/passwd vers le répertoire / :

[root@centos ~]# cp /etc/passwd /

Modifiez ensuite le fichier la ligne test du fichier /passwd ainsi :

...
test10:x:500:500:trainee:/home/trainee:/bin/bash
...

Supprimez les lignes nuucp et svctag dans le fichier /passwd et ajoutez en fin de fichier la ligne Unix est super! :

# vi passwd
"passwd" 18 lignes, 719 caractères
root:x:0:0:Super-User:/:/sbin/sh
daemon:x:1:1::/:
bin:x:2:2::/usr/bin:
sys:x:3:3::/:
adm:x:4:4:Admin:/var/adm:
lp:x:71:8:Line Printer Admin:/usr/spool/lp:
uucp:x:5:5:uucp Admin:/usr/lib/uucp:
smmsp:x:25:25:SendMail Message Submission Program:/:
listen:x:37:4:Network Admin:/usr/net/nls:
gdm:x:50:50:GDM Reserved UID:/:
webservd:x:80:80:WebServer Reserved UID:/:
postgres:x:90:90:PostgreSQL Reserved UID:/:/usr/bin/pfksh
nobody:x:60001:60001:NFS Anonymous Access User:/:
noaccess:x:60002:60002:No Access User:/:
nobody4:x:65534:65534:SunOS 4.x NFS Anonymous Access User:/:
test10:x:100:1:Test:/export/home/test:/bin/ksh
Unix est super!
~
~
~
~
~
~
"passwd" 17 lignes, 635 caractères

Comparez maintenant les deux fichiers :

# diff /etc/passwd /passwd
8d7
< nuucp:x:9:9:uucp Admin:/var/spool/uucppublic:/usr/lib/uucp/uucico
14d12
< svctag:x:95:12:Service Tag UID:/:
18c16,17
< test:x:100:1:Test:/export/home/test:/bin/ksh
---
> test10:x:100:1:Test:/export/home/test:/bin/ksh
> Unix est super!

Dans cette sortie on constate le caractère < et le caractère >. Le premier indique le premier fichier qui a suivi la commande diff tandis que le deuxième indique le deuxième fichier.

Le message 8d7 indique qu'il faut supprimer la ligne 8 dans /etc/passwd car elle n'existe pas après la ligne 7 dans le fichier /passwd.

Le message 14d12 indique qu'il faut supprimer la ligne 14 dans /etc/passwd car elle n'existe pas après la ligne 12 dans le fichier /passwd.

Le message 18c16,17 indique qu'il faut changer la ligne 18 dans /etc/passwd afin que celle-ci corresponde aux lignes 16 et 17.

Inversez maintenant l'ordre de comparaison :

# diff /passwd /etc/passwd
7a8
> nuucp:x:9:9:uucp Admin:/var/spool/uucppublic:/usr/lib/uucp/uucico
12a14
> svctag:x:95:12:Service Tag UID:/:
16,17c18
< test10:x:100:1:Test:/export/home/test:/bin/ksh
< Unix est super!
---
> test:x:100:1:Test:/export/home/test:/bin/ksh

<note important> Notez que les messages sont maintenant inversés. </note>

La Commande cmp

La commande cmp compare les fichiers caractère par caractère. Par défaut la commande s'arrête à la première différence rencontrée :

# cmp /passwd /etc/passwd
/passwd /etc/passwd diffèrent : car. 193, ligne 8

L'option -l de la commande indique toutes les différences en trois colonnes :

# cmp -l /passwd /etc/passwd | more
cmp : EOF sur /passwd
   193 163 156
   194 155 165
   195 155 165
   196 163 143
   201  62  71
   202  65  72
   203  72  71
   204  62  72
   205  65 165
   206  72 165
   207 123 143
   208 145 160
   209 156  40
   210 144 101
   211 115 144
   212 141 155
   214 154 156
   215  40  72
   216 115  57
   217 145 166
   218 163 141
   219 163 162
--A suivre--

La première colonne représente le numéro de caractère, la deuxième la valeur octale ASCII du caractère dans le fichier /passwd et la troisième la valeur octale ASCII du caractère dans le fichier /etc/passwd.

La commande patch

La commande patch est utilisée pour appliquer des modifications à un fichier à partir d'un fichier patch qui contient les différences entre le contenu de l'ancienne version du fichier et la nouvelle version.

Rappelez-vous des modifications apportées au fichier /tmp/greptest par rapport au fichier /tmp/greptest1 :

# cat /tmp/greptest
# Commentaire du début
^ voici une ligne pour la recherche fgrep
fenestrOS
fenestros
# Un autre commentaire
555-5555
f

.fenestros

.fe

£
# Commentaire de la fin
# cat /tmp/greptest1
fenestrOS
fenestros
555-5555
f
.fenestros
.fe
£

Afin de créer un fichier de patch, il convient d'utiliser la commande diff avec l'option -u

# cd /tmp
# diff -u greptest greptest1 > greptest.patch

L'examen du fichier de patch démontre les modifications à apporter au fichier greptest :

# cat greptest.patch
--- greptest    jeu. août 16 09:57:03 2012
+++ greptest1   jeu. août 16 09:54:15 2012
@@ -1,14 +1,7 @@
-# Commentaire du début
-^ voici une ligne pour la recherche fgrep
 fenestrOS
 fenestros
-# Un autre commentaire
 555-5555
 f
-
 .fenestros
-
 .fe
-
 £
-# Commentaire de la fin

Procédez maintenant à l'application du fichier patch :

# patch < greptest.patch
  Ressemble à une opération context diff unifiée.
Fichier auquel appliquer le patch : greptest
terminé

Contrôlez maintenant le contenu du fichier greptest :

# cat greptest
fenestrOS
fenestros
555-5555
f
.fenestros
.fe
£

La commande strings

La commande strings est utilisée pour trouver toutes les chaînes de caractères qui peuvent être imprimés dans un ou plusieurs fichiers objets ou exécutables passés en argument. Un fichier objet est un fichier intermédiaire intervenant dans le processus de compilation.

Sous Linux et Unix, le format d'un fichier objet est le format ELF, (Executable and Linkable Format). Ce format est aussi utilisé pour :

les exécutables,
les bibliothèques partagés,
les core dumps.

Sans option, la commande strings trouve toutes les chaînes d'une longueur de 4 caractères ou plus suivies par un caractère non-imprimable :

# strings /usr/bin/passwd | more
usage:
nisplus
nisplus
nisplus
nisplus
nisplus
nisplus
nisplus
nisplus
nisplus
nisplus
nisplus
nisplus
/bin/sh
%s: %s
passwd -r ldap [-l|-N|-u] [-f] [-n min] [-w warn] [-x max] name
passwd -r ldap -s [name]
passwd -r ldap -sa
passwd -r ldap [-egh] [name]
[-x max] name
passwd -r nisplus [-D domainname] [-l|-N|-u] [-f] [-n min] [-w warn]
passwd -r nisplus [-D domainname] -s [name]
--A suivre--

L'option -t de la commande retourne, en plus des chaînes concernées, la position de décalage pour chaque ligne sur laquelle une ou plusieurs chaînes se trouvent :

# strings -t d /usr/bin/passwd | more
  16844 usage:
  16852 nisplus
  16860 nisplus
  16868 nisplus
  16876 nisplus
  16884 nisplus
  16892 nisplus
  16900 nisplus
  16908 nisplus
  16916 nisplus
  16924 nisplus
  16932 nisplus
  16940 nisplus
  16948 /bin/sh
  16956 %s: %s
  16965 passwd -r ldap [-l|-N|-u] [-f] [-n min] [-w warn] [-x max] name
  17033 passwd -r ldap -s [name]
  17061 passwd -r ldap -sa
  17085 passwd -r ldap [-egh] [name]
  17118 [-x max] name
  17137 passwd -r nisplus [-D domainname] [-l|-N|-u] [-f] [-n min] [-w warn]
  17209 passwd -r nisplus [-D domainname] -s [name]
--A suivre--

L'option -t prend un de trois arguments qui indique le système de numérotation à utiliser :

Argument	Système de Numérotation
d	Décimal
o	Octal
x	Héxadécimal

L'option -n de la commande permet de modifier le nombre de caractères minimales dans les chaînes recherchées :

# strings -t d -n 15 /usr/bin/passwd | more
  16965 passwd -r ldap [-l|-N|-u] [-f] [-n min] [-w warn] [-x max] name
  17033 passwd -r ldap -s [name]
  17061 passwd -r ldap -sa
  17085 passwd -r ldap [-egh] [name]
  17137 passwd -r nisplus [-D domainname] [-l|-N|-u] [-f] [-n min] [-w warn]
  17209 passwd -r nisplus [-D domainname] -s [name]
  17257 passwd -r nisplus -sa
  17281 passwd -r nisplus [-egh] [-D domainname] [name]
  17333 passwd -r nis [-eg] [name]
  17365 passwd [-r files] [-d|-l|-N|-u] [-f] [-n min] [-w warn] [-x max] name
  17437 passwd [-r files] -s [name]
  17469 passwd [-r files] -sa
  17493 passwd [-r files] [-egh] [name]
  17529 passwd [-r files | -r nis | -r nisplus | -r ldap] [name]
  17612 Permission denied
  17648 Password aging is disabled
  17676 Invalid argument to option
  17704 Password file/table busy. Try again later.
  17748 Unexpected failure. Password file/table missing.
  17800 Unexpected failure. Password file/table unchanged.
  17852 Invalid combination of options
  17884 Permission denied
--A suivre--

La commande comm

La commande comm est utilisée pour comparer deux fichiers texte. La sortie de la commande sépare les lignes en trois catégories :

Les lignes présentes seulement dans le premier fichier,
Les lignes présentes seulement dans le deuxième fichier,
Les lignes présentes dans la deux fichiers.

Utilisez la commande comm pour comparer les fichiers /etc/passwd et /root/passwd :

# comm /etc/passwd /passwd
                root:x:0:0:Super-User:/:/sbin/sh
                daemon:x:1:1::/:
                bin:x:2:2::/usr/bin:
                sys:x:3:3::/:
                adm:x:4:4:Admin:/var/adm:
                lp:x:71:8:Line Printer Admin:/usr/spool/lp:
                uucp:x:5:5:uucp Admin:/usr/lib/uucp:
nuucp:x:9:9:uucp Admin:/var/spool/uucppublic:/usr/lib/uucp/uucico
                smmsp:x:25:25:SendMail Message Submission Program:/:
                listen:x:37:4:Network Admin:/usr/net/nls:
                gdm:x:50:50:GDM Reserved UID:/:
                webservd:x:80:80:WebServer Reserved UID:/:
                postgres:x:90:90:PostgreSQL Reserved UID:/:/usr/bin/pfksh
        nobody:x:60001:60001:NFS Anonymous Access User:/:
        noaccess:x:60002:60002:No Access User:/:
        nobody4:x:65534:65534:SunOS 4.x NFS Anonymous Access User:/:
svctag:x:95:12:Service Tag UID:/:
nobody:x:60001:60001:NFS Anonymous Access User:/:
noaccess:x:60002:60002:No Access User:/:
nobody4:x:65534:65534:SunOS 4.x NFS Anonymous Access User:/:
test:x:100:1:Test:/export/home/test:/bin/ksh
        test10:x:100:1:Test:/export/home/test:/bin/ksh
        Unix est super!

Pour afficher uniquement les lignes présentes dans les deux fichiers, il convient d'utiliser les options -1 et -2 :

# comm -12 /etc/passwd /passwd
root:x:0:0:Super-User:/:/sbin/sh
daemon:x:1:1::/:
bin:x:2:2::/usr/bin:
sys:x:3:3::/:
adm:x:4:4:Admin:/var/adm:
lp:x:71:8:Line Printer Admin:/usr/spool/lp:
uucp:x:5:5:uucp Admin:/usr/lib/uucp:
smmsp:x:25:25:SendMail Message Submission Program:/:
listen:x:37:4:Network Admin:/usr/net/nls:
gdm:x:50:50:GDM Reserved UID:/:
webservd:x:80:80:WebServer Reserved UID:/:
postgres:x:90:90:PostgreSQL Reserved UID:/:/usr/bin/pfksh

La commande head

La commande head permet d'afficher les x premières lignes d'un fichier. Sans options, la valeur de x est de 10 par défaut :

# head /etc/passwd
root:x:0:0:Super-User:/:/sbin/sh
daemon:x:1:1::/:
bin:x:2:2::/usr/bin:
sys:x:3:3::/:
adm:x:4:4:Admin:/var/adm:
lp:x:71:8:Line Printer Admin:/usr/spool/lp:
uucp:x:5:5:uucp Admin:/usr/lib/uucp:
nuucp:x:9:9:uucp Admin:/var/spool/uucppublic:/usr/lib/uucp/uucico
smmsp:x:25:25:SendMail Message Submission Program:/:
listen:x:37:4:Network Admin:/usr/net/nls:

Avec l'option -n, la valeur de x peut être spécifiée :

# head -n 12 /etc/passwd
root:x:0:0:Super-User:/:/sbin/sh
daemon:x:1:1::/:
bin:x:2:2::/usr/bin:
sys:x:3:3::/:
adm:x:4:4:Admin:/var/adm:
lp:x:71:8:Line Printer Admin:/usr/spool/lp:
uucp:x:5:5:uucp Admin:/usr/lib/uucp:
nuucp:x:9:9:uucp Admin:/var/spool/uucppublic:/usr/lib/uucp/uucico
smmsp:x:25:25:SendMail Message Submission Program:/:
listen:x:37:4:Network Admin:/usr/net/nls:
gdm:x:50:50:GDM Reserved UID:/:
webservd:x:80:80:WebServer Reserved UID:/:

La commande tail

La commande tail permet d'afficher les x dernières lignes d'un fichier. Sans options, la valeur de x est de 10 par défaut :

# tail /etc/passwd
smmsp:x:25:25:SendMail Message Submission Program:/:
listen:x:37:4:Network Admin:/usr/net/nls:
gdm:x:50:50:GDM Reserved UID:/:
webservd:x:80:80:WebServer Reserved UID:/:
postgres:x:90:90:PostgreSQL Reserved UID:/:/usr/bin/pfksh
svctag:x:95:12:Service Tag UID:/:
nobody:x:60001:60001:NFS Anonymous Access User:/:
noaccess:x:60002:60002:No Access User:/:
nobody4:x:65534:65534:SunOS 4.x NFS Anonymous Access User:/:
test:x:100:1:Test:/export/home/test:/bin/ksh

La valeur de x peut être spécifiée :

# tail -15 /passwd
bin:x:2:2::/usr/bin:
sys:x:3:3::/:
adm:x:4:4:Admin:/var/adm:
lp:x:71:8:Line Printer Admin:/usr/spool/lp:
uucp:x:5:5:uucp Admin:/usr/lib/uucp:
smmsp:x:25:25:SendMail Message Submission Program:/:
listen:x:37:4:Network Admin:/usr/net/nls:
gdm:x:50:50:GDM Reserved UID:/:
webservd:x:80:80:WebServer Reserved UID:/:
postgres:x:90:90:PostgreSQL Reserved UID:/:/usr/bin/pfksh
nobody:x:60001:60001:NFS Anonymous Access User:/:
noaccess:x:60002:60002:No Access User:/:
nobody4:x:65534:65534:SunOS 4.x NFS Anonymous Access User:/:
test10:x:100:1:Test:/export/home/test:/bin/ksh
Unix est super!

Une option intéressante pour la surveillance des fichiers de journalisation est -f. Cette option met à jour l'affichage au fur et au mesure que le fichier est mis à jour :

# tail -f /var/adm/messages
Aug 14 16:19:31 unknown pseudo: [ID 129642 kern.info] pseudo-device: winlock0
Aug 14 16:19:31 unknown genunix: [ID 936769 kern.info] winlock0 is /pseudo/winlock@0
Aug 14 16:19:31 unknown pseudo: [ID 129642 kern.info] pseudo-device: pm0
Aug 14 16:19:31 unknown genunix: [ID 936769 kern.info] pm0 is /pseudo/pm@0
Aug 14 16:19:31 unknown pseudo: [ID 129642 kern.info] pseudo-device: rsm0
Aug 14 16:19:31 unknown genunix: [ID 936769 kern.info] rsm0 is /pseudo/rsm@0
Aug 14 17:24:20 unknown e1000g: [ID 801725 kern.info] NOTICE: pci8086,100e - e1000g[0] : link down
Aug 14 17:24:25 unknown e1000g: [ID 801725 kern.info] NOTICE: pci8086,100e - e1000g[0] : link up, 1000 Mbps, full duplex
Aug 14 17:24:25 unknown /sbin/dhcpagent[101]: [ID 967406 daemon.warning] refreshing state on e1000g0
Aug 14 17:24:25 unknown /sbin/dhcpagent[101]: [ID 778557 daemon.warning] configure_v4_lease: no IP broadcast specified for e1000g0, making best guess
^C#

Piste : • SO102 - Outils de Manipulation de Fichiers Texte

Table des matières