AWK

AWK
Básico de AWK
Qué es awk
AWK es una herramienta de procesamiento de patrones en líneas de texto. Su utilización
estándar es la de filtrar ficheros o salida de comandos de UNIX, tratando las líneas para, por
ejemplo, mostrar una determinada información sobre las mismas.
Por ejemplo:
Mostrar sólo los nombres y los tamaños de los ficheros:
# ls -l | awk '{ print $8 ":" $5 }'
Mostrar sólo los nombres y tamaños de ficheros .txt:

# ls -l | awk '$8 ~ /\.txt/ { print $8 ":" $5 }'
Imprimir las líneas que tengan más de 4 campos/columnas:

# awk 'NF > 4 {print}' fichero
Formato de uso
El uso básico de AWK es:
awk [condicion] { comandos }
Dónde:
 [condición] representa una condición de matcheo de líneas o parámetros.
 comandos : una serie de comandos a ejecutar:
o $0 → Mostrar la línea completa
o $1-$N → Mostrar los campos (columnas) de la línea especificados.
o FS → Field Separator (Espacio o TAB por defecto)
o NF → Número de campos (fields) en la línea actual
o NR → Número de líneas (records) en el stream/fichero a procesar.
o OFS → Output Field Separator (" ").
o ORS → Output Record Separator ("\n").
o RS → Input Record Separator ("\n").
o BEGIN → Define sentencias a ejecutar antes de empezar el procesado.
o END → Define sentencias a ejecutar tras acabar el procesado.
o length → Longitud de la línea en proceso.
o FILENAME → Nombre del fichero en procesamiento.
o ARGC → Número de parámetros de entrada al programa.
o ARGV → Valor de los parámetros pasados al programa.
Las funciones utilizables en las condiciones y comandos son, entre otras:

 close(fichero_a_reiniciar_desde_cero)
 cos(x), sin(x)
 index()
 int(num)
 lenght(string)
 substr(str,pos,len)
 tolower()
 toupper()
 system(orden_del_sistema_a_ejecutar)
 printf()
Los operadores soportados por awk son los siguientes:
 *, /, %, +, -, =, ++, --, +=, -=, *=, /=, %=.
El control de flujo soportado por AWK incluye:
 if ( expr ) statement
 if ( expr ) statement else statement
 while ( expr ) statement
 do statement while ( expr )
 for ( opt_expr ; opt_expr ; opt_expr ) statement
 for ( var in array ) statement
 continue, break
 (condicion)? a : b → if(condicion) a else b;
Las operaciones de búsqueda son las siguientes:
 /cadena/ → Búsqueda de cadena.
 /^cadena/ → Búsqueda de cadena al principio de la línea.
 /cadena$/ → Búsqueda de cadena al final de la línea.
 $N ~ /cadena/ → Búsqueda de cadena en el campo N.
 $N !~ /cadena/ → Búsqueda de cadena NO en el campo N.

 /(cadena1)|(cadena2)/ → Búsqueda de cadena1 OR cadena2.
 /cadena1/,/cadena2>/ → Todas las líneas entre cadena1 y cadena2.
Ejemplos de selección de columnas

Mostrar una determinada columna de información:
# ls -l | awk '{ print $5 }'
176869
12
4096
4096
Mostrar varias columnas, así como texto adicional (entre comillas):

# ls -l | awk '{ print $8 ":" $5 }'
AEMSolaris7.pdf:176869
fich1:12
Desktop:4096
docs:4096
Imprimir campos en otro orden:

# awk '{ print $2, $1 }' fichero
Imprimir último campo de cada línea:

# awk '{ print $NF }' fichero
Imprimir los campos en orden inverso:

# awk '{ for (i = NF; i > 0; --i) print $i }' fichero
Imprimir última línea:

# awk '{line = $0} END {print line}'
Imprimir primeras N líneas:

# awk 'NR < 100 {print}'
Mostrar las líneas que contienen valores numéricos mayor o menor que
uno dado:
# ls -l | awk '$5 > 1000000 { print $8 ":" $5 }'
# ls -l | awk '$5 > 1000000 || $5 < 100 { print $8 ":" $5 }'

fich1:12
z88dk-src-1.7.tgz:2558227
(También hay operaciones &&)
Mostrar la línea con el valor numérico más grande en un campo

determinado:
# awk '$1 > max { max=$1; linea=$0 }; END { print max, linea }'
fichero
Mostrar aquellos ficheros cuya longitud es mayor que 10 caracteres:

# ls -l | awk 'length($8) > 10 { print NR " " $8 }'
2 AEMSolaris7.pdf
10 function_keys.txt
14 notas_solaris.txt
19 z88dk-src-1.7.tgz
(Campo $8 -nombrefichero- > 10 caracteres, y numero de record)
Mostrar líneas con más o menos de N caracteres:

# awk 'length > 75' fichero
# awk 'length < 75' fichero
Mostrar campos/líneas que cumplan determinadas condiciones entre
campos:
# awk '$2 > $3 {print $3}' fichero
# awk '$1 > $2 {print length($1)}' fichero
Mostrar y el número de campos de un fichero además de la línea:

# awk '{ print NF ":" $0 } ' fichero
Mostrar y numerar sólo las líneas no vacías (no en blanco):

# awk 'NF { $0=++a " :" $0 }; { print }'
Imprimir las líneas que tengan más de N campos:

# awk 'NF > 5 { print $0 }' fichero
Mostrar el número de línea de cada fichero de una lista iniciando

desde cero la cuenta de líneas al empezar cada fichero:
# awk '{print FNR "\t:" $0}' *.txt
Mostrar el número de línea de cada fichero de una lista sin resetear

la cuenta de líneas al empezar cada nuevo fichero:
# awk '{print FNR "\t:" $0}' *.txt
Matcheo/Sustitución de cadenas
Mostrar las líneas que contengan una determinada cadena
# awk '/cadena/ { print }' fichero
Mostrar las líneas que NO contengan una determinada cadena

# awk '! /cadena/ { print }' fichero
# ls -l | awk '/4096/ { print $8 ":" $5 }'

Desktop:4096
docs:4096
Mostrar todas las líneas que aparezcan entre 2 cadenas:

# awk '/cadena_inicio/, /cadena_fin/' fichero
Comparaciones exactas de cadenas:

# awk '$1 == "fred" { print $3 }' fichero
Líneas que contengan cualquier numero en punto flotante:

# awk '/[0-9]+\.[0-9]*/ { print }' fichero
Busqueda de cadenas en un campo determinado

# awk '$5 ~ /root/ { print $3 }' fichero
# ls -l | awk '$8 ~ /txt/ { print $8 ":" $5 }'

apuntes.txt:9342
function_keys.txt:2252
notas_solaris.txt:57081
(Nota, con ~ hemos buscado sólo /txt/ en el campo $8)
Sustituir cadena1 por cadena2:

# awk '{ gsub(/cadena1/,"cadena2"); print }' fichero
Sustituir 1 por 2 sólo en las líneas que contengan "cadena3".

# awk '/cadena3/ { gsub(/1/, "2") }; { print }' fichero
Sustituir una cadena en las líneas que no contengan "cadena3".

# awk '!/cadena3/ { gsub(/1/, "2") }; { print }' fichero
Sustituir una cadena u otra:

# awk '{ gsub(/cadena1|cadena2/, "nueva"); print}' fichero
Filtrado / Eliminación de información
Filtrar las líneas en blanco (numero campos ==0):
# cat file.txt | awk {' if (NF != 0) print $0 '}
Contar número de líneas donde la columna 3 sea mayor que la 1:

# awk '$3 > $1 {print i + "1"; i++}' fichero
Eliminar campo 2 de cada línea:

# awk '{$2 = ""; print}' fichero
Eliminar líneas duplicadas aunque sean no consecutivas:lines.

# awk '!temp_array[$0]++' fichero
Eliminar líneas que tengan una columna duplicada (usando un separador

de columna).
Usamos _ como temp_array. Usamos -F para indicar el separador de
columnas.
En este ejemplo miramos que la columna 3 sea diferente. Es el
equivalente de un
comando "uniq" comparando sólo una columna determinada.
# awk -F',' '!_[$3]++' fichero
(Se basa en utilizar un array de tipo hash/diccionario temporal donde

las líneas que aún no han aparecido valen 0, y las que han
aparecido !=0)
Saltar 1000 Líneas de un fichero:

# awk '{if ( NR > 1000 ) { print $0 }}' fichero
Saltar líneas < 10 y > 20:

# awk '(NR >= 0) && (NR <= 20) { print $0 }'
Cálculos de tamaños / longitudes

Imprimir el número de líneas que contienen una cadena:
# awk '/cadena/ {nlines = nlines + 1} END {print nlines}' fichero
Sumar todos los tamaños de ficheros de un ls -l, o con una condición:

# ls -l | awk '{ sum += $5 } END { print sum }'
3660106
# ls -l | awk ' $3 == "sromero" { sum += $5 } END { print sum }'
3660106
Contar número de líneas del fichero:

# awk 'END {print NR}' infile
Contar el número de líneas vacías de un fichero:

# awk 'BEGIN { x=0 } /^$/ {x=x+1} END { print "Lineas vacias:", x }'
fichero
NOTA: Expandido para leerlo mejor:

BEGIN { x=0 }
/^$/ { x=x+1 }
END { print "Lineas vacias:", x }
Contar el número de palabras / campos en un fichero:

# awk '{ total = total + NF }; END { print total+0 }' fichero
Contar el número total de líneas que contienen una cadena:

# awk '/cadena/ { total++ }; END { print total+0 }' fichero
Imprimir con formato:

yes | head -10 | awk '{printf("%2.0f", NR)}'
Calcular la suma de todos los campos de cada línea

# awk '{suma=0; for (i=1; i<=NF; i++) suma=suma+$i; print suma}'
fichero
Calcular la suma y la media de todas las primeras columnas del

fichero:
# awk '{ suma += $1 } END { print "suma:", s, " media:", s/NR }
Cambio de IFS (Field Separator)
Sacar campos 1 y 3 de /etc/passwd:
# awk -F":" '{ print $1 "\t" $3 }' /etc/passwd
Sacar datos de un fichero CSV separado por comas:

# awk -F"," '$1=="Nombre" { print $2 }' fichero.csv
Otros
Tabular líneas con 3 espacios:
# awk '{ sub(/^/, " "); print }'
Obtener 1 números aleatorio:

# awk '{print rand()}'
Generar 40 número aleatorio (0-100) sustituyendo la línea por el

número:
# yes | head -40 | awk '{ print int(101*rand())}'
Generar 40 números aleatorios sólo con awk:

# awk 'BEGIN { for (i = 1; i <= 40; i++) print int(101 * rand()) }'
Reemplazar cada campo por su valor absoluto:

# awk '{ for (i=1; i<=NF; i=i+1) if ($i<0 0="" 1="" a="" awk="" d=""
de="" definici="" else="" en="" espositivo="" f="sprintf(" fichero=""
ficheros="" field="" for="" funciones="" function="" gazzette="" i="-
$i" if="" individuales="" linux="" lo="" mbox="" n="" nawk=""
okopnik="" partir="" print="" propias="" return="" rom="" s="" un=""
utilizaci="" y="">>f}' mail_file
<0 0="" 1="" a="" awk="" d="" de="" definici="" else="" en=""
espositivo="" f="sprintf(" fichero="" ficheros="" field="" for=""
funciones="" function="" gazzette="" i="-$i" if="" individuales=""
linux="" lo="" mbox="" n="" nawk="" okopnik="" partir="" print=""
propias="" return="" rom="" s="" un="" utilizaci="" y="">
propias="" return="" rom="" s="" un="" utilizaci="" y="">df -h | awk
'{print $6}' > prueba.txt
sed 's/Mounted//' prueba.txt > archivo.txt
for i in `cat archivo.txt`
do
#echo $i
FS_UTIL=`df -h $i |grep /|awk '{print $5}'|cut -f1 -d"%"`
#echo $FS_UTIL
if test $FS_UTIL -ge 80
then
echo "File System" $i " > 80%"
fi
done
df -h | awk '{print $6}' > prueba.txt
sed 's/Mounted//' prueba.txt > archivo.txt
for i in `cat archivo.txt`
do
#echo $i
FS_UTIL=`df -h $i |grep /|awk '{print $5}'|cut -f1 -d"%"`
#echo $FS_UTIL
if test $FS_UTIL -ge 85
then
echo "File System" $i " > 85%" >> fileystem.txt

fi
done
rm -rf prueba.txt
rm -rf archivo.txt
echo "Los filesystem que se encuentran en el archivo adjunto tienen un consumo superior al 85% de
uso" | mailx -s "Monitoreo filesystem servidor" -a fileystem.txt Nelson.martinez@acme.com
funciones="" function="" gazzet

AWK

Cargado por

Información del documento

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

AWK

Cargado por

Copyright:

Formatos disponibles

AWK

Mostrar sólo los nombres y tamaños de ficheros .txt:

Imprimir las líneas que tengan más de 4 campos/columnas:

 [condición] representa una condición de matcheo de líneas o parámetros.

 comandos : una serie de comandos a ejecutar:

o $0 → Mostrar la línea completa

o $1-$N → Mostrar los campos (columnas) de la línea especificados.

o FS → Field Separator (Espacio o TAB por defecto)

o NF → Número de campos (fields) en la línea actual

o NR → Número de líneas (records) en el stream/fichero a procesar.

o OFS → Output Field Separator (" ").

o ORS → Output Record Separator ("\n").

o RS → Input Record Separator ("\n").

o BEGIN → Define sentencias a ejecutar antes de empezar el procesado.

o END → Define sentencias a ejecutar tras acabar el procesado.

o length → Longitud de la línea en proceso.

o FILENAME → Nombre del fichero en procesamiento.

o ARGC → Número de parámetros de entrada al programa.

o ARGV → Valor de los parámetros pasados al programa.

Las funciones utilizables en las condiciones y comandos son, entre otras:

Los operadores soportados por awk son los siguientes:

 *, /, %, +, -, =, ++, --, +=, -=, *=, /=, %=.

El control de flujo soportado por AWK incluye:

 if ( expr ) statement else statement

 while ( expr ) statement

 do statement while ( expr )

 for ( opt_expr ; opt_expr ; opt_expr ) statement

 for ( var in array ) statement

 (condicion)? a : b → if(condicion) a else b;

Las operaciones de búsqueda son las siguientes:

 /cadena/ → Búsqueda de cadena.

 /^cadena/ → Búsqueda de cadena al principio de la línea.

 /cadena$/ → Búsqueda de cadena al final de la línea.

 $N ~ /cadena/ → Búsqueda de cadena en el campo N.

 $N !~ /cadena/ → Búsqueda de cadena NO en el campo N.

 /cadena1/,/cadena2>/ → Todas las líneas entre cadena1 y cadena2.

Ejemplos de selección de columnas

Mostrar varias columnas, así como texto adicional (entre comillas):

Imprimir campos en otro orden:

Imprimir último campo de cada línea:

Imprimir los campos en orden inverso:

Imprimir última línea:

Imprimir primeras N líneas:

# ls -l | awk '$5 > 1000000 || $5 < 100 { print $8 ":" $5 }'

Mostrar la línea con el valor numérico más grande en un campo

Mostrar aquellos ficheros cuya longitud es mayor que 10 caracteres:

Mostrar líneas con más o menos de N caracteres:

Mostrar y el número de campos de un fichero además de la línea:

Mostrar y numerar sólo las líneas no vacías (no en blanco):

Imprimir las líneas que tengan más de N campos:

Mostrar el número de línea de cada fichero de una lista iniciando

Mostrar el número de línea de cada fichero de una lista sin resetear

Mostrar las líneas que NO contengan una determinada cadena

# ls -l | awk '/4096/ { print $8 ":" $5 }'

Mostrar todas las líneas que aparezcan entre 2 cadenas:

Comparaciones exactas de cadenas:

Líneas que contengan cualquier numero en punto flotante:

Busqueda de cadenas en un campo determinado

# ls -l | awk '$8 ~ /txt/ { print $8 ":" $5 }'

Sustituir cadena1 por cadena2:

Sustituir 1 por 2 sólo en las líneas que contengan "cadena3".

Sustituir una cadena en las líneas que no contengan "cadena3".

Sustituir una cadena u otra:

 , /, %, +, -, =, ++, --, +=, -=, =, /=, %=.