Léa-Linux & amis :   LinuxFR   GCU-Squad   GNU
Extraire code HTML ds scripts BASH
Envoyé par: Desespere

hello !

Savez vous comment extraire un bout de code HTML situé entre 2 balises HTML déterminées d'une page html dans un script bash (avec grep, sed, awk ou ce que vous voulez!)

je préfererais éviter à avoir recours à un script perl ou autre, afin que tout mon script tienne dans mon seul script shell.

Le problème est que grep, awk et sed marchent au ligne par ligne, hors mon code à extraire est sur plusieurs lignes...

Merci beacoup de votre aide

Poste le Sunday 23 November 2003 14:11:42
Répondre     Citer    
Re: Extraire code HTML ds scripts BASH
Envoyé par: Jonesy's

Bonjour,

Effectivement avec sed et grep tu risques d'avoir du mal, encore que en ajoutant head et tail on doit s'en sortir.

Mais le plus simple, sans perl, c'est awk :
---------------------------------------
#!/usr/bin/awk -f

BEGIN {
RC=0
INTO=""
}

/BS/ {
RC=1
}

/.*/ {
if ( RC == 1 ) {
INTO=INTO$0
}
}

/BE/ {
sub("BS", "", INTO)
sub("BE", "", INTO)
print "Contenu : "INTO
INTO=""
RC=0
}
---------------------------------------
BS étant la balise de début et BE la balise de fin.

@+

Poste le Sunday 23 November 2003 18:03:46
Répondre     Citer    

Veuillez vous authentifier auparavant pour commenter.

 

Ce forum !
Extraire code HTML ds scripts BASH
Pour poser vos questions sur les scripts shell, le Perl, le C, etc... Attention : nous ne sommes pas des spécialistes du dev, ce forum est juste pour de petites aides ponctuelles concernant le développement et les outils de développement.

Sauf mention contraire, les documentations publiées sont sous licence Creative-Commons