[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Re: [riminilug-general] Risposta tardiva a: "Mi serve uno script"

To: riminilug-general@xxxxxxxxxxxx
Subject: Re: [riminilug-general] Risposta tardiva a: "Mi serve uno script"
From: Ivan Tarozzi <ivan@xxxxxxxxxxxx>
Date: Tue, 11 Sep 2012 14:41:34 +0200
Delivered-to: battarsa@xxxxxxxxxxxx
Delivered-to: mailing list riminilug-general@xxxxxxxxxxxx
Dkim-signature: v=1; a=rsa-sha256; c=relaxed/relaxed; d=gmail.com; s=20120113; h=sender:message-id:date:from:user-agent:mime-version:to:subject :references:in-reply-to:content-type:content-transfer-encoding; bh=6U4eshRmN1k8nXykItYyK4xMv6U3VyJTn9jDbx15Ano=; b=cbsYYjHx0r23vht+oK0ygj9J/UEzvBoa8ucf9T0h56mWbzg1VC/7V8ldhGAtfW6Yb1 nrKKB/NR579c1lkjYVzhhdaRXisSp605jVziYCeNZ5iGkmQsbjp/OONS53IpkCryhFEx aZTIyAzVmdu1iiDMaZ9FeVJ6SeiOo7okHLSeiPk/yhfwO79klKct696k+A42icGp39EP 79QcfmuQL7LOOd2JMx33LkMPMl2KiBCvbAFrVSKWGkMravpIxbK8DB/9mtchIaHpEXv4 0NM1uXwo2HqFpIMb/DqWAmtAPjWodZTSlt8mDFowG5bgduIa7X7JvYYrmPHEDvcve91T ZAkg==
In-reply-to: <1347275815.3154.2.camel@andycat>
List-help: <mailto:riminilug-general-help@riminilug.it>
List-post: <mailto:riminilug-general@riminilug.it>
List-subscribe: <mailto:riminilug-general-subscribe@riminilug.it>
List-unsubscribe: <mailto:riminilug-general-unsubscribe@riminilug.it>
Mailing-list: contact riminilug-general-help@xxxxxxxxxxxx; run by ezmlm
References: <1347275815.3154.2.camel@andycat>
Reply-to: riminilug-general@xxxxxxxxxxxx
Sender: Ivan Tarozzi <itarozzi@xxxxxxxxx>
User-agent: Mozilla/5.0 (X11; Linux x86_64; rv:10.0.5) Gecko/20120624 Icedove/10.0.5

Il 10/09/2012 13:16, Andrea Grossi ha scritto:

Ciao a tutti !!

Visto che sono stato "tirato" in ballo..

Da informazioni datemi da Andy Urbi sul tipo di file da
passare allo script , ne ho creato uno che avesse le seguenti
caratteristiche:
1) File di testo puro (non formattato tipo Open/Libre Office)

2) Il record iniziava con un nominativo racchiuso tra virgolette e,
    di seguito senza spazi, l'indirizzo e-mail racchiuso tra i
caratteri minore e maggiore (<  >  ); di seguito, senza spazi,
  vi era il carattere virgola (,) e uno spazio e poi si ricominciava col
record successivo.

3) Il file aveva la stessa "cadenza" ripetuta per ogni record.

Esempio: file.csv

"Tizio Tizi"<tiziotizi@xxxxxx>, "Caio Cai"<caiocai@xxxxxx>, "Sempronio
Semproni"<semproniosemproni@xxxxxx>,
"Mario Rossi"<mariorossi@xxxxxx>, "Guido Guidi"<guidoguidi@xxxxxx>,
"Cecco Cecchi"<ceccocecchi@xxxxxx>,

Volevo ottenere questo risultato:

Caio Cai            caiocai@xxxxxx
Cecco Cecchi        ceccocecchi@xxxxxx
Guido Guidi         guidoguidi@xxxxxx
Mario Rossi         mariorossi@xxxxxx
Sempronio Semproni  semproniosemproni@xxxxxx
Tizio Tizi          tiziotizi@xxxxxx

Ho aperto un terminale ( Scorciatoia da tastiera CTRL + ALT + T )
e , avendo il file.csv, ho digitato:

cat file.csv |awk 'BEGIN {RS=", "}{print $0}'|sed -e '/^$/d'>  nuovo.csv

in awk
-ho impostato la variabile RS (Record Separator) con virgola spazio (, )
-print $0 stampa l'intero record

in sed
- ho eliminato le righe vuote e ho salvato il tutto in un nuovo file
(nuovo.csv)

Eccolo:

"Tizio Tizi"<tiziotizi@xxxxxx>
"Caio Cai"<caiocai@xxxxxx>
"Sempronio Semproni"<semproniosemproni@xxxxxx>
"Mario Rossi"<mariorossi@xxxxxx>
"Guido Guidi"<guidoguidi@xxxxxx>
"Cecco Cecchi"<ceccocecchi@xxxxxx>

Poi sempre nel terminale ho digitato:

cat nuovo.csv |sed 's|"<|,|g;s|"||g;s|>||g'>nuovo2.csv

in sed
- ho sostituito la sequenza "<  con il carattere virgola (,)
- di seguito ho eliminato le virgolette (") e il carattere>
- è stato creato il file nuovo2.csv (qui di seguito riportato)

Tizio Tizi,tiziotizi@xxxxxx
Caio Cai,caiocai@xxxxxx
Sempronio Semproni,semproniosemproni@xxxxxx
Mario Rossi,mariorossi@xxxxxx
Guido Guidi,guidoguidi@xxxxxx
Cecco Cecchi,ceccocecchi@xxxxxx

Infine ho digitato :

cat nuovo2.csv |column -t -s , |sort>  file_finale.csv

in column
- la -t indica che viene applicato un formato tabella al file
- la -s indica che il carattere , (virgola) viene utilizzato come
separatore dei campi del record e li presenta incolonnati.

sort ordina alfabeticamente (a ->  z)
viene creato il file_finale.csv

Output:

Caio Cai            caiocai@xxxxxx
Cecco Cecchi        ceccocecchi@xxxxxx
Guido Guidi         guidoguidi@xxxxxx
Mario Rossi         mariorossi@xxxxxx
Sempronio Semproni  semproniosemproni@xxxxxx
Tizio Tizi          tiziotizi@xxxxxx

N.B. Non sono un informatico e ho impiegato diverso tempo per venirne a
capo :)
Sicuramente vi sono metodi più eleganti e raffinati per ottenere la
stessa cosa.

Anzi chi avesse soluzioni alternative, si faccia avanti !

Vi saluto !

Andrea G.


E bravo Andrea! Allora non sei timido :D

Intanto grazie per la piegazione e complimenti per il risultato portatoa casa.Come dici bene, lo stesso risultato si può raggiungere in tanti modi econ strumenti diversi, ma intanto questo sembra funzionare.

Visto che siamo tutti qui per imparare e migliorare, ho solo un paio dinote alla tua spiegazione:

premesso che anch'io conosco molto poco sed e ogni volta che lo devousare mi fa arrabbiare, volevo chiedere a te e ad altri che differenzac'è tra il passare lo script di sed con il parametro -e (primo comando)e senza (secondo comando).


leggendo questo nella man page:
----
If  no  -e, --expression, -f, or --file option is given, then the first
non-option argument is taken as  the  sed  script  to  interpret.   All
remaining  arguments  are  names  of input files; if no input files are
specified, then the standard input is read.
-----------

sembra che la chiamata senza -e sia il modo implicito per passare loscript, e quindi, in assenza di altri parametri, le 2 modalità sonoesattamente equivalenti (giusto?). Mi faceva solo strano vedere che inun posto lo usi e nell'altro no.... o c'è una spiegazione diversa e piùfine?


poi, il comando :
	cat nuovo.csv |sed 's|"<|,|g;s|"||g;s|>||g'>nuovo2.csv

mi suona un po' strano perchè solitamente (anche da man page) ilcarattere usato nel comando di sostituzione è / e non |:

	sed 's/"</,/g;s/"//g;s/>//g'

qualcuno sa darmi una spiegazione del perchè funzioni ugualmente equindi perchè i 2 caratteri siano equivalenti?

Infine, ma è una sciocchezza, invece di usare cat e redirigere via pipea sed, si può passare direttamente il nome del file a sed:


	sed 's/"</,/g;s/"//g;s/>//g' nuovo.csv > nuovo2.csv

Visto che poi Andrea chiedeva metodi alternativi, invece di usare awk sipuò usare sempre sed per fare lo split del file:

	sed 's/, /\n/g' file.csv

Ovvero si sostituisce il la coppia di caratteri virgola-spazio (, ) conil carattere di newline.... ma non aggiunge molto a quanto fatto daAndrea via awk :)

	

Ivan


---------------------------------------------------------------------
Per cancellarsi, scrivi a: riminilug-general-unsubscribe@xxxxxxxxxxxx
Se vuoi conoscere altri comandi, scrivi a: riminilug-general-help@xxxxxxxxxxxx

Follow-Ups:
- Re: [riminilug-general] Risposta tardiva a: "Mi serve uno script"
  - From: Andrea Grossi
- Re: [riminilug-general] Risposta tardiva a: "Mi serve uno script"
  - From: Paolo Sala

References:
- [riminilug-general] Risposta tardiva a: "Mi serve uno script"
  - From: Andrea Grossi

Prev by Date: [riminilug-general] R: [riminilug-general] Risposta tardiva a: "Mi serve uno script"
Next by Date: Re: [riminilug-general] Risposta tardiva a: "Mi serve uno script"
Previous by thread: [riminilug-general] Risposta tardiva a: "Mi serve uno script"
Next by thread: Re: [riminilug-general] Risposta tardiva a: "Mi serve uno script"
Index(es):
- Date
- Thread