Sawyer, la legge di Zipf e il Dna

riprendo da www.linguaggiomacchina.it questo pezzo (datato 16 agosto 2011) di Andrea Mameli, intitolato: “Sawyer, la legge di Zipf e il Dna. Della serie imparare dalla fantascienza”.

Per ideare scenari complessi, con aperture credibili verso il tecnologicamente possibile e per giunta in una storia che si sviluppa su diversi piani, bisogna essere ottimi scrittori. Farlo con uno stile avvincente e con spunti scientifici corretti e pertinenti riesce a pochissimi. Ma se poi aggiungiamo una frizzante ironia, nei confronti dei pregiudizi, e anche una rara (ma mai pietistica) delicatezza nei confronti delle persone affette da patologie importanti, allora per me siamo di fronte a un genio. Così ho pensando mentre leggevo WWW 1: Risveglio di Robert J. Sawyer. Per fortuna, due mesi fa, il mio consigliere per la fantascienza, Daniele Barbieri, mi ha invitato caldamente alla lettura di questo libro facendomi scoprire un autore straordinario. Basta leggere la sua biografia e scorrere i suoi titoli. Non amo i confronti, ma inizio a pensare di essere di fronte al nuovo Asimov.

Ma ritorniamo al libro (che sto finendo proprio in queste ore) il cui titolo in inglese è WWW: Wake. Abbiamo, per limitarci a uno dei piani su cui si sviluppa la storia, una ragazza nonvedente, due genitori molto svegli, uno scienziato giapponese e una catena di eventi a mio parere travolgenti. E abbiamo una serie di visioni, sostenute dalla tecnologia, un vero e proprio simulacro del World Wide Web che annuncia il risveglio di un essere cosciente. Uno dei più riusciti innesti scientifici sulla trama fantastica (che orrore queste classificazioni!) fa affiorare un concetto (“Zipf Plot”) di uno scienziato di Harvard, George Kingsley Zipf, noto (ma io non lo conoscevo affatto!) per aver scoperto che l’ordine di frequenza delle parole in una lingua (in qualsiasi lingua!) non è casuale ma segue una precisa legge. Per esempio nella lingua inglese la parola più frequente, “the”, compare il doppio della seconda (“of”), e la frequenza con la quale compare la terza, “and”, è un terzo della seconda, ecc. Così la descrive un personaggio del libro di Sawyer: “George Zipf notò che in ogni lingua umana la frequenza con cui viene utilizzata una parola è inversamente proporzionale alla posizione che occupa nella tabella di frequenza di tutte le parole di quella lingua”.

George Kingsley Zipf descrisse la legge che prende il suo nome nel 1949 in Human Behaviour and the Principle of Least-Effort (Comportamento umano e il principio del minimo sforzo).

Ovviamente la mia curiosità non si placa con Wikipedia. Ed ecco spuntare uno studio [Linguistic features of noncoding DNA sequences. Phys Rev Lett. 1994 Dec 5;73(23):3169-72.] basato sulla legge di Zipf applicata a sequenze note di DNA, conteggiando tutte le ripetizioni di parole identiche. Il risultato è chiaro: le zone non codificanti si adattano meglio alla legge di Zipf rispetto a quelle codificanti, come spiega bene l’articolo di Leonardo Gnesi Linguistica e DNA, ovvero: Dove sequenze “silenti” incontrano il linguaggio umano.

Ma la legge di Zipf significa anche altro: in qualunque conversazione spontanea o testo scritto, in qualsiasi lingua, la frequenza delle parole corte è maggiore di quella delle parole lunghe.

Però oggi è il 15 agosto e ho tempo: non mi fermo qui. Vado avanti e trovo un recente paper di Steven T. Piantadosi1, Harry Tily e Edward Gibson, del MIT, che sembra invalidare la legge di Zipf: Word lengths are optimized for efficient communication. In altre parole la lunghezza di una parola rifletterebbe esclusivamente il suo contenuto di informazione. Analizzando l’uso delle parole in 11 lingue europee Steven Piantadosi e i suoi colleghi hanno determinato una stretta correlazione fra lunghezza delle parole e contenuto informativo. Se questo studio troverà conferma vorrebbe dire che il linguaggio è un vettore di informazioni molto efficiente: il compito delle parole brevi sarebbero quello di ridurre la densità informativa della conversazione.

Per ulteriori approfondimenti rimandiamo al comunicato ufficiale del MIT: Wordly wisdom. What determines the length of words? MIT researchers say they know. (interessanti anche i commenti).

P.S. Reputo estremamente interessante anche questo link: Physicists’ papers on natural language from a complex systems viewpoint

 

 

Redazione
La redazione della bottega è composta da Daniele Barbieri e da chi in via del tutto libera, gratuita e volontaria contribuisce con contenuti, informazioni e opinioni.

2 commenti

  • Bel post. Una miniera di informazioni.
    Sto leggendo anch’io il libro di Sawyer e ne sono affascinata. Direi le stesse parole di Andrea Mameli ma siccome lui lo fa molto meglio di me, me ne sto zitta e sottoscrivo.
    Grazie a Daniele per il suggerimento e per il resto.

Lascia un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *