Riprendo quanto postato da Carla sul suo blog e cerco qui di chiarire alcuni aspetti del problema Affidabilità delle fonti, su cui si discute da tempo.
Partendo dal principio. Credo ci sia una piccola confusione di termini riguardo al “rapporto fiduciario basato su una continua frequentazione” pronunciato da Paolo Valdemarin Su Nòva del 26 gennaio scorso. Infatti qui non ci troviamo a trattare la pertinenza del singolo documento come se esso fosse sospeso nel vuoto. Ci troviamo piuttosto ad utilizzare la precedente produzione di un blogger o le reazioni della blogosfera a determinati post per cercare di creare un qualche meccanismo che ci permetta di dare una valutazione a priori su quanto è o sarà prodotto da una certa fonte su argomenti determinati; su quanto un certo testo possa essere pertinente per noi all’interno di un contesto da stabilire di volta in volta. La frequentazione continua può produrre un effetto di questo tipo?
Probabilmente può darci un’idea, può aiutarci a discernere quali documenti consultare prima degli altri, può insomma facilitarci il lavoro iniziale. La ricerca e la lettura del documento non può comunque mai essere esclusa. Stabilire dei criteri che definiscano una qualche affidabilità serve solo a selezionare in un tempo minore i documenti nella massa della produzione intellettiva.
Il problema non è infatti quello di delegare o meno la lettura dei documenti a qualcun altro, quanto il poterci fare aiutare dagli altri nella selezione degli stessi.
Torno ora a una più generica definizione di Internet.
Ho parlato, nel mio documento del 22 gennaio scorso, di Internet come “contenitore” e vado ora a spiegare meglio il perché di fronte alle perplessità di Carla. Nell’immagine descritta, Internet appare come un aggregato libero di documenti ipertestuali, che rifiuta le categorizzazione in quanto rappresentanti di una organizzazione verticale che si opporrebbe ad una organizzazione invece democratica e orizzontale.
Partendo dal presupposto che Internet non è un medium, ma un insieme di media possiamo facilmente notare come non esso non abbia una organizzazione sistematica. Internet comprende reti verticali e verticistiche e comprende reti orizzontali come gran parte della blogosfera. Bisogna sempre considerare come gran parte del web non sia accessibile all’utente comune e come i problemi di accessibilità e di connettività limitino in modo particolarmente evidente l’utilizzo della rete stessa. Internet è dunque un insieme di reti più o meno gerarchicamente organizzate e più o meno interconnesse tra loro. Se dimentichiamo questo principio base, rischiamo di falsare la visione stessa della struttura sociale che nasce all’interno della rete e, di conseguenza, avere ragionamenti magari limitati o incongruenti che diventano ottime chiavi di risoluzione dei problemi. Il contenitore non è allora pieno di materiale dello stesso tipo, ma di tante piccole scatole create con criteri e regole differenti. Imparare a classificarle e gestirle è un metodo per diventarne consapevoli, per inventariare quanto di diverso possiamo trovare.
Quello che ho appena esposto mi pare un errore reiterato all’interno di una visione della tecnologia in qualche modo “utopistica” che deriva dalla frequentazione di una parte limitata del grande universo che Internet rappresenta. Non so oggi quanto siano in percentuale i documenti web il cui accesso è ristretto o controllato e non so come la moltitudine delle reti sia interconnessa tra loro. Ma se il ragionamento di Carla regge quando parliamo del mio o del suo blog o di qualche sito conosciuto, continua ad avere validità ad esempio all’interno delle pagine riservate della mia università o dei documenti riservati e consultabili solo da determinate categorie nel sito di qualche governo così come dell’ultima associazione di amici? Credo purtroppo di no, la nostra libertà è limitata a quanto possiamo consultare e siccome tutto il resto non ci appare davanti agli occhi, non ci preoccupiamo poi tanto neppure di andarlo a cercare.
Vorrei toccare ora un altro tema molto generale, ma che non mi sembra si sia ancora chiarito. Che differenza c’è tra una biblioteca e Internet?
Innanzitutto occorre esplicitare bene i due termini. Prendiamo per buona la definizione di Internet si cui sopra e soffermiamoci un attimo sul secondo termine.
Quando io parlo di biblioteca non parlo del classico edificio in cui sono raccolti i libri destinati ad essere consultati, non soltanto. Di conseguenza quando parlo di classificazione, non mi rifaccio alla terminologia Dewey o per soggetto che posso trovare nella biblioteca sotto casa. Diciamo piuttosto che è opportuno prendere il termine secondo un’accezione più allargata ripresa sempre dalla semiotica interpretativa. Intendo quindi biblioteca in maniera più vicina al concetto di Enciclopedia di conoscenza; un insieme virtuale di tutte le conoscenze della nostra cultura nel momento storico dato.
Se prendiamo il termine con questa accezione, si nota come ogni percorso di senso all’interno debba essere necessariamente individuale. Come ogni rimando non possa essere stabilito a priori, ma sia una decisione del singolo. Tuttavia resta un problema; le dimensioni di questa massa culturale. Come gestirla? Da sempre l’uomo ha cercato di creare forme di classificazione destinate ad aiutarlo in questo compito, non raggiungendo mai lo scopo che si era prefissato, e cercando al contempo di elaborarne di migliori mano a mano che la tecnologia e la condivisione del sapere producevano un numero sempre maggiore di documenti.
Oggi siamo all’apice di questo percorso. Se ogni ora solo Technorati elabora tanti post quanti libri sono pubblicati nel nostro paese in un anno, come si può trovare in questa massa quello che può essere interessante e separarlo da quello che magari non è utile per noi all’interno di una certa ricerca?
L’unica soluzione è avere un metodo di classificazione delle fonti. Un metodo tendenzialmente semantico, un metodo che parta per categorizzazioni e argomenti e si rifaccia all’esperienza umana che costituisce la spina dorsale della parte abitata della rete.
Che differenza c’è tra questa mia posizione e quella di Sergio Maistrello in fondo? Lui parla del miglior disordine possibile, io parlo di un aiuto umano alla ricerca sia iniziale che nel prosieguo. Entrambi constatiamo la non gestibilità di una rete anarchica.
C’è di sicuro un po’ di speranza in più nei suoi discorsi che nei miei, ma questa è un’altra storia!
In problema è che l’uso dei metadati al momento non ci permette soluzioni definite (ma su questo sto lavorando e pubblicherò presto un piccolo articolo) e nel frattempo dobbiamo cercare di discuterne e di trovare delle soluzioni. Senza rinunciare a dibattere il tema fondamentale. Cosa è e come si può gestire una classificazione di queste dimensioni?
Il problema di fondo che trovo nell’impostazione di Carla è quindi uno solo: che differenza c’è tra la classificazione che lei vede per la rete e quella che esiste nel mondo del documento tradizionale? Io non ho mai usato i cataloghi in biblioteca, sono sempre andato per rimandi di bibliografia e scelta personale, quasi mai ho letto un libro per intero in ambito di ricerca. Non è normale farlo. E che differenza abbiamo tra la classificazione attraverso il paratesto librario e un link ad un documento? Che cosa è una bibliografia se non un aiuto che diamo agli altri sotto forma di scelte soggettive per fargli proseguire un percorso di senso unico e irriproducibile? A cosa può servire una classificazione se non a dare un punto di partenza per percorsi che NON seguiranno quanto il ranking in sé può dire, ma che si muoveranno con libertà attorno ad una linea che fornisce il via, ma che non sa dare di suo indicazioni utili aggiuntive?
Internet non è una biblioteca, è la biblioteca.
Un lettore che, giunto in fondo alle pagine del suo libro, è convinto di “aver letto tutto” è qualcuno che legge romanzi, non che ricerca informazione ed è un limite intellettuale, non del mezzo. Nessun mezzo è capace di esaurire un argomento e nessuno può pretendere di doverlo fare. Bisogna essere consapevoli che stiamo costruendo un percorso, di volta in volta differente, e sempre personale.
L’affidabilità di una fonte cosa è allora? E’ un consiglio, è una qualche forma sempre più elaborata di suggerimento per indicarci possibili strade da percorrere. Non è mai un giudizio fine a sé stesso, altrimenti parleremmo di critica. Ed è davvero sempre più necessaria qui in rete, perché mentre ho scritto tutto questo chissà quante cose sono state pubblicate e non leggerò mai solamente perché non avrò un link che mi conduca a loro oppure perché esse non saranno indicizzate nelle prime pagine di Google. Siamo noi che dobbiamo creare le nostre priorità e renderle disponibili agli altri, siamo noi che dobbiamo cercare le formule giuste per rendere tutto questo più umano.
La tecnologia non sa creare ordini di idee nuovi, è sempre l’uomo a farlo. Ed è per questo che rifiuto il determinismo tecnologico del mezzo. Internet non creerà mai nulla, saremo sempre noi a farlo, ma ci ostiniamo a relegare la nostra fiducia più nei laboratori e nei software che nell’uso che facciamo degli stessi.
Allora l’uso delle nuove tecnologie non avrà mai nulla di sensazionale e nuovo; avrà di certo della caratteristiche inedite, ma saremo sempre capaci di analizzarle partendo dalle nostre vecchie categorie. Se impediamo ad esse di sclerotizzarsi, questo bisogna ricordarlo in ogni momento.
Di grande interesse, nella sua semplicità, l’esposizione sullo stato della blogosfera mondiale pubblicato da David Sifry su Technorati. Analisi quest’ultima che ben ricalca il pragmatismo e la semplicità anglosassone.
Diamo dunque una veloce occhiata ai dati che vengono esposti e vediamo cosa è successo, almeno a grandi linee, negli ultimi mesi nella parte conosciuta del mondo dei blog (quelli segnalati su Technorati e sui cui l’intera indagine è basata).
L’analisi prende in considerazione gli ultimi quattro mesi e, rifacendosi anche alle precedenti analisi, constata come la blogosfera abbia raddoppiato i suoi utenti ogni 5.5 mesi fino ad oggi, raggiungendo la cifra di 27,2 milioni di utenti segnalati. Si parla quindi di una comunità che oggi è oltre 60 volte più numerosa rispetto a quella esistente solo tre anni fa.
Ovviamente ogni giorno nascono nuovi blog (circa 75.000), ma ciò che risulta più interessante è come solo (o almeno) la metà dei blogger (circa 13.7 milioni) continui a postare con una certa regolarità dopo tre mesi dall’apertura del blog. Si nota quindi una notevole dispersione a seguito dell’avventura comunicativa sulla rete. Rifacendoci ai dati di ottobre 2005 possiamo stabilire anche il seguente paragone.
Ottobre 2005 - Blog segnalati 19 milioni, di cui ancora usati a tre mesi dalla nascita 10.4 milioni. Quindi a tre mesi la fedeltà al mezzo era pari a circa il 54.7%
Febbraio 2006 – Blog segnalati 27,2 milioni, di cui ancora usati a tre mesi dalla nascita 13,7 milioni. Quindi a tre mesi la fedeltà al mezzo era pari a circa il 50.4%
C’è una certa discesa percentuale degli utenti attivi. Tuttavia per avere qui una risposta più chiara bisognerebbe standardizzare la raccolta dei dati, ad esempio ogni quattro mesi, poiché stiamo mischiando presente, passato e futuro nel calcolo. Degli utenti oggi attivi non sappiamo in effetti quanti saranno ancora al loro posto tra tre mesi e fare un confronto di questo tipo, mi pare un poco azzardato.
Interessante considerare come Sifry tragga conclusioni diverse dalle mie. La blogosfera sta crescendo o sta diminuendo? In valore assoluto di certo gli utenti aumentano, ma se ci fosse un trend discendente degli utenti attivi in rapporto ai blog creati, potrebbe voler dire che la blogosfera è entrata in una fase di assetto dopo aver raggiunto una dimensione che le attuali capacità di gestione delle informazioni non permettono di superare facilmente.
Come si potrebbe eventualmente spiegare una reale diminuzione degli utenti attivi in rapporto ai blog creati? Disillusione sul fenomeno? Scarsa attenzione degli altri per via del numero sempre maggiore di fonti e quindi partecipazione in declino per mancanza di feedback? Problematica di gestione delle informazioni prodotte dai blog in rapporto a quanto la blogosfera stessa (i blogger) sa recepire nell’unità di tempo?
Se così fosse la discussione sull’affidabilità delle fonti e sulla gestione delle informazioni del mese scorso assumerebbe un peso ancora maggiore. Non è che troppa informazione può fare male e disincentivare quando il seguirla sembra andare oltre le capacità di percezione immediata? Non si rischia forse di creare reti chiuse di utenza e discussione andando a perdere quella parvenza di unità che si era mantenuta sino ad ora?
Molto interessanti poi le considerazioni sullo spam che avviene all’interno del mondo dei blog, calcolato in circa il 9% dei nuovi blog creati e il 60% dei ping ricevuti da Technorati. Anche qui sarebbe molto interessante potere sapere se dai dati precedenti questi blog sono stati estrapolati oppure no. Il nove per cento dei nuovi blog degli ultimi quattro mesi equivale a parlare di circa 738.000 blog. Numero non irrilevante per calcolare un tasso di fidelità simile a quello che proponevamo sopra.
Proseguendo l’analisi potrei dare per scontato l’annuncio della crescita dei post, arrivati a 50.000 ogni ora, mentre rilevo con piacere la crescita del tagging, ovvero del fornire parole chiave ai post per permettere a tutti gli utenti di trovarli più facilmente. Un po’ di ordine fa sempre piacere!La conclusione è quindi dubbiosa. Tante domande, poche risposte.
I dati come vengono forniti da Technorati non sono chiari; non si riesce davvero a capire se e quanto la blogosfera sia ancora in fase di decisa spinta.
Sarebbe stato molto più utile avere dei dati regolari ed esposti in maniera meno ambigua. Se qualcuno riuscisse a venirne in possesso sarei curioso di leggerli e di poterci ragionare sopra con un po’ di calma per cercare di stabilire la situazione attuale con maggior precisione, ma dal post che ho individuato, al di là dell’entusiasmo del primo momento, non abbiamo i mezzi per poter dare uno “stato dell’arte” chiaro ed univoco.
Potrebbe ovviamente essere solo il mio inglese, ma in caso contrario sarebbe un peccato che alla semplicità e al pragmatismo delle esposizioni anglosassoni, questa volta manchi un poco di scientificità
Cerco di rispondere velocemente a quanto detto da Dario nel suo ultimo post, più che altro perché questi sono giorni molto pieni e di tempo non ce n’è. Ci torneremo sicuramente sopra con più calma.
Il problema di stabilire con una precisione un po’ migliore l’affidabilità dei documenti pubblicati in rete è effettivamente, e non può essere diversamente, un problema semantico. Con ciò intendo dire che il collegamento in sé (d’ora in avanti parleremo di valutazione sintattica, come fa Dario nel suo post) non ci dice nulla di più che la mera contabilità delle pagine che rimandano ad un determinato documento. Ovviamente questo non ci fornisce elementi di maggiore discriminazione rispetto a quanto sapevamo prima: perché una pagina è così linkata? Ci sarebbero infiniti motivi differenti e potenzialmente validi. Si tratta quindi di spostare la questione sul livello semantico dei collegamenti, ovvero sul valore di cui essi sono investiti culturalmente dal creatore.
Considerando che un link non è soggettivo, non ci è possibile in alcun modo usarli per darci una qualche indicazione sulla reale affidabilità di ciò a cui rimandano. Questo se escludiamo due ipotesi.
1. Utilizziamo dei sotterfugi inserendo un valore semantico a posteriori al collegamento. (questa è la via più comoda e di immediata realizzazione, quella che ho proposto io nel mio ultimo documento)
2. Inseriamo un valore semantico nel link in sé, modifichiamo il codice con cui esso è costruito e diamo, determiniamo, link differenti a seconda del contenuto che vogliamo dare agli stessi
Questa seconda via è certamente quella del futuro, ma ancora non pare alla nostra portata. Manca in effetti la definizione di uno standard comune al web e di facile utilizzo (non scordiamo che dovrebbe essere utilizzata a livello mondiale, considerando anche le differenza semantiche che esistono tra le lingue, dove l’aggettivo fantastico detto da un italiano potrebbe essere l’equivalente di un semplice good per un inglese).
Inoltre il problema della insicurezza propria ai dati non verrebbe attenuata, perché ci imbarcheremmo in un sistema di valutazioni puro e semplice, con gli utenti del web impegnati in continuazione a dare voti a quanto trovano, con tutte le loro diversità, le loro opinioni differenti e i giudizi tremendamente discordanti.
Come giustamente conclude Dario, il problema non sta tanto nel meccanismo, in quanto con entrambe le soluzioni finora prospettate si potrebbe costruire un qualche tipo di ranking. Il problema resta gestire quanto si crea ed evitare che venga utilizzato in malo modo, evitare che esso degeneri attraverso l’uso forzato che qualcuno potrebbe farne.
Ma davvero c’è qualche campo del vivere umano in cui questo non sia vero? Stiamo forse cercando di portare sulla rete un metodo perfetto di classificazione che non abbiamo saputo creare in nessun altro momento dell’esistenza del genere umano? Il problema non è tanto di trovare un modo ideale, quanto di proseguire la ricerca verso un modello migliore di quello attuale perché oggi trovare dati affidabili in rete è sempre più un’impresa e tutto ciò non può che peggiorare di giorno in giorno.
Il primo passo che dobbiamo fare è, a mio avviso, abbandonare le classifiche e spostare la discussione sull’affidabilità sui singoli documenti. Il web non può restare solo una vetrina, sia essa per i buoni o per i cattivi o per il blog più cool e popolare del momento. Bisogna davvero cominciare a pensare più al prodotto che al produttore. Forse questo basterebbe ad evitare gran parte dei fenomeni di devianza che i metodi di classificazione hanno sempre prodotto.
Purtroppo ad essi non possiamo fare a meno, oggi più che mai
P.S. Sulla prospettiva di un investimento semantico dei collegamenti web mi riservo di tornare tra qualche giorno, passati gli ultimi esami in università e raccolta una documentazione aggiornata sufficiente.
Come annunciato in precedenza pubblico l'intero rapporto sull'affidabilità delle fonti in rete. Ringrazio tutti coloro che con i loro ragionamenti, le critiche ed i commenti hanno contribuito a strutturare i miei pensieri e, proprio per questo, li invito a continuare, ad insistere nella loro opera maieutica. Ora mi riposo un poco che questo documento mi è costato abbastanza ore negli ultimi giorni!
Intanto il tutto è scaricabile in formato pdf qui
Sto cercando di condensare le discussioni di questi giorni in un piccolo saggio per la rivista online Agli incroci dei venti con cui collaboro ormai da diversi anni. Spero che possa essere pronto entro il fine settimana.
Il tema dell'affidabilità delle fonti nella blogosfera è destinato infatti ad acquisire comunque un posto sempre più rilevante. Quando le informazioni aumentano oltre la soglia di guardia è necessario decimarle nel minor tempo cercando di effettuare la scelta più accurata. Un problema che noto in questa discussione avviatasi negli ultimi giorni è la partecipazione limitata che essa riesce a ottenere. Mi attendevo in effetti una reazione un po' più ampia, mentre il modo di procedere della discussione tramite blog si sta rivelando più lenta di quanto pensassi in principio. Mi viene da domandarmi a questo punto: Il blog è davvero un luogo adatto per andare oltre il commento di posizioni definite a priori e di documenti preparati in precedenza? Il blog è un terreno di discussione comune oppure è più un luogo per ottenere feedback rispetto ad un lavoro che comunque viene svolto in maniera tradizionale? Cerchiamo sulla rete informazioni da utilizzare e commenti immediati oppure cerchiamo la discussione e la costruzione comune di conoscenza?
Sono questioni che mi sto ponendo in queste ore. I commenti che si ricevono non entrano quasi mai direttamente nel merito dei post. Quale è dunque il ruolo del blog nella distribuzione di conoscenza e nella gestione dei progressi della stessa? Nel caso specifico della discussione sull'affidabilità che stiamo portando avanti, un metodo di tipo Wiki, oppure un forum un po' più classico, non potrebbero forse rivelarsi più adatti? E questo dipende da come gli utenti utilizzano il blog oppure dalle sue caratteristiche di base?
Forse ciò deriva semplicemente dalle aspettative che potevo avere, ma sarebbe interessante sapere cosa ne pensano gli altri.
Continuerò a seguire lo sviluppo della discussione ed entro il fine settimana pubblicherò un documento riassuntivo che esponga la mia posizione sull'argomento con le linee guida che potrebbero guidare una classificazione di base e una prima proposta di prova sul campo della teoria. Sino ad allora ogni commento, ogni consiglio, ogni opinione anche contraria sulla divisione in tre classificazioni separate che ho proposto ieri: Affidabilità-Influenza-Visibilità e sui 4 punti che possono condurci a meglio stabilire come sia rilevabile l'affidabilità di un blog, sono ottimamente accetti.
Qualche prima, piccola, modifica apportata al documento che ho scritto questo pomeriggio. Più che altro una modifica al punto 4 tendente alla democratizzazione che è insita nel concetto di affidabilità. Il lavoro proseguirà nei prossimi giorni.
In merito alla discussione sviluppatasi nei giorni scorsi sul rapporto edito da Casaleggio, che pretendeva di quantificare l’affidabilità dei blog in base al semplice numero di collegamenti entranti, propongo un’ipotesi differente, ripresa dal funzionamento del meccanismo testuale secondo Eco e che, forse, potrebbe rivelarsi più fecondo.
Cose a caso: molto affascinanti (Forse).