Contents

Salotti digitali. Per un’analisi socio-stilometrica delle riviste culturali italiane online

Contents

Salotti digitali. Per un’analisi socio-stilometrica delle riviste culturali italiane online

L’interesse per le esperienze di lettura digitale ha conosciuto negli ultimi anni una grande espansione (Kuijpers et. al., 2024; Rebora et al., 2022). Gli studi si sono focalizzati in particolare sull’analisi delle attività di social reading (Rebora et al. 2022; Pianzola et al. 2020; Rebora, Pianzola, 2018). Un contributo decisivo alla diffusione di un simile fenomeno è venuto dallo sviluppo di piattaforme specializzate come Anobii e Wattpad che, grazie all’accesso libero e gratuito, hanno visto crescere rapidamente la propria comunità di utenti. Una buona parte dei lettori digitali, inoltre, è contraddistinta da un’attitudine alla partecipazione che ha favorito ulteriormente la prolificità delle piattaforme e, di conseguenza, la produzione di una notevole mole di dati sull’esperienza contemporanea della lettura (Lauer, 2023). Proprio la prolificità degli utenti delle piattaforme di social reading, la complessità di dati disponibili e la loro accessibilità hanno permesso il rapido sviluppo degli studi in questo ambito che possono offrire prospettive nuove sulla pratica della lettura così come può essere concepita oggi. Gli studi hanno adottato una pluralità di metodologie e strumenti capaci di individuare di volta in volta aspetti caratteristici delle modalità di lettura: dalla sentiment analysis applicata all’attività di Digital Social Reading su Wattpad (Pianzola, et al., 2020; Rebora et al. 2022), allo sviluppo di strumenti per l’annotazione delle recensioni online (Loi et al., 2023), all’uso di metodi per la creazione collaborativa di testi di genere (Manjavacas et al., 2017). Ciononostante, se le analisi in questo campo garantiscono prolifici spunti di riflessione, una minore attenzione sembra essere rivolta all’indagine di una più ristretta area del vasto universo del social reading: le riviste culturali online. Le ragioni di una simile distanza tra l’interesse rivolto alle piattaforme come Wattpad e le ricerche riservate alle riviste online sono le più varie. Si possono considerare aspetti dirimenti: i. la differenza quantitativa dei dati reperibili per i due ambiti; ii. i problemi relativi all’accessibilità delle informazioni e alla loro effettiva riutilizzabilità per quanto riguarda le riviste; iii. le difficoltà nella costruzione dei corpora di riferimento. Tuttavia, nell’analisi dei processi di canonizzazione, un ruolo rilevante è spesso giocato proprio da esperienze appartenenti al campo di produzione ristretta quali le riviste che sono in grado di contribuire alla consacrazione o meno di un autore o di un libro (Bourdieu, 1992). Se, dunque, lo studio delle modalità di fruizione dei testi da parte di un pubblico ampio può contribuire a definire ulteriormente un fenomeno su larga scala come la lettura digitale, indagare le esperienze di lettura all’interno di spazi più ristretti come le riviste potrebbe apportare un contributo più dettagliato sui processi di formazione dei gusti all’interno di comunità ristrette (Bourdieu, 1979), presentando così nuovi percorsi d’indagine nell’ambito della critica letteraria contemporanea. Il presente lavoro si propone, dunque, di analizzare le modalità di lettura di cinque riviste letterarie italiane online: «Critica letteraria»(CL), «Culturificio»(Cult), «Downtobaker»(Down), «Flanerì»(fla), «Il rifugio dell’Ircocervo»(IRI). L’analisi sarà condotta attraverso metodi stilometrici volti a verificare, da un lato, se esista una specificità delle riviste rispetto a una piattaforma di social reading come Anobii, dall’altro, se sia possibile individuare una peculiarità interna a ciascuna rivista tale da renderla riconoscibile in termini di strategia editoriale. L’analisi ci permetterà, infine, di osservare se l’azione culturale delle riviste online ha effetti diretti sul mercato del libro in Italia.

Corpus

La scelta dei casi di studio è stata arbitraria ma si è fondata su criteri determinati dalle domande di ricerca. Nell’alveo composito e variegato di riviste che popolano l’attuale spazio culturale italiano online, infatti, le cinque individuate condividono una prima caratteristica fondamentale: l’appartenenza al pool di “grandi lettori” selezionato da un’altra rivista, «L’Indiscreto», al fine di stilare tre volte l’anno «delle classifiche librarie alternative a quelle di vendita, sulla base di una valutazione qualitativa da parte degli addetti ai lavori» (redazione «L’Indiscreto» 2023). Tutte e cinque, dunque, da una parte, sono riconosciute autorevoli da una comunità di pari e, pertanto, sono luoghi “consacrati” (Bourdieu, 1992), dall’altra, in virtù del loro ruolo attivo nella creazione delle classifiche sono luoghi consacranti (Ibidem) dal momento che attribuiscono un valore alla produzione libraria italiana. Le riviste, inoltre, sono tutte presenti online e sono accessibili gratuitamente sebbene in forme diverse. «Critica letteraria», infatti, a differenza delle altre quattro, ha messo a disposizione tutti i fascicoli dal 1973, anno della fondazione, fino ai due anni precedenti l’anno in corso. Di conseguenza, gli articoli estratti da «Critica letteraria» risalgono al 2022, mentre per le altre riviste i testi presi in esame sono stati pubblicati tra il 2023 e il 2024. Bisogna considerare, inoltre, un’altra differenza tra «Critica letteraria» e le altre riviste: il giornale fondato nel 1973 è una rivista scientifica indicizzata in diversi repertori accademici e ha, quindi, un’ambizione originaria più mirata rispetto alle altre quattro considerate: gli articoli sono indirizzati per la maggior parte a un pubblico accademico, con le relative considerazioni in termini di processi di pubblicazione, per quanto siano liberamente accessibili. Alla luce di queste considerazioni, abbiamo selezionato testi che appartenevano alla categoria delle “recensioni” per ciascuna delle riviste, per cercare di omologare il più possibile l’analisi ed evitare eventuali inconsistenze interpretative. Sono stati selezionati nove testi per ciascuna rivista estraendo gli ultimi testi pubblicati o gli ultimi testi accessibili nel caso della «Critica letteraria». Abbiamo attribuito un identificativo univoco a ciascun testo da 01 a 09. La lunghezza di ciascuna recensione varia dalle 600 alle 1200 parole. In una prima fase, abbiamo provato a utilizzare i testi nella loro conformazione iniziale al momento dell’estrazione. Dopo aver verificato l’inconsistenza dell’analisi, abbiamo aggregato i testi per avere una lunghezza complessiva quasi omogenea per ogni testo di riferimento. Abbiamo ottenuto così dei brani tra le 4000 e le 6000 parole circa. A ogni oggetto dell’analisi è stato, dunque, attribuito un nuovo identificativo. Per la creazione del testo relativo alla piattaforma Anobii abbiamo preso in considerazione le recensioni pubblicate sugli stessi libri che erano stati recensiti dalle riviste. Non tutti i volumi indicati dalle riviste avevano, ciononostante, una corrispettiva recensione su Anobii. Abbiamo selezionato dunque i 13 volumi recensiti dalle riviste che presentavano almeno una recensione anche su Anobii. Trattandosi spesso di recensioni molto brevi abbiamo creato nuovamente alcuni blocchi di testo che avessero la stessa lunghezza delle recensioni estratte dalle riviste: sono stati creati i file “Anobii01-03”, “Anobii04-05”, “Anobii06-10”, le recensioni degli ultimi tre volumi Anobii 11, 12 e 13 non sono state prese in considerazione in questa fase perché troppo brevi per essere affidabili. In una seconda fase della ricerca abbiamo creato un unico file “Anobii01-13” per poter portare avanti nuove analisi: in quel caso, tutti i testi estratti da Anobii sono stati presi in considerazione. L’elenco dei volumi recensiti sulle riviste, dell’autore della recensione e del luogo online in cui sono stati recensiti, con i relativi metadati selezionati (titolo, autore, editore, indirizzo editore, anno e luogo di pubblicazione) si può trovare nel repository [github] (https://github.com/MarcoDeCristofaro/Riviste_culturali_online.git) insieme al corpus di riferimento. Per i volumi recensiti su Anobii trattandosi sempre di miscellanee non sono stati indicati l’autore o l’autrice della recensione.

Metodologia

Il lavoro si propone di effettuare uno studio sociologico del comportamento delle riviste letterarie italiane basandosi sulla teoria dei campi elaborata da Bourdieu (1992). Per analizzare i testi abbiamo adottato diversi metodi stilometrici utilizzando il linguaggio di programmazione R e fondando, in particolare, le indagini sul pacchetto Stylo elaborato da Eder, Rybicki e Kestemont (2016). In primo luogo, al fine di identificare un’eventuale riconoscibilità delle riviste rispetto ad Anobii, abbiamo condotto l’analisi facendo ricorso alla Delta Distance (Burrows, 2002) e impostando come sistema di visualizzazione la cluster analysis per dendogrammi (Ward, 1963). Abbiamo impostato un numero crescente di Most Frequent Words da 50MFW a 450MFW. L’obiettivo in questa fase era raggiungere una stabilità nelle relazioni tra le varie riviste e soprattutto nelle relazioni tra le riviste e le recensioni estratte da Anobii. Dopo questa prima fase abbiamo estratto una distance table prendendo in considerazione un file contenente tutti i testi provenienti da Anobii e i diversi blocchi di testo creati con gli articoli delle riviste. La distance table ci ha offerto un quadro più dettagliato sulle eventuali connessioni visualizzate attraverso i dendogrammi. Il testo Anobii01-13 creato ad hoc per la distance table è stato utilizzato per condurre la successiva rolling stylometry (Eder, 2016). In questo caso, abbiamo sottoposto il testo Anobii01-13 a un’analisi che permettesse di individuare se alcune sue parti fossero più vicine allo stile di determinate riviste: l’obiettivo consisteva nell’individuare non più soltanto la relazione complessiva con i testi di una rivista, ma le sezioni del testo costruito con le recensioni di Anobii più adatte ad essere pubblicate su una determinata rivista. Il primo tentativo è stato condotto utilizzando tutti i blocchi di testo elaborati con gli articoli estratti dalle differenti riviste. Per quanto il risultato fosse interessante, appariva difficile da interpretare nella rappresentazione. Abbiamo quindi creato cinque differenti file contenenti ciascuno l’insieme delle recensioni estratte da ogni rivista. Abbiamo nuovamente sottoposto il testo Anobii01-13 alla rolling analysis rintracciando così non solo i testi più vicini in termini di stile, ma le sezioni di testo più adatte all’una o all’altra rivista. Il test è stato condotto utilizzando due diversi parametri per le MFW. In primo luogo abbiamo utilizzato 100 MFW che, tuttavia, dimostravano una certa inconsistenza nei risultati con una grande frammentazione del testo usato come test. In un secondo momento abbiamo impostato 2000MFW che hanno evidenziato una più precisa suddivisione del test_set. Per verificare l’affidabilità dei risultati abbiamo condotto la rolling stylometry su un testo composito. In particolare il nuovo file di testing era formato da alcuni brani estratti da Anobii01-13 e da alcuni estratti da CL01-09. Abbiamo verificato, dunque, la capacità della rolling analysis di distinguere le sezioni specifiche appartenenti alla rivista «Critica letteraria» per valutare l’attendibilità nel distinguere una maggiore somiglianza con testi provenienti da riviste diverse. L’obiettivo dell’analisi successiva era quello di individuare in modo esplicito le caratteristiche distintive dei testi, ovvero l’insieme di elementi lessicali e strutturali capaci di rendere un testo più prossimo a una rivista piuttosto che ad Anobii. Abbiamo fatto ricorso, dunque, alla Zeta Analysis (Burrows, 2007) che ci consente di individuare diversi livelli del testo dalla word-frequency agli n-gram con relativi Zscores. Dopo una prima analisi Zeta complessiva, dunque, abbiamo estratto la Word Frequency Table soffermandoci su alcuni aspetti che apparivano come dirimenti nella collocazione dei testi. Per alcuni elementi lessicali come l’uso del pronome “mi” e del pronome/aggettivo possessivo “mia” abbiamo cercato di individuare la distanza tra il suo utilizzo in Anobii e il suo utilizzo nelle riviste. Terminata la prima fase di analisi rivolta al rapporto tra le riviste e Anobii, ci siamo concentrati sulla capacità delle riviste di adottare una strategia stilistico-editoriale ben riconoscibile e distintiva. Un primo tentativo di classificazione è stato effettuato sull’insieme dei testi così come sono stati estratti da ciascun giornale online. La brevità dei testi, tuttavia, nonostante il ricorso a diverse features di riferimento (MFW progressive, diverse distanze, Delta, Euclidea, Manhattan, Argamon) ci ha impedito di trovare una effettiva stabilità nei risultati con gli estratti originali. Abbiamo composto, dunque, dei blocchi di testo che ci hanno ricondotto a un corpus di dieci file. Abbiamo effettuato, successivamente, l’analisi utilizzando la Delta Distance e impostando un numero di MFW crescente. I risultati hanno dimostrato subito un miglioramento in termini di stabilità raggiungendo un equilibrio con l’utilizzo di 200MFW. Una volta ottenuto un output stabile abbiamo verificato le rispettive distanze tra le riviste attraverso la Distance table. Riscontrati i punti di maggior distanza e vicinanza tra i testi delle varie riviste, abbiamo verificato nel dettaglio i risultati conducendo ancora una volta una Zeta Analysis. In questo caso, abbiamo confrontato le riviste a gruppi di due, per individuare gli elementi lessicali maggiormente distintivi. Abbiamo nuovamente ricostruito la word frequency table soffermandoci qui su parole portatrici di maggior significato e non sulle function words. Una simile scelta è stata dettata proprio dalla specificità delle riviste: le function words presentavano una certa vicinanza all’interno della word frequency table portandoci a considerare le parole più complesse come distintive di ciascuna strategia editoriale. Data l’importanza di alcune delle parole considerate, abbiamo verificato anche gli Zeta Scores per effettuare un confronto sulla frequenza di utilizzo all’interno di ciascuna rivista. Successivamente, abbiamo effettuato un’ulteriore indagine soffermandoci sulla struttura del testo e utilizzando le Part of Speech (POS) come riferimento metodologico. Dopo aver convertito i testi in file composti di sole POS, li abbiamo confrontati osservando una maggiore difficoltà nel trovare un equilibrio stabile. Abbiamo approfondito qui l’indagine osservando gli Zeta Scores degli n-gram considerati e individuando gli elementi maggiormente distintivi. Un ultimo test è stato condotto attraverso l’utilizzo di metodologie che adottano il machine learning per il text mining e l’attribuzione corretta dei testi. In questo caso, abbiamo prelevato il file CL09, che avremmo usato come test_set. Abbiamo sottoposto l’insieme delle recensioni come reference_set per allenare il modello attributivo. Infine abbiamo verificato se il modello fosse in grado di attribuire CL09 alla rivista corrispondente «Critica letteraria». Procedendo per cerchi concentrici abbiamo effettuato un’ultima analisi proprio su «Critica letteraria». Ancora una volta la scelta non è stata casuale: rispetto a tutte le altre, infatti, come abbiamo detto, questa rivista occupa una posizione più marcata nello spazio culturale online, appartenendo al mondo accademico. Abbiamo quindi recuperato le recensioni della rivista nella loro conformazione iniziale. Abbiamo estratto la relativa distance table e, dopo aver sviluppato una Word Frequency Table e aver individuato gli Zeta Scores per la Word Frequency Table, abbiamo analizzato le Variant Words più significative.

Analisi dei risultati

Nella complessità di metodi stilometrici utilizzati siamo stati in grado di estrarre una pluralità ben differenziata di dati. Ci soffermeremo in primo luogo sul confronto tra riviste e Anobii per andare poi sempre più a dettagliare l’indagine delle informazioni.

Un confronto tra due differenti spazi di lettura digitale: Anobii vs riviste culturali

La cluster analysis iniziale, condotta utilizzando la Würzburg distance, ha subito messo in rilievo la difficoltà nel distinguere in modo netto le riviste e le recensioni estratte da Anobii. Fig.1 ci permette fondamentali osservazioni. Con un numero basso di MFW (50MFW) i testi estratti da Anobii sono più facilmente raggruppati, ma emergono difficoltà di attribuzione per quanto riguarda alcune delle riviste: in particolare, IRI01-05 è collegato a fla01-05, mentre fla06-09, per quanto isolato, è ricondotto al gruppo di testi estratti da Anobii, e IRI06-09, a sua volta isolato, è collocato all’interno del ramo che contiene i testi di «Downtobaker». Aumentando il numero di MFW considerate è ancora più difficile riscontrare la stabilità nell’attribuzione: i testi delle riviste si ritrovano spesso intrecciati tra loro, soltanto «Critica letteraria» ha una propria immediata riconoscibilità sia con 150MFW sia con 250MFW, e, allo stesso tempo, Anobii01-03 si lega in modo più stretto a Cult01-04, lasciando soltnato Anobii06-10 e Anobii04-05 ben connessi tra loro. In una cluster Analysis con Delta distance utilizzando da 50 a 250MFW, dunque, sembra difficile non solo una chiara distinzione tra Anobii e le riviste, ma anche il raggiungimento di una certa stabilità tra le riviste stesse. Un miglioramento evidente si può trovare solo a 450MFW (Fig.2) quando tutte le riviste trovano la propria corretta collocazione e solo un blocco di testo estratto da Anobii appare problematico: Anobii01-03. È bene osservare, tuttavia, che quest’ultimo raccoglie l’insieme più proficuo di recensioni estratte da Anobii, ovvero le recensioni relative a La giornata di uno scrutatore di Calvino. A sua volta, la recensione a La giornata di uno scrutatore fa parte del gruppo di testi riconducibile alla rivista «Culturificio», e in particolare è il file Cult03 che rientra nel file Cult01-04. Se consideriamo, dunque, che Anobii01-03 rientra nel cluster a cui appartiene anche Cult01-04 si può supporre che l’ampia presenza di recensioni su Anobii relative a La giornata di uno scrutatore abbia influenzato, soprattutto da un punto di vista lessicale, la sua specifica collocazione all’interno del cluster. Per verificare ulteriormente questo aspetto abbiamo prodotto una distance table (Fig.3) individuando la distanza tra l’insieme dei testi estratti da Anobii e i blocchi di testo delle singole riviste. Appare subito evidente come sulla distribuzione nel cluster si rifletta la scelta dei testi recensiti su Anobii. Dei 45 libri recensiti dalle riviste, 13 sono recensiti su Anobii. Di questi 13: 1 è recensito da CL, 2 da Cult (di cui 1 è Calvino), 2 da Down, 5 da Fla e 3 da IRI (sebbene il numero di parole in queste ultime recensioni sia estremamente ridotto). Di conseguenza quasi la metà dei libri recensiti da Anobii è stata recensita anche dalla rivista «flanerì» che, d’altro canto, nella distance table, si avvicina molto ad Anobii01-13. L’altra rivista più vicina è «Culturificio» per le ragioni legate al caso Calvino, di cui abbiamo detto. Le riviste restanti hanno, invece, valori più alti e una distanza più marcata rispetto ad Anobii. Per approfondire ulteriormente questo filone di indagine abbiamo ritenuto utile sezionare il testo complessivo Anobii01-13 applicando la Rolling Stylometry. Una prima indagine condotta sull’insieme dei blocchi di testo composti con le recensioni delle riviste ci ha permesso di individuare i candidati più adatti a indagare la relazione tra l’approccio alla recensione di Anobii e quello delle riviste(Fig.4). Una nuova conferma alle osservazioni fino ad ora fatte è il candidato più probabile all’attribuzione del primo blocco di Anobii01-13 di quasi 10.000 parole: Cult01-04 si conferma il candidato più probabile ad accogliere testi simili a quelli estratti da Anobii, ancora una volta testimoniando il peso che le recensioni al libro di Calvino hanno sul social network dei lettori. La seconda parte di Anobii01-13 è, invece, dominata dai testi di «flanerì»(fla01-05, fla06-09) con un’incursione di IRI01-05 che rappresenta l’aspetto più interessante dal momento che le recensioni di Anobii relative agli stessi libri recensiti dal «Rifugio dell’Ircocervo» sono estremamente brevi. La stilometria, in questo caso, sembra aver colto alcune specificità a quell’altezza del testo che hanno permesso una differente attribuzione che potremo indagare con l’analisi successiva. I risultati della prima indagine ci hanno indotto a effettuare una nuova verifica utilizzando la rolling stylometry. In questo caso, abbiamo considerato blocchi di testo che raccogliessero l’insieme delle recensioni per ciascuna rivista. Abbiamo ottenuto dunque cinque file CL01-09, Cult01-09, Down01-09, fla01-09, IRI01-09. Applicando come feature 100MFW, il quadro si presentava ora più frammentario (Fig.5)L’attribuzione come miglior candidato oscilla tra «Il rifugio dell’Ircocervo», «Culturificio» e «Flanerì», confermando i risultati delle analisi precedenti, ma senza una distinzione netta tra le tre riviste. Ancora una volta escluse appaiono «Critica letteraria» e «Downtobaker». Se, però, l’esclusione di «Critica letteraria» può essere comprensibile ricordando proprio la specificità di questa rivista accademica, meno chiara fino a questo momento è l’esclusione di «Downtobaker». Andando a modificare il parametro relativo alle MFW e selezionando 2000MFW anche questo aspetto sembra trovare una sua più chiara collocazione. Fig.6 ci mostra come considerando più parole anche «Downtobaker» rientra nel novero delle riviste possibili candidate a ricevere un testo pubblicato su Anobii. Un allargamento dello spettro di possibili alternative che esclude di nuovo «Critica letteraria» confermando la sua specificità rispetto alle altre riviste, ma allo stesso tempo sostenendo l’ipotesi che, se un giornale scientifico online conserva tratti tanto distintivi da essere difficilmente assimilabile a un social network letterario, lo stesso non si può dire per le altre riviste culturali che sembrano rappresentare una declinazione differente, in termini stilometrici, del più vasto orizzonte della lettura online. Per verificare l’attendibilità di una simile analisi abbiamo effettuato una rolling stylometry su un testo pastiche, ovvero su un testo creato ad hoc che contiene sia brani estratti da Anobii sia brani estratti da «Critica letteraria». Il risultato è un’ulteriore testimonianza della nostra analisi: le sezioni di «Critica letteraria» sono immediatamente riconosciute e non vanno a modificare eccessivamente la precedente attribuzione di sezioni di Anobii01-13 a determinate riviste. Se, però, nel complesso i testi di Anobii sembrano avvicinarsi alle recensioni scritte per riviste culturali online non accademiche, andando a indagare i brani da un punto di vista lessicale attraverso il ricorso alla Zeta Analysis, alcuni tratti distintivi, per quanto non ampiamente marcati, sembrano emergere. Fig.7 ci mostra un confronto sull’uso delle parole più frequenti. Tra quelle maggiormente utilizzate dalle riviste ritroviamo termini che riconducono ad un’analisi formale dei libri. La parola che maggiormente distingue le riviste in positivo rispetto ad Anobii è “esempio”. Tra le altre più adatte alle riviste che ad Anobii troviamo: autrice e autore, lingua, letteraria, prospettiva, opere, portato, personaggi, narrativa. Uno spettro lessicale che denota senz’altro un tentativo di oggettivizzare l’analisi, di concentrarsi sull’indagine formale e strutturale ed eventualmente sulle caratteristiche della scrittura e della lingua di determinati autrici e autori. Di tutt’altro tenore le parole “preferite” nei testi di Anobii. Ritroviamo un’abbondanza di verbi declinati alla prima persona sia singolare che plurale, une tendenza all’utilizzo di pronomi personali o aggettivi e pronomi possessivi, il ricorso ad avverbi e aggettivi che indicano la soggettivizzazione dell’esperienza della lettura come “personalmente” e “piacevole”. Interessante anche la diversa rappresentazione dei generi letterari: tra le parole maggiormente adottate da Anobii e poco usate dalle riviste vi è “autobiografia”, laddove sulle riviste non troviamo accenni espliciti ai generi letterari. Si può osservare, dunque, un diverso approccio all’analisi formale dei libri e di conseguenza la ricerca di esperienze di lettura differenti. Tendenza confermata dalle Word Frequency Table (Fig.8). Il pronome personale riflessivo “mi” registra una frequenza di 0.32 nei testi pubblicati su Anobii, mentre per tutte le altre riviste non supera lo 0.11 e in alcuni casi è del tutto assente come in CL01-04 e Cult01-04, nonostante quest’ultimo insieme di brani sia stato collocato dalla cluster analysis in stretta connessione ad Anobii. Un simile risultato ci fa supporre che, se a un livello lessicale globale, l’analisi di un volume come La giornata di uno scrutatore induca la stilometria a collegare due testi, a un maggior grado di dettaglio basato su alcune function words dirimenti, le riviste riescono a ottenere una propria riconoscibilità che le tiene ben distinte dall’approccio alla lettura di Anobii. Lo stesso si verifica per l’aggettivo/pronome possessivo “mia”, presente in Anobii con 0.11, totalmente assente in 5 blocchi di testo estratti dalle riviste e inferiore allo 0.09 per tutti e cinque i restanti brani. A convalidare definitivamente il ruolo delle function words capaci di distinguere tra un approccio più soggettivizzante nella distinzione tra riviste e Anobii si riportano gli Zeta Scores relativi all’utilizzo del pronome “mi” nei differenti testi. Ad eccezione di due blocchi di testo, fla06-09 e IRI01-05 che non vanno oltre lo 0.06, tutti gli altri blocchi di testo estratti dalle riviste hanno un valore negativo nel confronto con Anobii01-13 che presenta invece uno Zeta Score di 2.61 nell’utilizzo del pronome “mi”. Una simile differenza appare sostanziale nel considerare le riviste culturali, per quanto prossime complessivamente alla scrittura utilizzata su Anobii, in possesso di caratteristiche formali capaci di distinguerle se portate a un livello estremo di dettaglio.

Prese di posizione nello spazio di produzione ristretta: un confronto tra le riviste

Nella seconda fase della nostra analisi abbiamo cercato di capire se la riconoscibilità delle riviste rispetto ad Anobii si riflettesse anche tra le riviste stesse. È apparso subito evidente come la lunghezza dei testi fosse un elemento fondamentale per l’affidabilità dell’analisi stilometrica. I primi tentativi di cluster analysis con testi di lunghezza variabile tra le 600 e le 1200 parole hanno mostrato una certa instabilità impedendo una corretta classificazione dei brani. Raccogliendo le varie recensioni in blocchi di testo più lunghi si ottenevano invece risultati più stabili già con sole 50MFW. Una totale stabilità è stata invece raggiunta con 200MFW e con la Delta Distance (Fig.9). Se consideriamo che impostando 200MFW nella cluster analysis che aveva incluso anche Anobii i risultati erano ancora instabili, possiamo sostenere che la presenza di un testo con caratteristiche simili all’una o all’altra rivista può porre problemi analitici all’approccio stilometrico che, invece, non emergono considerando le sole riviste. Una simile difficoltà metodologica è dovuta probabilmente agli aspetti che abbiamo evidenziato in precedenza: la vicinanza stilistica complessiva induce a ricercare gli elementi distintivi nei punti di maggior dettaglio che vanno dalla focalizzazione sulle function words all’indagine degli n-grams. Laddove a livello complessivo, come nel caso delle sole riviste, la stabilità è stata trovata già con poche MFW è possibile allora riscontrare elementi distintivi tra i vari testi e, dunque, tra i vari giornali culturali anche ad un livello più alto di analisi. Le considerazioni scaturite dalla cluster analysis trovano supporto nella distance table. A differenza di quanto accadeva con la presenza di Anobii01-13, tra le riviste non si registra mai una grande vicinanza a livello stilistico. Le distanze tra i vari blocchi di testo superano quasi sempre il valore 1 ed esistono distanze marcate anche tra due blocchi di testo estratti dalla stessa rivista come nel caso di «Dowtobaker». Il caso di maggior vicinanza registrato è tra fla01-05 e IRI01-05. Una vicinanza che fino ad ora non era emersa e che occorrerà indagare. Facendo ricorso nuovamente alla Zeta analysis, un primo elemento che a livello lessicale emerge chiaramente è l’utilizzo della parola “corpi”, di uso diffuso su «Il rifugio dell’Ircocervo», come conferma anche il confronto lessicale tra quest’ultimo e «Downtobaker», dove troviamo il singolare “corpo”. Il ricorso al campo semantico del “corpo” è supportato sul «Rifugio dell’Ircocervo» da un insieme di altri termine che a vario titolo vi rimandano e che non sono adottate invece sulle altre riviste, tanto meno da quelle indicate come più prossime quali «Flanerì». Tra questi termini troviamo: sangue, morta, sesso, viscerale (Fig.10). Se «Il rifugio dell’Ircocervo» si distingue per l’ampio ricorso al campo semantico del corpo, «Flanerì» appare come una delle riviste più focalizzate sullo studio formale dei libri ponendo al centro una terminologia analitica che si allontana dall’approccio della rivista corrispettiva attraverso termini come “testo”, “parola”, “pubblicato”. Un approccio che è ancora più evidente, come probabilmente ci si poteva aspettare, sulla «Critica letteraria». Qui i termini distintivi rispetto a tutte le altre riviste sono: critica, saggio, studi, creativa, definizione, motivi, opere. Un vocabolario che attinge al campo della scrittura saggistica e in particolare dal mondo accademico. Se in questi confronti binari sono emersi le prime tendenze predominanti nell’una o nell’altra rivista, uno sguardo complessivo sulle parole più utilizzate e in possesso di un maggior portato semantico nel campo della critica letteraria suggerisce ulteriori percorsi sul rapporto che si instaura tra le differenti riviste. Fig.11 ci mostra come intorno a termini quali “storia”, “mondo” e “romanzo” si raggiunga una certa uniformità nell’utilizzo. L’uso della parola “storia” è leggermente maggiore in Down06-09 e fla01-05, ma si attesta su valori molti vicini tra tutte le riviste. Lo stesso accade per la parola “mondo”, sottorappresentata in CL01-04, ma utilizzata in modo omogeneo in quasi tutte le altre riviste. Considerazioni simili si possono fare sulla parola “romanzo”, “protagonista”, “scrittura”, “personaggi” che sono parte integrante di quel vocabolario che invece aveva permesso la distinzione più netta tra riviste e Anobii. Per identificare una maggiore distinzione occorre quindi ricorrere agli Zeta scores sull’uso delle differenti parole all’interno delle riviste (Fig.12). I termini che suggeriscono un approccio analitico-formale evidenziano qui la lontananza tra ciascun giornale culturale. Il termine “protagonista” raggiunge il valore 1.5 in IRI01-05, in cinque degli altri blocchi di testo ha un valore negativo, in 3 blocchi di testo non raggiunge l’1 e, nell’unico caso in cui questo accade, Down06-09, non va molto oltre (1.09). Bisogna ricordare, inoltre, che IRI01-05 nella distance table era rappresentato come prossimo a fla01-05 che, invece, nell’uso del termine “protagonista” presenta un valore negativo. La vicinanza ancora una volta era dettata da uno sguardo complessivo che non trova un riscontro a un maggior livello di dettaglio come l’analisi lessicale ha dimostrato e gli Zeta scores su termini analitici confermano. Spostando l’attenzione su un altro termine dirimente come “scrittura” possiamo avanzare ulteriori considerazioni. Si impone subito il suo uso distintivo in «Critica letteraria» con valori che vanno da 1.33 a 1.60. Altri sei blocchi di testo presentano invece valori negativi, un blocco presenta un valore prossimo allo zero e l’unico altro blocco positivo, IRI01-05, si attesta sull’1.17. L’attenzione alla scrittura, dunque, appare una prerogativa della «Critica letteraria» poco presente nelle altre riviste online ad eccezione nuovamente di IRI01-05 che, confermando quanto successo con la parola “protagonista”, evidenzia un approccio analitico, fondato sullo studio del testo nelle sue caratteristiche formali. Un altro dato significativo riguarda l’uso della parola “letteratura” ancora una volta da parte della rivista «Il rifugio dell’Ircocervo» ma in un altro blocco di testo IRI06-09. In questo caso, la distanza nella frequenza d’uso è notevole: IRI06-09 raggiunge un valore di 2.52, mentre altri sei blocchi hanno un valore negativo e i tre restanti superano di poco lo zero. Se un simile dato potrebbe suggerire, legato alle altre informazioni sulla rivista, un’attenzione agli aspetti letterari, bisogna considerare che tra i testi recensiti nel blocco considerato figura il libro di Luciano Funetta, Domicilio sconosciuto. Perdersi nella letteratura latinoamericana, pubblicato da UTET nel 2023 che potrebbe aver contribuito all’impennata del valore relativo alla frequenza d’uso di “letteratura”. Ciononostante, si può sostenere che, facendo attenzione a un determinato campo semantico, alcune riviste, come «Critica letteraria» e «Il Rifugio dell’Ircocervo», riescono meglio nella loro ricerca di una posizione riconoscibile nel panorama online. Se, inoltre, il lessico appare come un criterio decisivo nella classificazione delle riviste, ancora più rilevante è la capacità distintiva dei vari testi, laddove vengano prese in considerazione le Parts of Speech. In questa fase dell’analisi abbiamo trasformato ciascun file in un testo corrispettivo, attraverso le funzioni di tokenizzazione di UDPipe applicate attraverso il linguaggio R. Abbiamo sottoposto i testi composti da Parts of Speech a una nuova Cluster Analysis utilizzando nuovamente la Delta distance. La classificazione, ancora una volta, ha trovato una propria stabilità con 200MFW e prendendo in considerazione 2 n-grams. Il risultato conferma che in termini di organizzazione formale, a un livello alto di analisi, le riviste manifestano dei tratti riconoscibili che ne permettono una distinzione reciproca. Estraendo gli Zeta Scores relativi all’uso degli n-grams nei tesi questo aspetto viene ulteriormente confermato e approfondito. In alcuni casi, come CL01-04 e Down01-05, la distanza dell’elemento “det noun” è notevole a indicare un approccio molto diverso alla scrittura. Per “det” si intende “determiner” ovvero tutte quelle parole che modificano i nomi esplicitandone il contesto (Cfr. Universal POS Tag). I determiner possono essere: articoli, numerali, parole utilizzate in senso attributivo, o anche aggettivi possessivi e dimostrativi. L’uso poco frequente in CL01-04 e molto frequente in Down01-05 della coppia “det noun” indica, dunque, nel primo, una maggiore ampiezza semantica e, nel secondo, il richiamo costante a elementi già presenti precedentemente nel testo. Considerando, d’altro canto, l’insieme di tutti i blocchi di testo, si osserva come i due relativi alla «Critica letteraria» e i due relativi a «Flanerì» presentano valori negativi per l’n-gram “det” “noun” mentre tutti gli altri hanno valori positivi: si tratta di un elemento stilistico, dunque, particolarmente distintivo che denota una maggiore ricercatezza formale in queste due riviste. Aspetto che viene confermato dall’uso dell’n-gram “adj punct”. In questo caso solo i due blocchi di «Critica letteraria» e fla01-05 presentano dei valori positivi: data la specificità della successione “adjective”, in cui rientrano anche gli avverbi, e punteggiatura, un simile n-gram rappresenta un connotato stilistico ben riconoscibile che sancisce di nuovo la posizione maggiormente distinta delle due riviste che lo utilizzano.

Un focus sulla «Critica letteraria»

In virtù della specificità di «Critica letteraria», l’ultima fase della nostra indagine è stata dedicata a individuare alcune peculiarità all’interno dei testi che abbiamo estratto dalla rivista. In primo luogo, abbiamo voluto verificare ulteriormente la sua riconoscibilità stilistica sottoponendo l’insieme di tutti i testi estratti a un processo di analisi attraverso l’uso di tecniche di machine learning, affidandoci alla metodologia nota come Support Vector Machines. Abbiamo realizzato un training set con cui addestrare il modello inserendo i testi di tutte le riviste correttamente annotati. Il test set su cui provare il modello era composto da CL09. Abbiamo sottoposto dunque quest’ultimo al modello allenato e il risultato ha confermato le nostre ipotesi di partenza: il primo candidato a cui attribuire CL09 è CL01-04, seguito da tutti i testi di «Critica letteraria» fino a CL08. Il modello confermava, dunque, l’immediata riconoscibilità della rivista e la vicinanza tra i suoi testi specifici. Abbiamo estratto, infine, le variant words all’interno dei vari file CL per sondare l’esistenza di ulteriori specificità per ciascuno degli elementi considerati. Abbiamo così ottenuto una nuova conferma sulla capacità della stilometria di offrire valutazioni di dettaglio nello studio delle strategie editoriali delle riviste. Infatti, sebbene a livello complessivo i testi CL condividano caratteristiche comuni, soffermandoci sulle variant words, emergono delle specificità in ciascuno dei testi considerati. Prendendo in esame solo dieci parole portatrici di significato (Fig.13) possiamo effettuare ulteriori approfondimenti. Per quanto il modello di machine learning, infatti, avesse attribuito CL09 al gruppo di testi CL01-04, l’utilizzo di alcune parole distanzia molto i due testi. Parole come “tempo”, “due”, “protagonista”, “uomo” avvicinano CL09 ad altri testi di «Critica letteraria», mentre parole come “tutto”, “anni”, “storia” sembrano determinare una maggiore vicinanza tra CL09 e CL01-04. Dati che riconducono la prossimità tra i due testi a tratti stilistici più che lessicali, rendendoli quindi ulteriormente rappresentativi di uno stile di scrittura del testo più che delle scelte tematiche.

Considerazioni finali

La stilometria si è rivelata uno strumento adeguato nello studio delle caratteristiche stilistiche delle riviste culturali italiane online. Non solo, infatti, ci ha permesso di individuare le possibili specificità di questi spazi della lettura digitale che si differenziano dai social network della lettura come Anobii, ma ci ha portato a effettuare considerazioni di dettaglio sulle strategie attuate da ogni singolo giornale culturale per prendere posizione nel vasto panorama di cui sono parte. Se, infatti, nel complesso appare difficile una netta differenziazione, in alcuni casi, tra le recensioni apparse su Anobii e quelle pubblicate dalle riviste, denotando così una propensione alla scrittura online in linea di massima abbastanza omologata, approfondendo i connotati caratteristici di ogni rivista, a livello formale, lessicale e tematico, abbiamo osservato una progressiva differenziazione. Soprattutto l’indagine lessicale e tematica ha determinato il divario tra l’esperienza di lettura del pubblico di Anobii, la sua modalità di esprimere giudizi su libri e autori, e l’esperienza di lettura maggiormente diffusa sulle riviste. Risultati in parte diversi si sono riscontrati nell’analisi rivolta ai soli giornali culturali online. Ottenuta la stabilità con testi di circa 5000 parole, le riviste si sono collocate in rami distinti dei vari dendogrammi, manifestando una certa riconoscibilità. La loro posizione distintiva è stata confermata dalle analisi di dettaglio: le scelte lessicali e tematiche hanno mostrato una grande aderenza all’attitudine specifica di ciascun giornale, laddove l’organizzazione formale del testo, come l’indagine delle Parts of Speech ha confermato, ha evidenziato tutta la riconoscibilità di ogni strategia editoriale. Per quanto si trovino sempre fenomeni di sovrapposizione stilistica tra i diversi giornali online, dunque, la stilometria si è rivelata capace di riconoscere i più profondi elementi distintivi. Aspetti che sono confermati anche dalla successiva analisi sulla distribuzione geografica degli editori che hanno pubblicato i libri recensiti dalle riviste (Fig.14). Quest’ultima analisi è stata condotta attraverso l’utilizzo del software Palladio. L’indagine mostra come gli editori recensiti dalle riviste siano distribuiti in modo vario sul territorio nazionale. Al di là di alcune inevitabili concentrazioni tra Milano, Torino e Roma, che chiaramente riflettono la conformazione del mercato editoriale italiano, sono evidenziati anche altri centri di rilievo a Palermo, Napoli, Venezia e diversi piccoli centri disseminati su tutta la penisola. Un simile dato denota una certa ricerca di varietà in termini di libri da recensire e di editori considerati sulle pagine delle riviste culturali italiane. Una pluralità di voci confermata dal confronto con la distribuzione degli editori considerati invece dalle recensioni su un altro social network come Instagram. Prendendo in considerazione, infatti, 84 recensioni scritte da sei bookinfluencer, a loro volta inseriti nel gruppo di “grandi lettori” dell’«Indiscreto», la mappa degli editori appare molto meno eterogenea (Fig.15). I metadati relativi a queste recensioni sono stati pubblicati a loro volta sul repository github. In questo caso, predomina il ruolo di Milano e Torino sul mercato editoriale a cui sono maggiormente attenti i lettori attivi sui social network. Ancora presenti, sebbene in misura molto ridotta, i centri di Roma e Palermo, assenti altri come Napoli e Venezia. L’eterogeneità degli interessi di lettura delle riviste è confermata anche da un’ulteriore network analysis (Fig.16). Qui sono gli snodi della rappresentazione che ben evidenziano l’ampio spettro di editori considerati. Pochi i punti di contatto dove ritroviamo soprattutto case editrici dall’autorità ormai consolidata sul mercato italiano e significativamente in possesso di un capitale simbolico ampiamente riconosciuto dall’immaginario del pubblico della penisola, come nel caso di Adelphi. Se la stilometria, dunque, ci ha permesso di ricostruire una determinata attitudine alla lettura, l’analisi della distribuzione geografica e delle relazioni tra gli editori recensiti ci offre un quadro sulla possibile influenza delle riviste sul mercato editoriale italiano. L’insieme di queste osservazioni offre spunti interessanti sui futuri studi delle pratiche di lettura contemporanee. Vedere come si caratterizzano spazi specifici della fruizione culturale online permette di individuare anche alcune peculiarità del mercato del libro. Un ulteriore apporto alla ricerca, attualmente in corso, potrà venire dall’applicazione di tecniche di sentiment analysis per approfondire ulteriormente i processi di formazione del gusto dei lettori digitali. Applicare la sentiment analysis a recensioni pubblicate sui differenti social network confrontando gli agenti inseriti nei gruppi consacrati come quelli appartenenti all’insieme dei “grandi lettori” dell’«Indiscreto» e agenti appartenenti al più ampio spazio digitale come i lettori che pubblicano recensioni su Anobii, Goodreads e Amazon, potrebbe presentare osservazioni ancora diverse sul modo in cui l’attività della lettura si declina oggi sul web. Infine, sarà necessario in futuro trasformare i dati estratti dall’analisi in Linked Open Data, seguendo un modello ontologico definito. Un simile approccio ci permetterà non solo di ricostruire più facilmente le mappe sociali della lettura digitale, ma anche di estrarre connessioni utili a futuri approfondimenti.

Bibliografia

Bourdieu, Pierre, La Distinction. Critique sociale du jugement, Les Éditions de Minuit, Paris, 1979

Boudieu, Pierre, Les Règles de l’art. Genèse et structure du champ littéraire, Le Seuil, Paris, 1992

Burrows, John, ‘Delta’: a Measure of Stylistic Difference and a Guide to Likely Authorship, Literary and Linguistic Computing, Volume 17, Issue 3, 2002, Pages 267–287

Eder, Maciej, Rybicki Jan, & Kestemont Mike. Stylometry with R : a package for computational text analysis. The R Journal, 8(1), 2016, p. 107–121

Kuijpers, Moniek M., et al. “Validation of the Story World Absorption Scale through Annotation of Online Book Reviews.” Journal of Cultural Analytics, vol. 9, no. 1, Mar. 2024

Lauer, Gerhard, La lettura nell’era digitale o la fine dell’editoria letteraria che abbiamo conosciuto, in L. Braida e B. Oubry-Vial, Leggere in Europa. testi, forme, pratiche (secoli XVIII-XXI), Carocci, Roma, 2023, pp. 113-135

Loi, C., Kuijpers, M., Ensslin, A., & Lauer, G. (2023). Paths to transformation across contemporary reading practices: The role of motivations and genre preferences. Psychology of Aesthetics, Creativity, and the Arts. Advance online publication

Manjavacas Enrique, Karsdorp Folgert, Burtenshaw Ben, and Kestemont Mike.. Synthetic Literature: Writing Science Fiction in a Co-Creative Process. In Proceedings of the Workshop on Computational Creativity in Natural Language Generation (CC-NLG 2017), pages 29–37, Santiago de Compostela, Spain. Association for Computational Linguistics, 2017

Nakamura, L. (2013). “Words with Friends”: Socially Networked Reading on Goodreads. PMLA, 128(1), 238-243. doi:

Humanities + Design, Stanford University, Palladio

Pianzola Federico, Rebora Simone, Lauer Gerhard, Wattpad as a resource for literary studies. Quantitative and qualitative examples of the importance of digital social reading and readers’ comments in the margins. PLoS ONE, 15(1): e0226708, 2020

Rebora Simone, Boot Peter, Pianzola Federico, Gasser Brigitte, Herrmann J.Berenike, Kraxenberger Maria, Kuijpers, Moniek M., Lauer Gerhard, Lendvai Piroska, Messerli Thomas C., Sorrentino Pasqualina, Trans.WangLirui. Digital Humanities and Digital Social Reading[J]. Digital Humanities Research, 2022, 2(1): 52-67

Rebora Simone, Pianzola Federico. A New Research Programme for Reading Research: Analysing Comments in the Margins on Wattpad. DigitCult - Scientific Journal on Digital Cultures, [S.l.], v. 3, n. 2, p. 19-36, sep. 2018. ISSN 2531-5994. Date accessed: 30 mar. 2024. doi:

Ward, Joe H. «Hierarchical Grouping to Optimize an Objective Function». Journal of the American Statistical Association 58, No 301 (1963): 236–44