StorieInMovimento.org

La linguistica dei corpora

Segnaliamo che nell’articolo di Francesca Socrate, La linguistica dei corpora. Linguaggio e conflitto, pubblicato sul numero 52 di «Zapruder», L’ordine del discorso, per tre volte la parola “pamphlet” compare al posto di “taltac2”.
Taltac2 indica il nome del software utilizzato dall’autrice per svolgere una parte della propria ricerca e il refuso rende dunque di difficile comprensione il testo.
Scusandoci con Francesca Socrate e con i lettori e le lettrici, ripubblichiamo qui la versione rettificata dell’articolo.
La redazione di «Zapruder» e i curatori de L’ordine del discorso (Salvatore Corasaniti, Alessandro Pes e Alessandro Stoppoloni)

La linguistica dei corpora. Linguaggio e conflitto

di Francesca Socrate

Tra il 2007 e il 2010 avevo registrato una trentina di interviste a donne e uomini che avevano partecipato al ’68: era la mia prima volta con la storia orale, e quella memoria, che avevo previsto di raccogliere senza sapere in verità di quale materia fosse fatta, rivelava così tutta insieme una forza inaspettata.

Innumerevoli gli spunti di analisi che mi suggeriva e mille le domande che mi poneva – anzi, che mi imponeva. Come governare tutto questo, quali significati attribuirle?

Avevo alle spalle la tradizione ormai lunga di una storia orale volta a lavorare su soggettività e memoria, e l’insieme dei criteri e dei metodi utilizzati fino ad allora per arrivare a quell’obiettivo. Avevo imparato da Sandro Portelli che la costruzione dell’intreccio – la sua forma, l’ordine in cui gli eventi vengono presentati nel racconto – nasconde un criterio organizzativo che dice la soggettività del narratore. E da Luisa Passerini per prima la capacità interpretativa delle categorie della psicologia sociale e della psicoanalisi di fronte alla costruzione memoriale, alle sue contraddizioni e ai suoi silenzi.

Conoscevo insomma la ricchezza di tanto lavoro sulle fonti orali che si era misurato con la ricerca del senso di cui ogni racconto autobiografico è interprete più o meno consapevole. Ma dove, e soprattutto come trovare i segnali? Quale criterio adottare per identificare le spie di quei significati sotterranei e per lo più nascosti?

Le interviste mi suggerivano un mare di temi e di motivi, ognuna di loro raccontava una sua memoria di cui cercavo l’unicità ma insieme i punti di contatto con le altre, e l’ottica con cui avanzavo cambiava lente e punto di osservazione a seconda del genere di domande che mi facevo. Un viaggio entusiasmante di cui però non vedevo la fine. Una grande confusione e la paura di non riuscire a orientarmi in quel materiale che avevo d’altronde intenzione di ampliare con altre interviste, come poi avrei fatto. Ma soprattutto la sensazione di lavorare in modo impressionistico, senza un principio regolatore, affidandomi alla casualità delle mie intuizioni.

Avevo troppe domande e già allora troppe storie da interpretare: il rapporto di quelle persone con i fatti della “grande storia”, il punto di vista da cui li avevano guardati e come li avevano vissuti, e il modo in cui tutto questo veniva tradotto nella memoria autobiografica, in quello scarto narrativo che riscrive il passato alla luce del presente. Gli interrogativi insomma della storia alle prese con quella straordinaria fonte che è l’intervista orale.

Fondamentalmente mi interessava il lavoro della memoria, cercare di scoprirne il senso nascosto nelle pieghe del racconto, andare al di là di quanto veniva volontariamente enunciato per individuare l’implicito, se non l’inconsapevole. Ma se questa era la mia domanda, perché non concentrarmi proprio sul linguaggio, sulla materia di cui si può dire sono fatte le interviste? Perché non analizzarlo come un documento che porta le tracce emotive e culturali di chi lo ha prodotto?

Era stata per prima la lettura – tardiva da parte mia – di due saggi di Maurizio Gribaudi (1978; 1981) e la sua riflessione sui metodi di analisi dell’implicito a rafforzarmi nell’idea che avesse senso provare quella strada, che insomma «una considerazione più attenta del linguaggio – su cui è basata la maggioranza delle fonti storiche – debba essere pensata come essenziale» (1981, p. 248). Le storie di vita non sono d’altronde, aveva sottolineava già allora Gribaudi, «testimonianze dirette che parlano da sé» (1978, p. 1131): l’analisi degli aspetti formali del racconto a cominciare dalla sua lingua può quindi essere un modo per andare oltre una lettura impressionistica del contenuto di un testo.

Questa è stata la prima scelta. Ma da che parte cominciare, soprattutto per me che non avevo competenze linguistiche specifiche?

In quella fase la svolta decisiva mi venne da Franco Moretti che insegnava allora Letterature comparate all’università di Stanford. Durante una delle nostre conversazioni in cui gli raccontavo quella mia immersione nelle interviste, cose che mi tornavano e cose che invece non capivo, mi chiese se conoscevo la linguistica dei corpora. Non ne sapevo nulla. Mi disse che ci stava lavorando (di lì a pochi giorni avrebbe fondato a Stanford il Literary lab, un centro di ricerca che sarà all’avanguardia nell’area delle DH[ref]1. https://litlab.stanford.edu. Per i risultati degli esperimenti pubblicati in rete da allora nella serie dei pamphlet, vedi https://litlab.stanford.edu/pamphlets/[/ref] e di inviargli per mail qualche intervista digitalizzata che mi avrebbe mostrato di cosa si trattava. Dopo pochi minuti mi è arrivata una tabella con una lista di cento parole per ognuna delle nove interviste che gli avevo mandato, parole organizzate secondo un ordine decrescente di occorrenze – delle volte cioè in cui ogni parola ricorreva nel testo dell’intervista. Insomma, erano le prime 100 parole più usate da ciascun intervistato.

Ecco, è cominciata così. È stato immediato: anche solo a scorrerle, quelle parole elencate in quell’ordine mi hanno subito sorpresa. Erano parole che mi parlavano, alludevano a significati che mi sono sembrati immediatamente interessanti, da interrogare, espliciti o nascosti che fossero, indizi di un racconto, segnali delle diversità tra le interviste. Che cosa erano quelle liste? E soprattutto cosa è la linguistica dei corpora (ldc)?

La Linguistica dei Corpora e i suoi software

La ldc è lo studio delle regolarità linguistiche presenti in una raccolta di testi fra loro confrontabili (il corpus, appunto). Nel passato dizionari e grammatiche poggiavano su corpora, per lo più di dimensioni ridotte. Dalla seconda metà del Novecento le tecnologie informatiche hanno affiancato la ldc: si tratta di software di analisi automatica dei testi il cui sviluppo e la sempre più rapida diffusione hanno ampliato e continuano a ampliare la capacità di verifica quantitativa e statistica dei testi e del loro contenuto (Chiari 2007; Barbera 2013). Metodologia nata nell’ambito della glottologia e della linguistica, la ldc è utilizzata da tempo anche da altre discipline (sociologia, biologia, psicologia sociale, critica letteraria, storia della letteratura). Per la ricerca storica invece l’uso di questo approccio è stato estremamente limitato sia nel tempo che nello spazio: in Italia solo pochissimi esempi (Vetter 2013; 2015; Marin 2013; 2015), contrariamente al Regno unito o alla Francia (Robin 1973; Genet 2011; Mayaffre 2008; Cinquin 2012a; 2012b), dove è stato a più riprese adottato e posto al centro di riflessioni teoriche e metodologiche.

Non seguirà qui un manuale di istruzione per l’uso di questi software, delle varie procedure e dei numerosi risultati che si possono raggiungere. Non ho le competenze informatiche né statistiche adeguate, mentre circolano peraltro in Italia manuali accurati e gli stessi programmi hanno le loro istruzioni, una guida al loro uso passo dopo passo. Mi limiterò quindi a nominare le risorse che ho utilizzato nel mio lavoro, e che costituiscono solo una parte delle potenzialità di questi strumenti informatici. Ma per quanto ridotte rispetto alle capacità del programma di cui mi sono servita, quelle risorse hanno costituito per me un passaggio risolutivo e necessario, e mi hanno offerto un criterio di partenza per interrogare le mie interviste e da lì poi poter lavorare alla loro interpretazione.

Ho usato un software italiano, taltac2, acronimo di trattamento automatico lessicale e testuale per l’analisi del contenuto o di un corpus. Per quanto diversi tra loro, i software su cui poggia la ldc fanno molte cose a cominciare dal contare le parole dei corpora. La prima informazione che il software produce è il vocabolario complessivo, la lista cioè di tutte le parole presenti in un determinato corpus così come vengono pronunciate o scritte: il programma le riconosce in quanto successione di caratteri dell’alfabeto compresi tra spazi bianchi, e per questo le chiama in italiano forme grafiche. Per ogni parola viene indicata la frequenza con cui compare nel corpus e alcuni specifici attributi informativi come il lemma a cui quella viene ricondotta e le indicazioni grammaticali determinanti (sostantivo, verbo, pronome, avverbio, congiunzione). Quando il corpus è composto di vari testi il ricercatore può creare una tabella in cui collegare a ciascun testo le caratteristiche categoriali considerate interessanti per la ricerca. Una sorta di database da importare nel programma. L’incrocio fra il database e il vocabolario complessivo del corpus produce quello che taltac2 chiama il vocabolario caratteristico o delle specificità, ovvero le parole proprie dei singoli gruppi identificati attraverso le variabili categoriali. Questo vocabolario è basato su un algoritmo che ci dice se la presenza di una determinata parola in quel determinato gruppo è sovradimensionata rispetto alle attese, ricorre cioè con una frequenza più alta di quella media del corpus, senza che questo risultato sia dovuto al puro effetto del caso (sulla base di un valore di probabilità: più basso è questo valore, più alta la specificità positiva della parola). È la lista insomma delle parole specifiche di quel determinato gruppo, quelle che lo caratterizzano rispetto agli altri.

Le liste di parole arrivate da Franco Moretti erano quindi uno dei primi risultati prodotti da un software di analisi testuale utilizzato a Stanford. E se avessi trovato in questo approccio la possibilità di superare la confusione e l’impressionismo? Se avessi trovato nella logica statistica del software un principio ordinatore di quel materiale ricchissimo e ingovernabile?

Ci riflettei molto e decisi di chiedere un parere a Tullio De Mauro: aveva senso che lavorassi in una prospettiva storica sulle mie fonti orali con quel metodo e senza una competenza di linguista? Una bellissima mattinata di riflessione alla fine della quale De Mauro non solo approvò l’idea ma mi consigliò anche un breve corso per imparare a usare un programma, taltac2 appunto, cui aveva contribuito con il suo Dizionario della lingua italiana. Il corso iniziava di lì a pochi giorni. Un mese per imparare gli elementi basilari del software, con molta ma prevedibile fatica, e poi l’esperimento che durerà alcuni mesi, tra consultazioni indispensabili con una ricercatrice dell’Istat, Valentina Talucci, alcune letture altrettanto indispensabili sull’applicazione dell’informatica all’area delle discipline umanistiche (Gigliozzi 2003; Chari 2007) e l’apporto essenziale e generoso di Franco Moretti.

Inserito il corpus nel programma, ho costruito il mio database associando a ogni intervista le caratteristiche socioculturali della persona intervistata secondo alcune variabili di cui volevo verificare l’incidenza sulla costruzione narrativa della memoria: l’anno di nascita, il genere sessuale, le origini familiari, il percorso scolastico, la militanza politica prima e dopo il ’68, la condizione lavorativa al momento dell’intervista, tra le prime, cercando così di incrociare la simultaneità delle differenze e delle somiglianze che caratterizzavano socialmente una per una le persone intervistate.

Alla fine avevo le liste delle specificità: le parole proprie delle donne e quelle degli uomini, le parole proprie dei nati tra il ’39 e il ’45, e di quelli tra il ’46 e il ’50 – le due “generazioni sociali” in cui avevo suddiviso le persone intervistate –, le parole proprie dei diplomati nei diversi corsi di studi delle scuole superiori, e così via. Insomma, i linguaggi specifici – una lista di circa cinquanta parole ­– delle intervistate e degli intervistati raggruppati volta a volta secondo i tratti socioculturali che avevo scelto come significativi. Da ognuna di quelle parole potevo poi, intervista per intervista, luogo dopo luogo, risalire rapidamente al contesto in cui quella era stata pronunciata attraverso la lista delle concordanze. Potevo così dal generale tornare alla pluralità, alle voci individuali, uniche e irriducibili, all’orizzonte di possibilità che quelle mie categorie volta a volta contenevano.

Ma neanche le parole parlano da sé. Dall’analisi quantitativa alla linguistica testuale per arrivare all’interpretazione

Come nella mia prima lettura delle liste di Franco Moretti, anche di fronte ai vocabolari specifici mi sarebbe venuto naturale fermare lo sguardo in primo luogo sui sostantivi che si impongono con il loro significato immediato, segni apparentemente trasparenti di quello che designano, del racconto cui alludono. Ma era un ritrovarsi di nuovo di fronte al contenuto manifesto della lingua, all’esplicito. La loro forza semantica evidente rischiava di ridurre il mio lavoro a ridire ciò che la fonte ha già detto: come ha scritto Michel Foucault a proposito degli storici, la loro «sintesi soggettiva» non è altro che un commento, testimone di «un eccesso del significato sul significante» (1969, pp. 10-11). Rischiavo insomma di produrre tautologie, quasi come le visualizzazioni delle parole nelle words cloud.

Determinante è stata per me in quella fase la lettura di Harald Weinrich e Émile Benveniste, che mi hanno insegnato invece quali profonde implicazioni di senso siano nascoste nei dettagli della lingua, nella sua grammatica: i tempi e le persone verbali, i pronomi, in primo luogo; e poi comunque le congiunzioni, gli avverbi. Dettagli si fa per dire: così come i lapsus, i silenzi, le dimenticanze, quelle opzioni grammaticali si impongono quasi all’insaputa di chi parla, sono pronunciati involontariamente insomma, tanto più in un dialogo informale e privato come l’intervista orale dove le scelte lessicali ma soprattutto grammaticali sono meno intenzionali di quanto non lo siano in un testo scritto o in un discorso orale preparato. Dettagli che come tali riflettono l’atteggiamento soggettivo del narratore, quello che Benveniste ha chiamato l’impronta umana nel linguaggio, «definita dalle forme linguistiche della “soggettività”, e dalle categorie della persona, dei pronomi e del tempo» (2010, p. 4). Due grandi testi, imprescindibili: è la linguistica testuale. Il suo apporto teorico e di metodo ci consente di leggere quello che il testo non esplicita ma che comunica tra le righe, per lo più involontariamente, e questo accade grazie a un’analisi della lingua che non viene limitata al piano semantico, ma si concentra, come specifica Weinrich, su «una grammatica non sganciata dalla sfera dei significati» (2004, p. 219).

I risultati empirici dell’analisi computazionale non sono quindi un punto di arrivo, ma una base di partenza, uno strumento. Perché quell’elenco di parole specifiche, quegli elementi lessicali, una volta descritti vanno spiegati, per ricondurli al mondo, alla storia collettiva e alla storia individuale delle persone intervistate, al loro posizionamento allora e oggi, e ai vari passaggi in quell’arco temporale. Attraverso quella sorta di metodo indiziario che è la linguistica testuale, le parole spesso inaspettate indicate dalla logica statistica diventano segnali da interrogare per rintracciare i meccanismi più inconsapevoli della memoria e il significato che quelle elaborazioni mnestiche hanno per chi racconta.

È qui che si apre dunque la fase qualitativa della ricerca, una sorta di seconda navigazione in cui interpretare i risultati ottenuti andando oltre quanto viene dichiarato esplicitamente. Dall’analisi quantitativa del corpus, quindi, all’analisi linguistica del testo. Per arrivare alla fine all’interpretazione.

Traggo qui un esempio di questo passaggio dal mio lavoro nella sua versione più recente, basata su un corpus di una sessantina di interviste dove i cambiamenti introdotti dopo il mio primo “esperimento” non intaccano però nella sostanza lo schema di utilizzazione del software (Socrate, 2018). Si tratta dei due vocabolari specifici relativi al genere sessuale: quello delle donne e quello degli uomini.

Già solo a una prima occhiata è evidente la distanza tra le parole dei due gruppi. Le prime 10 parole delle donne: io, mia, sono andata, sono stata, marito, amica, quindi, donne, femminismo, mi.

Le prime 10 parole degli uomini: polizia, sono andato, Giurisprudenza, movimento studentesco, sono stato, Nuova Repubblica, fascisti, assemblea, occupazione, destra.

Queste persone hanno condiviso per un periodo importante della loro giovinezza gli stessi eventi, negli stessi spazi, ma queste parole pronunciate più di quarant’anni dopo segnano due racconti lontani e diversissimi: per le donne, un racconto in prima persona, così fortemente in soggettiva (io, mia, mi), che si distingue per l’attenzione alle relazioni personali e all’esperienza femminista; per gli uomini, invece, un racconto di gesta e di imprese, di occupazioni e scontri con la polizia, quasi visto dal di fuori, oggettivato. Una differenza tra i due vocabolari impressionante per la sua nettezza, ma certo non inaspettata. Questo è ciò che il risultato di taltac2 immediatamente ci dice.

Ma a cercare i dettagli nella lista completa delle specificità femminili, nel cercare le spie di un senso nascosto, compare un avverbio che mi incuriosisce: forse. Un avverbio di dubbio: che funzione ha questa parola specifica delle donne nel loro racconto? Insicurezze della memoria? Esitazioni? Aggiustamenti per mitigare un’asserzione?

Verifico i contesti, e forse compare invece più spesso in momenti del discorso altri, quelli che segnano il passaggio dal registro autobiografico e personale a proposizioni di carattere speculativo, dal soggettivo all’oggettivo.

Studentessa di lettere e filosofia a Firenze, A.S. mi sta raccontando con entusiasmo della sua tesi e del suo maestro, ma a un tratto una pausa breve, un dubbio, quasi un richiamo ai suoi compiti di intellettuale: «Tutto questo per dire che, in quegli anni, prima del ’68, perché tutto questo era negli anni immediatamente prima del ’68, io… ma io posso parlare di me? perché io sto parlando di me, invece forse dovrei parlare…». Le rispondo che mi interessa proprio il suo parlare di sé, e A. riprende decisa il suo racconto in prima persona: «Io avevo una specie di… di cosa dentro che non riuscivo a capirmi…»[ref]2. A.S. (1945, storica), Firenze, 10 maggio 2014, nella sua abitazione.[/ref]

Quell’avverbio mi sembra rifletta una tensione che ha attraversato il movimento delle donne. Mi riferisco qui al passaggio contrastato vissuto dal movimento femminista nel momento della crisi dell’autocoscienza quando si schiuse una fase di ricerca teorica e di storicizzazione della propria storia. Quel passaggio produsse reazioni e discussioni aspre, quasi fosse una riapertura a quel pensiero astratto e maschile che era stato l’oggetto di un rifiuto fondativo e fosse così infranta l’esclusiva straordinaria scoperta della pratica femminista del partire da sé per capire sé e il mondo. ­Non importa se le mie intervistate abbiano militato o meno nel femminismo. Per la loro storia e l’area sociale e ideologica cui appartenevano il femminismo condivide con loro la sua eredità culturale. Ancora una volta la narrazione e le parole si rivelano intessute di tempo. Così oggi la memoria femminile nell’incertezza che accompagna la scelta di un registro autobiografico replica quella tensione, una scelta che, intenzionale o meno, è una forma di resistenza a una visione del ’68, e in genere della storia e della società, universalistica e neutra. Decostruisce cioè una fittizia omogeneità, quella pulsione egualitaria che la categoria di “generazione del ’68” ha poi fissato oscurando le differenze e la loro percezione non solo tra i generi, ma tra persone diverse per età, per risorse culturali e sociali, eccetera. La rammemorazione si fa così contromossa che recupera i propri vissuti: come ha scritto David Bidussa (2017),

La rammemorazione – e dunque la riemersione di qualcosa da una precedente condizione di oblio – non implica la riattivazione di un ricordo e dunque non richiama la funzione della memoria. Si fonda su un processo attivo, non rievocativo. La rammemorazione si accredita perciò come la fonte da cui proviene la storia.

La lingua d’altronde non è neutra, esprime soggettività, emozioni, opinioni, si relaziona con gli altri. La lingua è un’arma di offesa e di difesa. Attraverso la lingua passano direttamente e indirettamente le relazioni e i conflitti tra gli individui e tra le collettività che si concretano non solo nella contrapposizione esplicitata di idee e sistemi di valore, ma in modo spesso inconsapevole da parte di chi parla anche nella dimensione nascosta degli aspetti morfosintattici o semantici. Se un’intervista orale è un atto di memoria, essa è contemporaneamente un atto di nascondimento sotto la superficie opaca della lingua. L’analisi computazionale offre pertanto dei dati, i suoi oggetti linguistici, che a seguirli e spiegarli si possono rivelare nodi di identità memoriali in cui si intrecciano percorsi individuali e atteggiamenti collettivi comuni ai gruppi di cui fanno parte.

Conclusioni

Due metodi, due fasi.

A mio parere compatibili. Anzi complementari, secondo una gerarchia degli obiettivi che assegna però alla ldc e ai suoi software un ruolo ancillare. Contare le parole vuol dire scegliere un metodo quantitativo di analisi del linguaggio di un testo. È evidente. È un lavoro ausiliario che propone oggetti linguistici da investigare. E può rivelarsi una scelta preziosa. Ma solo a patto di non fermarsi lì. Ma di assumere i risultati della logica statistica del software come indizi da decifrare, se fare storia vuol dire come io credo (provare a) interpretare, a dare un senso. Attraverso la linguistica testuale, poi, cercare dietro, o meglio dentro le parole l’impronta umana nel linguaggio. Per poi andare oltre, e individuare i nessi tra quei significati e il mondo sociale di chi narra nel lungo tempo che intercorre tra l’evento e il racconto. Insomma, appunto interpretare.

Chiudo questo articolo con una domanda aperta. Quantitativo e qualitativo possono dunque essere metodi complementari? o si escludono a vicenda? o, come invece sostiene Franco Moretti oggi, dopo una lunghissima esperienza di lavoro su e con la dimensione quantitativa, non possono incontrarsi perché seguono logiche che li portano su strade divergenti?

L’interpretazione trasforma tutto ciò che tocca: «questo, significa quello». Un assoluto rispetto per i dati è il punto d’onore del lavoro quantitativo. Sono agli antipodi. Si pensi a come lavorano sulla forma. L’interpretazione si muove di norma tra la forma e il mondo, andando in cerca del senso storico-sociale delle opere; la quantificazione si muove tra forma e forma, per tracciare il grande atlante della letteratura. Per la prima, la forma è fondamentalmente una forza, un agire: un modo di “plasmare” l’esistente che va accolto con sospetto, contrastato, e infine smascherato. Per l’altra, la forma è un prodotto finito, da misurare a mente fredda e collocare all’interno di tutto un sistema di rapporti. Una spinge verso la storia, ed è animata dal pathos del conflitto; l’altra verso la morfologia, animata dal pathos dell’esplorazione. Grandi passioni, tutte e due. Ma troppo esclusive per lavorare assieme. (Moretti, di prossima pubblicazione).

Non credo si possa sciogliere la questione richiamandosi ai diversi punti di vista disciplinari: storia della letteratura e storia della società. La dimensione storico-sociale interessa Moretti quanto chiunque faccia storia. È quindi una domanda aperta non solo perché la risposta esulerebbe dall’economia di questo articolo, ma perché è necessario, e sicuramente interessante, un tempo ulteriore di riflessione. Che non si fermerebbe neanche qui, viste le riserve, se non il rifiuto verso la quantificazione che nello stesso nostro ambito si è andato consolidando negli ultimi decenni. E ancora, una postilla a latere che riguarda l’area specifica della storia orale: cosa vuol dire analizzare un’intervista con tutto il suo carico di relazione personale, di intersoggettività, come un testo digitalizzato?

BIBLIOGRAFIA

Barbera, M.
(2013) Linguistica dei corpora e linguistica dei corpora italiani. Un’introduzione.

Benveniste, É.
(2010) Problemi di linguistica generale, il Saggiatore, Milano [I ed. Paris, 1966].

Bidussa, D.
(2017) Sarebbe stato bello conoscerti, Walter Benjamin! Buon compleanno, «Gli Stati Generali».

Chiari, I.
(2007) Introduzione alla linguistica computazionale, Laterza, Roma-Bari.

Cinquin, S.
(2012) Utilizzare la lessicometria in storia (1): panorama storiografico, «Diacronie. Studi di storia contemporanea».
(2012) Utiliser la lexicométrie en histoire (2): les aspects concrets, «Devenir historien-ne. Méthodologie de la recherche et historiographie».

Foucault, M.
(1969) La nascita della clinica. Il ruolo della medicina nella costituzione delle scienze umane, Einaudi, Torino [I ed. Paris, 1963].

Genet, J.Ph.
(2011) Langue et histoire: des rapports nouveaux, in Langue et histoire, sous la direction de J.M. Bertrand, P. Boilley, J.Ph. Genet e P. Schmitt-Pantel, Publications de la Sorbonne, Paris.

Genet, J.Ph. e Zorzi, A.
(2011) Les historiens et l’informatique. Un métier à reinventer, école française de Rome, Rome.

Gigliozzi, G.
(2003) Introduzione all’uso del computer negli studi letterari, a cura di F. Ciotti, Bruno Mondadori, Milano.

Gribaudi, M.
(1978) Storia orale e struttura del racconto autobiografico, «Quaderni Storici», n. 39.
(1981) A proposito di linguistica e storia, «Quaderni Storici», n. 46.

Marin, M.
(2013) Catechismi rivoluzionari: evidenze lessicologiche e lessicometriche, in La felicità è un’idea nuova in Europa. Contributo al lessico della rivoluzione francese, II, a cura di C. Vetter e M. Marin, Edizioni Università di Trieste, Trieste, pp. 453-730.

Mayaffre, D.
(2008) Quand “travail”, “famille”, “patrie” co-occurrent dans le discours de Nicolas Sarkozy. étude de cas et réflexion théorique sur la co-occurrence, «JADT 2008 – 9es Journées statistique des Données Textuelles, Mars 2008», Presses Universitaires de Lyon, Lyon, pp. 811-822.

Moretti, F.
(2013) Distant reading, Verso, London-New York.
(di prossima pubblicazione) La strada per Roma. La letteratura tra ermeneutica e quantificazione

Moretti, F., Algee-Hewitt, M., Allison S., Gemma, M. et al.
(2019) La letteratura in laboratorio, a cura di G. Episcopo, FedOAPress, Napoli.

Robin, R.,
(1973) Histoire et linguistique, Armand Colin, Paris.

Socrate, F.
(2018) Sessantotto. Due generazioni, Laterza, Roma-Bari.

Vetter, C. e Marin, M. (a cura di)
(2013) La felicità è un’idea nuova in Europa. Contributo al lessico della rivoluzione francese, II, EUT, Trieste.

Vetter, C., Marin, M. e Gon, E.
(2015) Dictionnaire Robespierre. Lexicométrie et usages langagiers. Outils pour une histoire du lexique de l’Incorruptible, EUT, Trieste.

Weinrich, H.
(2004) Tempus. Le funzioni dei tempi nel testo, il Mulino, Bologna [I ed. Stuttgart, 1964].

Tutti i link di questo articolo si intendono consultati l’ultima volta il 7 novembre 2019.

Related Articles

Licenza

Licenza Creative Commons

Tutti i contenuti pubblicati su questo sito sono disponibili sotto licenza Creative Commons Attribuzione - Non commerciale - Condividi allo stesso modo 4.0 Internazionale (info qui).

Iscriviti alla newsletter di SIM