Traduzione e Interpretazione

Lezione 17 aprile: Thompson

Paul Thompson photo

Paul Thompson

Ieri abbiamo avuto il secondo appuntamento con Paul Thompson dell’università di Reading, ed oggi sono pronta a darvi un resoconto dei due pomeriggi di seminario, mescolando i contenuti senza soluzione di continuità.

“Lecturers talking, students writing” è un’etichetta che copre solo una parte di quello che abbiamo fatto, ovvero quella incentrata su due corpus liberamente accessibili in rete all’indirizzo http://www.sketchengine.co.uk/open.

Il BASE [British Academic Spoken English] corpus e il BAWE [British Academic Written English] corpus sono rispettivamente costruiti raccogliendo lectures e seminars dei professori e lavori degli studenti presso le università di Reading e Warwick.

Prima di guidarci nella loro consultazione, Thompson ha ricordato le peculiarità che, stando alla letteratura, qualsiasi corpus dovrebbe avere:

It should be REPRESENTATIVE & PRINCIPLED

Thompson ha poi spiegato ai meno addetti ai lavori a cosa un corpus potrebbe servire. Ha parlato, ad esempio, della possibilità di studiare collocations, prosody, frequencies e phraseology, e ha altresì messo in luce i diversi tipi di corpora esistenti:

general vs specific
annotated vs plain text
written vs spoken
diachronic vs synchronic
entire texts vs samples
entire works vs sampling
monolingual vs multilingual

È stato fatto un breve accenno al POS [Part Of Speech] tagging e ai vari passi nello sviluppo di un corpus, il che è stato di non poca utilità per noi al primo anno di questo percorso di dottorato.

Siamo poi passati alla pratica, e ci è stato chiesto di interrogare il BASE e di indagare su una parola (a nostra scelta) tra le più frequenti nel parlato dei professori britannici (che, come Thompson ha sottolineato, sembrano usare molte parole generiche, tipo “thing”, per avvicinarsi ai loro studenti).

Io personalmente ho guardato le frequenze di “point” come lemma e cercando le sue collocazioni ho trovato “point out” e “point about”. Pensando, erroneamente, che “point about” potesse essere un phrasal verb come il predecessore, ho affinato la ricerca e in realtà ho capito che mi sbagliavo. La preposizione about occorreva prima.

Ma questa sono io. Torniamo a Thompson.

Se volete più informazioni sui corpora BASE e BAWE vi basterà consultare la home page del progetto http://www.sketchengine.co.uk/ (in pratica l’indirizzo di prima ma senza open) e troverete utili informazioni su cosa uno Sketch Engine account potrebbe darvi. Riassumendo, per una modica cifra annuale che non ricordo, avrete:

- Pre-loaded corpora in many languages
- WebBooTCat (mi ha fatto piacere ritrovare un paper col nome di Marco Baroni che ai miei tempi insegnava alla SSLMIT di Forlì)
- Corpus builder

Cliccando su Documentation avrete anche parecchie informazioni on how to get started (il che potrebbe essere particolarmente utile per chi non ha dimestichezza con questi strumenti).

A questo proposito, mi sento di consigliare a chi cerca un po’ di bibliografia sui corpora, quello che, molto modestamente, io ho letto in materia (sezione References). Ho caricato solo una parte del materiale, ma se qualcuno è interessato posso ovviamente aggiungere altri riferimenti a libri che ho letto.

Verso la fine del suo seminario, Thompson è diventato decisamente più tecnico (poveretti quelli che ai corpus non sono per niente interessati). Ci ha parlato di XML annotation, ovvero di elements, attributes e values, ci ha spiegato come usare il programma Note Tab Pro (che è anche disponibile in una versione free per chi volesse provare) e ci ha fatto caricare due corpus che ha provveduto ad inviare via mail a ciascuno di noi insieme ad un programma per interrogarli. Su suo suggerimento, ho provato a caricare anche il mio corpus, il frutto di due anni di lavoro sull’interpretazione televisiva che sono confluiti nella mia tesi di specialistica (se vi interessa eccovi un piccolo riassunto del mio lavoro: summary of my dissertation).

Con mia grande sorpresa il programma funzionava anche con i miei testi in XML, anche se c’è un piccolo bug che crea un po’ di confusione con gli attributes. Ad ogni modo si tratta di un programma ancora in fase di elaborazione, che noi oggi abbiamo avuto la fortuna di cominciare ad usare.

Da interprete “habituée” alla SFSCon so benissimo quanto un programma può evolversi grazie al feed back degli utenti, quindi è mia intenzione provare il programma conosciuto oggi per vedere se ci sono problemi nel loading e nella consultazione del mio corpus e se in un qualche modo mi può permettere, con i corpora che andrò a creare nei prossimi tre anni, di osservare cose che Xaira e i programmi usati fino ad ora non mi permettono di studiare.

Quello che Thomson ha detto a me personalmente, quando dava a ciascuno di noi il suo feedback sui nostri progetti, è off the records. Dico solo che farò tesoro dei suoi suggerimenti, e che li passerò ovviamente al vaglio del mio tutor e co-tutor.

Sperando di aver reso un servizio agli assenti (di sicuro l’ho reso a me stessa), vi do appuntamento alla prossima settimana con i PhD summaries.

Quanto al resto, avrei mille cose da condividere in termini di lessico ed esperienze per il momento, ma purtroppo non ho mai tempo di fermarmi a scrivere (e le ore in treno mi servono per tradurre testi arretrato e preparare il convegno di fine mese).

Portate pazienza se non aggiorno tanto spesso..verranno tempi migliori..o almeno me lo auguro!!!!

Leave a Reply