fbpx

„CoRoLa. Accesul la textele scrise și la cele orale”, prima prelegere din 2021 în cadrul CLTA

„CoRoLa. Accesul la textele scrise și la cele orale”, prima prelegere din 2021 în cadrul CLTA

Joi, 21 ianuarie 2021, va avea loc conferința „CoRoLa. Accesul la textele scrise și la cele orale”, prezentată de dr. Verginica Barbu Mititelu, cercetător științific la Research Institute for Artificial Intelligence din cadrul Academiei Române. Evenimentul științific va avea loc online începând cu ora 18:00, pe platforma Google Meet. Persoanele interesate de participare sunt invitate să acceseze acest link pentru a lua parte la reuniune.

Conferința face parte din ciclul Conferințelor Centrului de Lingvistică Teoretică și Aplicată (CLTA), organizat de Departamentul de Lingvistică al Facultății de Litere al Universității din București.

Proiectul CoRoLa, printre programele prioritare ale Academiei Române 

Proiectul CoRoLa (Corpusul de referință pentru limba română contemporană) a debutat în 2014 ca program prioritar al Academiei Române și a fost încredințat Institutului de Cercetări pentru Inteligență Artificială „Mihai Drăgănescu” din București (ICIA) și Institutului de Informatică Teoretică din Iași (IIT).

Corpusul conține texte diverse, datând din 1989 și până astăzi, scopul creării acestuia fiind să ofere o imagine obiectivă a limbii române actuale scrise și vorbite. Corpusul este deschis utilizării publice prin intermediul a două interfețe pentru căutare în date de tip text și una pentru căutare în date de tip audio.

Domeniile principale de utilizare a corpusului CoRoLa sunt:

  • studii lingvistice;
  • modelarea limbajului pentru procesarea automată a limbii române;
  • dezvoltarea de modele de traducere;
  • învățarea limbii;
  • indexare și recuperare inteligentă și multi-criterială de informație textuală și orală;
  •  clasificare semantică de volume mari de date (text și audio);
  • extragere de cunoștințe din date (text și audio);
  • rezumare automată de documente; sisteme de întrebare-răspuns;
  • recunoaștere și sinteza automată a vorbirii etc.
Procese elaborate în definitivarea corpusului de texte

Dezvoltarea corpusului a urmat standardele și bunele practici internaționale și reflectă toate stilurile funcționale ale limbii (cu denumirile în engleză, conform metadatelor textelor, Imaginative, Science, Journalistic, Law, Administrative, Memoirs, Blogpost), acoperă patru domenii generale (Arts&Culture, Nature, Science, Society). Acestea din urmă sunt clasificate în 70 de subdomenii.

Colectarea datelor s-a făcut în baza unor protocoale semnate cu furnizorii de texte, deținători ai drepturilor de proprietate intelectuală asupra textelor la care ne-au oferit acces. Textele sunt însoțite de metadate și au fost supuse unui lanț de prelucrare ce combină preprocesare manuală asistată de computer și procesare complet automată.

Curățarea (n.n.: eliminarea elementelor care nu aparțin textului ‒ antete, note, titluri, cuprins etc. ‒ din documente), verificarea utilizării corecte a diacriticelor și introducerea lor automată atunci când a fost nevoie, precum și crearea metadatelor pentru fiecare document s-au realizat folosind instrumente de procesare dezvoltate intern. Ulterior, datele au fost segmentate la nivel de propoziție și de cuvânt, adnotate morfosintactic, lematizate, grupurile sintactice au fost identificate. În plus, fișierele audio și traducerile lor au fost aliniate (la nivel de fonem, silabă și cuvânt).

Persoanele interesate pot afla mai multe detalii despre conferință aici. Mai multe informații despre activitățile derulate de CLTA pot fi consultate aici.

Date despre conferențiar

Dr. Verginica Barbu Mititelu este absolventă a Facultății de Litere din cadrul Universității din București, precum și al unui stagiu de cercetare Erasmus la Universitatea din Viena. În anul 2009, tânăra cercetătoare a obținut titlul de doctor în Filologie, cu calificativul Summa cum Laudae, cu teza Semantic Relations (synonymy, antonymy, hyponymy). A Theoretical and Computational Linguistics Perspective. În perioada 2011-2013, Verginica Barbu Mititelu urmează studii postdoctorale în cadrul Academiei Române, având ca temă de cercetare Semantic and Derivational Network for Romanian. În prezent, dr. Mititelu își desfășoară activitatea în cadrul Academiei Române.

SECŢIUNE ACCESIBILIZATĂ PENTRU PERSOANELE CU DIZABILITĂŢI DE VEDERE

Acest site folosește cookie-uri pentru o mai bună experiență de vizitare. Prin continuarea navigării, ești de acord cu modul de utilizare a acestor informații.

Privacy Settings saved!
Privacy Settings

When you visit any web site, it may store or retrieve information on your browser, mostly in the form of cookies. Control your personal Cookie Services here.


Cine suntem
Site-ul este deținut și administrat de Universitatea din București cu sediul în Bulevardul Mihail Kogălniceanu 36-46, București. Pentru a urmări mai ușor informațiile, trebuie să știţi că ne putem referi la instituția noastră folosind termenii „Universitatea din București”, „nouă”, „nostru” etc, iar la tine, ca utilizator și vizitator al site-ului, folosind termenii „utilizator”, „dumneavoastră”, etc. Această politică descrie informațiile pe care le colectăm atunci când vizitați www.unibuc.ro. Prin utilizarea acestui site web, sunteți de acord cu colectarea și utilizarea informațiilor dumneavoastră personale (în cazul în care acestea sunt furnizate) în conformitate cu această politică. Site-ul poate conține legături către și de pe site-uri web. Dacă urmați un link către oricare dintre aceste site-uri web, rețineți că acestea au propriile politici de confidențialitate. Universitatea București nu are nicio responsabilitate sau răspundere pentru aceste politici sau modul în care aceste site-uri web își gestionează datele. Verificați aceste politici înainte de a trimite orice informații personale acestor site-uri.
Informațiile colectate şi durata de stocare
În cazul în care utilizați site-ul nostru, vom colecta și procesa următoarele date personale despre dumneavoastră:
  • Informații pe care ni le oferiți atunci când completați un formular web sau solicitați trimiterea newsletter-ului. Informațiile pe care ni le furnizați pot include numele, adresa de e-mail, numărul de telefon, etc.
  • Informatiile pe care ni le oferiti in formularul de solicitare de informatii publice (ex. nume, prenume, e-mail) sunt colectate conform Legii nr. 544/2001
  • Informații pe care le colectăm despre dumneavoastră, prin intermediul fişierelor cookie pe care le folosim, în momentul în care accesați site-ul nostru. Pentru detalii suplimentare, consultați informarea privind cookie-urile.
Stocarea datelor de natură personală se realizează pe servere situate în România, atâta timp cât avem consimțămȃntul dumneavoastră.
Cum utilizăm datele personale pe care le furnizați sau le colectăm
Folosim datele personale despre dumneavoastră în următoarele moduri:
  • datele personale furnizate de dumneavoastră prin formularele noastre web vor fi folosite în scopul procesării cererilor dumneavoastră. Prin trimiterea solicitării sunteți de acord cu prelucrarea datelor dumneavoastră de către Universitatea din București.
  • în cazul în care sunteți de acord cu primirea de informații prin newsletter, vă vom trimite noutǎți despre următoarele subiecte:
  • informații despre evenimentele şi activităţile organizate în cadrul Universităţii din Bucureşti
  • informațiile tehnice pe care le colectăm prin utilizarea cookie-urilor vor fi utilizate în scopurile stabilite în “Informarea privind cookie-urile”.
Transferuri internaționale
În vederea oferirii serviciului de newsletter, datele dumneavoastră de identificare și contact sunt transmise către MailerLite, cu sediul în Lituania. Detalii privind măsurile de protectie a datelor adoptate de către MailerLite se găsesc la adresa https://www.mailerlite.com/terms-of-service  şi pe site-ul https://www.privacyshield.gov/welcome Site-ul nostru web utilizează Google Analytics, un serviciu pentru analiza web, precum şi Google Adwords, furnizate de Google. Google Analytics utilizează fișiere de tip cookie pentru a ajuta un anumit site web să analizeze modul în care utilizați respectivul site web. Informațiile generate de fișierele de tip cookie cu privire la utilizarea de către dumneavoastră a site-ului web vor fi transmise și stocate de Google pe servere care pot fi localizate în UE, SEE şi/sau Statele Unite. Google va utiliza aceste informații în scopul evaluării utilizării de către dumneavoastră a site-ului web, elaborând rapoarte cu privire la activitatea site-ului web și furnizând alte servicii referitoare la activitatea site-ului web și la utilizarea internetului. De asemenea, Google poate transfera aceste informații către terți în cazul în care are această obligaţie conform legii sau în cazul în care acești terți prelucrează informațiile în numele Google. Google nu va asocia adresa dumneavoastră IP cu alte date deținute de Google. Informații detaliate cu privire la Google și protecția datelor cu caracter personal (inclusiv modul în care puteți controla informațiile trimise către Google) pot fi găsite la: https://policies.google.com/privacy/partners. Din site-ul nostru web puteţi să distribuiţi un articol utilizând un buton de distribuire în reţelele de socializare (de exemplu: Facebook, Twitter, Youtube). Informații detaliate cu privire la protecția datelor cu caracter personal oferită de aceste organizatii pot fi gasite la adresele: https://www.facebook.com/policy.php https://twitter.com/en/privacy https://www.youtube.com/yt/about/policies/#community-guidelines
Accesați datele dumneavoastră personale
Aveți dreptul să cereți o copie a informațiilor deținute de noi  prin formularea unei solicitări de acces. Pentru a solicita o copie a datelor deținute despre dumneavoastră sau pentru a vă actualiza informațiile, contactați Universitatea din București la adresa de e-mail dpo@unibuc.ro. Datele de natură personală deținute de către Universitatea din București sunt supuse condițiilor din Regulamentul UE 679/2016 care oferă persoanelor vizate dreptul de acces la toate tipurile de informații înregistrate, deținute de operatorul de date, sub rezerva anumitor limitări.
Drepturile persoanei vizate
Conform Regulamentului 679/2016 - GDPR, aveţi dreptul de a solicita Universitaţii din București, în calitate de operator de date de natură personală, rectificarea, ştergerea sau restricţionarea prelucrării datelor personale referitoare la dumneavoastră. De asemenea, aveţi dreptului de a vă retrage consimţământul în orice moment, fără a afecta legalitatea prelucrării efectuate pe baza acestuia, înainte de retragere. Dacă nu mai doriți să primiți newsletter-ul, vă puteţi dezabona prin trimiterea unui e-mail la adresa contact@pr.unibuc.ro sau prin folosirea linkului de dezabonare din cadrul newsletter-ului.
Dreptul de a depune o plângere în faţa Autorităţii de supraveghere
Conform Regulamentului 679 /2016 - GDPR, aveți dreptul de a depune o plângere la Autoritatea Naţională de Supraveghere a Prelucrării Datelor cu Caracter Personal. Mai multe detalii se pot obține accesȃnd adresa http://www.dataprotection.ro/.
  • _ga
  • _gid
  • _gat

Decline all Services
Accept all Services