Cyhoeddiadau:

 • Knight, Dawn, Steve Morris, Laura Arman, Jennifer Needs a Mair Rees. (2021, yn cael ei baratoi). Blueprints for minoritised language corpus design: a focus on CorCenCC. Llundain: Palgrave.
 • Knight, Dawn, Steve Morris a Tess Fitzpatrick. (2020, yn cael ei baratoi). Corpus Design and Construction in Minoritised Language Contexts: A focus on CorCenCC (Corpws Cenedlaethol Cymraeg Cyfoes – National Corpus of Contemporary Welsh). Llundain: Palgrave.
 • Knight, Dawn, Fernando Loizides, Steven Neale, Laurence Anthony, ac Irena Spasić. (2020, derbyniwyd). Developing computational infrastructure for the CorCenCC corpus – the National Corpus of Contemporary Welsh. Language Resources and Evaluation (LREV).
 • Corcoran, Padraig, Geraint Palmer, Laura Arman, Dawn Knight ac Irena Spasić. (2020, derbyniwyd). Word Embeddings in Welsh. Journal of Information Science.
 • Muralidaran, Vignesh, Dawn Knight ac Irena Spasić. (2020, derbyniwyd). A systematic review of unsupervised approaches to usage-based grammar induction. Natural Language Engineering.
 • Spasić, Irena, David Owen, Dawn Knight ac Andreas Arteniou. (2019). Data-driven terminology alignment in parallel corpora. Trafodion yGynhadledd Celtic Language Technology Workshop 2019, Dulyn, Iwerddon.
 • Piao, Scott, Paul Rayson, Dawn Knight, a Gareth Watkins. (2018). Towards a Welsh Semantic Annotation System. Trafodion y Gynhadledd Gwerthuso Adnoddau Iaith (LREC) 2018, Mai 2018, Miyazaki, Japan.
 • Neale, Steven, Kevin Donnelly, Gareth Watkins, a Dawn Knight. (2018). Leveraging Lexical Resources and Constraint Grammar for Rule-Based Part-of-Speech Tagging in Welsh. Poster a gyflwynwyd yng Nghynhadledd Gwerthuso Adnoddau Iaith (LREC) 2018, Mai 2018, Miyazaki, Japan.
 • Rayson, Paul. (2018). Increasing Interoperability for Embedding Corpus Annotation Pipelines in Wmatrix and other corpus retrieval tools. Trafodion y gweithdy Heriau wrth Reoli Corpora Enfawr yng Nghynhadledd Gwerthuso Adnoddau Iaith (LREC) 2018, Mai 2018, Miyazaki, Japan.
 • Rayson, Paul a Scott Piao. (2017). Creating and Validating Multilingual Semantic Representations for Six Languages: Expert versus Non-Expert Crowds. Trafodion y Gweithdy 1af ar ‘Sense, Concept and Entity Representations and their Applications’ a gynhaliwyd yng nghynhadledd European Chapter of the Association for Computational Linguistics 2017 (EACL) Ebrill, Valencia.
 • Piao, Scott, Paul Rayson, Dawn Archer, Francesca Bianchi, Carmen Dayrell, Mahmoud El-Haj, Ricardo-María Jiménez, Dawn Knight, Michael Křen, Laura Löfberg, Rao Muhammad Adeel Nawab, Jawad Shafi, Phoey Lee Teh ac Olga Mudraya (2016). Lexical Coverage Evaluation of Large-scale Multilingual Semantic Lexicons for Twelve Languages yng Nghynhadledd Gwerthuso Adnoddau Iaith (LREC) 2016, Mai 2016, Portorož, Slovenia.

Yn ôl i’r brig

Areithiau Cyweirnod a Chyflwyniadau mewn Cynadleddau

Yn ôl i’r brig

Offer a Meddalwedd CorCenCC:

Mae corpws CorCenCC a’i offer cysylltiedig yn feddalwedd ffynhonnell agored, felly maent ar gael i bawb eu defnyddio ar safle GitHub CorCenCC. I fynd i’r wefan, cliciwch yma.
Dyfynnwch yr allbynnau hyn fel a ganlyn:

 • Corpws ac offer ymholi CorCenCC:
  • Knight, Dawn, Steve Morris, Tess Fitzpatrick, Paul Rayson, Irena Spasić, Enlli Môn Thomas, Alex Lovell, Jonathan Morris, Jeremy Evans, Mark Stonelake, Laura Arman, Joshua Davies, Ignatius Ezeani, Steven Neale, Jennifer Needs, Scott Piao, Mair Rees, Gareth Watkins, Lowri Williams, Vignesh Muralidaran, Bethan Tovey, Laurence Anthony, Tom Cobb, Margaret Deuchar, Kevin Donnelly, Michael McCarthy a Kevin Scannell. (2020). CorCenCC: (Corpws Cenedlaethol Cymraeg Cyfoes – Corpws Cenedlaethol Cymraeg Cyfoes): Dull cymunedol o adeiladu corpws ieithyddol. [Adnodd Digidol]. Ar gael yn: www.corcencc.cymru/archwilio
 • Dyfynnu adroddiad prosiect CorCenCC:
  • Knight, Dawn, Steve Morris, Tess Fitzpatrick, Paul Rayson, Irena Spasić ac Enlli Môn Thomas. (2020). Corpws Cenedlaethol Cymraeg Cyfoes – Corpws Cenedlaethol Cymraeg Cyfoes – Dull cymunedol o adeiladu corpws ieithyddol: Adroddiad Prosiect. Cyhoeddwyd ar-lein yn: [Manylion ar ddod yn fuan]
 • Isadeiledd ac ap torfoli CorCenCC:
  • Knight, Dawn, Fernando Loizides, Steven Neale, Laurence Anthony, ac Irena Spasić. (2020). Developing computational infrastructure for the CorCenCC corpus – the National Corpus of Contemporary Welsh. Language Resources and Evaluation (LREV). [Manylion ar ddod yn fuan]
 • Tagiwr rhan ymadrodd ‘CyTag’ CorCenCC:
  • Neale, Steven, Kevin Donnelly, Gareth Watkins, a Dawn Knight. (2018) Leveraging Lexical Resources and Constraint Grammar for Rule-Based Part-of-Speech Tagging in Welsh. Yn Nhrafodion yr 11eg Cynhadledd Adnoddau Iaith a Gwerthuso (LREC 2018). Miyazaki, Japan. 7-12 Mai, 2018
 • Tagiwr semantig ‘CySemTagger’ CorCenCC:
  • Piao, Scott, Paul Rayson, Dawn Knight a Gareth Watkins (2018). Towards A Welsh Semantic Annotation System. Yn Nhrafodion yr 11eg Cynhadledd Adnoddau Iaith a Gwerthuso (LREC 2018), Miyazaki, Japan.
  • Piao, Scott, Paul Rayson, Dawn Knight, Gareth Watkins a Kevin Donnelly (2017). Towards a Welsh Semantic Tagger: Creating Lexicons for A Resource Poor Language. Yn Nhrafodion y Corpus Linguistics 2017 Conference, a gynhaliwyd o 24-28 Gorffennaf 2017 ym Mhrifysgol Birmingham, Birmingham, DU.
 • Pecyn cymorth addysgegol ‘Y Tiwtiadur’ CorCenCC:
  • Davies, Joshua, Enlli Môn Thomas, Tess Fitzpatrick, Jennifer Needs, Laurence Anthony, Thomas Michael Cobb, a Dawn Knight. (2020). Y Tiwtiadur. [Adnodd Digidol]. Ar gael yn: www.corcencc.cymru/YTiwtiadur

Yn ôl i’r brig

Is-brosiectau a meddalwedd

Isod, ceir manylion am holl is-brosiectau CorcenCC a ariannwyd yn allanol:

Dyddiad Dechrau
Ariannwr
Swm
Disgrifiad [ynghyd â’r Prif Ymchwilydd]
Chwef 2017 Y Cyngor Prydeinig £2000 Cyllid i gefnogi lansiad cyhoeddus prosiect CorCenCC yn Adeilad y Pierhead, Caerdydd [Knight]
Hyd 2017 Llywodraeth Cymru £24,992 Comisiwn cystadleuol gan Lywodraeth Cymru i ddarparu asesiad cyflym o’r dystiolaeth o ymagweddau a dulliau effeithiol ar gyfer addysgu ail iaith. Am ragor o wybodaeth, cliciwch yma. [Fitzpatrick]
Ion 2018 Cynllun Grant Cymraeg 2050 2017-2018 (GC2050/17-18/20) £19,964 Prosiect a oedd yn canolbwyntio ar adeiladu WordNet awtomatig ar gyfer y Gymraeg, sef cronfa ddata geiriadurol lle caiff geiriau eu grwpio’n setiau o gyfystyron (synsetiau), sy’n cael eu trefnu’n rhwydwaith o gysylltiadau semanteg-eiriadurol. I fynd at wefan WordNet Cymru, cliciwch yma. [Spasić]
Ion 2018 Cyd-bwyllgor Addysg Cymru (CBAC) £1,968 Grant ymchwil (gan gynnwys rhaglen fewnfurol). Grant ymchwil i gwblhau gwaith ar lunio geirfa graidd B1 ar gyfer Cymraeg i Oedolion (lefel Canolradd). Am fwy o wybodaeth, cliciwch yma. [Morris]
Ion 2019 Cyllid Technoleg Llywodraeth Cymru £20,000 Cyllid i gefnogi’r gwaith o ddatblygu Boniwr Cymraeg. Am fwy o wybodaeth, cliciwch yma. [Spasić]
Awst 2019 Cyllid Technoleg Llywodraeth Cymru £90,000 Prosiect yn dwyn y teitl: ‘Welsh language processing infrastructure: Welsh word embeddings’. Roedd y prosiect yn canolbwyntio ar ymgorffori geiriau ar gyfer y Gymraeg (ar greu geiriadur ac ymgorffori geiriau a thermau Cymraeg yn bennaf) ac yn cyfrannu at nod y Cynllun Gweithredu Technoleg Cymraeg i ‘hybu adnoddau dysgu codio a thechnoleg Cymraeg ar gyfer athrawon a disgyblion ysgol ac eraill’. Am fwy o wybodaeth, cliciwch yma. [Spasić]
Mai 2020 Cyllid Technoleg Llywodraeth Cymru £90,000 Prosiect yn dwyn y teitl: ‘Learning English-Welsh bilingual embeddings and applications in text categorisation’. Nod y prosiect hwn yw ymestyn canlyniadau’r prosiect blaenorol drwy greu cynrychioliadau trawsieithol o eiriau mewn man ymgorffori ar y cyd ar gyfer Cymraeg a Saesneg. [Knight]

Yn ôl i’r brig

Cylchlythyr CorCenCC (archif)

Cliciwch isod i weld ôl-rifynnau archif o’r cylchlythyrau a gyhoeddwyd yn ystod prosiect CorCenCC:

Yn ôl i’r brig