Cynorthwy-ydd Ymchwil – Hysbyseb (Tachwedd 2018)

 ‘CorCenCC – Corpws Cenedlaethol Cymraeg Cyfoes:  Dull cymunedol o adeiladu corpws ieithyddol’

Gwahoddir ceisiadau ar gyfer Cynorthwy-ydd Ymchwil i ymuno â phrosiect rhyngddisgyblaethol ac aml-sefydliadol fydd yn creu corpws ffynhonnell agored o Gymraeg cyfoes ar raddfa eang (CorCenCC). Nod y prosiect yw ailddiffinio cwmpas, dyluniad a seilwaith methodoleg datblygu corpws, yn ogystal â chreu adnodd Cymraeg o bwys i’w ddefnyddio mewn lleoliadau cymunedol, masnachol, addysgol a llywodraethol.

Bydd gan yr ymgeisydd llwyddiannus gefndir mewn astudiaethau iaith, ieithyddiaeth gymhwysol, a/neu’r Gymraeg. Mae sgiliau cyfathrebu llafar ac ysgrifenedig rhagorol yn Gymraeg ac yn Saesneg yn hanfodol, yn ogystal â gallu cyfathrebu’n broffesiynol drwy’r dudalen ar y we, technolegau rhwydweithio cymdeithasol a’r cyfryngau.  Bydd deiliad y swydd yn ymgymryd â rôl ganolog wrth adeiladu’r corpws a chanolbwyntio ar gasglu a phrosesu data iaith ysgrifenedig a llafar.

Ariennir y prosiect 3½ blynedd hwn gan y Cyngor Ymchwil Economaidd a Chymdeithasol a Chyngor Ymchwil y Celfyddydau a’r Dyniaethau. Dawn Knight, o Ganolfan Ymchwil Iaith a Chyfathrebu Prifysgol Caerdydd, sy’n arwain y prosiect. Mae tîm y prosiect academaidd hefyd yn cynnwys Irena Spasic a Jonathan Morris (Prifysgol Caerdydd); Tess Fitzpatrick, Steve Morris a Alex Lovell (Abertawe); Paul Rayson (Prifysgol Lancaster) ac Enlli Thomas (Prifysgol Bangor).

Swydd amser llawn ym Mhrifysgol Caerdydd am gyfnod penodol o 8 mis yw hon. (1 Ionawr 2019 – 31 Awst 2019, Prifysgol Caerdydd)

Os oes gennych ymholiadau anffurfiol, cysylltwch â Dr Dawn Knight (KnightD5@caerdydd.ac.uk).

Disgwylir i’r ymgeiswyr llwyddiannus gymryd y swydd o 1 Ionawr 2019 neu cyn gynted â phosibl wedi hynny. Bydd cyfweliadau yn digwydd erbyn 3 Rhagfyr 2018.

Cyflog: £27,025 – £31,302 y flwyddyn (Gradd 5)

Dyddiad hysbysebu: Dydd Llun, 5 Tachwedd 2018

Dyddiad cau: Dydd Iau, 22 Tachwedd 2018

I wneud cais, neu am ragor o wybodaeth, cliciwch yma

 

Newyddion (2018)

Ap nawr ar Android! (Medi 2018)
Ydych chi’n cofio ein ap torfoli? I ategu’r fersiwn iOS sydd ar gael yn barod, yn ddiweddar rydym wedi bod yn gweithio ar greu mwy o ffyrdd i siaradwyr Cymraeg gynnwys eu data yn y corpws. Gallwch chi bellach gyfrannu data drwy fersiwn gwe ar ei newydd wedd, neu ar blatfformau Android hefyd!

Un o’n nodau ar CorCenCC yw cynnwys data yn y corpws sy’n dod yn uniongyrchol o’r gymuned er mwyn gwneud yn siŵr fod cynrychiolaeth dda o Gymraeg cyfoes yn y 10 miliwn o eiriau. Mae’r ap yn rhoi cyfle i siaradwyr Cymraeg recordio sgyrsiau gyda’i gilydd a gydag eraill ar draws amrywiaeth o gyd-destunau fel bod modd iddynt gael eu cynnwys yn y corpws terfynol, a lanlwytho metadata sy’n ein helpu ni i gategoreiddio cyfraniadau o’r fath. Mae data torfol yn gyfeiriad gweddol newydd, ac felly rydym yn ei ystyried yn ffordd gyffrous o gasglu Cymraeg cyfoes, yn ogystal â’r ffyrdd mwy traddodiadol o gasglu data (byddwch chi’n gyfarwydd â nhw os ydych eisoes wedi gweld aelodau tîm CorCenCC o gwmpas y lle).

Wrth gwrs, y cynhwysyn allweddol yn hyn oll yw eich data. P’un a ydych yn sgwrsio â’ch ffrindiau yn y dafarn neu mewn caffi, gyda’ch teulu wrth y bwrdd bwyd, neu unrhyw beth arall yr hoffech ei rannu, mae eich Cymraeg yn bwysig i ni – ac rydym eisiau gweld gymaint ohoni yn cael ei hadlewyrchu yn CorCenCC â phosibl, ac i fod ar gael i’r gymdeithas weld a dysgu ohoni. Felly ystyriwch gymryd rhan fel cyfrannwr, neu helpwch ni i roi’r gair ar led bod yr ap ar gael. Bydd CorCenCC yn adnodd i bawb, felly beth am wneud yn siŵr ei fod yn adlewyrchu pob agwedd o’n Cymraeg. Mae ein ap torfoli yn un ffordd o wneud hynny.

Os oes gennych chi ddiddordeb mewn cyfrannu data llafar trwy’r ap, gallwch lawrlwytho ein fersiynau iOS neu Android i’ch dyfais. Gallwch hefyd gyfrannu data llafar, ysgrifenedig neu electronig drwy ein ap gwe: app.corcencc.org. Mae croeso i chi ebostio gydag unrhyw gwestiynau sy’n ymwneud â’r ap: tech@corcencc.org.

Cyfarfod adolygu prosiect cyfan (28/03/18)
Ar 28ain Mawrth, daeth 24 aelod o dîm y prosiect, gan gynnwys aelodau tîm y rheolwyr a’r cylch ymgynghorol, i Gaerdydd ar gyfer ail gyfarfod blynyddol adolygu’r prosiect cyfan.
Yn ystod rhan gyntaf y cyfarfod, cawson ni gyfle i ddweud ffarwel i hen aelodau, croesawu aelodau newydd a chlywed y diweddaraf am becynnau gwaith dros y 12 mis blaenorol. Dangoswyd CyTag, dull nodi rhannau o leferydd, ar waith (http://cytag.corcencc.org) yn ogystal â manylion rhaglen trin a thrafod ymholiadau. Bydd fersiwn haws ei ddefnyddio o’r ail ar gael maes o law – byddwn ni’n rhoi’r diweddaraf trwy’r wefan, Twitter a Facebook yn ystod y datblygu.
Yn ystod y prynhawn, rhoeson ni ragor o sylw i ddarpar ddefnyddwyr ac aelodau’r bwrdd ymgynghorol gan ystyried prif beryglon ac anawsterau tîm y prosiect, ffyrdd o ymgysylltu â’r to nesaf o ddefnyddwyr a sut y gallwn ni gynnal ac estyn y gwaith ardderchog sy’n mynd rhagddo ynglŷn â’r prosiect.
Rwy’n siŵr y bydd y tîm yn cytuno bod y cyfarfod yn un gwerthfawr ac ysgogol lle cawson ni gyfle i longyfarch pawb am y gwaith dyfal hyd yn hyn yn ogystal â rhoi cipolwg ar y pethau cyffrous sydd ar y gweill. Bydd rhagor maes o law!
Diolch yn fawr i bawb a ddaeth i’r cyfarfod a chyfrannu at ei lwyddiant, ac i’r rhai a gymerodd ran (yn ddwyieithog) o hirbell.

 

WordNet Cymru

Fis diwethaf, cwblhaodd tri o aelodau’r tîm – Irena Spasic, Steven Neale a Dawn Knight – orchwyl ar gyfer prosiect WordNet Cymraeg, sydd ar waith ers tri mis ochr yn ochr â phrosiect CorCenCC. Mae WordNet Cymraeg yn gronfa ddata o enwau, berfau, ansoddeiriau ac adferfau Cymraeg wedi’u trefnu ar ffurf setiau o gyfystyron ac wedi’u cysylltu â’i gilydd yn ôl amryw nodweddion eiriadurol a semantaidd sy’n gyffredin. Mae’n defnyddio’r un dull â rhaglenni WordNet mewn ieithoedd eraill ac mae rhaglenni o’r fath wedi bod yn hanfodol ynglŷn â phennu ystyr geiriau yng ngorchwylion prosesu iaith naturiol megis diffinio geiriau a chrynhoi testunau.

Mae WordNet Cymraeg wedi’i lunio dros dri mis, ac roedd yn dda gyda ni gael eu hariannu gan Lywodraeth Cymru yn rhan o gynllun Grant Cymraeg 2050. Yn unol â’r tueddiadau diweddaraf ynglŷn â chreu rhaglenni o’r fath yn awtomatig, rydyn ni wedi defnyddio gwybodaeth roes ein cyfeillion sy’n ymwneud â Geiriadur Prifysgol Cymru i gyfieithu geiriau o’r fersiwn Saesneg i’r un Cymraeg a’u trefnu wedyn ar ffurf setiau o gyfystyron Cymraeg wedi’u seilio ar strwythur gwreiddiol WordNet English. Rydyn ni’n fodlon iawn ar y fersiwn Cymraeg sy’n cwmpasu tua 67% o’r hyn a ystyrir yn setiau cyfystyron ‘craidd’ ar gyfer iaith newydd – rhyw 5,000 o’r syniadau mwyaf cyffredin a chanddynt y cysylltiadau cryfach â setiau eraill o gyfystyron.

At hynny, cawson ni gyfle i ddangos ein gwaith ni gerbron yr arianwyr yn rhan o achlysur Cymru Arloesol yn ddiweddar yn adeilad Tramshed Tech, Caerdydd, lle y cyflwynodd nifer o brosiectau sydd o dan nawdd Grant Cymraeg 2050 eu cynnydd. Roedd yn galonogol bod yno a gweld y ffyrdd cyffrous mae pobl yn gyrru datblygiad technoleg y Gymraeg, ac roedd yn dda fod yn bresennol ar gyfer cyflwyniad un o’n cydweithwyr, Steven Neale, am hynt WordNet Cymraeg a’r gwerth mae’n ei gynnig yn y maes hwnnw. Mae’n gyfnod cyffrous o ran llunio technoleg sy’n gweithredu trwy gyfrwng y Gymraeg, a bydd rôl bwysig i ddulliau prosesu iaith naturiol yn hynny o beth.

Mae rhagor am WordNet Cymraeg ar http://users.cs.cf.ac.uk/I.Spasic/wncy/index.html ac mae modd dechrau defnyddio WordNet Cymraeg ar https://github.com/CorCenCC/wncy.

Newyddion (2017)

30/11/2017

Mae tîm CorCenCC yn falch o gyhoeddi ein bod wedi derbyn arian gan gynllun Grant Cymraeg 2050 Llywodraeth Cymru i weithio ar brosiect o’r enw WordNet Cymraeg.

Nod y prosiect yw adeiladu WordNet yn awtomatig ar gyfer yr iaith Gymraeg, cronfa ddata ‘eirfaol’ lle mae geiriau wedi’u grwpio yn setiau o gyfystyron (synsets), sydd wedyn yn cael eu trefnu yn rhwydwaith o berthnasau ‘lecsico-semantig’.

Defnyddir WordNets yn eang mewn prosesu iaith naturiol (NLP) i gefnogi dealltwriaeth o’r ystyr a fynegir mewn iaith ysgrifenedig ac ar lafar. Bydd WordNet, felly, yn hanfodol ar gyfer cymwysiadau technoleg iaith megis ateb cwestiynau, adfer gwybodaeth a chyfieithu peirianyddol.

Mae’r technolegau hyn yn hanfodol ar gyfer datblygu rhyngwynebau hawdd eu defnyddio o ran ffonau clyfar ac apiau i’r cartref, a fydd yn gyrru’r defnydd o dechnoleg ddigidol cyfrwng Cymraeg ar gyfer Cymraeg 2050.

Drwy gysylltu prosiect WordNet Cymraeg â phrosiect CorCenCC, byddwn yn ailddefnyddio ei gynlluniau cynaliadwyedd ac ymgysylltu i gynyddu gwelededd a sicrhau dyfodol hirdymor WordNet Cymraeg. Bydd gweithgareddau ymgysylltu â’r cyhoedd yn cynnwys:

  • Cynnal ymgyrch cyfryngau cymdeithasol i hysbysebu’r prosiect ac annog defnyddwyr i brofi ei gweithredoedd.
  • Cynnal sioeau / gweithdai rhanbarthol mewn ysgolion, llyfrgelloedd a chanolfannau cymunedol / Mentrau Iaith i godi ymwybyddiaeth posibl defnyddwyr o’r WordNet, a hefyd i ddarparu hyfforddiant sylfaenol i’w gyfleustodau.

Bydd WordNet Cymraeg yn cael ei arwain gan yr Athro Irena Spasic, gan weithio gyda Dr Dawn Knight a Dr Steven Neale.

 

17/11/2017 – CorCenCC yn cynnal unig ddigwyddiad Cymraeg Gŵyl ‘Being Human’ 2017

Ar ddydd Gwener 17 Tachwedd, aeth Jenny Needs a Steve Morris i Ganolfan Gymraeg Tŷ’r Gwrhyd ym Mhontardawe i gynnal unig ddigwyddiad Cymraeg rhaglen Gŵyl ‘Being Human’ eleni. Dyma unig ŵyl genedlaethol y dyniaethau yn y DU a’r unig hyb sydd gan yr ŵyl yng Nghymru yw Abertawe. Arweinir yr ŵyl gan Ysgol Astudiaethau Uwch Prifysgol Llundain mewn partneriaeth â’r Academi Brydeinig a Chyngor Ymchwil y Celfyddydau a’r Dyniaethau.

Enw sesiwn Gymraeg CorCenCC oedd “Rho dy Gymraeg i ni!” ac roedd yn gyfle gwych i gasglu oriau o ddata llafar trwy arbrofi ar ddull y rhaglen deledu ‘Gogglebox’ a gofyn i gyfranwyr ymateb yn fyw i ffilmiau byr. Roedd hefyd yn gyfle i ymgysylltu â’r cyhoedd yng Nghwm Tawe a dangos yr ap iddyn nhw (fel mae Jenny yn ei wneud yn y llun). Cafwyd ymateb da – a bywiog – gan y ‘beirniaid soffa’ i’r ffilmiau byr ac yn sicr, mae’n ffordd o gasglu data llafar y byddwn yn edrych ar ei defnyddio eto yn y dyfodol.

 

06/11/2017 – Diwrnod i ffwrdd CorCenCC

Ar y 13eg o Dachwedd, daeth holl dîm WP1 (y Prif Ymchwilydd, Cyd-ymchwilwyr a Chynorthwywyr) ynghyd yn Abertawe am ddiwrnod i ffwrdd. Roedd y cyfarfod hwn yn amlswyddogaethol; rhoddodd amser i’r tîm gwrdd wyneb yn wyneb i bwyso a mesur y cynnydd a wnaed hyd yn hyn a myfyrio’n gadarnhaol arno, a blaenoriaethu a chynllunio misoedd nesaf y prosiect. Roedd y cyfarfod yn gynhyrchiol ac yn ffordd dda o gyflwyno aelodau newydd o’r tîm. I ddechrau, profwyd ein sgiliau cyfathrebu trwy gwblhau tasgau cyfathrebu rhyngweithiol gan ddefnyddio delweddau. Ond canolbwynt y drafodaeth oedd ar sut i lilinio’r broses o ymdrin â Data Mawr, a nodi heriau casglu data a ffyrdd o’u goresgyn. Yn gyffredinol, daethpwyd i gasgliadau cadarnhaol, ac rydym eisoes wedi dechrau gweithredu newidiadau i ddulliau casglu data, megis defnyddio sgrapiwr gwe i awtomeiddio echdynnu testunau e-iaith.

 

01/08/2017 – A fyddai gennych chi ddiddordeb mewn gweithio fel trawsgrifydd ar gyfer CorCenCC?

Fel y gwyddoch, rydyn ni wedi bod yn brysur yn recordio pobl yn siarad Cymraeg ledled y wlad. Mae gwaith trawsgrifio’r recordiadau wedi dechrau, ond rydyn ni bellach yn chwilio am ragor o drawsgrifwyr – a fyddai gennych chi ddiddordeb? Mae’r gwaith yn hyblyg (cewch weithio pryd bynnag sy’n eich siwtio chi, a gwneud cymaint/cyn lleied o oriau a fynnwch chi) felly mae’n hawdd ei ffitio o gwmpas gweithgareddau eraill, ac mae’r recordiadau yn ddiddorol ac yn amrywiol – un diwrnod efallai byddwch chi’n trawsgrifio darlith neu bregeth, a’r diwrnod nesaf sgwrs fywiog lawr yn y dafarn! Os oes gennych chi ddiddordeb mewn ymuno â’n tîm o drawsgrifwyr, ebostiwch trawsgrifio@corcencc.org am ragor o wybodaeth, os gwelwch yn dda.

 

17/02/2017 – Lansio Ap Torfoli CorCenCC

I gyd-fynd â lansiad y wefan, lansiwyd fersiwn gyntaf ap torfoli CorCenCC ym mis Chwefror. Ar hyn o bryd mae’r ap ar gael ar iOS a bydd fersiwn Android yn cael ei rhyddhau o fewn y ddau-pedwar mis nesaf (cofiwch wylio am hynny!). Mae’r ap yn hawdd ei ddefnyddio ac ar gael yn rhad ac am ddim.

Rhoddwyd sylw i’r newyddion am lansio’r ap ar wefannau pob un o sefydliadau partneriaid y prosiect, ar wefannau technegol ac yn Y Cymro a’r Denbighshire Free Press (ymhlith eraill). Trwy ledu’r gair am yr ap a’r prosiect, ein gobaith yw codi ymwybyddiaeth pobl am bwysigrwydd a gwerth y gwaith a sicrhau bod cymaint o bobl ag sy’n bosibl yn cyfrannu data a/neu yn defnyddio’r corpws pan fydd wedi cael ei adeiladu.

 

28/02/2017 – Lansio’r prosiect

Er mwyn dathlu llwyddiant 12 mis cynta’r prosiect, cynhaliodd tîm CorCenCC ddigwyddiad lansio yn Adeilad y Pierhead ym Mae Caerdydd. Gydag ymgyrch sylweddol ar y cyfryngau wrth gefn, gan gynnwys cyfweliadau radio ar raglen Good Morning Wales y BBC (Prif Ymchwilydd Dawn Knight) a rhaglen Post Cyntaf BBC Radio Cymru (Llysgennad Nia Parry) a sylw yn y wasg brintiedig ac ar-lein mewn nifer o leoedd (gan gynnwys y BBC a’r Mail Online, gwefannau sefydliadau a blogiau technoleg, ymysg eraill), bwriad y digwyddiad oedd gweithredu fel sbardun i ymgysylltu â’r cyhoedd, llunwyr polisi, addysgwyr, cyhoeddwyr a’r cyfryngau; gan godi ymwybyddiaeth o’r prosiect ac annog unigolion i gefnogi’r gwaith.

news

Roedd Alun Davies AC, Gweinidog y Gymraeg a Dysgu Gydol Oes yn y lansiad, ac roedd y lansiad yn gyfle i ymwelwyr ddod i wybod mwy am y prosiect. Mae’r prosiect ar y cyd rhwng prifysgolion Caerdydd, Abertawe, Caerhirfryn a Bangor yn torri tir newydd wrth greu corpws o Gymraeg cyfoes ar raddfa fawr a fydd yn agored i bawb. Mae’’n cael ei gefnogi gan lysgenhadon enwog – y bardd Damian Walford Davies, y cerddor a’r gyflwynwraig Cerys Matthews, y ddarlledwraig Nia Parry a’r dyfarnwr rygbi rhyngwladol Nigel Owens. Prosiect cymunedol yw hwn sy’n defnyddio technolegau ffonau symudol a digidol i alluogi’r cyhoedd i gymryd

Alun and co

Alun Davies, Steve Morris, Dawn Knight, Bethan Jenkins a Tess Fitzpatrick

rhan. Y n y digwyddiad, cafwyd cyfle i weld ap casglu data newydd a fydd yn galluogi siaradwyr Cymraeg o bob cefndir i gyfrannu at y prosiect. Yn ogystal, rhannodd partneriaid a llysgenhadon CorCenCC eu hargraffiadau o sut y bydd CorCenCC yn effeithio ar eu hymchwil a’r gymuned Gymraeg yn ehangach.

team

Meddai Alun Davies AC, Gweinidog y Gymraeg a Dysgu Gydol Oes: “Pleser o’r mwyaf yw bod yma heddiw ar gyfer y prosiect cyffrous hwn. Bydd y gwaith hwn yn rhoi cofnod go iawn i ni o sut mae’r Gymraeg yn cael ei defnyddio mewn gwirionedd ac yn ein helpu i ddatblygu rôl y Gymraeg mewn technoleg. Bydd hyn yn hollbwysig os ydym am gyrraedd ein targed o gael miliwn o siaradwyr Cymraeg erbyn 2050.”

Roedd tua 85 o bobl yn y lansiad ar y noson, a dyma’r troi cyntaf i fwyafrif tîm estynedig CorCenCC fod gyda’i gilydd yn yr un lle! Noddwyd y lansiad gan gronfeydd y Cyngor Prydeinig, Yr Ysgol Saesneg, Cyfathrebu ac Athroniaeth ym Mhrifysgol Caerdydd, a Sefydliad Ymchwil y Celfyddydau a’r Dyniaethau ym Mhrifysgol Abertawe – llawer o diolch am eich cefnogaeth!

 

01/03/17 – Cyfarfod Tîm Cyfan y Prosiect

Ddiwrnod ar ôl y lansiad, cynhalion ni gyfarfod cyntaf Tîm Cyfan y Prosiect ym Mhrifysgol Caerdydd ar Ddydd Gŵyl Ddewi. Mae’r cyfarfod, a gynhelir yn flynyddol, yn dod â Thîm Prosiect CorCenCC (TPC – sy’n cynnwys y Prif Ymchwilydd, pob un o’r Cyd-Ymchwilwyr, y Cynorthwywyr Ymchwil a’r myfyrwyr PhD), Ymgynghorwyr a phob aelod o Grŵp Ymgynghorol y Prosiect at ei gilydd ac yn gyfle gwych i’r tîm ddod i nabod ei gilydd yn well (wyneb yn wyneb) a thrafod syniadau a chynlluniau’r dyfodol. Nod y cyfarfod oedd rhoi diweddariadau penodol ar bob pecyn gwaith, ystyried a thrafod llwybrau posibl o ran ymgysylltu â’r prosiect (gan ganolbwyntio ar fewnbwn gan Grŵp Ymgynghorol y Prosiect yn bennaf) a meddwl am y ffyrdd gorau i ni wthio’r ffiniau mewn ymchwil corpws cyfredol gyda datblygiadau ar CorCenCC yn y dyfodol.

team.2

Hoffen ni ddiolch yn fawr iawn i bob un ohonoch chi a deithiodd o bell ac o agos er mwyn mynychu’r cyfarfod hwn – roedden ni i gyd yn meddwl bod y cyfarfod yn un llwyddiannus a dymunol sy’n debygol o roi i ni gryfder ychwanegol o ran syniadau a chymhelliant i danio’r camau nesaf wrth i’r prosiect ddatblygu. Rydyn ni’n edrych ymlaen at eich croesawu chi i gyd yn ôl i Gaerdydd ar gyfer y cyfarfod yn 2018!

meeting

Cylchlythyr CorCenCC – rhifynnau blaenorol

Tanysgrifiwch i dderbyn ein cylchlythyr prosiect

Rhowch eich cyfeiriad e-bost yn y ffurflen isod ac yna cliciwch y botwm ‘Subscribe’