Abstract
Yn 2017, cyhoeddodd Llywodraeth Cymru (LlC) weledigaeth uchelgeisiol: cael miliwn o siaradwyr Cymraeg erbyn 2050, gan ddyblu’r niferoedd cyfredol, bron. Mae’r cynllun gwaith cychwynnol i wireddu’r nod hwn, sy’n cynnwys adran ar seilwaith ieithyddol, yn ymgymryd (erbyn 2021) i roi: ‘cefnogaeth i gynhyrchu rhagor o adnoddau geiriadurol, corpora a therminoleg o ansawdd uchel i gefnogi dysgwyr a siaradwyr rhugl’ (Llywodraeth Cymru, 2017). Er i gysyniad a dechrau’r gwaith ar brosiect CorCenCC ddigwydd cyn cyhoeddi’r cynllun hwn gan LlC, mae’r ddau yn ganlyniad i ddiddordeb mewn creu momentwm ar gyfer defnyddio’r Gymraeg gyda thechnoleg newydd, ac yn cyfrannu i hyn. Er bod prosiect CorCenCC yn annibynnol ar LlC, mae deialog barhaus rhwng y ddau endid wedi bod yn nodwedd allweddol ar y prosiect. O gynnal y cyfarfod briffio cyntaf ar gyfer darpar randdeiliaid ynghylch gweledigaeth CorCenCC yn y Senedd, mae cyfarfodydd cyson â LlC drwy’r prosiect wedi hoelio sylw ar sut gall CorCenCC lywio’r ymdrechion i gynllunio corpws sy’n hanfodol fel sylfaen i wireddu strategaeth Cymraeg 2050: Miliwn o siaradwyr.
Access this chapter
Tax calculation will be finalised at checkout
Purchases are for personal use only
Cyfeiriadau
Cooper, S., Jones, D. B., & Prys, D. (2019). Crowdsourcing the Paldaruo Speech Corpus of Welsh for Speech Technology. Information, 10(8), 247–258.
Deuchar, M. (2011). Patagonia Corpus of Welsh-Spanish Bilingual Speech [Ar-lein]. Cafwyd o: http://www.bangortalk.org.uk/speakers.php?c=patagonia [Cyrchwyd 15/02/2021].
Deuchar, M., Webb-Davies, P., & Donnelly, K. (2018). Building and Using the Siarad Corpus. John Benjamins.
Donnelly, K. (2013). Kynulliad3: A Corpus of 350,000 Aligned Welsh and English Sentences from the Third Assembly (2007–2011) of the National Assembly for Wales [Ar-lein]. Cafwyd o: http://cymraeg.org.uk/kynulliad3 [Cyrchwyd 15/02/2021].
Donnelly, K. (2014). Kwici: A 4m-word Corpus Drawn from the Welsh Wikipedia [Ar-lein]. Cafwyd o: http://cymraeg.org.uk/kwici [Cyrchwyd 15/02/2021].
Ellis, N. C., O’Dochartaigh, C., Hicks, W., Morgan, M., & Laporte, N. (2001). Cronfa Electroneg o Gymraeg (CEG): Cronfa ddata eirfaol, miliwn o eiriau, sy’n cyfrif amlder defnydd geiriau yn y Gymraeg [Ar-lein]. Cafwyd o: http://www.bangor.ac.uk/ar/cb/ceg.php.en [Cyrchwyd 15/02/2021].
EUSTAT. (2016). Population Aged 2 and Over in the Basque Country by Language Spoken at Home and Overall Level of Basque According to Province and Sex. Cafwyd o: https://en.eustat.eus/elementos/ele0014700/65_Population_aged_2_and_over_in_the_Basque_Country_by_language_spoken_at_home_and_overall_level_of_Basque_according_to_province_and_sex/tbl0014782_i.html [Cyrchwyd 15/02/2021].
Haugen, E. (1983). The Implementation of Corpus Planning: Theory and Practice. Yn J. Cobarrubias & J. A. Fishman (Goln.), Progress in Language Planning: International Perspectives (tt. 269–289). Berlin: Mouton.
Jones, B. M. (1996). Aberystwyth Child Language Databases: CIG1 [Ar-lein]. Cafwyd o: http://users.aber.ac.uk/bmj/abercld/cronfa18_30/sae/intro.html [Cyrchwyd 15/02/2021].
Jones, B. M. (2000). The Aberystwyth Child Language Databases [Ar-lein]. Cafwyd o http://users.aber.ac.uk/bmj/abercld/projects.html [Cyrchwyd 15/02/2021].
Jones, G. (2019). Diweddaraiad gan y Prif Ystadegydd: trafodaeth am ddata ar y Gymraeg sy’n deillio o’r Arolwg Blynyddol o’r Boblogaeth. Cafwyd o https://digidoladata.blog.llyw.cymru/2019/03/27/diweddariad-gan-y-prif-ystadegydd-trafodaeth-am-ddata-ar-y-gymraeg-syn-deillio-or-arolwg-blynyddol-or-boblogaeth/ [Cyrchwyd 15/02/2021].
Jones, D., & Eisele, A. (2006). Phrase-Based Statistical Machine Translation Between English and Welsh. Papur a gyflwynwyd yn LREC-2006: Fifth International Conference on Language Resources and Evaluation. 5th SALTMIL Workshop on Minority Languages: Strategies for developing machine translation for minority languages (tt. 75–77), Genoa, Yr Eidal.
Jones, R., Mason, J., Jones, R., Helliker, L., & Pawlewski, M. (1998). SpeechDat Cymru: A Large-scale Welsh Telephony Database. Papur a gyflwynwyd yn Workshop on Language Resources for European Minority Languages, Granada, Sbaen.
Jones, D. B., Robertson, P., & Taborda, A. (2015). Corpus of Facebook Welsh Language Texts [Ar-lein]. Cafwyd o: http://techiaith.cymru/data/corpora/facebook/?lang=en [Cyrchwyd 15/02/2021].
Llywodraeth Cymru. (2017). Cymraeg 2050: Milwn o siaradwyr Cynllun Gweithredu 2019–20 [Ar-lein]. Caerdydd: Llywodraeth Cymru. Cafwyd o: https://llyw.cymru/sites/default/files/publications/2020-04/cymraeg-2050-miliwn-o-siaradwyr-cynllun-gweithredu-2019-i-2020.pdf [Cyrchwyd 15/02/2021].
Llywodraeth Cymru. (2020). Arolwg Cenedlaethol Cymru: Ebrill 2019 i Mawrth 2020 [Ar-lein]. Cafwyd o Caerdydd: https://llyw.cymru/arolwg-cenedlaethol-cymru-ebrill-2019-i-mawrth-2020 [Cyrchwyd 15/02/2021].
Morgan, E. (2018). Written Statement: The Future of Welsh Language Linguistic Infrastructure: Development and Coordination. Caerdydd: Llywodraeth Cymru. Cafwyd o: https://gov.wales/written-statement-future-welsh-language-linguistic-infrastructure-development-and-coordination?_ga=2.153666296.1589586268.1566378257-736005675.1566378257 [Cyrchwyd 15/02/2021].
NFER. (2005). Ein Geiriau Ni – Corpus of Children’s Literature in Welsh [Ar-lein]. Cafwyd o: https://www.egni.org/index.htm [Cyrchwyd 15/02/2021].
Prys, D., Jones, D., & Roberts, M. (2014). DECHE and the Welsh National Corpus Portal. Papur a gyflwynwyd yn Proceedings of the First Celtic Language Technology Workshop (tt. 71–75), Dulyn, Iwerddon.
Prys, D., Prys, G., & Jones, D. (2016). Cysill Ar-lein: A Corpus of Written Contemporary Welsh Compiled from an On-line Spelling and Grammar Checker. Papur a gyflwynwyd yn Tenth International Conference on Language Resources and Evaluation (LREC) (tt. 3261–3264), Portorož, Slofenia.
Riemersma, A. M. J., Gorter, D., & Ytsma, J. (2001). Frisian in the Netherlands. Yn G. Extra & D. Gorter (Goln.), The Other Languages of Europe: Demographic, Sociolinguistic and Educational Perspectives (tt. 103–118). Amsterdam: Multilingual Matters.
Scannell, K. (2007). The Crúbadán Project: Corpus Building for Under-Resourced Languages. Cahiers du Cental, 5(1), 1–10.
Scannell, K. (2012). Kevin Scannell’s Website. Cafwyd o: http://borel.slu.edu/ [Cyrchwyd 15/02/2021].
Williams, B. (1999). A Welsh Speech Database: Preliminary Results. Papur a gyflwynwyd yn Sixth European Conference on Speech Communication and Technology (EUROSPEECH’99) (tt. 2283–2286), Budapest, Hwngari.
Wilson, A. (2002). The Language Engineering Resources for the Indigenous Minority Languages of the British Isles and Ireland Project [Ar-lein]. Cafwyd o: http://www.ling.lancs.ac.uk/biml/ [Cyrchwyd 15/02/2021].
Wright, S. (2016). Language Policy and Language Planning – From Nationalism to Globalism. (2il arg.). Basingstoke: Palgrave Macmillan.
Y Swyddfa Ystadegau Gwladol. (2020). Data am y Gymraeg o’r Arolwg Blynyddol o’r Boblogaeth: 2019 [Ar-lein]. Cyrchwyd o Caerdydd: https://llyw.cymru/data-am-y-gymraeg-or-arolwg-blynyddol-or-boblogaeth-2019 [Cyrchwyd 15/02/2021].
Author information
Authors and Affiliations
Corresponding author
Rights and permissions
Copyright information
© 2021 The Author(s), under exclusive license to Springer Nature Switzerland AG
About this chapter
Cite this chapter
Knight, D., Morris, S., Fitzpatrick, T. (2021). 2.2 Corpws Cenedlaethol Cymraeg Cyfoes: Cyd-destun a Gweledigaeth. In: Corpus Design and Construction in Minoritised Language Contexts - Cynllunio a Chreu Corpws mewn Cyd-destunau Ieithoedd Lleiafrifoledig. Palgrave Macmillan, Cham. https://doi.org/10.1007/978-3-030-72484-9_7
Download citation
DOI: https://doi.org/10.1007/978-3-030-72484-9_7
Published:
Publisher Name: Palgrave Macmillan, Cham
Print ISBN: 978-3-030-72483-2
Online ISBN: 978-3-030-72484-9
eBook Packages: Social SciencesSocial Sciences (R0)