dilluns, 14 de febrer del 2011

Dodi hen lyfrau Cymraeg ar-lein

Ers blynyddoedd bellach yr wyf, o bryd i'w gilydd, yn dodi hen destunau Cymraeg, sydd erbyn hyn yn eiddo i bawb (am fod yr hawlfraint arnynt wedi dod i ben), ar ein gwefan (Gwefan Cymru a Chatalonia).

Mae’n fodd i "achub" hen lyfrau a’u rhoi o fewn cyrraedd pawb (er nad oes fawr o werth llenyddol i lawer ohonynt erbyn heddiw - creiriau hanesyddol ynt yn hytrach). 

Mae pob testun Cymraeg ar y rhyngrwyd hefyd yn helpu creu corpws hwylus o'r iaith ar gyfer archwilwyr ieithyddol. (Weithiau, wrth chwilio am enghraifft o ryw air drwy Google, rwy'n gweld ei fod ar glawr mewn llyfr diberchennog o'm heiddo innau. Nid oedd yr holl waith yn ofer wedi'r cyfan!)

Yn ychwanegol, mae pob diferyn yn y môr hwn yn dod â’r Gymraeg i sylw gweddill y byd. 

Ac yn anad dim y mae eu paratoi yn fodd cael blas ar hyd yn oed y llyfrau mwyaf sych o'r ddeunawfed ganrif - casgliadau o bregethau hirwyntog a diderfyn, cofiannau sebonllyd, a barddonaiaeth ddiawen a di-fflàch. Ceir yma a thraw sylw diddorol am ryw unigolyn neu bentref, rhyw briod-ddull wedi mynd yn angof ers talwm, geiriau tafodieithol, sôn am lefydd a ystyrir yn gwbl Saesneg erbyn heddiw, ond yn Gymraeg os nad yn gwbl Gymraeg ganrif a hanner yn ôl, megis ym Mro Morgannwg neu yng Nghwm Sirhywi).

Wrth gwrs, mae llawer yn gwneud gwaith tebyg. Dros y blynyddoedd, y mae gwirfoddolwyr wedi bod wrthi’n paratoi testunau ar gyfer gwefannau fel Cywaith Gutenberg ac mae ambell lyfr dihawlfraint yn y Gymraeg wedi cymeryd ei le rhwng y miloedd sy ganddynt. Ond nid yw’r llyfr gwreiddiol ar gael ar ffurf delwedd yng ngwefan  y cywaith. 

Mae'n ddefnyddiol bod â delwedd o'r tudalen gwreiddiol i gael ei gymharu â'r testun teipiedig weithiau - wrth atgynhyrchu’r hen lyfrau ar ffurf testun electronaidd, mae'n anochel fod ambell wall yn ymwthio i’r testun yn ystod y gwaith copïo, neu'r cywiro ar y sganiad. Gall fod hefyd newid sylfaenol ar fformat tudalen er mwyn eu  gwneud yn addas ar gyfer dogfen testun electronaidd.

Erbyn hyn mae Google Books, Internet Archive, ac eraill, yn ychwanegu holl gynnwys ambell lyfrgell at yr adnoddau sydd i’w cael ar y Rhyngrwyd, ac ymhlith y pentyrrau hyn o lyfrau y mae llawer yn y Gymraeg. Yn ogystal â'r delwedd neu lun o'r tudalen, mae'r cymwynaswyr hyn yn ei drawsnewid yn destun electronaidd.
 
Sut bynnag, nid yw’r delwedd bob tro yn ddarllenadwy (y sganiad wedi methu yn rhannol neu'n gyfangwbl, er enghraifft); at hyn, y mae’r fersiwn destun electronaidd yn un “amrwd”, heb gywiro gwallau’r rhaglen ANG (Adnabod Nodau Gweledol).

Yr wyf wedi rhoi cynnig ar wahanol ffyrdd o gyferbynnu delwedd o’r tudalen gwreiddiol â’r testun electronaidd, ond nid yw’r atebion wedi bod yn gwbl foddhaol bob amser.

Problem fawr hefyd yw bod y delweddau’n llyncu llawer o le ar y wefan.

Mae’n bosil “allfudo”’r broblem hon, a rhoi’r delweddau ar wefan allanol megis ImageShack (am ddim). Dodir dolen gyswllt yng nghorff y testun electronaidd ar gyfer pob un o'r delweddau, ond bydd ambell ddolen yn torri am ryw reswm neu'i gilydd dros amser. Mae'n cymryd llawer o amser i fynd at bob delwedd, a'u gwneud yn fwy i gael eu gweld yn glir. Ac mae’r holl broses o baratoi testun yn y modd hyn yn un lafurus a hir.

Efallai taw rhoi delweddau o dudalennau'r llyfr yn ei gyfanrwydd ar "youtube" yw'r ateb.

O wneud hyn, gellir gweld hefyd sut yn union y mae llyfr o'r clawr blaen hyd at y clawr cefn. Er nad yw'r ansawdd o’r radd flaenaf, eto i gyd y mae’n bosibl darllen y testun gwreiddiol.

Yr wyf wedi rhoi ar "youtube" yn ddiweddar y llyfrau hyn (maent i'w gweld ar ffurf destun electronaidd hefyd yn y wefan): 

1) Chwedlau Aesop Glan Alun, a gyhoeddwyd gan Hughes a'i Fab, Wrecsam (dwy gyfrol, yn ddiddyddiad, efallai o 1850-1860).




Gwaetha'r modd, mae pryfed arian wedi difetha rhai o'r tudalennau yn y llyfr hwn.


(Nid y troseddwyr eu hunain sydd yma gyda llaw - o lun mewn erthygl wikipedia ar Lepisma saccharina y mae'r teulu bach uchod. Nid wyf byth yn gweld y diawliaid bach - dim ond ôl eu dinistr.)

2) "Murmuron Tawe" gan y Parch. D. G. Jones (Pontardawe), 1913. (Llyfr cerddi, "darnau adroddiadol i bobl ieuainc a phlant")



3) Hanes Tonyrefail (Thomas Morgan, 1899). Yn yr achos hwn, mae'r tudalenau testun electronig wedi eu gosod rhwng y delweddau'r llyfr am fod ansawdd y delweddau gwreiddiol mor wael -  wedi'u gwneud ar sail llungopïau a wnaed ar llungopiwr cynteig mewn rhyw lyfrgell cyhoeddus ddeugain mlynedd yn ôl.