Orðabankar og aðrir bankar
Málstofustjóri: Gunnar Thor Örnólfsson
Fjármálaorð á fleygiferð
Orðaforði á sviði fjármála hefur tekið miklum breytingum á síðustu árum enda hafa fræðin og efnahagslífið verið í örri þróun og mörg ný hugtök hafa komið með innleiðingu Evróputilskipana. Þetta gerir það að verkum að stöðugt þarf að uppfæra íðorðasöfn á þessu sviði svo að þau verði ekki úrelt. Rannsóknin, sem sagt verður frá í erindinu, beindist m.a. að því að kanna áhrif af þessum aðstæðum. Rannsóknin fór fram á þessu ári og var framkvæmd á þann hátt að send var spurningakönnun til fjármálafyrirtækja og fjármálastofnana og auk þess til þýðingastofa sem þýða fjármálatexta. Spurt var um viðhorf til íðorða (hvort þau skipta miklu eða litlu máli), hvort íðorð væru skráð og þá á hvaða hátt, hvernig gangi að finna íslensk íðorð og hver væru helstu vandamál tengd íðorðum.
Helstu niðurstöður eru þær að mikill meirihluti telur þýðingar íðorða skipta mjög miklu máli en skráning á íðorðum er þó áberandi lítil. Fram kemur að um helmingur þátttakenda þarf að leita að íslenskum íðorðum nokkrum sinnum í viku eða daglega. Meira en helmingur þátttakanda telur að helstu vandamál tengd íðorðum í fjármálum séu að þeim hefur ekki verið safnað saman á einn stað. Um 20% þátttakenda benda einnig á gamla og úrelta íðorðalista sem vandamál.
Greiningardeild Íðorðabankans
Vinna við íðorðasöfnun er seinleg og erfitt að henda reiður á nýjum hugtökum eða breyttri notkun hugtaka á tilteknum fagsviðum. Afar tímafrekt er að fara yfir marga texta til að greina íðorð og skoða notkun þeirra, en með aðstoð tölvutækninnar og öflugs greiningarhugbúnaðar er mögulegt að vinna þessa vinnu með kerfisbundnum hætti. Við kynnum nýjan veflægan hugbúnað sem er í þróun og safnar sjálfvirkt mögulegum íðorðum á sviði fjármála. Markmið verkefnisins er að auðvelda ritstjórnum íðorðasafna á þessu sviði að skoða hvernig íðorð eru notuð, safna notkunardæmum og að greina ný íðorð í texta þegar notkun þeirra verður útbreidd. Auk þess að láta kerfið safna mögulegum íðorðum sjálfvirkt geta notendur hlaðið textum eða þýðingarminni upp í kerfið svo það geti dregið íðorð út úr því efni. Á sérstöku vinnusvæði orðanefnda og ritstjóra íðorðasafna er hægt að fara yfir greininguna, merkja við hugtök sem ekki voru þekkt fyrir, geyma raunveruleg notkunardæmi og bæta við öðrum upplýsingum. Notendur geta deilt gögnum sínum með öðrum, tekið þau út úr kerfinu á ólíkum sniðum og sent valin íðorð eða dæmi til birtingar í Íðorðabankanum, miðlægu kerfi fyrir íslensk íðorð sem rekið er af Stofnun Árna Magnússonar í íslenskum fræðum.
Leitin að fjármálaorðum
Markmið með rannsókninni er að útbúa hugbúnað til sjálfvirkrar íðorðaleitar innan íslensks texta, með áherslu á gögn úr fjármálageiranum. Eftir könnun á því hvort raunhæft væri að aðlaga og nota tilbúnar hugbúnaðarlausnir sem ætlaðar eru fyrir slíkar leitir á öðrum tungumálum, reyndist niðurstaðan sú að besti kosturinn væri að útfæra séríslenska lausn. Teknar voru til skoðunar þær aðferðir til íðorðaleita sem hafa reynst best á síðustu árum, sem og þau íslensku forrit sem hægt væri að styðjast við í útfærslu á þeim aðferðum.
Niðurstaðan er hugbúnaðarfrumgerð sem tekur við runu af íslenskum texta – auk lista þekktra íðorða í viðkomandi fagi, sé slíkur listi til staðar – og skilar af sér ágiskunum um ný og óskráð íðorð. Frumgerðin fær engin lýsigögn um textann sjálfan og þarf því fyrst að vinna úr honum málfræðilega, en þar er að hluta til beitt öðrum forritum sem aðstoða við tókun, mörkun, nafnmyndagreiningu og þáttun textans. Eftir að textinn hefur verið færður yfir á viðeigandi snið beitir frumgerðin tölfræðilegum aðferðum til að reikna út hvaða segðir séu líklegastar til að vera íðorð, með tilliti til tíðni hverrar segðar innan textans og hversu lík hún sé þekktum íðorðum.