Language:  

 BECOME PART OF EUROPEAN RESEARCH IN IST WORLD !
Find:
AddThis Social Bookmark Button
HELP | ABOUT
 
 Query Definition:
 

Project:
   
   Selected Dataset:
 
 
 
   Search Method:
  » Basic Search
 
  » Categorical Search
» IST World » European Research» Projects » 1 Result » Details View
Masintõlge I
Start: 1/1/2006
End: 12/31/2008

Project Status History
unknown 1/1/2006
 
 Funding Programmes
National Programme for Estonian Language Technology (Estonian Ministry of Education and Research)340000EEK

Abstract
PROJEKTI EESMÄRGID JA TÄHTSUS (kuni 1 lk) : Projekt jätkab muutusteta Riikliku Sihtprogrammi „Eesti keel ja rahvuslik mälu (2004-2008)” raames aastal 2004 alanud projekti „Masintõlge I”. Projekti raames on loodud lausete kaupa paralleelistatud inglise-eesti korpus (maht keeliti 7,8 ja 5,0 miljonit sõna) ning tehtud esimesed katsed tõlkida nii eesti keelest inglise keelde kui ka vastupidi, kasutades selleks vabavaralist statistilise masintõlke programmi Pharaoh (http://www.isi.edu/licensed-sw/pharaoh/). Tähtsus Masintõlge on kiiresti arenev valdkond; kiiresti arenevad nii kasutatavad meetodid kui ka vastav tarkvara (s.h. vabavara), mis on orienteeritud järjest suuremate ja lingvistiliselt rohkem märgendatud tekstikorpuste kasutamisele. Praegusel etapil ongi põhirõhk korpustel kui edasise töö alusel, mis pealegi ei vanane nii kiiresti kui momendil kasutatavad meetodid ja tarkvara. Erinevatest masintõlke meetoditest on uuele keelele hõlpsamini rakendatavad statistilised masintõlkesüsteemid. Statistilised süsteemid on, vähemalt teoreetiliselt, keelest sõltumatud. Seega läheb nende süsteemide uuele keelepaarile rakendamiseks vaja vaid piisavalt suurt (aga piisavalt suur on vähemalt paarkümmend miljonit sõna suur) paralleelkorpust, millest süsteem leiab ise tõlkevastete tõenäosused ja koostab sihtkeele keelemudeli. Siiski on MT-alastes uuringutes viimasel ajal jõutud tõdemuseni, et ainult statistilistest meetoditest ei piisa hea tõlke saamiseks, eriti üksteisest tüpoloogiliselt erinevate keelte puhul. Nii ongi aktuaalseks muutunud statistiliste ja lingvistiliste meetodite kombineerimine. Eesmärgid 1. Parandada olemasoleva inglise-eesti korpuse paralleelistamise kvaliteeti, suurendada tema mahtu ja mitmekesistada tekstide valikut (Riikliku programmi alaeesmärk 3.2.1.2). 2. Märgendada korpus lingvistiliselt nii põhjalikult kui see on automaatselt võimalik (morfoloogiliselt, fraaside ja väljendite osas, süntaktiliselt, semantiliselt). Seda tuleb teha nii eesti kui inglise keele osas. Seejuures eeldame, et tarkvara, mida korpuste märgendamiseks kasutatakse, töötatakse välja muude projektide raames; antud projektis ainult kohandatakse teda. 3. Teha seeria masintõlke eksperimente nii olemasolevate vabavaraliste kui TÜs välja töötatud tarkvarapakettidega, kasutades momendil olemas olevaid korpusi. Eksperimentide tulemused peavad olema seejuures omavahel võrreldavad. Sellist metoodikat kasutades otsime eesti keele seisukohast perspektiivsemaid algoritme ja lahendame probleeme, mis takistavad just eesti keelega seotud masintõlget.

 
 Organisations
 
 Results  
   
   
   
   
   

 
People
Advanced Analysis ...
 
 Results  
 Competence  

 
 Related Projects (with similar people)
Advanced Analysis ...
 
 Results  
 Competence  
   
   

 
 Related Projects (with similar organisations)
Advanced Analysis ...
 
 Results  
 Competence  
   
   




 
data sets 
Estonian
European Research
 Analytic Tools:
» Result List
» Details View
 
 Advanced Tools:
» Collaboration Diagram
» Competence Diagram
 
 Experimental Tools: 
» Collaboration Trends
» Competence Trends
» Consortia Prediction
Please send corrections and pointers to missing information to feedback@ist-world.org.