http://www.gjzbw99.com 2005-09-08 09:04 《中華工控網》原創
在剛剛結束的“國際口語翻譯研究聯盟(C-STAR III)”組織的國際機器翻譯核心技術評測中,我所“網絡內容管理與信息服務”團隊提交的中-英翻譯系統取得了BLEU得分0.528,NIST得分10.25的最好成績。C-STAR是國際上最早從事口語翻譯的國際性組織,這次中-英翻譯評測吸引了包括美國IBM公司、CMU計算機系、日本ATR、德國亞琛大學、意大利ITC、日本NTT等12個著名研究機構參加。據研究,中文到英文人工翻譯句子的BLEU得分一般在0.5~0.6,這說明我所翻譯技術在評測應用場景下的翻譯結果已經接近人工翻譯的質量。這是團隊不斷進行戰略方向研究和人才建設所取得的又一成果。
從2003年起,由高創中心和模式識別實驗室相關人員組成的團隊明確認識到目標凝練和隊伍建設對于創新事業發展的決定作用。結合國家重大戰略需求,深入研究本學科方向應用的新特點和趨勢,以語音語言技術為核心,逐步確定了網絡內容管理、媒體內容管理和通用領域機器翻譯三大戰略方向,并整合相關資源,完善團隊建設。在機器翻譯方面,適時地實現了從限定領域口語翻譯向通用領域文本翻譯的轉變,提升了技術的完備性和可擴充性。同時團隊把機器翻譯作為團隊國際合作和基礎理論創新的重要窗口。這次參加評測的系統是團隊集成了研究組多年的技術以及雙語語料庫的積累,抓住機器翻譯理論發生重大轉折的機遇,通過組織和引進優秀青年人才,在短短不到一年的時間里面取得的階段性成果。同時團隊還在機器翻譯理論上積極創新,在近一年的時間里,論文 “An Approach to Automatic Acquisition of Translation Templates Based on Phrase Structure ExtractionAlignment” 被國際核心期刊 IEEE Transaction on SpeechAudio Processing 錄用,論文 “Toward Practical Spoken Language Translation” 被國際機器翻譯領域權威雜志 Machine Translation 錄用,從而結束了我所自然語言處理研究只有高水平的技術和系統,沒有國際一流學術期刊論文的歷史。
目前團隊還在加緊攻關,通過不斷提高統計翻譯技術的泛化性能提升系統的翻譯性能。機器翻譯技術通過與語音識別等技術的結合,可形成可靠的口語翻譯裝置和翻譯服務,同時也必將進一步擴展網絡內容管理的語種范疇。 |