http://www.gjzbw99.com 2009-07-22 17:07 來源:中國自動化學會專家咨詢工作委員會
要素重組:讓自主創新能力無窮大的秘密
許嘉璐(右)和他的學生陳小盟(左)。中為河北省委常委、唐山市委書記趙勇(時任團中央書記處書記)。
許嘉璐曾經撰文指出,HNC的研究,第一,必須采取集體攻關的辦法;第二,可以用“百花齊放,百家爭鳴”的方針,不拘一格,幾種風格齊頭并進,既相互競爭,又彼此取長補短;第三,采用科學的管理辦法,按照科學研究的規律管理;第四,既要爭取國家的支持,又要盡量與企業合作;第五,既要出成果又要出人才;第六,中文信息處理事業將是長期的,要有薪火相傳的準備;第七,允許失敗,在不斷失敗—研究—再失敗—再研究的循環往復中前進。
按照這一思路,北京大正語言知識處理研究院十分注意生產要素重組工作,他們要讓自主創新的能力無窮大。
在許嘉璐的主持建議下,2004年1月,北京師范大學成立了中文信息處理研究所,以發揮語言學與應用語言學學科優勢,加強中文信息處理應用基礎研究;促進語言學與計算機等相關學科的交融,推動計算機語言學這一交叉學科的發展;搭建中文信息處理領域的合作平臺,匯集高校、科研院所、高科技企業的專家學者集體攻關,探索中文信息處理理論與應用研究的新路;為國家培養兼通語言學與計算機科學的“兩棲型”專業人才;保持我國在語言信息技術領域的競爭力,保障國家、民族和社會的信息安全。
而北京大正語言知識處理科技有限公司,具有民營性質,是針對自然語言理解處理的理論探索及其技術應用的高新技術企業,是科技成果轉化的基地。
根據許嘉璐的意見,研究院第二個資源重組的表現為全新的“學、研、產、用”相結合的產業化創新之路。許嘉璐多次指出,中文信息處理事業事關國家安全和社會穩定,它的發展需要加強基礎研究、應用研究和社會需求三者的結合,需要語言學界和計算機科學界專家學者的密切配合、共同攻關。HNC基礎理論和技術及其應用研究過程中,課題組通過探索市場經濟條件下的科學研究模式和項目管理模式,組織了中國科學院、北京大學、清華大學、上海交通大學、北京大正語言知識處理研究院等高校、科研院所、高科技企業的專家集體攻關,打通語言學與計算機科學的壁壘。
中國計算機語言學專業委員會第一屆主任魯川,在《有關“科學”和“語言”的暢想》一文中寫道:“HNC是自然科學跟人文科學交叉的新興‘智慧科學’的一個典型代表。在探索過程中,北京大正語言知識處理研究院根據社會生產需求拓展研究領域,以理論研究促進方法學的創新。以應用方法學創新,催生應用成果的實現,用應用成果轉化反哺基礎研究,使自主創新逐步走上了良性循環的道路?!?/P>
持續創新:“核心競爭力”的金鑰匙
許嘉璐(前右)與陳小盟(后左)在工作中。
在強手如林的競爭中,北京大正語言知識處理研究院招兵買馬,廣納賢才,依托黃曾陽的HNC理論,在許嘉璐的精心指點下,潛下心來,埋頭HNC基礎理論研究和各項實驗,一干就是8年。這8年,得到了慧眼識珠的中關村管委會和北京市委、市政府的大力支持。
八度燕來雁去,八度星回歲改,八度寒來暑住,八度春華秋實。
8年前,黃曾陽的理論還只是一些公式和PC機上的初步模版演示。8年后,他已經是詩情畫意,收獲滿囊。他的專著《HNC(概念層次網絡)理論∶計算機理解語言研究的新思路》由清華大學出版社出版,概念層次網絡的研究,對語義文本、分詞等等的研究漸入佳境。黃曾陽也桃李滿枝,不少學子志愿投身到HNC理論這一具有自主知識產權的研究中,并不斷尋求新的創新與突破。
8年中,研究院一步一個腳印,捷報頻傳:
2001年6月,研究院成立半年后,HNC網絡信息智能過濾器樣板機誕生并進入中試。年底,過濾器開始試應用。它能有效地識別文本信息內容,提高了智能與自動識別能力,對網絡中流動的海量電子文本信息進行目標搜索與追蹤。這一成果,使我國在信息語言知識處理領域的國際競爭中占據領先地位。
2003年4月,“HNC信息智能過濾器”以其卓越的品質通過公安部計算機信息系統安全產品質量檢測,5月,取得公安部頒發的《計算機信息系統安全產品銷售許可證》,6月,取得國家版權局頒發的軟件著作權登記證書。
2004年,“HNC信息智能過濾器”獲得北京市科委頒發的軟件企業認定和軟件產品登記認定。
2005年,研究院參與承擔的“中文信息處理應用基礎研究”課題,順利通過國家高新技術研究發展計劃(863計劃)驗收,HNC開始形成了具有原始創新特點的理論與技術體系。
2007年,研究院承擔了國家科技支撐計劃“中文信息處理應用研究與系統開發”課題的研發。
2008年5月,工業和信息化部公布:大正研究院的“花季護航”上網管理軟件,中標“綠色上網過濾軟件產品一年使用權及相關服務采購”項目,成為國內相關領域軟件產品中惟一入選文字過濾產品……
8年來,大正研究院和北京師范大學中文信息處理研究所一起,先后承擔了包括國家重點科技支撐中文信息處理應用研究與系統開發項目(即原國家973計劃項目)、國家863計劃項目及中科院知識創新工程項目等科研任務。
8年來,大正研究院在國內外學術期刊發表論文60余篇,取得了2項發明專利、17項計算機軟件著作權。
總結8年的創新實踐之路,研究院董事長陳小盟感慨良多。
陳小盟說:“思想與理念有多遠,創新之路就會有多遠。在大正研究院,我們提煉了這樣一條理念:HNC語言知識處理基地是一株大樹;HNC語言知識、HNC概念聯想網絡、以此為基礎吸收進來的其他理論應用成果、世界知識是它的根;建立在對語言的語義理解的基礎上,應用在計算機對語言信息的智能化處理的多個層面是它的果實。”
按照許嘉璐的構想,研究院更像一個孵化器,在特殊機制催生下,HNC理論好比種子,市場需求好比土壤,北京大正語言知識處理研究院的基礎理論研究好比耕耘,而實用技術和項目則是陽光雨露下破殼而出的新生命。
黨的十七大以后,他們認真學習科學發展觀,對自主創新開始了新一輪的反思。經過總結經驗教訓,逐步達成共識:研究院的核心競爭力,來自持續不斷的自主創新;自主創新的動力來自市場需求。自主創新是一個科技、經濟一體化過程,是技術進步與應用創新共同作用催生的產物,從而對知識社會條件下以需求為導向、以人為本的創新模式更加堅定不移。
八年“潛伏”:贏得“紅杏枝頭春意鬧”
黃曾陽(中)在一次機器翻譯研討會上。
黑格爾說過:“要是沒有熱情,世界任何偉大事業都不會成功?!?nbsp;
作為HNC基礎研究課題的重要承擔單位之一和成果轉化基地,大正語言知識處理研究院、大正語言知識處理科技有限公司匯集了一大批莘莘學子。他們甘于奉獻,耐得住寂寞。許嘉璐說:“在IT界員工的收入一般是可觀的,而且跳槽早已司空見慣,‘大正’的收入只能說是中等水準,但到這里工作的學子們很少抱怨。大家默默耕耘,無私奉獻,就是為了讓具有自主創新的技術能夠茁壯成長,就是為了提高國家的科技軟實力?!?
自主創新激發出蓬蓬勃勃的活力,HNC基礎理論研究猶如一株青翠欲滴的新苗,一旦破土而出,就呈現出日新月異的景象。自主創新不斷推動著科研成果的產業化進程,隨著基礎理論研究的深化,“大正”的系列產品脫穎而出。
在推出HNC信息智能過濾器后,研究院又針對家庭、學校、網吧、企事業單位等不同用戶群推出系列產品,形成豐富的產品線。值得稱道的“花季護航”上網管理軟件,剛剛出爐就炙手可熱,被全國婦聯“百萬家庭護苗工程”確定為指定產品?!盎咀o航”上網管理軟件,運用特有的語義判定技術,能夠自動判定識別信息的褒貶義,對黃色暴力黑色等不良信息進行有效的防止與過濾。海量內容審查和管理系統——自動審查軟件,是針對海量內容難于搜索、難于管理,人工審核費時費力等問題而開發的一款自動審查出版內容的軟件,讓計算機模擬人腦,在“理解”的基礎上判斷文本內容,有效地解決了誤審核的問題,提高了審核的準確度。
與此同時,北京大正語言知識處理研究院還面對漢語加快走向世界的客觀需求,開發推出了創新、實用、大眾化的“漢語之聲”網站,用戶可以在漢語之聲網站享受學習漢語、體驗中國文化、訂購中國文化產品等專業服務。
面對果實累累的今天,許嘉璐說:“自主創新是實現民族復興的不竭動力,中華民族要自立于世界民族之林,要展翅騰飛,就要不斷提升科技軟實力,依靠自主創新變中國制造為中國創造。要在自主創新中出成果、出人才。北京大正語言知識處理研究院開發HNC基礎理論技術,并通過自主創新取得了初步成果,這僅僅是一個嘗試。相信我們國家會有大批類似HNC這樣的自主知識產權理論和技術誕生,也相信會有大批北京大正語言知識處理研究院式的IT企業脫穎而出。”
來源:光明日報