時間:2023-03-22 17:43:21
序論:速發(fā)表網(wǎng)結合其深厚的文秘經(jīng)驗,特別為您篩選了11篇自動識別技術論文范文。如果您需要更多原創(chuàng)資料,歡迎隨時與我們的客服老師聯(lián)系,希望您能從中汲取靈感和知識!
關鍵詞 :介詞短語 條件隨機場 識別
一、引言
專利文獻在國家經(jīng)濟發(fā)展和科技交流中發(fā)揮著十分重要的作用。近年來,中國專利的申請數(shù)量漲速飛快。面向專利領域的文本信息處理(如專利文本機器翻譯)逐漸成為自然語言處理的重要應用領域之一,并引起了學術界和業(yè)界的廣泛關注。
為了滿足專利文本特定的表述需要,介詞短語作為一種重要的短語類型,在漢語專利文本中分布廣泛。據(jù)統(tǒng)計,在隨機抽取的500句漢語專利語料中,包含介詞短語的句子有226句,占到了樣本總量的45.2%。[1]可見介詞短語的出現(xiàn)比例非常高。漢語介詞短語的自動識別具有較大的難度,主要表現(xiàn)在以下幾點:
1.介詞短語的內部構成相當復雜。介詞短語可以由介詞與其他詞語和短語(動賓短語、名詞短語、方位短語、時間短語等)構成,甚至可以由整個句子構成。復雜的內部結構很容易形成遠距離的搭配關系。
2.兼類介詞的存在。在一定的語境下,介詞還可以兼做名詞、量詞、形容詞、連詞和動詞等,必須結合上下文語境才能判斷具體詞性。
3.在同一個句子中經(jīng)常會出現(xiàn)多個并列的介詞短語,或者會出現(xiàn)復雜的嵌套介詞短語。
下面是一個包含介詞短語的真實專利語句示例:
(1)本發(fā)明【在條件允許的情況下】【通過[為一個宏塊中的不同區(qū)域]提供不同的預測信息】而提出了許多更加準確的結果。
從例句可以明顯地看出,專利文本中的介詞短語通常具有更多的字數(shù)和更為復雜的結構。例句中用括號標示出了兩個并列的介詞短語結構,其中一個的內部還有另外一個介詞短語,屬于嵌套結構的介詞短語。正確識別這些短語就比較困難了。
在句子S=W1,W2,W3……Wn中,假設字符串Wi,Wi+1……Wj為待識別的介詞短語,介詞短語識別的主要任務就是分別將Wi和Wj識別為該介詞短語的左右邊界。由于左邊界就是介詞本身,因此關鍵問題在于確定右邊界位置。介詞Wi通常稱為前界,右邊界Wj稱為后界,緊鄰右邊界的詞語Wj+1一般稱為后詞。
考慮到介詞短語分布的廣泛性和對專利文本處理的影響,本文嘗試利用條件隨機場模型(Conditional Random Field,即CRF),主要對大規(guī)模專利語料中位于同一分句內部的介詞短語進行自動識別研究,希望能做出一些有益的探索。
二、相關研究
針對漢語介詞短語識別的難點,國內外學者做了大量研究工作,提出了一些有效的方法,主要包括規(guī)則方法,統(tǒng)計方法和將二者相結合的混合方法。梁猛杰等(2013)通過考察介詞規(guī)則庫的處理特點,依據(jù)規(guī)則的覆蓋程度從低到高進行分類,重新調整了規(guī)則的前后排序方案,同時對排序的規(guī)則進行優(yōu)選,在保證時間復雜度較低的情況下提高了介詞用法自動識別的準確率[2](P152~155)。朱筠(2013)、胡韌奮(2015)等在概念層次網(wǎng)絡理論(Hierarchical Network of Concepts,HNC)[3]的指導下,面向漢語專利領域的文本,專門構建了較大規(guī)模的漢語專利語料知識庫,在利用規(guī)則方法開展?jié)h英專利機器翻譯研究的過程中探索了介詞短語的識別方法和思想[4][5]。于俊濤(2006)釆用基于最大熵模型的方法,通過獲取有效的特征集合完成了介詞短語識別的任務。奚建清(2007)引入機器學習方法,提出了基于隱馬爾可夫模型(HMM)的漢語介詞短語邊界確定方法。首先基于HMM自動識別介詞短語,然后利用依存語法錯誤校正方法對識別結果進行修正,取得了不錯的識別準確率[7](P172~182)。胡思磊(2008)、宋貴哲(2011)、張杰(2013)利用CRF模型對介詞短語進行識別,取得了較好的效果。于俊偉(2005)采用了規(guī)則和統(tǒng)計相結合的介詞短語識別方法,提出了利用搭配模板獲取可信搭配關系以及基于詞性的三元統(tǒng)計模型和規(guī)則相結合的方法識別介詞短語[11](P17~23)。昝紅英等(2013)在已有工作的基礎上,提出了一種規(guī)則與CRF模型相結合的介詞用法自動識別算法。通過將人工書寫的規(guī)則與CRF在宏觀層面和微觀層面進行有機的結合,根據(jù)介詞的具體特點,選擇合適的識別方法,使最終的識別準確率達到了80%左右[12](P2152~2157)。
三、CRF模型介紹
作為一種基于統(tǒng)計的判別式學習模型,CRF模型最早由Lafferty等人在2001年提出。該模型來源于最大熵模型。CRF通過計算和統(tǒng)計已知元素推理計算未知元素的條件概率。與隱馬爾可夫模型不同,CRF可以利用上下文信息,而不需要嚴格的獨立性假設,因此在序列標注問題中表現(xiàn)出很好的性能。此外,CRFs還解決了最大熵馬爾可夫模型(MEMM)中的標注偏置問題。CRFs被廣泛應用于自然語言處理領域的句法分析、命名實體識、詞性標注等方面,并取得了很好的效果。CRFs是一種以給定的輸入序列X為條件來預測輸出序列Y概率的無向圖(undirected graphical)結構模型。(X,Y)就是一個以觀察序列為條件的隨機域。概率計算可以通過如下公式得到:
四、基于CRF的介詞短語識別
國外學者已經(jīng)開發(fā)了完整的CRF模型工具包,利用工具包可以快速地訓練模型并得到相應的結果。在本文中,將使用CRF++0.53版本的工具包①對中國專利信息中心提供的專利語料進行訓練。
(一)序列標注
很多基于CRF模型的語塊識別任務通??梢赞D化為序列標注問題。在識別介詞短語的過程中,首先對包含介詞短語的句子進行分詞處理,然后對每個詞語進行標注,確定介詞短語的邊界。我們采用{B, I, E, O}標記集進行標記。其中B表示介詞短語的前界,I表示介詞短語的內部成分,E表示介詞短語的后界,O表示不屬于介詞短語的部分。
(2)本發(fā)明通過采用有效的方法提高汽車產(chǎn)量。
對于這個例句,可以做出如下標記:
本發(fā)明O通過B采用I有效的I方法E提高O汽車O產(chǎn)量O。O
將其反映到序列標注問題上,則可以認為:
輸入序列X={本發(fā)明 通過 采用 有效的 方法 提高 汽車 產(chǎn)量 。}
相應地,輸出標注序列Y={O B I I E O O O O }
(二)特征選擇
特征是訓練CRF模型必需的。在CRF中,特征選擇是一個非常重要的問題,選擇合適的特征對模型訓練和測試都將十分有益。盡管可以不加限制地定義標記序列的特征,但不代表特征越多就越好。通過考察大規(guī)模語料中介詞短語的特點,初步確定了以下五個特征及其屬性值:
1.詞特征。詞作為句子的基本構成單元,是最基本的特征,模型可以通過詞之間的差異性來尋找詞本身的內部特征。
2.詞性特征。通過分析發(fā)現(xiàn),詞性特征對邊界的識別具有很大的提示作用。因此需要標記序列中詞語的詞性。本文采用北京大學《現(xiàn)代漢語語法信息詞典》中的詞性標記集進行標記。
3.候選前界特征。從當前詞位置開始向前查找,查找位于同一分句中的介詞。如果該介詞存在,則該特征值為介詞本身;否則特征值為“N”。
4.候選后界特征。如果認為當前詞語可以作為介詞短語的后界,則特征值記為“Y”,否則記為“N”。
5.候選后詞特征。后詞對介詞短語的正確識別也起到了很大的提示作用,判斷當前詞是否是候選后詞也能減小后界的選擇范圍。如果認為當前詞語可以作為介詞短語的后詞,則特征值記為“Y”,否則記為“N”。
下表是例句2的標注實例:
將以上五個特征分為五列,對分詞處理后含有介詞短語的每一句語料進行標注,同時在最后一列加入{B, I, E, O}標記集,以確定介詞短語的邊界,以此形成訓練語料和測試語料。
(三)特征模板
對于CRFs模型而言,根據(jù)選擇的特征設計出不同的特征模板,根據(jù)特征模板系統(tǒng)生成不同的特征函數(shù),會影響系統(tǒng)的性能。因此,特征模板選擇的好壞將直接影響CRFs模型的效果。所以,特征模板的選擇也是CRFs模型在介詞短語識別中的重要問題之一。
CRFs模型的特征模板一般包括原子特征模板和復合特征模板。單獨使用原子特征模板,只能表現(xiàn)出單個位置的特征信息,容易造成期望值和實際結果的偏差較大,導致參數(shù)的估計不準確??梢詫υ犹卣鬟M行組合,構成復合特征模板,通過定義各特征的窗口來描述標注單元和上下文之間的關系。本文將窗口大小定義為2。即分別考慮當前詞、當前詞前面兩個詞及后面兩個詞的五項特征。
當完成了序列特征標注任務,就可以利用CRF工具包對模型進行訓練并識別介詞短語了。
五、實驗及分析
(一)實驗結果
在這一部分,設計實驗測試CRF模型識別介詞短語的效果。從中國專利信息中心提供的專利語料中隨機選擇了1000句含有介詞短語的句子作為測試集進行序列標注。實驗采用四倍交叉驗證方法,即將測試集按照數(shù)量均分為4等份,其中的3份語料作為訓練語料,另一份作為測試語料,共進行四次實驗,分別計算實驗的三個評價指標:準確率(P)、召回率(R)和F1值,并將實驗的平均值作為最終的參考結果。評價指標計算公式如下:
其中,“N”代表每次實驗的測試集(250句)中介詞短語的數(shù)量,“N1”代表模型識別介詞短語的數(shù)量,“N2”代表正確識別的數(shù)量。
(二)實驗分析
從上表可以看出,實驗的整體評價指標都達到了90%以上,表明CRF模型對于識別介詞短語的有效性。
通過分析識別錯誤的結果,初步認為分析錯誤的原因可能有以下幾點:
1.有的介詞在訓練集中出現(xiàn)次數(shù)很少或者幾乎沒有出現(xiàn),因此CRF模型無法有效學習到這些介詞的特征,當它們出現(xiàn)在測試集中,模型就難以正確識別。
2.有些介詞短語具有歧義,模型不容易判斷短語的右邊界位置。例如:通過墨水著色劑可以有效地使染布上色。這句話中,兩個名詞“墨水”和“著色劑”挨在一起,不確定二者是否可以組成復合名詞,不容易判斷到底哪個名詞才是介詞短語真正的右邊界。
3.CRF模型對于序列的標注特征比較敏感。在人工標注的過程中一些難以避免的標注失誤或錯誤也會導致識別錯誤的現(xiàn)象。
六、結語
本文利用條件隨機場模型嘗試對漢語專利語料中的介詞短語進行了識別研究。在分析大規(guī)模語料的基礎上,選擇了合適的特征,對語料進行序列標注,同時利用CRF工具包訓練了識別短語的模型,最后設計了實驗檢驗識別效果。實驗整體的準確率達到了90%以上,表明提出的方法對于識別介詞短語是有效的。
未來將加強對歧義介詞短語的研究,考察更多語料,爭取發(fā)現(xiàn)更多有效的特征,同時擴大測試規(guī)模,希望進一步提高識別的效果與性能。
(本文得到了“國家高技術研究發(fā)展計劃”[863課題,項目編號2012AA011104],中央高?;究蒲袠I(yè)務專項資金以及中國博士后科學基金資助項目的資助,特此表示感謝?。?/p>
注釋:
①http://crfpp.googlecode.com/
參考文獻:
[1]Li Hongzheng,Zhu Yun,Yangyang,Jin Yaohong.Reordering
Adverbial Chunks in Chinese-English Patent Machine Translation[A].Proceedings of CCIS2014.
[2]梁猛杰,宋玉,韓英杰等.基于規(guī)則排序的介詞用法自動識別研
究[J].河南師范大學學報(自然科學版),2013,41(3).
[3]黃曾陽.HNC(概念層次網(wǎng)絡)理論[M].北京:清華大學出版
社,1998.
[4]朱筠.基本句群處理及其在漢英專利機器翻譯中的應用[D].北
京:北京師范大學漢語文化學院博士學位論文,2013.
[5]胡韌奮.面向漢英專利機器翻譯的介詞短語自動識別策略[J].
語言文字應用,2015,1.
[6]于浚濤.基于最大熵的漢語介詞短語自動識別[D].大連:大連理
工大學碩士學位論文,2006.
[7]奚建清,羅強.基于HMM的漢語介詞短語自動識別研究[J].計算
機工程,2007,33(2).
[8]胡思磊.基于CRF模型的漢語介詞短語識別[D].大連:大連理工大
學碩士學位論文,2008.
[9]宋貴哲.漢語介詞短語識別研究[D].大連:大連理工大學碩士學
位論文,2011.
[10]張杰.基于多層CRFs的漢語介詞短語識別研究[D].大連:大連
理工大學碩士學位論文,2013.
[11]干俊偉,黃德根.漢語介詞短語的自動識別[J].中文信息學
報,2005,(4).
[12]昝紅英,張騰飛,張坤麗.規(guī)則與統(tǒng)計相結合的介詞用法自動
識別研究[J].計算機工程與設計,2013,(6).
中圖分類號:TP311.52文獻標識碼:A文章編號:1007-9599 (2010) 10-0000-01
RFID-based File Management System
Zheng Fu’e Shang Deji
(Zhengzhou Radio&TV University,Zhengzhou450000,China)
Abstract:The paper firstly analyzes the current situation of the current archives management,then designs a management system based on RFID technology to improve the status of records management.And describes the functional design and business process.
Keywords:File Management;RFID technology;Process design
一、檔案管理的現(xiàn)狀[1][2]
近年來隨著信息技術的發(fā)展,我國檔案事業(yè)取得了較大的發(fā)展,檔案的種類日益多樣化,信息量迅速膨脹。但是傳統(tǒng)檔案管理手段與技術所導致的問題日益突顯:檔案編目流程繁瑣低效、整理時間冗長;檔案存放次序較易被打亂;檔案查閱耗時長;檔案的盤點操作不科學;對失效檔案的管理滯后等等。
RFID(無線射頻識別)技術作為新一代物流跟蹤與信息識別的技術,可以促進檔案管理的自動化、智能化。
二、RFID技術簡介
RFID(Radio Frequency Identification),即無線射頻識別,是興起于20世紀90年代的一項自動識別技術。RFID射頻識別是一種非接觸式的自動識別技術,它通過射頻信號自動識別目標對象并獲取相關數(shù)據(jù)。一個典型的RFID系統(tǒng)由射頻電子標簽、讀寫器或閱讀器以及天線三部分構成。實際應用中,讀寫器把關于物品的數(shù)據(jù)寫入RFID標簽,然后將標簽貼在待識別物體的表面。讀寫器可無接觸地讀取并識別電子標簽中所保存的數(shù)據(jù),從而可以實現(xiàn)對物體識別信息的遠距離、無接觸式采集、無線傳輸?shù)裙δ?并且同時能識別多個RFID標簽。[3]
RFID技術應用于檔案管理可以促進檔案管理的自動化、智能化,具有較多優(yōu)點,比如:遠距離快速掃描、安全性高。[4]
三、基于RFID的檔案管理設計
本文設計的基于RFID技術的檔案管理系統(tǒng),其主要由RFID數(shù)據(jù)管理模塊和檔案管理信息模塊兩部分組成,如圖1所示。
(一)RFID數(shù)據(jù)管理模塊
該模塊由信息采集和終端管理器組成,是系統(tǒng)的數(shù)據(jù)存取中心與信息輸入輸出終端。終端管理器包括讀寫器或閱讀器,是中心數(shù)據(jù)庫獲取信息與輸出信息的重要端口。讀寫器的作用是負責將數(shù)據(jù)庫中的信息寫入標簽或是將標簽中的信息導入數(shù)據(jù)庫。[3]
信息采集部分包括物品、物品電子標簽、讀寫器等,主要完成物品的識別和物品EPC碼的采集和處理。存儲有EPC碼的電子標簽在經(jīng)過讀寫器的感應區(qū)域時,檔案的EPC碼會自動被讀寫器捕獲,從而實現(xiàn)自動化EPC信息采集,采集的數(shù)據(jù)將交由上位機信息采集軟件進行進一步的處理,如數(shù)據(jù)校對、數(shù)據(jù)過濾、數(shù)據(jù)完整性檢查等,這些經(jīng)過整理的數(shù)據(jù)可以為檔案信息管理模塊所使用。
(二)檔案信息管理模塊
檔案信息管理模塊可以在檔案信息管理系統(tǒng)的基礎上改進增加與RFID數(shù)據(jù)管理模塊交換數(shù)據(jù)的接口。
RFID數(shù)據(jù)管理模塊與檔案信息管理模塊通過系統(tǒng)接口實現(xiàn)模塊間的對接,由RFID數(shù)據(jù)管理模塊實現(xiàn)檔案數(shù)據(jù)的收集、儲存、讀寫電子標簽;檔案信息管理模塊實現(xiàn)對檔案信息的應用與管理。同時,可對系統(tǒng)用戶設置不同權限,以實現(xiàn)對用戶的安全性管理。
四、系統(tǒng)流程設計[1]
該系統(tǒng)流程主要有檔案入庫、日常管理、查找和盤點、防盜管理和銷毀等,下面將分別介紹幾個重要流程。
(一)檔案入庫
新的檔案入庫前,首先要對新檔案進行編目,并把該檔案信息寫入RFID標簽,同時標簽數(shù)據(jù)會被傳送到中心數(shù)據(jù)庫里,以備系統(tǒng)其他模塊調用和查詢。
(二)檔案日常管理
對于檔案的日常管理,均需要通過讀寫器對標簽進行讀寫操作完成,在數(shù)據(jù)庫中存儲工作記錄,同時在檔案RFID芯片中寫入借出和歸還記錄。同時,每次借出和歸還操作產(chǎn)生時,必須通過手持機對存儲該檔案的檔案架標簽進行寫操作,更新檔案架標簽中的存放記錄。
(三)檔案查找和盤點
在查詢相關檔案時,管理員通過系統(tǒng)按編號提取中心數(shù)據(jù)庫里所儲存的數(shù)據(jù)信息,核對無誤后發(fā)出出庫指令,檔案自動識別部分將根據(jù)編目號找出該檔案存放的檔案架編號即其物理位置。
(四)檔案防盜管理
在檔案室出入口安裝有讀寫器,并與該管理系統(tǒng)連接。當檔案經(jīng)過出入口時,讀寫器自動讀取檔案數(shù)據(jù),若判斷檔案未經(jīng)辦理領用操作,則裝置發(fā)出異常警報。
(五)銷毀
當檔案在入館時,將檔案保管期限寫入RFID標簽并存儲于中心數(shù)據(jù)庫中。當有檔案達到保管期限前,系統(tǒng)將提示該檔案將于何時失效,由管理員做出銷毀或繼續(xù)保管處理,以減少對檔案室資源的占用。
五、結束語
RFID技術應用于檔案管理中可以解決現(xiàn)有檔案管理中的一些問題,它使檔案管理自動化,可以提高檔案管理的效率,減少人員的使用,免去了計算機檔案管理和人工檔案管理的繁瑣。
參考文獻
[1]嚴林.電子檔案管理―計算機技術在檔案管理中的應用[J].機電兵船檔案,2010,(03):81-82
傳統(tǒng)的標簽防碰撞算法可分為ALOHA算法[2-3]和樹形算法[4-5]2類。ALOHA算法是1種完全隨機接入的多址接入?yún)f(xié)議算法,比如:PALOHA算法(隨機推遲算法)、時隙ALOHA算法(SA算法)、幀時隙ALOHA算法(FSA算法)、動態(tài)幀時隙ALOHA算法(DFSA算法)和分組ALOHA算法等。該類算法在標簽試圖發(fā)送數(shù)據(jù)時,并不考慮信道當前的忙閑狀態(tài),一旦產(chǎn)生數(shù)據(jù),就立刻決定將其發(fā)送至信道,這種發(fā)送控制策略有嚴重的盲目性。隨著用戶數(shù)量或發(fā)送信息量的增加,這種完全隨機接入的算法將使信道重疊現(xiàn)象加劇,碰撞概率增大,傳輸性能下降。
近幾年,有學者提出了采用CDMA技術進行防碰撞的方法,其性能有明顯改善。文獻[6]提出在標簽識別過程中,使用碼分多址技術,實現(xiàn)一個時隙可以同時傳輸多個標簽。文獻[7]提出了一種基于碼分多址思想的時隙ALOHA算法,來解決射頻識別中的防碰撞問題,此算法的系統(tǒng)穩(wěn)定范圍要大于時隙ALOHA系統(tǒng),并且當選用的擴頻碼組階數(shù)為N時,此算法的最大吞吐量可達原時隙ALOHA的N倍。上述2個文獻所提到的算法,當標簽數(shù)量很多時,數(shù)據(jù)碰撞的概率明顯增加,使系統(tǒng)的吞吐量急劇下降,影響了系統(tǒng)的整體性能?;谝陨显颍菊撐奶岢隽?種改進的基于CDMA技術的防碰撞算法,能夠適應大量標簽的識別應用,減少了識別碰撞的發(fā)生,使系統(tǒng)吞吐量得到明顯改善。
1基于CDMA技術的新型防碰撞算法
n×1-1Nn-1(2)由于傳統(tǒng)的基于ALOHA的防碰撞算法中一個時隙最多只能正確識別一個標簽的信息,所以當標簽數(shù)目過大時,系統(tǒng)的吞吐率,即正確識別標簽數(shù)目所占的百分比將會大幅度的降低,所以對于過量的標簽,本算法將會采取對所有標簽進行分組識別,當標簽需要分成2組時(系統(tǒng)識別幀最大時隙數(shù)N為256):nN×1-1Nn-1=n2N×1-1Nn2-1 (3)用上述公式可知n=354,所以當標簽數(shù)量大于354時,系統(tǒng)將會對標簽分組識別。
本文提出的新型算法如下:依據(jù)分組幀時隙ALOHA算法,通過此算法的分組規(guī)則,完成識別的所有標簽的分組。分組幀時隙ALOHA算法的分組規(guī)則如下:當標簽數(shù)量≤354時,無論幀長選擇8個時隙還是256個時隙,標簽都不分組,按照一個大組來進行識別;當標簽數(shù)量>354時,幀長選擇256個時隙比較適合讀寫器的識別;當標簽數(shù)量在355707時,標簽分為2組;當標簽數(shù)量在708~1 416時,標簽分成4組更適合信息的傳輸識別。當標簽數(shù)量更多時,按照這個規(guī)律分成合適的組數(shù)再進行識別,詳細過程如圖1所示。標簽分組工作完成后,在每個分組中分別采用碼分多址技術,利用其技術的保密性、抗干擾性和多址通信能力,對標簽中的數(shù)據(jù)進行擴頻處理并傳輸。然后讀寫器端利用碼組的自相關特性對不同標簽所發(fā)的數(shù)據(jù)進行解調,從而達到防碰撞的目的,進而完成對全部標簽的識別,也實現(xiàn)了同一時隙可以傳輸多個信息的情況。本論文中提到的新型防碰撞算法需要預先在待識別的標簽中植入擴頻性良好的正交碼組,以防止接收端沒有辦法正確解擴接收,本文選用Walsh序列。該算法可以有效減少圖1算法執(zhí)行過程示意圖標簽識別過程中的碰撞次數(shù),從而減少了識別時間并且降低了功耗。本論文將分組幀時隙ALOHA算法和碼分多址技術相結合,實現(xiàn)在每個分組內可以有多個標簽同時進行擴頻傳輸,并且在接收端采用并行接收技術進行多個標簽的同時接收。本發(fā)明在識別標簽過程中,每個組內均為一個獨立的識別過程,在分組幀長不改變的前提下,提高了標簽數(shù)量龐大時的系統(tǒng)性能。有效地減小標簽之間的碰撞概率,縮短讀寫器操作時間,提高吞吐率, 很適合應用于具有較大數(shù)量標簽的RFID系統(tǒng)中。
2仿真結果
本論文提出了采用碼分多址技術的新型防碰撞算法,并仿真了固定時隙數(shù)下ALOHA算法的系統(tǒng)吞吐率和本文所提出的算法改進后的系統(tǒng)吞吐量。
RFID系統(tǒng)中時隙ALOHA算法的幀長取值從16個時隙到256個時隙變化,根據(jù)公式2,系統(tǒng)吞吐率如圖2所示。其中,系統(tǒng)仿真設定的信息幀長F即時隙數(shù)設定按2的冪次方遞增,即F取值從16個時隙變化到256個時隙,橫坐標為標簽數(shù)N從1變化到500,縱坐標為吞吐率。當幀長設定為256個時隙,標簽數(shù)量少于256個時,系統(tǒng)吞吐量隨著標簽數(shù)量的增加而增加,直到標簽數(shù)量達到256時系統(tǒng)的吞吐量達到最大值。隨著標簽數(shù)量的逐漸增多,系統(tǒng)的吞吐量又呈現(xiàn)下降趨勢。從圖2可以得出2點結論:一、當標簽個數(shù)接近信息幀長時,系統(tǒng)的吞吐率比較高;二、隨著幀長取值的增加,系統(tǒng)對標簽的識別性能有明顯改善。
本論文提出的基于碼分多址技術的新型防碰撞算法選用Walsh序列碼,其在對標簽的ID號進行擴頻處理后,即可實現(xiàn)在同一時刻有2個以上的標簽同時進入讀寫器的識別區(qū)域,它們同時發(fā)送各自的ID號后,讀寫器在接收到這些在空間疊加后的信號時也能完整地分離出不同標簽的ID號,突破了時隙ALOHA算法在同一時刻不能有2個以上標簽到達的限制。此時,系統(tǒng)的吞吐量為(Walsh序列的階數(shù)為r)esucc=∑t=2rt=1N×P(N,n,t)(4)固定時隙數(shù)的ALOHA算法的系統(tǒng)吞吐量仿真圖和其與基于碼分多址技術的新型防碰撞算法的比較仿真結果如圖3所示。仿真條件為標簽的到達情況符合泊松過程。仿真圖3給出了RFID系統(tǒng)的讀寫器閱讀100個標簽的識別結果,其中新型算法選用的是Walsh序列,其階數(shù)r取值從2變化到3,固定時隙數(shù)的ALOHA算法的信息幀長F取值從32變化到64,橫坐標為標簽數(shù)N從1變化到100,縱坐標為吞吐量。從仿真結果看,在同樣的到達率的條件下,階數(shù)越大,算法的吞吐量越高,系統(tǒng)的識別性能有明顯改善。并且隨著到達率的增加,新型 算法的吞吐量也隨著增加,當標簽到達量與階數(shù)相等時,系統(tǒng)吞吐量達到最大,但到達量大于階數(shù)時,吞吐量隨著到達率的增加而呈下降趨勢。這是由于當在同一時隙內到達的標簽數(shù)量增加到一定程度后,基于Walsh序列階數(shù)r的有限性,選用相同的Walsh序列作為擴頻碼的標簽數(shù)量將會增加,此時必然導致碰撞的增加。當選用的Walsh序列階數(shù)為3時,基于碼分多址技術的新型防碰撞算法的系統(tǒng)吞吐量可高達3.2,遠高于時隙ALOHA的0.368。而且隨著Walsh序列階數(shù)的提高,吞吐量的最大值還可以提高,但這會以增加讀寫器和標簽的硬件復雜度為代價,在實際使用中必須根據(jù)需求在吞吐量和Walsh序列階數(shù)中作出折中選擇。
3結束語
本論文在標簽的到達情況符合泊松過程的情況下,利用碼分多址技術的多址通信能力,結合分組幀時隙ALOHA算法的優(yōu)勢,創(chuàng)新地提出了一種RFID系統(tǒng)中基于碼分多址技術的新型防碰撞算法。理論和仿真實驗表明:同已有的標簽防碰撞算法相比,本論文提出的新型算法提高了標簽數(shù)量龐大時的系統(tǒng)性能,能有效地減小標簽之間的碰撞概率,縮短讀寫器操作時間,提高吞吐率, 很適合應用于具有較大數(shù)量標簽的RFID系統(tǒng)中。
中圖分類號TN29 文獻標識碼A 文章編號 1674-6708(2013)95-0073-03
0 引言
目前對輪胎X射線檢測系統(tǒng)的圖像識別都是由人來主觀判斷的。X光機對輪胎進行掃描成像,將圖像傳輸?shù)接嬎銠C中在顯示屏上顯示,工作人員通過對輪胎X射線圖像的識別來判斷輪胎是否有缺陷并對其缺陷進行分類,由人工來進行輪胎缺陷圖像識別受到外界的干擾較大,并且具有工作量和工作強度大的特點,這些都容易給輪胎缺陷圖像的識別帶來較大不利影響。采用計算機圖形識別技術對輪胎X射線圖像進行識別,不僅能提高工作效率,有效解決人工識別過程中帶來的問題,使識別的過程客觀化,更加科學和規(guī)范。輪胎X射線缺陷檢測系統(tǒng)能對其圖像進行自動處理和歸類,通過對輪胎缺陷圖像的統(tǒng)計,還可以建立輪胎缺陷圖像的數(shù)據(jù)庫,提高企業(yè)在輪胎生產(chǎn)過程中的經(jīng)濟效益[1]。
國內廠商大都是用國外生產(chǎn)的X射線檢測產(chǎn)品,比較常見的品牌有德國的Collmann和YXLON等[2]。YXLON是國際上輪胎內部缺陷檢測設備的最大生產(chǎn)廠家,其產(chǎn)品具有可靠的檢測結果、快速的檢測時間、維護簡單、結構緊湊、操作簡單直觀等特點[3]。相比較國外,國內對輪胎用X光機圖像處理技術的研究不多,對于國內的輪胎制造廠商,如果想要運用輪胎缺陷圖像自動識別技術,只能向國外購買,但是價格昂貴。因此,現(xiàn)在國內的大部分廠商還是采用人工肉眼對輪胎X射線圖像檢測的方法進行質量判斷[4]。
1 輪胎X射線檢測裝置和結構分析
我們采用的輪胎X射線檢測圖像采集裝置為YXLON公司生產(chǎn)的LX-1500型輪胎X射線檢測系統(tǒng),YXLON的輪胎X射線檢測系統(tǒng)由X射線管、U型傳感器、數(shù)字圖像轉換器、圖像處理工作站和顯示器等部分組成,該系統(tǒng)具有機械結構設計良好和圖像識別系統(tǒng)分辨率高的特點。采用該系統(tǒng)對輪胎進行X射線檢測時,輪胎首先通過起重機被裝載到檢測的支架上,系統(tǒng)操作工使用控制面板輸入合適的參數(shù),按照設定好的參數(shù),徑向X射線管伸進到輪胎的中部,馬鞍型的輪胎線陣列檢測器也移動相應的位置,輪胎在支架上保持勻速的轉動,從而確保了輪胎X射線檢測過程的連續(xù)性。
2輪胎X射線檢測圖像分析
由于輪胎的規(guī)格型號極其繁雜,輪胎的內部結構也是千差萬別,導致表述輪胎缺陷時沒有統(tǒng)一的標準,這里依據(jù)對輪胎生產(chǎn)質量的控制要求,結合輪胎缺陷數(shù)據(jù)分析和文獻資料參考的基礎上,將輪胎內部鋼絲簾線的缺陷特征概括為以下四類:
2.1 簾線的形狀
對于質量正常的輪胎而言,其內部的胎體鋼絲簾線分布應該是與圖像橫向平行排列的直線序列,如圖1(a)所示。當簾線彎曲時,其檢測圖像如圖1(b)所示。
2.3簾線的細節(jié)
輪胎內部鋼絲簾線的細節(jié)主要表現(xiàn)為鋼絲簾線上的不連續(xù)點、交叉點或者斷點。圖3(a)是簾線交叉的X射線檢測圖像,圖3(b)是簾線斷開的X射線檢測圖像。對于胎體異物而言,由于X射線投影成像的關系,異物的影像會與鋼絲簾線的影像發(fā)生重疊,如圖3(c)所示,所以胎體異物也可以歸納為簾線上的細節(jié)問題。
4 結論
本文首先介紹了輪胎X射線檢測裝置,然后對輪胎X射線檢測的圖像進行了詳細分析,并對圖像中輪胎的缺陷種類進行了分類,最后介紹了自己設計的輪胎X射線檢測缺陷識別算法,針對形狀、尺度、細節(jié)、排列四種輪胎缺陷,分別設計了相應的輪胎缺陷識別算法。
參考文獻
[1]馮霞,郝振平.X射線在輪胎邊緣檢測中的應用[J].CT理論與應用研究,2010,19(3):61-66.
[2]徐啟蕾.輪胎X光圖像自動識別系統(tǒng)算法研究[D].青島:青島科技大學碩士學位論文,2006.
中圖分類號:TP311.52
1 引言
隨著社會科技的進步和經(jīng)濟的迅猛發(fā)展,醫(yī)院的業(yè)務也日漸增多,如何為醫(yī)院提供一種安全、舒適、方便、快捷和開放的信息化生活空間,是本文重點討論的問題。下文中,依托先進的科學技術,實現(xiàn)醫(yī)院內部管理的高效、互動和快捷。對醫(yī)院的出入口進行實時智能監(jiān)控,達到維護治安和防止破壞的作用,及時的把一切可能發(fā)生的或即將發(fā)生的案件制止,以及對進出醫(yī)院的可疑人物及車輛進行信息采集,把安全隱患降低到最小,對確保醫(yī)院安全具有十分重要的作用。本論文工作,是基于VC++和openCV設計開發(fā)了一款實用的醫(yī)院車輛及人員進出管理系統(tǒng)。能夠對來訪車輛進行自動車牌識別,根據(jù)車輛的數(shù)據(jù)庫信息查詢,實現(xiàn)門禁系統(tǒng)的自動控制;同時系統(tǒng)還包含人臉檢測模塊,能夠對每天來訪的人員進行人數(shù)統(tǒng)計。
2 系統(tǒng)總體設計
本系統(tǒng)功能主要分為兩大模塊:監(jiān)控管理和數(shù)據(jù)庫信息管理。具體功能圖如下所示:
3 系統(tǒng)詳細設計
打開和關閉攝像頭:通過調用opencv中的函數(shù)cvCaptureFromCAM();初始化從攝像頭中獲取視頻,獲得每一幀的圖像,并顯示在窗口的圖片控件上。通過調用opencv中的函數(shù)cvReleaseCapture();釋放資源,并將視頻窗口銷毀,實現(xiàn)關閉攝像頭的功能。
實時信息采集:通過函數(shù)cvSaveImage();將圖片保存,并進行命名,可將當前攝像頭所捕捉到的狀況進行采集,可對進出醫(yī)院的可疑人員和車輛進行抓拍。
人臉檢測:在opencv中含有根據(jù)人臉模板訓練的人臉分類haarcascade_frontalface_alt2.xml。通過加載分類器,可以對當前幀的圖像中出現(xiàn)的人臉進行識別,并通過cvCircle()將人臉圈出,實現(xiàn)人臉檢測功能。通過檢測出來的人臉可以知道今天目前為止該醫(yī)院共進出了多少人次,并將信息通過定時器定時刷新信息,反饋給保安人員。
車牌識別:車輛檢測可以采用埋地線圈檢測、紅外檢測、雷達檢測技術、視頻檢測等多種方式。采用視頻檢測可以避免破壞路面、不必附加外部檢測設備、不需矯正觸發(fā)位置、節(jié)省開支,而且更適合移動式、便攜式應用的要求。
系統(tǒng)進行視頻車輛檢測,需要具備很高的處理速度并采用優(yōu)秀的算法,在基本不丟幀的情況下實現(xiàn)圖像采集、處理。若處理速度慢,則導致丟幀,使系統(tǒng)無法檢測到行駛速度較快的車輛,同時也難以保證在有利于識別的位置開始識別處理,影響系統(tǒng)識別率。因此,將視頻車輛檢測與牌照自動識別相結合具備一定的技術難度。
車牌識別流程如圖2所示:
圖2 車牌識別流程
車牌圖像處理:對于車牌圖像,由實時監(jiān)控錄像進行實時保存,在進入車牌識別過程時打開。用dlg.GetPathName()得到圖片的路徑,將圖片打開。因為保存的圖片是倒著的,所以將圖片顯示在圖片控件前需要將圖片進行旋轉。利用函數(shù)cvCreateImage()將圖片轉化為二值化時的大小,用函數(shù)cvCvtColor()轉化為灰度圖,并用cvSmooth()進行高斯濾波,為圖片二值化做準備。
圖片二值化:所有灰度大于或等于閾值的像素被判定為屬于特定物體,其灰度值為255表示,否則這些像素點被排除在物體區(qū)域以外,灰度值為0,表示背景或者例外的物體區(qū)域。程序中沒有用opencv函數(shù)庫中的cvAdaptiveThreshold()和cvThreshold()進行二值化,而是通過調用AdaptiveThreshold()獲得第一個閾值,將最大像素的*0.7作為第二個閾值,進行圖片二值化,并將這兩個閾值用來做邊緣檢測函數(shù)cvCanny()的參數(shù)。
牌照定位:本程序中通過對二值化的圖像進行邊緣檢測后,在對得到的圖片進行垂直和水平掃描,在對水平方向從左往右掃描的過程中,對最大信息量的區(qū)域圈出,然后進行垂直分割,將得到的區(qū)域即為車牌區(qū)域,之后再用cvResize()將得到的圖片變?yōu)榻y(tǒng)一的大小。也就是車牌定位的過程為:水平分割、垂直分割、二值化牌照字符分割。完成牌照區(qū)域的定位后,再將牌照區(qū)域分割成單個字符,然后進行識別。字符分割一般采用垂直投影法。由于字符在垂直方向上的投影必然在字符間或字符內的間隙處取得局部最小值的附近,并且這個位置應滿足牌照的字符書寫格式、字符、尺寸限制和一些其他條件。利用垂直投影法對復雜環(huán)境下的汽車圖像中的字符分割有較好的效果。
牌照字符識別:字符識別方法主要有基于模板匹配算法和基于人工神經(jīng)網(wǎng)絡算法?;谀0迤ヅ渌惴ㄊ紫葘⒎指詈蟮淖址祷⑵涑叽绱笮】s放為字符數(shù)據(jù)庫中模板的大小,然后與所有的模板進行匹配,選擇最佳匹配作為結果。基于人工神經(jīng)網(wǎng)絡的算法有兩種:一種是先對字符進行特征提取,然后用所獲得特征來訓練神經(jīng)網(wǎng)絡分配器;另一種方法是直接把圖像輸入網(wǎng)絡,由網(wǎng)絡自動實現(xiàn)特征提取直至識別出結果。
是否放行:在識別車牌號之后,將得到的車牌號的字符串與數(shù)據(jù)庫中的車牌號的字符串進行對比,如果數(shù)據(jù)庫中有該車牌則是醫(yī)院的車,放行,否則不放行。
4 論文下一步的工作
本系統(tǒng)基本實現(xiàn)了醫(yī)院車輛進出的自動化管理,以及進出人員的人次統(tǒng)計。但是目前系統(tǒng)只實現(xiàn)了一個攝像頭的視頻監(jiān)控,這還不能滿足目前醫(yī)院多個監(jiān)控攝像頭同時工作的現(xiàn)狀。因此,論文下一步的改進工作,是實現(xiàn)醫(yī)院內多個監(jiān)控攝像頭的同時調取與管理。
參考文獻:
[1]鐘志光,盧君,劉偉榮.Visual C++.NET 數(shù)字圖象處理實例與解析[M].北京:清華大學出版社,2003,6.
[2]何斌,馬天予,王運堅,朱紅蓮.Visual C++ 數(shù)字圖象處理第二版[M].北京:人民郵電出版社,2002.
[3]夏良正.數(shù)字圖象處理[M].南京:東南大學出版社,1999,9.
[4]葛亮.Visual C++從入門到實踐[M].北京:清華大學出版社,2009.
[關鍵詞]快速公交;射頻識別;電子站牌;準確???/p>
中圖分類號:TU98.4 191 文獻標識碼:A 文章編號:1009-914X(2014)29-0292-01
1.研究背景
隨著我國城市社會經(jīng)濟高速發(fā)展,城市交通堵塞、群眾出行不方便問題日益突出,尤其大中城市的交通問題已經(jīng)逐漸影響到社會正常運營。為改善交通擁擠狀況各城市都在大興土木,道路越修越寬,交通設施占用的城市土地資源越來越多,終有一天會超過城市所允許的最大容量。為避免城市交通陷入擁擠―修路―再擁擠―再修路的惡性循環(huán),2005年10月總理、曾培炎副總理先后作出重要批示,要求各地優(yōu)先發(fā)展城市公交。一時間,“城市公交優(yōu)先”成為了社會各界關注的焦點。但是,隨著城市居民生活水平逐年提高,人們對出行的質量要求也越來越高,經(jīng)濟、安全、舒適、快捷的出行已經(jīng)成為現(xiàn)代城市居民追求的目標。但從目前的狀況來看,我國大部分的常規(guī)交通并不能滿足人們對出行的要求,公交服務水平普遍偏低。主要表現(xiàn)在運力不足,運行速度不高,準點率低,公交車型陳舊,公交線路不合理,公交吸引力低等。所以,在這種大背景的推動以及世界諸多城市建設快速公交系統(tǒng)的大力影響下,我國各大城市開始把快速公交系統(tǒng)推到了緩解城市交通壓力的前臺,北京、杭州、天津等地已相繼建成,合肥的快速公交已經(jīng)投入使用,而且在不斷的完善中。
射頻識別(Radio Frequency Identification,RFID)技術是一種非接觸式的自動識別技術,它通過射頻信號自動識別目標對象并獲取相關數(shù)據(jù),識別距離從幾厘米到幾十米遠,而且依據(jù)讀寫的方式不同,可以輸入說千字節(jié)的數(shù)字信息,具有極高的保密性。識別工作無須人工干預,可工作于各種惡劣環(huán)境。此外,由于射頻識別技術受外界的干擾較小,其識別準確率也比傳統(tǒng)的基于視頻圖像處理技術要高。因此,F(xiàn)RID技術已在世界各地得到廣泛的應用,以美國、日本和歐洲為首的發(fā)達國家對FRID技術的應用研究已達到相當高的水平,而基于射頻識別技術的車輛自動識別系統(tǒng)在我國的研究和應用尚處在起步階段。
2.設計原理
2.1 設計思路
系統(tǒng)結構:本系統(tǒng)主要由錄放系統(tǒng),LED顯示以及射頻信號的發(fā)射與處理組成。(圖1)
首先將準備放音的內容預先錄存儲到語音芯片中,當站臺接收到從公交車發(fā)送來的數(shù)據(jù)后,單片機1根據(jù)收到的有效公交車名數(shù)據(jù),然后向語音芯片發(fā)送對應的語音播放地址,啟動語音芯片送出音頻信號,語音芯片將音頻數(shù)據(jù)濾波后經(jīng)功率放大器驅動揚聲器播放語音,完成語音播放。同時與單片機2通信,驅動數(shù)碼管顯示相關車輛及停靠信息,從而實現(xiàn)車輛自動識別與乘客引導。
2.2 RF無線通信
典型的RFID系統(tǒng)可分成兩個部分。一部分是安裝在公交車的發(fā)射端,另外一部分就是安裝在BRT站臺的接受端。有源標識卡不斷主動向外發(fā)出無線電信號(1秒鐘發(fā)送3次),并且能夠傳輸較遠距離,該無線信號是有編碼的,每個標識卡的編碼是唯一的。標識卡發(fā)出的無線信號如果是在讀卡器的有效測量距離內,則該無線信號通過讀卡器上的天線被讀卡器接收并解碼,然后可以通過 TTL232接口將信息發(fā)送給單片機進行處理。
2.3 語音錄放模塊
語音自動播報電路如圖,由于需要預錄取相關的公交車信息及提醒語句,電路中必須加入語音功放電路。語音功放電路包括:語音芯片、音頻功率放大器、揚聲器等。本論文選用ISD4002語音芯片和自帶功率放大的音響,語音電路接口設計原理圖如圖2所示。
2.4 LED屏顯示電路
單片機驅動LED數(shù)碼管有很多方法,按顯示方式可分靜態(tài)顯示和動態(tài)顯示,按譯碼方式可分硬件譯碼和軟件譯碼。靜態(tài)顯示就是顯示驅動電路具有輸出鎖存功能,單片機將所要顯示的數(shù)據(jù)送出后就不再管,直到下一次顯示數(shù)據(jù)需要更新時再傳送一次新數(shù)據(jù),顯示數(shù)據(jù)穩(wěn)定,占用很少的CPU時間。動態(tài)顯示需要CPU時刻對顯示器件進行數(shù)據(jù)刷新,顯示數(shù)據(jù)有閃爍感,占用的CPU時間多。這兩種顯示方式各有利弊:靜態(tài)顯示雖然數(shù)據(jù)穩(wěn)定,占用很少的CPU時間,但每個顯示單元都需要單獨的顯示驅動電路,使用的硬件較多;動態(tài)顯示雖然有閃爍感,占用的CPU時間多,但使用的硬件少,能節(jié)省線路板空間,本設計采用動態(tài)掃描的方式驅動三個級聯(lián)數(shù)碼管。對各部分電路進行焊接調試,系統(tǒng)能夠很好的識別無線射頻的信息,并且LED和語音模塊都能正常工作,達到的預期的目標。
3.創(chuàng)新特色
智能公交系統(tǒng)目前正處于迅猛發(fā)展時期,市場前景廣闊。智能公交系統(tǒng)包含眾多子系統(tǒng),也涉及到很多交叉技術,是一個復雜的大系統(tǒng)。而在所有子系統(tǒng)及其所需功能中,公交車定位和報站系統(tǒng)又是整個公交系統(tǒng)的基礎。本設計通過對無線射頻技術特點和應用現(xiàn)狀的研究,結合我國目前城市快速公交現(xiàn)狀以及公交系統(tǒng)智能化的要求,提出一種新型智能化公交自動識別方案。在應用領域,如果一個設計的移植性差就意味著失敗,這些可擴展性都是由數(shù)字電路系統(tǒng)的特點來決定的,特別是射頻接口發(fā)射功率、發(fā)射頻率和MCU 控制程序可以修改,對應不同的系統(tǒng)可以設置不同的程序和參數(shù);系統(tǒng)硬件模塊也可以針對不同的系統(tǒng)做相應的修改。
4.應用前景
在世界諸多城市BRT建設的影響下,特別是國務院出臺81號文后,國內許多城市開始把發(fā)展大容量快速公交系統(tǒng)推到了緩解城市交通擁堵的前臺,紛紛開始規(guī)劃和建設BRT線路和系統(tǒng)。北京市編制了中心城公共汽(電)車線網(wǎng)規(guī)劃,并首次把BRT作為公共汽(電)車線網(wǎng)的一個功能層次,融入公交線網(wǎng)整體結構中,與常規(guī)公共汽車線網(wǎng)以及城市軌道交通線路有很好的銜接換乘關系。杭州開通了首條全長28公里貫穿城市東西走向的BRT線路,并計劃2~3年構筑起2至3條快速公交(BRT)線路以形成體系規(guī)模。此外,上海、廣州、西安、南京、成都、重慶、濟南也都在積極籌備建設BRT,有些城市目前已處于可行性研究階段。
總的來說,國內BRT的建設還處于起步階段,本設計所提出的BRT公交車準確??考俺丝蜕宪囎詣右龑到y(tǒng)能夠有效解決BRT公交的準確??考耙龑С丝陀行蜃屲嚨葐栴},大大提高了市民乘車效率,減小了交通隱患。市場前景廣闊。
基金項目:2013年國家級大學生創(chuàng)新創(chuàng)業(yè)訓練計劃項目(201310364012)
參考文獻
[1] 雷思孝,馮育長.單片機系統(tǒng)設計及應用[M].西安:西安電子科技大學出版社,2005.5.
[2] 李伯成,喉伯亨,張毅坤.微型計算機原理及應用[M].西安:西安電子科技大學出版社,2006.
[3] 赫建國,鄭燕,薛延俠.單片機在電子電路設計中的應用[M].北京:清華大學出版社,2006.5.
[4] 閻石.數(shù)字電子技術基礎[M].高等教育出版社.
[5] 竇建華.電子設計自動化―電路仿真與PCB設計[M].北京:國防工業(yè)出版社,2006.
[6] 張輝宜,陶永.智能公交系統(tǒng)的設計與實現(xiàn)[J].中國儀器儀表,2007,11:46~48.
冶金工業(yè)企業(yè)生產(chǎn)過程指從原材料的入廠開始,到半成品的流動、產(chǎn)成品的存儲和交付、廢棄物的處理等全過程,整個生產(chǎn)過程實際上就是系列化的物流活動。八鋼是有50多年歷史的老企業(yè),通過艱苦奮斗,不斷積累,形成了現(xiàn)在的發(fā)展格局。從目前的視角看,為使八鋼整體生產(chǎn)物流順暢,在物流布局及技術手段等方面都需要優(yōu)化。以八鋼物流道路運輸為例,進行探討。
在八鋼的生產(chǎn)過程中,運輸是生產(chǎn)的直接組成部分,八鋼各生產(chǎn)單元通過運輸使其空間狀態(tài)聯(lián)接在一起。在物流過程中很大一部分責任是由運輸擔任的,運輸是物流的基礎和主要組成部分.八鋼本部的大宗原燃料的運輸形式主要是道路運輸和皮帶運輸,相對而言道路運輸?shù)牟豢煽匾蛩馗啵饕接懙缆愤\輸?shù)膬煞N方式:公路運輸和鐵路運輸。
1公路運輸可視化分析
可視化公路運輸主要內容包括:車輛動態(tài)識別和定位技術應用、電子地圖技術應用、車輛導航技術應用、交通管理、協(xié)作運輸管理等。
1.1車輛識別
為了實時掌握公路運輸?shù)臓顩r,對公路運輸?shù)幕締卧臓顟B(tài)即車輛狀態(tài)必須知道,這就涉及到車輛識別?;诳臻g信息技術的移動式車輛偵測自動識別技術在公路運輸方面具有無可比擬的優(yōu)勢。
1.2電子地圖
電子地圖是公路運輸實現(xiàn)可視化必需的人機界面(interface),它具備了地理信息系統(tǒng)(gis)的大多數(shù)功能。公路運輸可視化的大部分信息都需要通過電子地圖來表示。電子地圖能夠把數(shù)字信號(包括對數(shù)字地圖、遙感數(shù)字圖象及自行數(shù)字化采集的數(shù)據(jù)進行可視化處理后形成的數(shù)字信號)和模擬信號顯示在計算機屏幕上。
電子地圖主要有兩方面作用:一是多維地圖的靜態(tài)顯示和動態(tài)顯示作用;二是動態(tài)環(huán)境下空間數(shù)據(jù)庫與物流信息管理系統(tǒng)數(shù)據(jù)庫的交流作用。總之電子地圖要完成gis中空間數(shù)據(jù)視覺化的任務。
電子地圖主要通過點狀要素(出入口、道口、交通燈等)、線狀要素(公路、鐵路等)、面狀要素(停車場、料場等)來反映交通詳細信息,滿通運輸服務的要求。
1.3車輛導航
車輛導航是指為具體的在廠內道路上的運輸車輛提供導航,它是車輛駕乘人員重要的輔助工具,使之能在正常情況先按照預定的線路行駛,異常情況下按照指定的線路移動。
為實現(xiàn)車輛導航,必須將gp導航系統(tǒng)與電子地圖、無線電通信網(wǎng)絡及交通管理信息系統(tǒng)結合起來,最終通過車載gp設備為駕乘人員傳遞相關的圖像和聲音信息。
1. 4交通管理
隨著八鋼產(chǎn)能的不斷擴大,廠內運輸?shù)能嚵髁繉⑦M一步增加,為使道路交通完全處于受控狀態(tài),制定相關規(guī)則并監(jiān)督執(zhí)行非常必要(尤其對大型運輸車輛的控制)。交通管理具體內容包括:車輛行進線路規(guī)劃、車輛監(jiān)控(路線、速度等)、停車位管理、交通道口監(jiān)控、車輛指揮、故障處理和緊急救援等。
首先對所有進出八鋼的大型運輸車輛的行進線路按物品(對應相應的物資編碼)做好規(guī)劃,線路規(guī)’劃本著線路最簡捷的原則進行,同時要考慮出入口、道口、回車場地、道路狀況、車流量、其它公路運輸?shù)纫蛩?,盡可能避免迂回運輸和重復運輸。線路規(guī)劃是動態(tài)的,可根據(jù)需要適時調整。線路規(guī)劃在大型運輸車輛進入門禁的時候,以聲、光和圖像的形式通過車載gps設備傳遞給駕乘人員,為其提供導航。
大型運輸車輛進入八鋼廠區(qū)的導航是強制的,為此需要實時跟蹤和監(jiān)控,確保其按照指定的線路、速度行駛,發(fā)現(xiàn)錯誤及時糾正。
隨著車流量的增加,靠車輛自律管理廠內交通將不能滿足要求,為此需要在重要道口建立交通信號控制系統(tǒng)和視頻監(jiān)控系統(tǒng)。交通信號系統(tǒng)主要用于管理道口現(xiàn)場交通;視頻監(jiān)控系統(tǒng)主要是將被監(jiān)控點實時采集的交通視頻圖像傳輸給監(jiān)控中心,以便監(jiān)督和及時調整控制流量。
八鋼有必要建立類似于城市交通指揮系統(tǒng)的交通管理系統(tǒng),可以作為勺又鋼物流信息管理系統(tǒng)”的一個獨立的子系統(tǒng)。交通管理系統(tǒng)以電子地圖和gps數(shù)據(jù)庫為工作平臺,運用計算機網(wǎng)絡,集成交通信號控制系統(tǒng)、電視監(jiān)控系統(tǒng)、交通誘導系統(tǒng)、電子警察系統(tǒng)、通信系統(tǒng)和車輛導航等系統(tǒng),實現(xiàn)各種交通管理信息集成整合,深化處理和增值服務,便于駕乘人員了解相應信息和交通狀況,使指揮人員能夠迅速決斷、快速反應、及時修正交通計劃,保證交通的安全與暢通。
1.5協(xié)作運輸管理
從實現(xiàn)物流可視化的角度來探討協(xié)作運輸管理。
將來八鋼的大宗原燃料的公路運輸主要通過社會協(xié)作的方式進行,為使公路運輸能夠按照八鋼的要求和意愿進行管理,在商談協(xié)作的時候,必須要求協(xié)作方按照八鋼的要求做一些必要的工作。
由于公路運輸處于買方市場,在商談協(xié)作運輸時掌握一定的主動權。
首先,要考慮軟硬件配備,主要包括:必須配備承擔運輸所需的車輛,車輛應裝備符合實現(xiàn)八鋼可視化物流所必須的gps車載設備和車輛自動識別裝置,具備車輛實時監(jiān)控系統(tǒng)(主要監(jiān)控八鋼外部運輸),具備與八鋼聯(lián)網(wǎng)的信息系統(tǒng)等。
其次是運輸管理,主要包括:為了避免集中到達,要求公路運輸商(可能是多家)按八鋼的交通容量編制運輸計劃,盡可能減小每批次的車輛數(shù)量;為充分利用社會資源,要求公路運輸商能實時控制在途車輛(必要時能提交八鋼共享),按照預定的計劃時間到達,同時要保證“運輸?shù)囊恢滦浴?在途車輛出現(xiàn)意外,有應急預案應對;對進入八鋼廠區(qū)的車輛能夠服從八鋼交通管理的要求;按照八鋼統(tǒng)一的電子結算方式進行運雜費結算等。
2鐵路運輸可視化分析
鐵路運輸占道路運輸?shù)谋戎卦诮窈髱啄陼鸩皆黾?大宗原燃料運輸里程一般在200km以上),鐵路運輸需要高度關注??梢暬F路運輸主要內容包括:車輛識別和定位技術應用、電子地圖技術應用、鐵路信號系統(tǒng)數(shù)據(jù)交換、車輛動態(tài)調度等。
2. 1車輛識別和定位技術應用
著重從機車跟蹤的角度探討車輛識別和定位。
為實現(xiàn)鐵路運輸可視化,需要知道機車行進方向、車輛數(shù)、車輛順序、車廂數(shù)、車輛標簽、所對應車輛的物品編碼(含品名、規(guī)格、產(chǎn)地等信息)、計量信息、列檢信息、裝卸信息、運行時間和運行位置等信息。這些都需要依靠車輛識別和定位技術來實現(xiàn)。
鐵路區(qū)域計算機連鎖系統(tǒng)(rcis)、動態(tài)自動識別稱量系統(tǒng)、全球定位系統(tǒng)(g ps )、電視監(jiān)控系統(tǒng)是進行車輛識別和定位的技術基礎,它們各有側重。
gps在車輛定位方面有無可比擬的優(yōu)勢,是實現(xiàn)車輛定位的重要手段,在gps基礎上結合rcis獲取的各節(jié)點信息,可實現(xiàn)車輛全過程精確定位和車輛動態(tài)跟蹤。
鐵路區(qū)域計算機連鎖系統(tǒng)和電視監(jiān)控系統(tǒng)相結合,借助模擬運算工具,也可實現(xiàn)車輛定位和跟蹤的功能。
用于車輛識別的技術手段包括圖像自動識別技術、射頻識別技術和移動式車輛偵測自動識別技術(cps技術),由于車廂經(jīng)常倒換,采用圖像自動識別技術、射頻識別技術進行識別更經(jīng)濟適用,尤其是射頻識別技術在我國鐵路運輸管理中已得到廣泛使用,也有相應的技術規(guī)范支撐。采用gps用于機車識別無疑是最佳選擇。將機車信息、車箱信息、編組信息等有效結合,即可得到完整的車列信息。
2.2電子地圖技術應用
電子地圖是鐵路運輸可視化重要的視覺平臺,作用同公路運輸,通過它可直接、快捷地了解到機車運行狀況。
電子地圖是實現(xiàn)可視化動態(tài)車輛調度十分重要的工具。電子地圖有兩類:一是基于地理信息系統(tǒng)(g is)的電子地圖,與實際地形相符,真實感強,但受幅面限制,一些信息不能直接反映在地圖上;二是模擬的示意性的電子地圖,可能與實際相差很大,但它幅面利用率高,可清晰顯示更多信息。以前更多的選擇后者,“鷹眼”技術使得前者的應用領域和范圍越來愈多。通過“鷹眼”技術可以詳細了解到每個區(qū)域的細部信息,通過鏈接甚至可以獲取包括某個信號燈的狀態(tài)、某個道岔的位置、某個攝像機獲取的車輛和行人圖像等信息。
2.3遠程監(jiān)控系統(tǒng)
在調度中心實現(xiàn)對道口、車站、鐵路沿線環(huán)境和現(xiàn)場的遠程監(jiān)控,一是可大大減輕日常人員巡視的工作量;二是便于及時發(fā)現(xiàn)危險隱患,保障安全生產(chǎn)。
遠程監(jiān)控系統(tǒng)的主要功能包括:實時視頻監(jiān)控、信息存儲、報警聯(lián)動、遠程遙控和校驗等。
遠程監(jiān)控系統(tǒng)由現(xiàn)場設備(可變焦紅外線數(shù)字攝像機、活動云臺)、傳輸通道(有線或無線)、主站設備(服務器、存儲裝置、軟件)、監(jiān)控終端等組成。
遠程監(jiān)控系統(tǒng)已成為鐵路運輸管理不可缺失的一個重要組成部分,隨著信息技術的發(fā)展,運用多媒體技術、基于web服務器的遠程監(jiān)視系統(tǒng),可以為有權限的局域網(wǎng)用戶提供實時的信息服務。
2.4鐵路信號系統(tǒng)數(shù)據(jù)交換
八鋼內部的鐵路運輸系統(tǒng)與公共鐵路運輸系統(tǒng)關聯(lián)度很高,隨著八鋼產(chǎn)能不斷提高,與外部公共鐵路運輸系統(tǒng)建立實時數(shù)字信息交換制度對雙方都有必要。可通過約定數(shù)據(jù)交換范圍、方式和格式,在雙方的數(shù)據(jù)服務器之間設置防火墻,實現(xiàn)信息共享并融入各自的管理系統(tǒng)。
內部可視化的相關信息需要集成在電子地圖上,這樣就需要在“八鋼物流信息管理系統(tǒng)鐵路運輸子系統(tǒng)”和現(xiàn)有的區(qū)域計算機連鎖系統(tǒng)(rcls)、擬建的車輛識別和定位系統(tǒng)、遠程電視監(jiān)控系統(tǒng)等之間實現(xiàn)信息無縫鏈接.由于現(xiàn)有的區(qū)域計算機連鎖系統(tǒng)(rbi)建設時未考慮與其它系統(tǒng)信息交換,相應的軟硬件不一定能滿足要求,屆時需要對服務器部分做相應的改動或升級。新建系統(tǒng)要充分考慮今后的拓展需求。
2.5車輛動態(tài)調度
車輛動態(tài)調度是“八鋼物流信息管理系統(tǒng)鐵路運輸子系統(tǒng)”重要組成部分,結合物流管制中心的建設就可視化的鐵路運輸管理和車輛動態(tài)調度的功能和內容展開描述。
車輛識別和定位技術應用、電子地圖技術應用、鐵路信號系統(tǒng)數(shù)據(jù)交換等都是為可視化的鐵路運輸管理和車輛動態(tài)調度服務的。鐵路運輸管理系統(tǒng)主要功能包括鐵路運輸計劃的管理、車輛運行信息顯示、車輛追蹤、物流信息顯示、調車作業(yè)圖表管理、列車運行圖的管理、運行數(shù)據(jù)統(tǒng)計分析、系統(tǒng)自診斷等。
冶金工業(yè)企業(yè)生產(chǎn)過程指從原材料的入廠開始,到半成品的流動、產(chǎn)成品的存儲和交付、廢棄物的處理等全過程,整個生產(chǎn)過程實際上就是系列化的物流活動。八鋼是有50多年歷史的老企業(yè),通過艱苦奮斗,不斷積累,形成了現(xiàn)在的發(fā)展格局。從目前的視角看,為使八鋼整體生產(chǎn)物流順暢,在物流布局及技術手段等方面都需要優(yōu)化。以八鋼物流道路運輸為例,進行探討。
在八鋼的生產(chǎn)過程中,運輸是生產(chǎn)的直接組成部分,八鋼各生產(chǎn)單元通過運輸使其空間狀態(tài)聯(lián)接在一起。在物流過程中很大一部分責任是由運輸擔任的,運輸是物流的基礎和主要組成部分.八鋼本部的大宗原燃料的運輸形式主要是道路運輸和皮帶運輸,相對而言道路運輸?shù)牟豢煽匾蛩馗?,主要探討道路運輸?shù)膬煞N方式:公路運輸和鐵路運輸。
1公路運輸可視化分析
可視化公路運輸主要內容包括:車輛動態(tài)識別和定位技術應用、電子地圖技術應用、車輛導航技術應用、交通管理、協(xié)作運輸管理等。
1.1車輛識別
為了實時掌握公路運輸?shù)臓顩r,對公路運輸?shù)幕締卧臓顟B(tài)即車輛狀態(tài)必須知道,這就涉及到車輛識別。基于空間信息技術的移動式車輛偵測自動識別技術在公路運輸方面具有無可比擬的優(yōu)勢。
1.2電子地圖
電子地圖是公路運輸實現(xiàn)可視化必需的人機界面(Interface),它具備了地理信息系統(tǒng)(GIS)的大多數(shù)功能。公路運輸可視化的大部分信息都需要通過電子地圖來表示。電子地圖能夠把數(shù)字信號(包括對數(shù)字地圖、遙感數(shù)字圖象及自行數(shù)字化采集的數(shù)據(jù)進行可視化處理后形成的數(shù)字信號)和模擬信號顯示在計算機屏幕上。
電子地圖主要有兩方面作用:一是多維地圖的靜態(tài)顯示和動態(tài)顯示作用;二是動態(tài)環(huán)境下空間數(shù)據(jù)庫與物流信息管理系統(tǒng)數(shù)據(jù)庫的交流作用??傊娮拥貓D要完成GIS中空間數(shù)據(jù)視覺化的任務。
電子地圖主要通過點狀要素(出入口、道口、交通燈等)、線狀要素(公路、鐵路等)、面狀要素(停車場、料場等)來反映交通詳細信息,滿通運輸服務的要求。
1.3車輛導航
車輛導航是指為具體的在廠內道路上的運輸車輛提供導航,它是車輛駕乘人員重要的輔助工具,使之能在正常情況先按照預定的線路行駛,異常情況下按照指定的線路移動。
為實現(xiàn)車輛導航,必須將GP導航系統(tǒng)與電子地圖、無線電通信網(wǎng)絡及交通管理信息系統(tǒng)結合起來,最終通過車載GP設備為駕乘人員傳遞相關的圖像和聲音信息。
1. 4交通管理
隨著八鋼產(chǎn)能的不斷擴大,廠內運輸?shù)能嚵髁繉⑦M一步增加,為使道路交通完全處于受控狀態(tài),制定相關規(guī)則并監(jiān)督執(zhí)行非常必要(尤其對大型運輸車輛的控制)。交通管理具體內容包括:車輛行進線路規(guī)劃、車輛監(jiān)控(路線、速度等)、停車位管理、交通道口監(jiān)控、車輛指揮、故障處理和緊急救援等。
首先對所有進出八鋼的大型運輸車輛的行進線路按物品(對應相應的物資編碼)做好規(guī)劃,線路規(guī)’劃本著線路最簡捷的原則進行,同時要考慮出入口、道口、回車場地、道路狀況、車流量、其它公路運輸?shù)纫蛩?,盡可能避免迂回運輸和重復運輸。線路規(guī)劃是動態(tài)的,可根據(jù)需要適時調整。線路規(guī)劃在大型運輸車輛進入門禁的時候,以聲、光和圖像的形式通過車載GPS設備傳遞給駕乘人員,為其提供導航。
大型運輸車輛進入八鋼廠區(qū)的導航是強制的,為此需要實時跟蹤和監(jiān)控,確保其按照指定的線路、速度行駛,發(fā)現(xiàn)錯誤及時糾正。
隨著車流量的增加,靠車輛自律管理廠內交通將不能滿足要求,為此需要在重要道口建立交通信號控制系統(tǒng)和視頻監(jiān)控系統(tǒng)。交通信號系統(tǒng)主要用于管理道口現(xiàn)場交通;視頻監(jiān)控系統(tǒng)主要是將被監(jiān)控點實時采集的交通視頻圖像傳輸給監(jiān)控中心,以便監(jiān)督和及時調整控制流量。
八鋼有必要建立類似于城市交通指揮系統(tǒng)的交通管理系統(tǒng),可以作為勺又鋼物流信息管理系統(tǒng)”的一個獨立的子系統(tǒng)。交通管理系統(tǒng)以電子地圖和GPS數(shù)據(jù)庫為工作平臺,運用計算機網(wǎng)絡,集成交通信號控制系統(tǒng)、電視監(jiān)控系統(tǒng)、交通誘導系統(tǒng)、電子警察系統(tǒng)、通信系統(tǒng)和車輛導航等系統(tǒng),實現(xiàn)各種交通管理信息集成整合,深化處理和增值服務,便于駕乘人員了解相應信息和交通狀況,使指揮人員能夠迅速決斷、快速反應、及時修正交通計劃,保證交通的安全與暢通。
1.5協(xié)作運輸管理
從實現(xiàn)物流可視化的角度來探討協(xié)作運輸管理。
將來八鋼的大宗原燃料的公路運輸主要通過社會協(xié)作的方式進行,為使公路運輸能夠按照八鋼的要求和意愿進行管理,在商談協(xié)作的時候,必須要求協(xié)作方按照八鋼的要求做一些必要的工作。
由于公路運輸處于買方市場,在商談協(xié)作運輸時掌握一定的主動權。
首先,要考慮軟硬件配備,主要包括:必須配備承擔運輸所需的車輛,車輛應裝備符合實現(xiàn)八鋼可視化物流所必須的GPS車載設備和車輛自動識別裝置,具備車輛實時監(jiān)控系統(tǒng)(主要監(jiān)控八鋼外部運輸),具備與八鋼聯(lián)網(wǎng)的信息系統(tǒng)等。
其次是運輸管理,主要包括:為了避免集中到達,要求公路運輸商(可能是多家)按八鋼的交通容量編制運輸計劃,盡可能減小每批次的車輛數(shù)量;為充分利用社會資源,要求公路運輸商能實時控制在途車輛(必要時能提交八鋼共享),按照預定的計劃時間到達,同時要保證“運輸?shù)囊恢滦浴?在途車輛出現(xiàn)意外,有應急預案應對;對進入八鋼廠區(qū)的車輛能夠服從八鋼交通管理的要求;按照八鋼統(tǒng)一的電子結算方式進行運雜費結算等。
2鐵路運輸可視化分析
鐵路運輸占道路運輸?shù)谋戎卦诮窈髱啄陼鸩皆黾?大宗原燃料運輸里程一般在200km以上),鐵路運輸需要高度關注??梢暬F路運輸主要內容包括:車輛識別和定位技術應用、電子地圖技術應用、鐵路信號系統(tǒng)數(shù)據(jù)交換、車輛動態(tài)調度等。
2. 1車輛識別和定位技術應用
著重從機車跟蹤的角度探討車輛識別和定位。
為實現(xiàn)鐵路運輸可視化,需要知道機車行進方向、車輛數(shù)、車輛順序、車廂數(shù)、車輛標簽、所對應車輛的物品編碼(含品名、規(guī)格、產(chǎn)地等信息)、計量信息、列檢信息、裝卸信息、運行時間和運行位置等信息。這些都需要依靠車輛識別和定位技術來實現(xiàn)。
鐵路區(qū)域計算機連鎖系統(tǒng)(RCIS)、動態(tài)自動識別稱量系統(tǒng)、全球定位系統(tǒng)(G PS )、電視監(jiān)控系統(tǒng)是進行車輛識別和定位的技術基礎,它們各有側重。
GPS在車輛定位方面有無可比擬的優(yōu)勢,是實現(xiàn)車輛定位的重要手段,在GPS基礎上結合RCIS獲取的各節(jié)點信息,可實現(xiàn)車輛全過程精確定位和車輛動態(tài)跟蹤。
鐵路區(qū)域計算機連鎖系統(tǒng)和電視監(jiān)控系統(tǒng)相結合,借助模擬運算工具,也可實現(xiàn)車輛定位和跟蹤的功能。
用于車輛識別的技術手段包括圖像自動識別技術、射頻識別技術和移動式車輛偵測自動識別技術(CPS技術),由于車廂經(jīng)常倒換,采用圖像自動識別技術、射頻識別技術進行識別更經(jīng)濟適用,尤其是射頻識別技術在我國鐵路運輸管理中已得到廣泛使用,也有相應的技術規(guī)范支撐。采用GPS用于機車識別無疑是最佳選擇。將機車信息、車箱信息、編組信息等有效結合,即可得到完整的車列信息。
2.2電子地圖技術應用
電子地圖是鐵路運輸可視化重要的視覺平臺,作用同公路運輸,通過它可直接、快捷地了解到機車運行狀況。
電子地圖是實現(xiàn)可視化動態(tài)車輛調度十分重要的工具。電子地圖有兩類:一是基于地理信息系統(tǒng)(G IS)的電子地圖,與實際地形相符,真實感強,但受幅面限制,一些信息不能直接反映在地圖上;二是模擬的示意性的電子地圖,可能與實際相差很大,但它幅面利用率高,可清晰顯示更多信息。以前更多的選擇后者,“鷹眼”技術使得前者的應用領域和范圍越來愈多。通過“鷹眼”技術可以詳細了解到每個區(qū)域的細部信息,通過鏈接甚至可以獲取包括某個信號燈的狀態(tài)、某個道岔的位置、某個攝像機獲取的車輛和行人圖像等信息。
2.3遠程監(jiān)控系統(tǒng)
在調度中心實現(xiàn)對道口、車站、鐵路沿線環(huán)境和現(xiàn)場的遠程監(jiān)控,一是可大大減輕日常人員巡視的工作量;二是便于及時發(fā)現(xiàn)危險隱患,保障安全生產(chǎn)。
遠程監(jiān)控系統(tǒng)的主要功能包括:實時視頻監(jiān)控、信息存儲、報警聯(lián)動、遠程遙控和校驗等。
遠程監(jiān)控系統(tǒng)由現(xiàn)場設備(可變焦紅外線數(shù)字攝像機、活動云臺)、傳輸通道(有線或無線)、主站設備(服務器、存儲裝置、軟件)、監(jiān)控終端等組成。
遠程監(jiān)控系統(tǒng)已成為鐵路運輸管理不可缺失的一個重要組成部分,隨著信息技術的發(fā)展,運用多媒體技術、基于wEB服務器的遠程監(jiān)視系統(tǒng),可以為有權限的局域網(wǎng)用戶提供實時的信息服務。
2.4鐵路信號系統(tǒng)數(shù)據(jù)交換
八鋼內部的鐵路運輸系統(tǒng)與公共鐵路運輸系統(tǒng)關聯(lián)度很高,隨著八鋼產(chǎn)能不斷提高,與外部公共鐵路運輸系統(tǒng)建立實時數(shù)字信息交換制度對雙方都有必要??赏ㄟ^約定數(shù)據(jù)交換范圍、方式和格式,在雙方的數(shù)據(jù)服務器之間設置防火墻,實現(xiàn)信息共享并融入各自的管理系統(tǒng)。
內部可視化的相關信息需要集成在電子地圖上,這樣就需要在“八鋼物流信息管理系統(tǒng)鐵路運輸子系統(tǒng)”和現(xiàn)有的區(qū)域計算機連鎖系統(tǒng)(Rcls)、擬建的車輛識別和定位系統(tǒng)、遠程電視監(jiān)控系統(tǒng)等之間實現(xiàn)信息無縫鏈接.由于現(xiàn)有的區(qū)域計算機連鎖系統(tǒng)(RBI)建設時未考慮與其它系統(tǒng)信息交換,相應的軟硬件不一定能滿足要求,屆時需要對服務器部分做相應的改動或升級。新建系統(tǒng)要充分考慮今后的拓展需求。
2.5車輛動態(tài)調度
車輛動態(tài)調度是“八鋼物流信息管理系統(tǒng)鐵路運輸子系統(tǒng)”重要組成部分,結合物流管制中心的建設就可視化的鐵路運輸管理和車輛動態(tài)調度的功能和內容展開描述。
車輛識別和定位技術應用、電子地圖技術應用、鐵路信號系統(tǒng)數(shù)據(jù)交換等都是為可視化的鐵路運輸管理和車輛動態(tài)調度服務的。鐵路運輸管理系統(tǒng)主要功能包括鐵路運輸計劃的管理、車輛運行信息顯示、車輛追蹤、物流信息顯示、調車作業(yè)圖表管理、列車運行圖的管理、運行數(shù)據(jù)統(tǒng)計分析、系統(tǒng)自診斷等。
鐵路車輛動態(tài)調度需要一個可視化的信息平臺,其主界面就是集合各種相關信息的鐵路運輸電子地圖(或稱之為八鋼鐵路地理信息系統(tǒng)圖)。鐵路車輛動態(tài)調度是計劃管理體系的一個重要組成部分,以計劃為驅動,實現(xiàn)產(chǎn)供銷運的緊密銜接,對采購、銷售、生產(chǎn)物流實施跟蹤管理。通過車輛調度模塊生成、調整和發(fā)送車輛運行計劃、維護和調整調度作業(yè)圖表、發(fā)送調度指令;鐵路運輸過程中的物流管理作業(yè)過程(如列檢、計量、裝卸等)也需要依靠車輛調度模塊來動態(tài)的實現(xiàn)控制;為使運輸過程處于可控狀態(tài),車輛調度模塊還要對車輛的動態(tài)跟蹤;實時(或定時)對鐵路運輸計劃的預測統(tǒng)計分析是車輛調度的重要工具和手段,通過它可獲得與鐵路運輸相關的信息(如庫存、消耗、待運、在途等信息),以便提前判斷和制定相應的措施。
中圖分類號:F252 文獻標志碼:A 文章編號:1000-8772(2012)01-0085-04
收稿日期:2012-01-08
作者簡介:鄒廣宇(1983-),男,天津人,計算機管理員,從事信息系統(tǒng)研究。
一、引言
1.論文研究的背景和意義
到目前為止,隨著現(xiàn)代信息的不斷發(fā)展,智能化和信息化已經(jīng)被廣泛應用到各個領域。目前的自動識別技術主要包括兩個種類:條碼技術和無線射頻(RFID)技術。隨著這兩種技術的不斷發(fā)展,自動識別技術已經(jīng)在全世界具有了一定的發(fā)展規(guī)模。由于信息量和人們需求的不斷擴大,現(xiàn)代的物流行業(yè)涉及的種類是很煩瑣的供應鏈結構也相應地變得很復雜,很多時候都是要求遠距離的傳輸,在這種傳輸中傳統(tǒng)的物流方式就存在很大的弊端。RFID技術,最早出現(xiàn)在第二次世界大戰(zhàn)的戰(zhàn)場上為飛機的一種敵我目標識別出現(xiàn)的。但是由于成本和技術限制等諸多原因,一直沒有得到廣泛的應用。
2.研究現(xiàn)狀
(1)物流信息的研究現(xiàn)狀。物流信息管理的發(fā)展已有很長一段時間,并且各個地區(qū)和國家的發(fā)展情況都不盡相同。我們可以在線地對車輛和貨物進行信息的追蹤和查找,但是這種方式對網(wǎng)站的信息和其他的鏈接都沒有可靠的保障。這種系統(tǒng)可以利用全球衛(wèi)星定位系統(tǒng)和智能的交通管理系統(tǒng)來對運輸貨物的車輛進行位置的追蹤,從而掌握貨物的運輸情況,以這種動態(tài)的管理方式使得車輛的管理效率得到提高。(2)RFID技術的研究現(xiàn)狀。條形碼技術可以說最早是由沃爾瑪公司開始應用的,從此成為了各個物流行業(yè)中的重要識別技術。而現(xiàn)在沃爾瑪公司否定了條碼技術開始使用電子標簽,這充分地說明了RFID技術明顯優(yōu)于傳統(tǒng)的條碼技術。也預示著RFID技術在商業(yè)物流行業(yè)中的應用會得到普及,最終取代條碼技術。RFID技術在中國作為一種新型的自動非接觸式識別技術的發(fā)展歷史還不是很久,所以是處于剛剛起步的階段。但是作為一種新型的技術手段,RFID技術還是具有很大的發(fā)展前景和空間的。
3.論文研究的主要內容
本文主要是把RFID技術應用到物流信息管理系統(tǒng)中,從而實現(xiàn)對物流全過程的調度優(yōu)化和控制的動態(tài)性。
二、物流信息系統(tǒng)概述
1.物流管理系統(tǒng)的概念及功能
(1)物流系統(tǒng)的定義。物流信息是一個非常廣泛的概念,涉及到我們社會經(jīng)濟的任何一個方面,是一個錯綜復雜的社會系統(tǒng)。從大的材料供應商、批發(fā)商到零售商和消費者,幾乎都有物流信息系統(tǒng)的身影?,F(xiàn)在的物流信息管理系統(tǒng)的主要任務有以下三方面:商品的流動,也就是我們所說的商流;信息的流動,也就是我們所說的信息流;資金的流動,也就是我們所說的資金流。物流信息管理系統(tǒng)的英文名稱是 Logistics Information System,以下簡稱為LIS。LIS的主要組成:計算機軟硬件、通信網(wǎng)絡的主要設備和人組成的智能人際交互界面系統(tǒng)。(2)物流信息管理系統(tǒng)的主要功能概述。通過計算機技術對數(shù)據(jù)進行處理,可以向運營商和客戶提供相應的共享數(shù)據(jù),并且可以加強企業(yè)和企業(yè)之間的合作關系,形成一種更加優(yōu)越和完善的供應鏈網(wǎng)絡。
2.物流管理系統(tǒng)的主要結構及類型
一個完善的物流信息管理系完成的主要功能包括:首先對信息進行采集整理存儲,然后對有用的信息進行相應的傳輸和利用。與此同時也涉及到了活動中的每個要素。
3.物流信息管理識別中主要的采集技術
物流信息管理系統(tǒng)主要是將各個環(huán)節(jié)的物流信息聯(lián)合到一起,表現(xiàn)出了物流管理系統(tǒng)強大的整合能力。(1)條碼技術簡介。這種識別技術主要是被應用在計算機的數(shù)據(jù)的輸入與輸出。具有很多的優(yōu)點:可靠性高、成本低并且采集和輸入輸出的速度非常快。由于這些優(yōu)點的存在,條碼技術目前被廣泛應用在國內外的物流行業(yè)中。條形碼識別技術由于具有非常優(yōu)越的優(yōu)點,準確可靠快速的傳輸,使得它的應用價值非常大。其中條形碼的設備主要分為條形碼的印刷設備和條形碼的掃描設備。(2)RFID識別。射頻識別技術,即RFID技術是一種非接觸式的自動識別的技術。一個標準的射頻識別系統(tǒng)是由三部分構成的:電子標簽、讀寫器和天線。但是由于實際中存在的問題,這種RFID系統(tǒng)好使需要軟硬件之間的良好配合才能完成它的功能。
三、RFID技術簡介
由于射頻的數(shù)據(jù)保密性非常好,所以目前被廣泛地應用在防偽行業(yè)中。RFID的主要優(yōu)點是:具有唯一的UID號碼。
1.RFID系統(tǒng)的組成和特點
一個最基本的RFID系統(tǒng)如圖1所示,一般包括:標簽、閱讀器、天線和數(shù)據(jù)的讀寫系統(tǒng)。
標簽的作用:RFID的電子標簽是由耦合元件組成的。上述每個電子標簽都具有唯一的UID編碼。是標簽唯一識別的標識。讀寫器:讀寫器是電子標簽的讀寫設備。主要控制數(shù)據(jù)的讀寫。天線:主要完成讀寫器和標簽之間射頻信號的傳遞。
如圖1所示,一個完整的RFID系統(tǒng)還包括一個中心處理的電腦和應用軟件系統(tǒng)。這個系統(tǒng)主要是將讀寫器上的信息和數(shù)據(jù)傳遞到電腦上的數(shù)據(jù)處理中心進行處理和應用。這也是RFID技術的基本原理。
2.RFID組成部分簡介
(1)電子標簽。RFID系統(tǒng)中的電子標簽是整個系統(tǒng)的數(shù)據(jù)的載體。通常情況下,一個完整的電子標簽主要是由標簽元件和天線組成。電子標簽與條形碼不同的是電子標簽可以自動地把自身存儲的信息發(fā)送出去,它是可編程的,可以適當?shù)馗膶懢幊痰某绦騺頋M足不同情況下的電子標簽的需求。(2)讀寫器。在RFID系統(tǒng)中,負責數(shù)據(jù)的讀寫的設備主要是讀寫器設備。讀寫器的功能非常強大,通常在系統(tǒng)中它都是獨立存在的,也就是說讀寫器可以單獨地對數(shù)據(jù)進行讀寫、處理并且顯示等。(3)數(shù)據(jù)的管理系統(tǒng)。完整的RFID系統(tǒng)除了包括最基本的標簽、天線、閱讀器外,還應該具有一整套完整的數(shù)據(jù)管理系統(tǒng)。數(shù)據(jù)管理系統(tǒng)的主要功能是完成數(shù)據(jù)信息的處理和存儲共享。
3.RFID技術的優(yōu)點
RFID技術的出現(xiàn),使人們認為RFID技術是條形碼的高級形式,但是這種說法是沒有什么理論依據(jù)的。RFID作為一種新型的非接觸式自動識別技術,它在很多方面都優(yōu)于條形碼技術。RFID技術的優(yōu)點很明顯,它不需要光源,并且更加安全。
4.RFID技術目前面臨的問題
RFID技術是一種新型的識別技術,它與條形碼識別技術相比,發(fā)展的歷史比較短。所以技術還不是很成熟,目前還存在著許多發(fā)展的問題。
四、物流管理系統(tǒng)的需求分析
1.RFID技術的主要應用
隨著信息技術的發(fā)展,RFID技術也有一定的發(fā)展,被應用在許多不同的領域,最主要的應用范圍包括:零售、倉儲、生產(chǎn)和運輸行業(yè)。
2.目前物流公司的現(xiàn)狀
經(jīng)濟需求的不斷增長,市面上有越來越多的物流公司來滿足人們對物流的需求。但是很多物流公司的規(guī)模都比較小,存在著一些缺點。
3.需求問題的解決
目前的物流企業(yè)的規(guī)模比較小,標準和網(wǎng)絡化都不完善,存在著各種各樣的問題。針對這些問題,我們對物流公司有了新的需求問題的解決方案。每個公司都可以發(fā)揮它的長處取長補短,互相幫助贏取共同的利益。這種集中管理和共享的方式不僅可以幫助物流公司來提高他們的運輸速度,而且還大大地降低了物流中貨物運輸?shù)某杀荆瑴p少了不必要的浪費,有助于管理者的經(jīng)營。
4.RFID系統(tǒng)結構的選擇
本文主要用到的數(shù)據(jù)庫是SQL。采用的主要構架是B/S模式。下面分別對這兩種技術進行簡單的介紹。(1)SQL簡介。SQL(Structured Query Language), 它的意思是結構化查詢的語言。SQL這種語言最主要的功能是它可以很好地與各個數(shù)據(jù)庫建立相應的聯(lián)系并且可以進行很好的溝通。(2)瀏覽器/服務器(B/S)構架。目前來說管理信息系統(tǒng)主要的構架類型主要包括:主機/終端型、客戶機/服務器即所謂的C/S模式、文件/服務型、三層的B/S和多層分布的形式。
這種技術是www技術和數(shù)據(jù)庫技術相結合的結果,是未來數(shù)據(jù)庫發(fā)展的主要方向。
B/S模式的主要結構如圖2所示:
5.系統(tǒng)成本的分析
我們知道RFID系統(tǒng)主要是由標簽、天線和閱讀器構成的,所以它的主要硬件成本也是由這三部分構成,這主要是從RFID系統(tǒng)的市場需求來看的。對于物流管理行業(yè)來說,這三部分也是主要的硬件投資方式。雖然目前RFID系統(tǒng)的成本略高,但是它帶給我們的優(yōu)點遠遠勝過了糨的這個不足。
五、系統(tǒng)的總體設計研究
1.基于RFID的物流管理系統(tǒng)的總體目標
物流信息系統(tǒng)主要解決的問題是:(1) 縮短從接受訂貨到發(fā)貨的時間;(2) 庫存適量化(壓縮庫存并防止脫銷);(3)提高搬運作業(yè)效率;(4)提高運輸效率;(5)使接受訂貨和發(fā)出訂貨更為省力;(6)提高接受訂貨和發(fā)出訂貨精度;(7)防止發(fā)貨配送出現(xiàn)差錯;(8)調整需求和供給回答信息咨詢等。一個好的完善的物流信息管理系統(tǒng)會很好的解決上述的問題。我們最終的目的都是為了提高服務水平并且降低物流運輸?shù)目偝杀尽?/p>
2.系統(tǒng)硬件產(chǎn)品介紹
本系統(tǒng)設計的是一個基于RFID硬件產(chǎn)品已有的物流管理系統(tǒng),所以首先對RFID不同用途的讀寫設備和它們的應用場合作了一下簡單的介紹,例如,下面這款電子標簽:
本系統(tǒng)選用的電子標簽是TI2048,這款電子標簽是TI公司新出的一款粘貼式的電子標簽。如圖3所示:
3.流程分析
(1)物流公司工作的流程分析。每個服務行業(yè)的宗旨都是客戶至上。對于物流公司來說,也是這樣。物流公司的終極目的就是讓客戶的郵件及時準確并且完整地到達目的地,而且要確保郵件在終點是有顧客簽收的。圖4所示的是一個顧客返送郵件到收件人的全過程。
4.軟件平臺和功能設計
Java EE開發(fā)平臺目前被廣泛應用在各種各樣的信息化平臺的開發(fā)中。在目前實際應用的Java EE開發(fā)平臺中,它主要由兩部分構成:第一種是以Spring, Hibernate兩個框架為基礎核心來構建的,這種類型的應用一般都不要應用服務器的支持,一般在Jetty,Tomcat等Web服務器上就可以很好的運行,這類Java EE應用被稱為輕量級的Java EE應用;另一種類型的Java EE則以EJB3. 0為核心來構建,這種類型的應用需要EJB容器支持,一般情況是需要在JBoss,WebLogic,WebSphere服務器中來運行,這類Java EE應用是sun公司官方推薦的Java EE平臺,所以它一般情況下稱為重量級的Java EE應用。
5.RFID物流管理系統(tǒng)的設計原則
首先,要確保系統(tǒng)具有一定的先進性。這里所說的先進性主要指的是RFID技術所特有的優(yōu)點。包括它硬件和軟件上的優(yōu)點。利用這些優(yōu)點可以提高物流管理系統(tǒng)的運行質量。其次,是RFID系統(tǒng)的安全性和可靠性。這里指的是要確保寄件人寄出郵件信息的安全性。郵件屬于寄件人、客戶的財產(chǎn),保證客戶財產(chǎn)的安全,是物流公司的首要職責。所以安全性和可靠性是很重要的。如果公司沒有對安全性和可靠性做出一定的保護,那么出現(xiàn)問題后不僅是客戶的財產(chǎn)丟失,更大的損失是物流公司,公司失去了在客戶心中的信譽。這種損失有時是無法彌補的。最后是系統(tǒng)通用性和擴展性的設計。通用性和擴展性是各個環(huán)節(jié)的樞紐,相當于是系統(tǒng)之間的接口。如果企業(yè)之間的系統(tǒng)不具通用性,合作起來就會有很多的問題。所以通用性的提高,可以加強企業(yè)和企業(yè)之間的合作和溝通關系。
6.系統(tǒng)模塊設計
本設計中的管理系統(tǒng)軟件主要由8個模塊構成:系統(tǒng)的設置模塊、運單的管理模塊、專線管理模塊、車輛的管理模塊、辦公環(huán)境管理模塊、報價管理模塊、客戶資料管理模塊、射頻卡片管理模塊。
六、總結與展望
1.總結。本文設計是基于RFID技術的物流信息管理系統(tǒng)。硬件設備包括電子標簽和閱讀器設備。軟件部分主要是由web服務器和基于Java EE 和SQL Server軟件平臺來實現(xiàn)的管理系統(tǒng)。本系統(tǒng)的最大的創(chuàng)新點是:將RFID技術與物流管理系統(tǒng)相結合。這個創(chuàng)意的最大優(yōu)點是增強了企業(yè)和企業(yè)之間的合作關系,確保貨物運輸過程中的準確性和安全性,降低了物流行業(yè)的運輸和管理成本,不僅給客戶提供了良好的服務,而且還在很大程度上提高了物流行業(yè)的經(jīng)濟效益。
2.展望。目前中國的RFID技術還處于剛剛起步的狀態(tài),RFID技術的應用還不夠完善, RFID技術的物流管理系統(tǒng)的成本較高,造成了RFID技術物流管理系統(tǒng)普及的困難。條形碼技術還會在很長一段時間內占據(jù)著識別技術的主要市場份額。但是RFID技術作為一項新技術,具有巨大的發(fā)展空間和非常廣闊的前景。由于時間和實驗的條件有限,本文的設計還存在著很多不足的地方,還有很多物流管理系統(tǒng)的方面沒有涉及到,需要在今后對此系統(tǒng)進行不斷的完善。主要包括:
一是可以將GPS模塊應用導系統(tǒng)中。GPS目前已經(jīng)在很多國家中被使用,但在中國還是很少使用的。利用GPS的定位系統(tǒng),我們可以對丟失的郵件進行定位,然后搜查。這樣可以大大的減少不必要的損失,提高系統(tǒng)的安全性。
二是物流管理手機平臺的應用。隨著技術的發(fā)展,目前有很多系統(tǒng)都支持手機平臺。時代的需求,人人都有手機,手機成了必備品,所以把物流管理系統(tǒng)應用在手機平臺,這樣方便客戶對物流行業(yè)運輸?shù)男枨?。提高了管理和查詢的效率?/p>
三是RFID技術在郵件分揀中的應用。RFID是一種非接觸式的自動識別技術。所以我們可以利用這個優(yōu)點來對郵件進行快速的分揀。這樣,手持分揀設備,就可以對郵件進行識別和信息的顯示。
參考文獻:
[1] K. Finkenzeller. RFID Handbook: Radio-Frequency Identification
Fundamentals and Applications.John Wiley & Sons,2000.
[2] EPCglobal Tag Data Standards Version 1.3.1,E.P.Cglobal Inc,2006.
[3] Twist,David C.The impact of radio frequency identification on supply
chain facilities.Journal of Facilities Management,2005,(3):226-239.
[4] 李進東,范琴秀.射頻識別技術的發(fā)展與應用[J].科技信息:學
術版,2006,(1):46-47.
2011年,大眾報業(yè)集團確立了“《大眾日報》歷史報數(shù)字化項目”,并成立了專門的項目組具體負責實施,圍繞集團歷史報刊數(shù)字化的相關問題進行了一系列調研。本文對歷史報刊數(shù)字化的最新技術進行了研究和探討,主要內容包括紙質報刊及膠片掃描、OCR識別和校對、元數(shù)據(jù)抽取與標引、PDF構建技術等方面。
歷史報刊數(shù)字化流程概述
歷史報刊數(shù)字化技術與最近十多年普通的報刊數(shù)字化技術不盡相同。自從報業(yè)實現(xiàn)數(shù)字化工作流程以來,報紙的采編發(fā)排都采用計算機技術,其信息已經(jīng)實現(xiàn)了數(shù)字化,而歷史報刊由于早期使用鉛字印刷或者石印、油印等,沒有對應的數(shù)字信息,因此需要通過相應的技術手段將紙質信息數(shù)字化提取到計算機當中。
歷史報刊特別是早期報紙是歷史文檔的重要資料,雖然人們對報紙的格式十分熟悉和認可,但從數(shù)字化處理的角度來看,報紙的格式是相當復雜的:文章長短不一,早期報紙有豎排版面、繁體字等,字體也不是當代的標準化字庫里的字體,有照片圖表,長篇的文字分布在不同的版面或頁面中。另外,早期報紙的印刷質量和紙張質量不是很好,隨著時間推移,有的字體可能會模糊,紙質會變得非常脆、易碎,難于處理,還有一些報紙只能在縮微膠片上找到。所有這些因素都使歷史報刊的數(shù)字化面臨很多困難,需要進行一些特殊處理。
目前,歷史報刊數(shù)字化有比較標準的制作流程和技術工藝,不同的廠商可能會有自己的特點,不過制作流程一般會包括以下幾個步驟:
1.報刊的清點。按照日期、版面清點數(shù)量,確認其完整性、可識別性、可掃描性。由于報刊一般都有一定的發(fā)行量,不止一個復本,應盡可能尋找最佳的一份,如果現(xiàn)實中找不到可用的報刊實體,可以用縮微膠片替代。
2.掃描和修圖。利用大幅面掃描儀掃描紙質報刊,用膠片掃描儀掃描縮微膠片。對掃描得到的TIF圖片進行修正,去除污漬、裂紋等。
3.OCR文字識別與校對。OCR(光學字符識別)是一種通過計算機自動識別圖片上文字的技術,標準印刷漢字的OCR識別正確率可達到99%以上。由于早期報刊印刷技術簡單和保存環(huán)境的原因,識別率可能稍低一些,需要進行多次校對以保證最終的質量。校對包括人工校對和智能化自動校對。
4.版面分析和劃分。將修正后的版面掃描圖片按照主題文章進行區(qū)域劃分和標識。
5.制作版式文件。根據(jù)步驟2、3、4得到的信息制作可檢索的數(shù)字版式文件,比如PDF等。
6.數(shù)字數(shù)據(jù)驗收。對上述步驟得到的文字、圖片、版式文件等數(shù)字數(shù)據(jù)進行再檢驗,以確保完整性和正確性。
7.數(shù)據(jù)入庫。文字入全文數(shù)據(jù)庫,圖片入圖片數(shù)據(jù)庫,版式文件入版面數(shù)據(jù)庫,三種數(shù)據(jù)庫是相關聯(lián)的,可以聯(lián)合檢索。
8.建立雙平臺檢索系統(tǒng)。一般采用B/S架構,用戶通過瀏覽器即可檢索上述三種數(shù)據(jù)庫。
經(jīng)過上述步驟的處理加工后,最終的產(chǎn)品是一個完整的系統(tǒng),其中包括:包含全部報刊文字和元數(shù)據(jù)的全文數(shù)據(jù)庫、包含報紙照片和版面掃描圖片的圖片、可檢索的PDF版式文件、基于B/S架構的雙平臺檢索系統(tǒng)等。此外,為了支持高質量的再印刷,也包括修正后的版面掃描TIF圖片。
歷史報刊數(shù)字化關鍵技術研究
歷史報刊數(shù)字化的關鍵技術包括:
1.圖像獲?。褐饕ㄟ^掃描,包括紙質掃描和膠片掃描等。
2.OCR文字識別與校對、版面分析和劃分等:將修正后的版面掃描圖片按照主題文章進行區(qū)域劃分,目前有自動識別主題文章區(qū)域的技術。
3.元數(shù)據(jù)抽取和分類標引:文章的元數(shù)據(jù)抽取包括對文章主題、副題、引題、作者、來源、關鍵詞、摘要、引文、外部特征等信息的自動識別和自動抽?。环謽艘愂前凑諊倚侣剺藴史诸惙▽ξ恼逻M行分類標識。
4.全文數(shù)據(jù)庫和圖片數(shù)據(jù)庫:全文數(shù)據(jù)庫是實現(xiàn)全文檢索的數(shù)據(jù)庫系統(tǒng),為按關鍵字檢索整篇文章帶來很大便利;圖片數(shù)據(jù)庫一般按照文件存儲、按照標引檢索。
5.數(shù)字版式文件的制作、檢索技術:制作數(shù)字化版式文件是為了能夠展現(xiàn)歷史報刊的原始風貌,使讀者能直觀地感受到是在閱讀一份早期的報刊,更具有視覺震撼力。目前報刊的數(shù)字版式文件一般采用Adobe的PDF格式,根據(jù)掃描圖像制作成可檢索PDF一般采用雙層和重構技術。
下面進行更詳細的闡述。
1.掃描技術
掃描是歷史報刊數(shù)字化制作流程中的關鍵,因為后續(xù)工作完全基于掃描后得到的TIF圖片,其掃描質量、分辨率的選擇、所使用的設備和參數(shù)設定都對后期制作有重要影響。特別是分辨率的選擇,需要考慮到當代印刷術和近代的印刷術,當代彩色報刊的印刷一般要求彩色圖片在200~300dpi即可,既不宜過低也不宜過高,而近代的印刷主要是以鉛印、油印等為主,歷史報刊的掃描精度一般采用300~600dpi,其目的是為了保存更多的細節(jié),更具參考和研究價值。掃描精度越高,所得到掃描圖片的容量也越大,因此,在選擇掃描精度的時候也需要考慮硬件方面的存儲容量。
由于報刊在印刷時是靠細小點陣來顯示圖像,并不是連續(xù)的色彩,高精度掃描會掃描出網(wǎng)狀條紋,這種情況可能會降低OCR軟件的處理速度?,F(xiàn)在許多掃描儀有去除網(wǎng)紋的功能,可以解決此類問題。對于沒有去除網(wǎng)紋功能的掃描儀,如對圖像要求不高的話,可用降低掃描分辨率的辦法。因此,如果考慮到下一步的文字識別率, 5號以上字體使用300dpi掃描,6號、7號字體使用400~600dpi掃描。綜合考慮上述因素,可以統(tǒng)一使用400dpi左右的掃描精度。
紙質報紙和縮微膠片掃描所使用的設備和參數(shù)設定也有所差別,紙質報紙一般使用大幅面的快速掃描設備,而縮微膠片掃描儀在掃描前需要進行預先光學處理,目的是為了達到和紙質掃描相同的分辨率。
OCR技術原理是對光學儀器產(chǎn)生的影像(比如掃描圖片)進行處理,消除一些影響識別的可忽略因素(自動或者手工),將影像進行區(qū)域分割,使之成為可以獨立識別的單元,然后從這些影響單元中提取形態(tài)特征,再與標準特征庫中的數(shù)據(jù)進行對比,根據(jù)對比的結果決定該單元的識別結果。由于不確定因素較多,比如掃描設備的質量、掃描資料的質量、掃描精度、識別軟件、學習和測試樣本等都會影響到識別的準確率。
文字識別之前的影像預處理是該過程中需要處理問題最多的階段,其中包括影像的正規(guī)化、除噪聲、圖像矯正、圖文分析、文字行與字分離等步驟。舉例說明,對于歷史報刊而言,如果其掃描圖片出現(xiàn)傾斜,超出計算機自動識別的誤差范圍,就需要就行圖像旋轉矯正;如果原始報刊本身由于存放時間過長,出現(xiàn)污點裂痕較多,影響到正常文字的識別,那么就需要將掃描圖片上的這些污點裂痕去除、背景化;此外,早期報紙有豎排版,在行、字分離上需要進行特殊處理。
從識別技術的難度角度來看,印刷體識別相對要容易、正確率更高一些,因此對于歷史報刊而言,只要預處理做得比較完善,其自動識別不會產(chǎn)生過多的錯誤。為了保證更高的文字正確率(比如差錯率在萬分之一以下),需要進行校對。校對包括軟件自動校對和人工校對,自動校對是根據(jù)自然語言處理技術對識別出的文字語句的正確性進行判斷和標注,然后進行糾錯;人工校對是完全依賴校對員的判斷。OCR的校對一般都是結合自動和人工兩種方式進行反復多遍的排查糾錯。
3.元數(shù)據(jù)抽取和標引技術
在建立全文數(shù)據(jù)庫、圖片數(shù)據(jù)庫和版式文件數(shù)據(jù)庫之前,需要對文章進行元數(shù)據(jù)抽取和標引,其目的是從多角度對文章、圖片和版面文件進行標注說明,以完善檢索系統(tǒng)。文章的元數(shù)據(jù)主要包括題名信息、作者信息、來源信息、關鍵詞信息、摘要信息、引文信息、外部特征信息等。對于報刊而言,題名信息、作者信息、來源信息一般都在版面上明確標出,在OCR識別的版面區(qū)域劃分過程中獲得相應的信息;而對于其他元數(shù)據(jù),比如關鍵詞信息、摘要信息、引文信息等,因為沒有明確標出,需要從報刊正文中提取,由于歷史報刊數(shù)字化需要在短時間內處理海量的報刊文章,依靠人工無法完成,所以必須要進行元數(shù)據(jù)的自動抽取,需要結合自然語言處理、機器學習等技術。
在文本中抽取元數(shù)據(jù)標引,可分為全關鍵詞標引和主關鍵詞標引。自動標引過程與人工標引過程相似,其特點是標引速度快,標引的前后一致性好,在隨機存儲介質容量允許、軟件檢索功能具備的情況下,可以實現(xiàn)文摘、甚至全文的無人工標引自動檢索。目前自動標引系統(tǒng)抽出的表述文獻主題的主關鍵詞準確性較差,還不能完全代替人工標引。
4.版式文件制作技術
版式文件是一種具有版權保護、加密、防止非法復制、防止屏幕拷貝、能夠全面展示版面多媒體內容和樣式、并且能夠精確輸出到打印設備的文件格式,目前比較流行的版式文件是Adobe公司的PDF,國內北大方正采用了CEB,另外還有epub等。報刊的版式文件一般采用PDF格式。
制作版式文件是歷史報刊數(shù)字化的一項重要工作,其意義有以下幾個方面:(1)首先通過版式文件能夠直觀地展示歷史報刊的外觀,包括版面布局、文字樣式和圖片等。(2)支持版面檢索,在雙平臺檢索平臺通過關鍵字檢索就能找到包含關鍵字的版面。(3)支持再印刷,矢量字體的版式文件能夠進行更大幅面的印刷輸出,不會有字體的變形。(4)標準化的文件格式便于存儲和交換。
目前歷史報刊數(shù)字化的PDF版式文件制作有兩種技術:雙層和重構。對于前期歷史報刊而言,因為沒有對應的電子版面文件,所以需要制作雙層或者重構PDF。制作雙層PDF的重點在于掃描圖片處理成合適清晰度的壓縮圖片用于雙層PDF的上層圖片層,并將文本按照原始版面結構重排并與圖片層對應,形成隱藏的下層文字層;重構PDF則是利用圖片和文本數(shù)據(jù)按照原始版面結構進行整版的圖文混合重排,是單層結構。這兩種PDF的主要區(qū)別有以下幾方面:
(1)在PDF文件結構方面:雙層PDF,顧名思義,該PDF邏輯上具有兩層(一層純圖片層、一層純文本層),上層是用于瀏覽的可視圖片層(為了避免文件體積過大,該圖片層一般使用高清掃描圖片的壓縮格式),能夠瀏覽版面掃描原貌;下層是用于文字檢索的隱藏文本層(瀏覽時不可見),文本層中的文字就是版式圖片經(jīng)OCR識別校正后的文本,它與上層圖片層版式圖片中的文字是一一對應的,一個是圖片化文字、一個是文本化的文字。這樣形成的雙層PDF既可以100%保留原始版面效果,又可以通過下層的文字信息支持選擇、復制、文字檢索等功能。重構PDF,是當代流行的單層圖文混排結構。
(2)在PDF版式重排方面:對于歷史報刊而言,雙層和重構PDF都要進行相應的版面重排,但是雙層PDF僅對其文字層的文字按照原始版面位置進行重排和對應;而重構PDF則要按照當今的圖文混排方式重現(xiàn)原始版面的樣貌,所以制作方面工作量要大一些。對于組版出版數(shù)字化之后的近期歷史報刊而言,由于已經(jīng)存在可印刷的數(shù)字PS版面文件和對應的數(shù)字矢量字庫,而且這些PS版面文件可以精確地批量生成當今流行的圖文混排的PDF版,不必再進行版面重排,就沒有制作雙層或者重構PDF之說了。
(3)在視覺瀏覽方面:雙層PDF是100%保留掃描版面視覺效果,但受圖片層的精度所限,其中的文字縮至較小時會產(chǎn)生字體變形,而放大到一定程度字體會產(chǎn)生馬賽克模糊;重構PDF中的文字是矢量字體,可對字體進行任意縮放,保持字體邊緣依然光滑,字體色素不會丟失,因此不會變形和模糊。但是,重構PDF中的文字字體可能與原始字體有所差別。特別是早期鉛字或者油印的報刊,由于沒有對應的數(shù)字矢量字庫,所以無法100%保留原始效果。但數(shù)字化以后的歷史版面,就不存在這個問題。
(4)在用于印刷方面:同視覺瀏覽方面相類似,雙層PDF是100%保留掃描版面視覺效果(原汁原味),但受圖片層的精度所限,不能進行大幅的放大印刷,字體會產(chǎn)生馬賽克模糊。對此可以直接使用修正后的高清TIF掃描圖片進行大幅面的印刷。重構PDF支持任意放大的印刷,字體邊緣光滑清晰,不會產(chǎn)生變形和模糊,印刷質量好于雙層PDF。
(5)在版式文字檢索和定位方面:雙層和重構PDF都支持版面文字檢索和定位,在檢索速度上,雙層的速度慢于重構,因為雙層PDF的文件較大。
(6)在存儲容量方面:重構PDF文件的存儲容量比雙層PDF文件小得多,一般是其1/4至1/6左右。因此重構PDF文件的打開和網(wǎng)絡傳輸都要比雙層PDF快,更適合于網(wǎng)絡瀏覽。
(7)在文字差錯率方面:理論上,歷史報刊數(shù)字化的文字差錯率和PDF采用雙層和重構并無關系,差錯率只和OCR識別準確率和人工校正等有關。在這方面,雙層和重構的差別在于:對于雙層PDF來說,即使文字層有錯字,由于其本身是隱藏的(上層是可視圖片),也不會被看見,但會在文本檢索和復制過程中體現(xiàn)出來;對于重構PDF來說,文字如果有錯誤,則直接能看到。出錯率的產(chǎn)生,很大程度上取決于原始掃描圖的修正、文字識別準確率、校改人員的責任心、新聞常識、歷史經(jīng)驗和承接公司的項目管理經(jīng)驗等。
(8)在渠道方面:雙層PDF適合在本地電腦和局域網(wǎng)上瀏覽,重構PDF除本地電腦和局域網(wǎng)上之外,也適合在互聯(lián)網(wǎng)上、手機、平板電腦、戶外大屏上瀏覽。
(9)在專輯出品方面:這兩種技術都能夠滿足個性化專輯出品的需求。
(10)費用方面:由于重構PDF的制作工作量相對大一些,所以制作重構PDF的費用比雙層PDF高15%~20%左右。
總的來說,實施歷史報刊數(shù)字化項目,如果僅從保護、存檔的角度考慮,那么掃描歷史報版面建立圖片數(shù)據(jù)庫,進而進行文字識別、校正、標引、入庫、建立全文數(shù)據(jù)庫和檢索網(wǎng)站即可;如果進一步從滿足版式檢索和PDF瀏覽功能考慮,可采用雙層PDF技術;如果考慮未來媒體終端的應用(例如蘋果的iPhone手機、iPad平板電腦)、開發(fā)更多的衍生產(chǎn)品,那么可采用重構PDF的技術方案。
總 結
國內從事這一領域的廠商采用不同的解決方案。在選擇解決方案的時候,首先要以保證質量為最基礎的條件,然后再考慮技術方案、價格、知識產(chǎn)權保護、再開發(fā)再利用等因素。歷史報刊數(shù)字化是一項尊重歷史、保護歷史資料、挖掘資料價值的工程,讓塵封的珍貴報刊通過現(xiàn)代信息技術以一種嶄新的面貌呈現(xiàn)在讀者面前,體現(xiàn)了社會責任和文化創(chuàng)新精神,保護與開發(fā)并存,讓歷史報刊重新面對公眾,為了解和研究中國近現(xiàn)代新聞發(fā)展歷史提供豐富的信息源泉。
中圖分類號:TP393.08 文獻標識碼:A 文章編號:1009-914X(2016)01-0280-01
1.引言
1.1 研究背景及意義
射頻識別技術,即RFID技術,是一種非接觸式自動識別技術,它利用射頻信號和空間耦合傳輸特性對被識別物品自動檢測,相比于其他識別技術,射頻識別技術讀寫速度快,操作簡單,可重復使用,體積小等特點。
基于射頻識別的物品管理是利用電子標簽與RFID讀寫器構成,RFID讀寫器讀取電子標簽中場頻電子碼并將信息傳輸至后臺終端進行處理。電子標簽儲存物品電子代碼并將其粘貼在物品上。RFID讀寫器與電腦相連用于讀取標簽中的信息,電子標簽與RFID讀寫器之間利用利用無線方式進行信息交換,是物聯(lián)網(wǎng)中的重要主要組成部分。
1.2 本設計的目的
通過射頻識別技術以及單片機設計一套物品管理系統(tǒng),該系統(tǒng)通過并行串口與電腦連接起來實現(xiàn)射頻識別模塊對物品的管理。通過本設計可以幫助我們了解射頻識別技術,物聯(lián)網(wǎng)的相關知識,培養(yǎng)物聯(lián)網(wǎng)系統(tǒng)研發(fā)與設計能力。
2.系統(tǒng)硬件部分
硬件電路包括:
(1)射頻識別模塊:用于接收卡片信息,模塊頻率為13.56MHz
(2)串行外設接口:用于接收射頻識別模塊中的信號進而單片機進行分析解碼操作
(3)單片機90C51:用于控制FM1702并進行數(shù)據(jù)的處理
(4)UART單片機通信接口:該端口為單片機與電腦連接的橋梁,波特率為9600bps
3.系統(tǒng)結構與系統(tǒng)軟件
3.1 系統(tǒng)結構
系統(tǒng)實現(xiàn)功能是利用90c51實現(xiàn)FM1702模塊與電腦的通信,通過串行外設接口實現(xiàn)兩個模塊之間的通信,UART單片機接口實現(xiàn)單片機與電腦的通信,實現(xiàn)物品的管理。
系統(tǒng)框圖如圖2所示。
3.2 軟件流程圖
下位機軟件流程圖如圖3所示。
此流程圖實現(xiàn)射頻識別模塊接收數(shù)據(jù)通過串口傳輸給電腦并且電腦可進行一系列操作的功能。開始運行,首先要進行初始化,初始化各串口中各種變量,然后打開定時器和時鐘中斷進入執(zhí)行循環(huán),接收串口指令,判斷標志位數(shù)值,依次執(zhí)行下去,0為聯(lián)機命令,1為接收卡片序列號,2為選擇功能,3為寫卡,4為讀卡,如有錯誤或執(zhí)行結束便返回A處重新執(zhí)行。
4 總結
隨著經(jīng)濟的發(fā)展與科技的進步,射頻識別技術有著廣闊的發(fā)展空間,不僅在物品管理中發(fā)揮作用,也會在更廣泛的領域體現(xiàn)它的價值,如GPS,生物識別技術,由單一的識別向多功能識別發(fā)展。射頻識別技術一定會在今后的生活中發(fā)揮更大的作用。
致謝
本論文由2015年北京市大學生科學研究與創(chuàng)業(yè)行動計劃資助。