1 自動識別技術 自動識別技術是以計算機、光、機、電、通信等技術的發展為基礎的一種高度自動化的數據采集技術。它通過應用一定的識別裝置,自動地獲取被識別物體的相關信息,并提供給后臺的處理系統來完成相關后續處理的一種技術。它能夠幫助人們快速而又準確地進行海量數據的自動采集和輸入,目前在運輸、倉儲、配送等方面已得到廣泛的應用。自動識別技術在20 世紀70 年代初步形成規模,經過近30年的發展,自動識別技術已經發展成為由條碼識別技術、智能卡識別技術、光字符識別技術、射頻識別技術、生物識別技術等組成的綜合技術,并正在向集成應用的方向發展。
條碼識別技術是目前使用最廣泛的自動識別技術,它是利用光電掃描設備識讀條碼符號,從而實現信息自動錄入。條碼是由一組按特定規則排列的條、空及對應字符組成的表示一定信息的符號。不同的碼制,條碼符號的組成規則不同。目前,較常使用的碼制有: EAN/ UPC 條碼、128 條碼、ITF - 14 條碼、交插二五條碼、三九條碼、庫德巴條碼等。
射頻識別(RFID) 技術是近幾年發展起來的現代自動識別技術,它是利用感應、無線電波或微波技術的讀寫器設備對射頻標簽進行非接觸式識讀,達到對數據自動采集的目的。它可以識別高速運動物體,也可以同時識讀多個對象,具有抗惡劣環境、保密性強等特點。
生物識別技術是利用人類自身生理或行為特征進行身份認定的一種技術。生物特征包括手形、指紋、臉形、虹膜、視網膜、脈搏、耳廓等,行為特征包括簽字、聲音等。由于人體特征具有不可復制的特性,這一技術的安全性較傳統意義上的身份驗證機制有很大的提高。目前,人們已經發展了虹膜識別技術、視網膜識別技術、面部識別技術、簽名識別技術、聲音識別技術、指紋識別技術等六種生物識別技術。
2 數據倉庫和數據挖掘技術 數據倉庫出現在20 世紀80 年代中期,它是一個面向主題的、集成的、非易失的、時變的數據集合,數據倉庫的目標是把來源不同的、結構相異的數據經加工后在數據倉庫中存儲、提取和維護,它支持全面的、大量的復雜數據的分析處理和高層次的決策支持。數據倉庫使用戶擁有任意提取數據的自由,而不干擾業務數據庫的正常運行。
數據挖掘是從大量的、不完全的、有噪聲的、模糊的及隨機的實際應用數據中, 挖掘出隱含的、未知的、對決策有潛在價值的知識和規則的過程。一般分為描述型數據挖掘和預測型數據挖掘兩種。描述型數據挖掘包括數據總結、聚類及關聯分析等,預測型數據挖掘包括分類、回歸及時間序列分析等。其目的是通過對數據的統計、分析、綜合、歸納和推理, 揭示事件間的相互關系,預測未來的發展趨勢,為企業的決策者提供決策依據。
3 人工智能技術 人工智能就是探索研究用各種機器模擬人類智能的途徑,使人類的智能得以物化與延伸的一門學科。它借鑒仿生學思想,用數學語言抽象描述知識,用以模仿生物體系和人類的智能機制,目前主要的方法有神經網絡、進化計算和粒度計算三種。
3. 1 神經網絡。神經網絡是在生物神經網絡研究的基礎上模擬人類的形象直覺思維,根據生物神經元和神經網絡的特點,通過簡化、歸納,提煉總結出來的一類并行處理網絡。神經網絡的主要功能主要有聯想記憶、分類聚類和優化計算等。雖然神經網絡具有結構復雜、可解釋性差、訓練時間長等缺點,但由于其對噪聲數據的高承受能力和低錯誤率的優點,以及各種網絡訓練算法如網絡剪枝算法和規則提取算法的不斷提出與完善,使得神經網絡在數據挖掘中的應用越來越為廣大使用者所青睞。
3. 2 進化計算。進化計算是模擬生物進化理論而發展起來的一種通用的問題求解的方法。因為它來源于自然界的生物進化,所以它具有自然界生物所共有的極強的適應性特點,這使得它能夠解決那些難以用傳統方法來解決的復雜問題。它采用了多點并行搜索的方式,通過選擇、交叉和變異等進化操作,反復疊代,在個體的適應度值的指導下,使得每代進化的結果都優于上一代,如此逐代進化,直至產生全局最優解或全局近優解。其中最具代表性的就是遺傳算法,它是基于自然界的生物遺傳進化機理而演化出來的一種自適應優化算法。
3. 3 粒度計算。早在1990 年,我國著名學者張鈸和張鈴就進行了關于粒度問題的討論,并指出“人類智能的一個公認的特點,就是人們能從極不相同的粒度(granulari2ty) 上觀察和分析同一問題。人們不僅能在不同粒度的世界上進行問題的求解,而且能夠很快地從一個粒度世界跳到另一個粒度世界,往返自如,毫無困難。這種處理不同粒度世界的能力,正是人類問題求解的強有力的表現”.隨后,Zadeh 討論模糊信息粒度理論時,提出人類認知的三個主要概念,即粒度(包括將全體分解為部分) 、組織(包括從部分集成全體) 和因果(包括因果的關聯) ,并進一步提出了粒度計算。他認為,粒度計算是一把大傘,它覆蓋了所有有關粒度的理論、方法論、技術和工具的研究。目前主要有模糊集理論、粗糙集理論和商空間理論三種。