人工智能利弊論文(2)
人工智能利弊論文篇二
一、引言
隨著計(jì)算機(jī)應(yīng)用范圍不斷的拓寬,我們對于計(jì)算機(jī)具有更加有效的感知“能力”,諸如對聲音、文字、圖像、溫度以及震動等外界信息,這樣就可以依靠計(jì)算機(jī)來對人類的生存環(huán)境進(jìn)行數(shù)字化改造。但是從一般的意義上來講,當(dāng)前的計(jì)算機(jī)都無法直接感知這些信息,而只能通過人在鍵盤、鼠標(biāo)等外設(shè)上的操作才能感知外部信息。雖然攝像儀、圖文掃描儀和話筒等相關(guān)設(shè)備已經(jīng)部分的解決了非電信號的轉(zhuǎn)換問題,但是仍然存在著識別技術(shù)不高,不能確保計(jì)算機(jī)真正的感知所采錄的究竟是什么信息。這直接使得計(jì)算機(jī)對外部世界的感知能力低下,成為計(jì)算機(jī)應(yīng)用發(fā)展的瓶頸。這時(shí),能夠提高計(jì)算機(jī)外部感知能力的學(xué)科——模式識別應(yīng)運(yùn)而生,并得到了快速的發(fā)展。
人工智能中所提到的模式識別是指采用計(jì)算機(jī)來代替人類或者是幫助人類來感知外部信息,可以說是一種對人類感知能力的一種仿真模擬。它探討的是計(jì)算機(jī)模式識別系統(tǒng)的建立,通過計(jì)算機(jī)系統(tǒng)來模擬人類感官對外界信息的識別和感知。
二、人工智能和模式識別
(一)人工智能。人工智能(Artificial Intelligence),是相對與人的自然智能而言的,它是指采用人工的方法及技術(shù),對人工智能進(jìn)行模仿、延伸及擴(kuò)展,進(jìn)而實(shí)現(xiàn)“機(jī)器思維”式的人工智能。簡而言之,人工智能是一門研究具有智能行為的計(jì)算模型,其最終的目的在于建立一個(gè)具有感知、推理、學(xué)習(xí)和聯(lián)想,甚至是決策能力的計(jì)算機(jī)系統(tǒng),快速的解決一些需要專業(yè)人才能解決的問題。從本質(zhì)上來講,人工智能是一種對人類思維及信息處理過程的模擬和仿真。
(二)模式識別。模式識別,即通過計(jì)算機(jī)采用數(shù)學(xué)的知識和方法來研究模式的自動處理及判讀,實(shí)現(xiàn)人工智能。在這里,我們將周圍的環(huán)境及客體統(tǒng)統(tǒng)都稱之為“模式”,即計(jì)算機(jī)需要對其周圍所有的相關(guān)信息進(jìn)行識別和感知,進(jìn)而進(jìn)行信息的處理。在人工智能開發(fā),即智能機(jī)器開發(fā)過程中的一個(gè)關(guān)鍵環(huán)節(jié),就是采用計(jì)算機(jī)來實(shí)現(xiàn)模式(包括文字、聲音、人物和物體等)的自動識別,其在實(shí)現(xiàn)智能的過程中也給人類對自身智能的認(rèn)識提供了一個(gè)途徑。在模式識別的過程中,信息處理實(shí)際上是機(jī)器對周圍環(huán)境及客體的識別過程,是對人參與智能識別的一個(gè)仿真。相對于人而言,光學(xué)信息及聲學(xué)信息是兩個(gè)重要的信息識別來源和方式,它同時(shí)也是人工智能機(jī)器在模式識別過程中的兩個(gè)重要途徑。在市場上具有代表性的產(chǎn)品有:光學(xué)字符識別系統(tǒng)以及語音識別系統(tǒng)等。
在這里的模式識別,我們可以將之理解成為:根據(jù)識別對象具有特征的觀察值來將其進(jìn)行分類的一個(gè)過程。采用計(jì)算機(jī)來進(jìn)行模式識別,是在上世紀(jì)60年代初發(fā)展起來的一門新興學(xué)科。
三、人工智能在模式識別中的應(yīng)用
(一)數(shù)字識別及語音識別。在數(shù)字識別的過程中,對于手寫體的識別一直是一個(gè)難題,而其又在郵政編碼的識別、銀行業(yè)務(wù)等方面具有較為廣泛的應(yīng)用,但是其字體形式變化較大,導(dǎo)致提高對其的識別率成為了一個(gè)難題,精準(zhǔn)的識別存在著較大的困難。而采用人工智能中的神經(jīng)網(wǎng)絡(luò)技術(shù)后,系統(tǒng)可以利用神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)及快速并行功能來實(shí)現(xiàn)對手寫數(shù)字的快速識別,有力的提高相關(guān)運(yùn)用領(lǐng)域的工作效率。
而語音識別,簡單的將就是能使得計(jì)算機(jī)能聽懂人所說的話,一個(gè)典型的例子就是七國語言(中、日、英、意、韓、法、德)口語自動翻譯系統(tǒng),它可以將人說的話翻譯成為機(jī)器所設(shè)定的目的語言,在整個(gè)過程中不需要翻譯人員的參與。其中的中文部分實(shí)驗(yàn)平臺設(shè)置在中科院自動化所的模式識別國家重點(diǎn)實(shí)
驗(yàn)室中,這標(biāo)志著我國的機(jī)器口語翻譯研究已經(jīng)跨入世界先進(jìn)行列。在這個(gè)系統(tǒng)的功能實(shí)現(xiàn)之后,出國旅行需要預(yù)定旅館、購買機(jī)票、就餐等需要和外國人進(jìn)行對話時(shí),只需要利用電話 網(wǎng)絡(luò)或者是國際互聯(lián)網(wǎng)就能夠順利的和對方進(jìn)行通話,進(jìn)行 語言交流。
(二)人臉立體識別模式。人臉識別的過程主要包括這樣三個(gè)主要的部分:其一,人臉模式庫,即與所采集的實(shí)時(shí)圖像進(jìn)行對比,判斷其是否存在于人臉模式庫當(dāng)中,若存在,則給出每個(gè)人臉的位置和大小等相關(guān)的臉部信息;其二,對面部特征進(jìn)行定位,即對每一個(gè)人臉的主要器官進(jìn)行檢測,包括對其的具體位置和形狀等特征進(jìn)行具體的信息收集,然后將之進(jìn)行歸一化的處理;其三,比對,即根據(jù)所采集到得人臉面部特征來和人臉模式庫中的圖像進(jìn)行對比,之后對該人臉的身份進(jìn)行核實(shí)。
常見的人臉識別技術(shù)大部分可以歸為這樣三個(gè)類型:采用基于幾何特征的方法,基于模板的方法以及基于模型的方 法。其中,基于幾何特征的方法最為常見,它通常需要與其他的算法進(jìn)行結(jié)合之后才能形成比較好的識別效果;而基于模板的方法又能夠分為基于匹配的方法、臉部特征的方法、線性判別分析的方法、神經(jīng)網(wǎng)絡(luò)方法以及奇異值分解方法等;再次,基于模型的方法主要包括基于隱馬爾可夫模型、主動外觀模型和主動形狀模型方法等。
采用人臉識別模式來進(jìn)行身份驗(yàn)證具有明顯的有點(diǎn),諸如:易用性好、準(zhǔn)確度高、隱私性能好、穩(wěn)定性好,且能被大部分的用戶容所接受。人臉二維圖像的識別已經(jīng)基本實(shí)現(xiàn),但是基于三維的立體圖像人臉識別技術(shù)卻處于研發(fā)階段。人臉的二維及三維模型所反映的臉部外部信息是不同的,二維圖像中的灰度值反映的是人臉表面亮度的差異,而三維圖像中添加了深度信息,它能夠表達(dá)臉形的信息數(shù)據(jù),使得臉部的信息量更加豐富,能提高臉部的識別概率。
看了“人工智能利弊論文”的人還看了: