計算機信息檢索技術(shù)的相關(guān)論文(2)
計算機信息檢索技術(shù)的相關(guān)論文
計算機信息檢索技術(shù)的相關(guān)論文篇二
《多媒體數(shù)據(jù)庫檢索技術(shù)初探》
【摘 要】本文介紹了兩種多媒體數(shù)據(jù)庫的查詢方法,分析了基于內(nèi)容的檢索特點和處理過程,闡述了圖象數(shù)據(jù)查詢和檢索的基本過程和相關(guān)技術(shù)。
【關(guān)鍵詞】多媒體 數(shù)據(jù)庫 檢索
多媒體數(shù)據(jù)庫從作為傳統(tǒng)數(shù)據(jù)庫的一種高級應(yīng)用開始,到作為適合多媒體數(shù)據(jù)的數(shù)據(jù)庫管理系統(tǒng),已經(jīng)經(jīng)歷了十來年的研究與發(fā)展。傳統(tǒng)數(shù)據(jù)庫技術(shù)有一個根本的出發(fā)點,就是企圖用一個統(tǒng)一的模式、統(tǒng)一的框架來描述、組織、處理客觀世界所有對象。凡是不滿足這種模式和柜架的對象就加以改造,而在改造過程中又不可避免地丟掉了許多語義信息。但多媒體數(shù)據(jù)類型卻無法處理,也無法改造。研究表面向?qū)ο髷?shù)據(jù)庫是解決多媒體數(shù)據(jù)庫較為科學(xué)的方法和工具,它可以方便靈活地處理圖形、圖像、聲音、文字、動畫等多媒體信息,尤其是具有層次結(jié)構(gòu)的復(fù)雜對象。
一 兩種多媒體數(shù)據(jù)庫查詢方法
多媒體數(shù)據(jù)庫查詢方法分為基于表示和內(nèi)容兩大類?;诒硎镜臋z索目前已相對成熟,并且得到廣泛的應(yīng)用。基于表示形式的檢索與數(shù)據(jù)類型和數(shù)據(jù)結(jié)構(gòu)有關(guān),在進行檢索時,只需對關(guān)鍵字檢索表進行檢索,再根據(jù)關(guān)鍵字檢索表的指針,找到相應(yīng)的數(shù)據(jù)。它的特點是檢索速度快、精確度高。但在實際應(yīng)用中,存在基于內(nèi)容的檢索需求。例如,“查找與相片A面貌相似的人”就要求基于內(nèi)容的檢索,這一類檢索和查詢更加實用,更貼近人的思維和日常需要,是今后檢索的主流,而基于表示的檢索對于這一類檢索要求則無能為力?;趦?nèi)容的檢索是根據(jù)媒體內(nèi)容語義進行檢索的。很明顯,人類語言極其豐富,人與人之間思維方式不同,同樣的,意義會有許多種表示方式,因此,對語義進行精確的分析困難很大,分析出來的結(jié)果不可能很精確。所以,基于內(nèi)容的檢索形式雖然能根據(jù)媒體內(nèi)容語義進行檢索,但是檢索速度很慢、精確度低。
二 基于內(nèi)容檢索的特點
隨著多媒體技術(shù)的普及,人們將大量接觸和處理多媒體信息,但每一種媒體數(shù)據(jù)都存在難以用符號化的方法進行描述的問題,如圖像中的顏色、視頻中的運動、音頻中的音調(diào)等。當用戶需要利用這些信息線索對數(shù)據(jù)進行檢索時,傳統(tǒng)的數(shù)據(jù)庫采用關(guān)鍵詞的檢索方式是不能完成的,為了滿足這種更深層次的檢索即基于內(nèi)容的檢索,就要先了解它的特點:一是從媒體內(nèi)容中提取信息線索;二是提取特征的方法多種多樣;三是人機交互進行基于內(nèi)容的檢索是一種近似匹配。
三 基于內(nèi)容的檢索的體系結(jié)構(gòu)
基于內(nèi)容的檢索作為一種信息檢索技術(shù),如超媒體系統(tǒng)、會議系統(tǒng)、多媒體信息系統(tǒng)等,提供基于多媒體數(shù)據(jù)內(nèi)容的信息查詢和檢索。因此,應(yīng)將基于內(nèi)容的檢索設(shè)計為多媒體數(shù)據(jù)庫的檢索引擎結(jié)構(gòu),在體系結(jié)構(gòu)上劃分為兩個子系統(tǒng):特征提取子系統(tǒng)和查詢子系統(tǒng),如下圖所示。
第一,目標標識。為用戶提供一種工具,以全自動或半自動的方式標識靜態(tài)圖像、視頻鏡頭等媒體區(qū)域,以便針對目標進行特征提取并查詢。
第二,特征提取。對多媒體數(shù)據(jù)進行特征提取,提取用戶感興趣、適合檢索要求的特征。特征提取可以是全局性的(如整幅圖像的視頻鏡頭),也可以是有針對性的(如視頻中的運動對象)等。
第三,數(shù)據(jù)庫。生成的數(shù)據(jù)庫由媒體庫、特征庫和知識庫三部分組成。媒體庫包含圖像、視頻、音頻、文本等多媒體數(shù)據(jù);特征庫包含用戶輸入的特征和預(yù)處理自動提取的內(nèi)容特征;知識庫表達可以更換以使用各種不同的應(yīng)用領(lǐng)域。
第四,查詢接口。友好的人機交互界面是檢索系統(tǒng)不可缺少的。在基于內(nèi)容的檢索中,由于特征不直觀,因此必須為其提供一個可視化的輸入手段,還應(yīng)在用戶界面提供查詢結(jié)果的創(chuàng)覽功能。
第五,檢索引擎。檢索是利用特征之間的距離函數(shù)進行相似性檢索。對于不同類型的媒體數(shù)據(jù)有不同的相似性檢測算法,檢索引擎中有一個有效可靠的相似性檢測函數(shù)集。
四 基于內(nèi)容檢索的處理過程
基于內(nèi)容的查詢和檢索是一個逐步求精的過程,也是一種特征不斷調(diào)整,重新匹配的循環(huán)過程。用戶查詢一個數(shù)據(jù)對象時,利用人機界面提供的輸人方式形成一個查詢條件,將查詢特征與數(shù)據(jù)庫中的特征按照一定的匹配算法進行匹配,然后把滿足一定相似性的一組候選結(jié)果按相似度大小排列返回給用戶,對系統(tǒng)返回的查詢結(jié)果,用戶可以通過測覽挑選滿意的結(jié)果,也可以從中選擇一個示例,進行特征調(diào)整,最后形成―個新的查詢條件,如此逐步縮小查詢范圍,直到用戶對結(jié)果滿意為止?;趦?nèi)容檢索的處理過程包括如下過程:一是初始檢索說明,二是相似性匹配,三是特征調(diào)整,四是重新檢索。該過程直到用戶放棄或得到滿意檢索結(jié)果為止。
五 結(jié)束語
本文研究的是多媒體圖象數(shù)據(jù)的查詢和檢索方法。多媒體數(shù)據(jù)庫基于內(nèi)容檢索技術(shù)是目前數(shù)據(jù)庫研究的一個熱點問題。高效快速地對媒體數(shù)據(jù)進行檢索,首先要建立數(shù)據(jù)生成子系統(tǒng)和數(shù)據(jù)查詢系統(tǒng),生成媒體庫、特征庫、知識庫等數(shù)據(jù)庫;然后要對圖象進行分割、提取特征、分類描述,分類結(jié)果存入相應(yīng)的數(shù)據(jù)庫中;最后進行相似匹配,完成查詢和檢索過程。
參考文獻
[1]武獻宇等.基于內(nèi)容的信息檢索技術(shù)研究[J].電腦知識與技術(shù).2009(8).
[2]曹靜.多媒體數(shù)據(jù)庫基于內(nèi)容檢索方法的研究[J].武漢工程職業(yè)技術(shù)學(xué)院學(xué)報.2005(12).
[3]鄭慶華、李人厚、胡峻.多媒體數(shù)據(jù)庫的主要問題、研究內(nèi)容與實現(xiàn)方法[J].計算機工程與應(yīng)用.1998(1).
[4]鄭慶華、李人厚等.分布式多媒體數(shù)據(jù)庫技術(shù)研究.小型微型計算機系統(tǒng).1998(7).
[5]蔡巍、劉玉照.基于內(nèi)容檢索多媒體數(shù)據(jù)庫的構(gòu)建[J].中國圖書館學(xué)報.2000(3).
[6]李蘭蘭、魏蛟龍.數(shù)字圖書館中多媒體數(shù)據(jù)庫信息的檢索[J].大學(xué)圖書情報學(xué)刊.2004(3).
[7]晏弼成.多媒體圖象數(shù)據(jù)的查詢與檢索[J].計算機工程.2001(5).
計算機信息檢索技術(shù)的相關(guān)論文相關(guān)文章: