文章詳情頁
MS SQL Server 對文件內(nèi)容進(jìn)行全文檢索的查詢
瀏覽:133日期:2023-11-07 13:50:23
因?yàn)轫?xiàng)目需要,需要對上傳的文件內(nèi)容進(jìn)行查詢。通過MSDN了解到Windows索引服務(wù)可以實(shí)現(xiàn)對文件的全文檢索,并可以通過SQL Server進(jìn)行查詢。項(xiàng)目將這兩者結(jié)合,實(shí)現(xiàn)對上傳文件的全文檢索的解決方案。 方案概要:1. 改變文件存儲時的文件名2. 配置索引服務(wù)器,并將索引服務(wù)器與MS SQL Server關(guān)聯(lián)。3. 修改SQL語句,將進(jìn)行全文查詢語句的內(nèi)容加入查詢條件中文件的存儲方式:為了方便存儲以及方便索引,我們將上傳的文件存儲到一個目錄里面,為了保證上傳的文件名不重復(fù),采用GUID作為文件名,并且通過這個GUID于數(shù)據(jù)庫記錄相關(guān)聯(lián)。同時,文件的后綴還保持原始文件的后綴,讓索引服務(wù)能夠識別該文檔。配置索引服務(wù) 進(jìn)入計算機(jī)管理(Computer Management)程序(右鍵”我的電腦”->”管理”),并找到索引服務(wù)(Index Service) 配置索引服務(wù)的功能(1) 右鍵選擇索引服務(wù)彈出一個菜單(2) 選擇New->Catalog(新建一個編錄) 設(shè)置新增加的編錄(1) 輸入編錄的名字(這個名字需要與數(shù)據(jù)庫進(jìn)行關(guān)聯(lián),要注意命名,這里假設(shè)DCSII(2) 點(diǎn)Browse進(jìn)入選擇索引服務(wù)運(yùn)行目錄窗體(3) 選擇前面創(chuàng)建的索引運(yùn)行目錄(任意地方)(4) 點(diǎn)確定完成本次操作 在編錄創(chuàng)建號以后,需要給編錄增加目錄(1) 右鍵選擇剛剛創(chuàng)建的編錄(2) 選擇New->Directory(新建目錄) 新建索引目錄(1) 點(diǎn)擊Browse進(jìn)入目錄選擇頁面(2) 選擇要進(jìn)行全文檢索文件的目錄(3) 確定完成本次操作 完成創(chuàng)建后啟動索引服務(wù) (1)啟動索引服務(wù) (2)索引服務(wù)啟動成功后索引編錄的信息,可以看到編錄信息就表示服務(wù)已經(jīng)啟動成功。將索引服務(wù)和SQL數(shù)據(jù)庫關(guān)聯(lián):在SQL 查詢分析器(SQL Query Analyer)里執(zhí)行下面的存儲過程EXEC sp_addlinkedserver Dcs, --;;連接服務(wù)器的名字,到后面查詢的時候要用到 'Index Server', 'MSIDXS', 'DCSII';;-- 索引服務(wù)里新建的編錄名字s.p.索引服務(wù)的性能調(diào)整方法1(1) 右鍵選擇索引服務(wù)(2) 選擇 All Tasks-> Tune Perrformance(3) 選擇用戶自定義(4) 點(diǎn)擊Customize進(jìn)入性能調(diào)整窗體(5) 將Index和Querying的屬性移動到最右邊(6) 點(diǎn)確定完成操作性能調(diào)整方法2 如果服務(wù)器不需要對整個系統(tǒng)的文件進(jìn)行索引,可以停止或者刪除System編錄。MS SQL對索引服務(wù)器的調(diào)用1. 通過sql語句查詢連接服務(wù)器的內(nèi)容SELECT Q.*FROM OpenQuery(dcs, --連接服務(wù)器名字 'SELECT FileName, Size, DocAuthor, path;--在連接服務(wù)器里的sql語句 FROM SCOPE() WHERE CONTAINS(''番號 and abc'') ' ) AS Q2. 因?yàn)镾QL語句不支持動態(tài)輸入的字符串,因此查詢字符串只好在C#代碼里進(jìn)行拼接s.p.實(shí)不用將文件保存到數(shù)據(jù)庫外面也能實(shí)現(xiàn)在數(shù)據(jù)庫里實(shí)現(xiàn)全文搜索。具體方案是在SQL Server 2000里安全全文搜索功能,用image字段存儲文件內(nèi)容,并新增一個字段存放文件類型,然后在通過企業(yè)管理器新建全文索引項(xiàng)的時候?qū)⑦@兩個字段匹配就可以。不過從數(shù)據(jù)庫的/率以及今后數(shù)據(jù)庫備份和恢復(fù)的效率上來看,將文件放在數(shù)據(jù)庫的設(shè)計不是太好
標(biāo)簽:
Sql Server
數(shù)據(jù)庫
相關(guān)文章:
排行榜
