基于mysql全文索引的深入理解_MySQL教程
推薦:10大關(guān)系數(shù)據(jù)庫SQL注入工具一覽BSQL Hacker BSQL Hacker是由Portcullis實(shí)驗(yàn)室開發(fā)的,BSQL Hacker 是一個(gè)SQL自動(dòng)注入工具(支持SQL盲注),其設(shè)計(jì)的目的是希望能對(duì)任何的數(shù)據(jù)庫進(jìn)行SQL溢出注入。 BSQL Hacker的適用群體是那些對(duì)注入有經(jīng)驗(yàn)的使用者和那些想進(jìn)行自動(dòng)SQL注入的人群。BSQL Hacker可自動(dòng)對(duì)O
前言:本文簡單講述全文索引的應(yīng)用實(shí)例,MYSQL演示版本5.5.24。Q:全文索引適用于什么場合?
A:全文索引是目前實(shí)現(xiàn)大數(shù)據(jù)搜索的關(guān)鍵技術(shù)。
至于更詳細(xì)的介紹請自行百度,本文不再闡述。
--------------------------------------------------------------------------------
一、如何設(shè)置?
![]()
如圖點(diǎn)擊結(jié)尾處的{全文搜索}即可設(shè)置全文索引,不同MYSQL版本名字可能不同。
二、設(shè)置條件
1.表的存儲(chǔ)引擎是MyISAM,默認(rèn)存儲(chǔ)引擎InnoDB不支持全文索引(新版本MYSQL5.6的InnoDB支持全文索引)
2.字段類型:char、varchar和text
三、配置
my.ini配置文件中添加
# MySQL全文索引查詢關(guān)鍵詞最小長度限制
[mysqld]
ft_min_word_len = 1
保存后重啟MYSQL,執(zhí)行SQL語句
SHOW VARIABLES
查看ft_min_word_len是否設(shè)置成功,如果沒設(shè)置成功請確保
1.確認(rèn)my.ini正確配置,注意不要搞錯(cuò)my.ini的位置
2.確認(rèn)mysql已經(jīng)重啟,實(shí)在不行重啟電腦
其他相關(guān)配置請自行百度。
注:重新設(shè)置配置后,已經(jīng)設(shè)置的索引需要重新設(shè)置生成索引
四、SQL語法
首先生成temp表
CREATE TABLE IF NOT EXISTS `temp` (
`id` int(11) NOT NULL AUTO_INCREMENT,
`char` char(50) NOT NULL,
`varchar` varchar(50) NOT NULL,
`text` text NOT NULL,
PRIMARY KEY (`id`),
FULLTEXT KEY `char` (`char`),
FULLTEXT KEY `varchar` (`varchar`),
FULLTEXT KEY `text` (`text`)
) ENGINE=MyISAM DEFAULT CHARSET=utf8 AUTO_INCREMENT=2 ;
INSERT INTO `temp` (`id`, `char`, `varchar`, `text`) VALUES
(1, 'a bc 我 知道 1 23', 'a bc 我 知道 1 23', 'a bc 我 知道 1 23');
搜索`char`字段 'a' 值
SELECT * FROM `temp` WHERE MATCH(`char`) AGAINST ('a')
但是你會(huì)發(fā)現(xiàn)查詢無結(jié)果?!
這時(shí)你也許會(huì)想:哎呀怎么回事,我明明按照步驟來做的啊,是不是那里漏了或者錯(cuò)了?
你不要著急,做程序是這樣的,出錯(cuò)總是有的,靜下心來,著急是不能解決問題的。
如果一個(gè)關(guān)鍵詞在50%的數(shù)據(jù)出現(xiàn),那么這個(gè)詞會(huì)被當(dāng)做無效詞。
如果你想去除50%的現(xiàn)在請使用IN BOOLEAN MODE搜索
SELECT * FROM `temp` WHERE MATCH(`char`) AGAINST ('a' IN BOOLEAN MODE)
這樣就可以查詢出結(jié)果了,但是我們不推薦使用。
全文索引的搜索模式的介紹自行百度。
我們先加入幾條無用數(shù)據(jù)已解除50%限制
INSERT INTO `temp` (
`id` ,
`char` ,
`varchar` ,
`text`
)
VALUES (
NULL , '7', '7', '7'
), (
NULL , '7', '7', '7'
), (
NULL , 'a,bc,我,知道,1,23', 'a,bc,我,知道,1,23', 'a,bc,我,知道,1,23'
), (
NULL , 'x', 'x', 'x'
);
這時(shí)你執(zhí)行以下SQL語句都可以查詢到數(shù)據(jù)
SELECT * FROM `temp` WHERE MATCH(`char`) AGAINST ('a');
SELECT * FROM `temp` WHERE MATCH(`char`) AGAINST ('bc');
SELECT * FROM `temp` WHERE MATCH(`char`) AGAINST ('我');
SELECT * FROM `temp` WHERE MATCH(`char`) AGAINST ('知道');
SELECT * FROM `temp` WHERE MATCH(`char`) AGAINST ('1');
SELECT * FROM `temp` WHERE MATCH(`char`) AGAINST ('23');
以下SQL搜索不到數(shù)據(jù)
SELECT * FROM `temp` WHERE MATCH(`char`) AGAINST ('b');
SELECT * FROM `temp` WHERE MATCH(`char`) AGAINST ('c');
SELECT * FROM `temp` WHERE MATCH(`char`) AGAINST ('知');
SELECT * FROM `temp` WHERE MATCH(`char`) AGAINST ('道');
SELECT * FROM `temp` WHERE MATCH(`char`) AGAINST ('2');
SELECT * FROM `temp` WHERE MATCH(`char`) AGAINST ('3');
如果搜索多個(gè)詞,請用空格或者逗號(hào)隔開
SELECT * FROM `temp` WHERE MATCH(`char`) AGAINST ('a x');
SELECT * FROM `temp` WHERE MATCH(`char`) AGAINST ('a,x');
上面的SQL都可以查詢到三條數(shù)據(jù)
五、分詞
看到這里你應(yīng)該發(fā)現(xiàn)我們字段里的值也是分詞,不能直接插入原始數(shù)據(jù)。
全文索引應(yīng)用流程:
1.接收數(shù)據(jù)-數(shù)據(jù)分詞-入庫
2.接收數(shù)據(jù)-數(shù)據(jù)分詞-查詢
現(xiàn)在有個(gè)重要的問題:怎么對(duì)數(shù)據(jù)分詞?
數(shù)據(jù)分詞一般我們會(huì)使用一些成熟免費(fèi)的分詞系統(tǒng),當(dāng)然如果你有能力也可以自己做分詞系統(tǒng),這里我們推薦使用SCWS分詞插件。
首先下載
1.php_scws.dll 注意對(duì)應(yīng)版本
2.XDB詞典文件
3.規(guī)則集文件
安裝scws
1.先建一個(gè)文件夾,位置不限,但是最好不要中文路徑。
2.解壓{規(guī)則集文件},把xdb、三個(gè)INI文件全部扔到 D:\scws
3.把php_scws.dll復(fù)制到你的PHP目錄下的EXT文件夾里面
4.在 php.ini 的末尾加入以下幾行:
[scws]
; 注意請檢查 php.ini 中的 extension_dir 的設(shè)定值是否正確, 否則請將 extension_dir 設(shè)為空,
; 再把 php_scws.dll 指定為絕對(duì)路徑。
extension = php_scws.dll
scws.default.charset = utf8
scws.default.fpath = "D:\scws"
5.重啟你的服務(wù)器
測試
$str="測試中文分詞";
$so = scws_new();
$so->send_text($str);
$temp=$so->get_result();
$so->close();
var_dump($temp);
如果安裝未成功,請參照官方說明文檔
--------------------------------------------------------------------------------
這樣我們就可以使用全文索引技術(shù)了。
分享:mysql中text與varchar與char的區(qū)別char類型 CHAR列的長度固定為創(chuàng)建表時(shí)聲明的長度。長度可以為從0到255的任何值。當(dāng)保存CHAR值時(shí),在它們的右邊填充空格以達(dá)到指定的長度。當(dāng)檢索到CHAR值時(shí),尾部的空格被刪除掉。在存儲(chǔ)或檢索過程中不進(jìn)行大小寫轉(zhuǎn)換。 varchar類型 VARCHAR列中的值為可變長字符串。長
- MSSQL清空日志刪除日志文件
- 關(guān)于數(shù)據(jù)庫中保留小數(shù)位的問題
- 解析mysql與Oracle update的區(qū)別
- mysql 導(dǎo)入導(dǎo)出數(shù)據(jù)庫以及函數(shù)、存儲(chǔ)過程的介紹
- MySQL——修改root密碼的4種方法(以windows為例)
- 解決MYSQL出現(xiàn)Can''t create/write to file ''#sql_5c0_0.MYD''的問題
- 深入理解SQL的四種連接-左外連接、右外連接、內(nèi)連接、全連接
- 解析:內(nèi)聯(lián),左外聯(lián),右外聯(lián),全連接,交叉連接的區(qū)別
- mysql出現(xiàn)“Incorrect key file for table”處理方法
- mysql重裝后出現(xiàn)亂碼設(shè)置為utf8可解決
- 淺析一個(gè)MYSQL語法(在查詢中使用count)的兼容性問題
- 解析MySQL中INSERT INTO SELECT的使用
MySQL教程Rss訂閱編程教程搜索
MySQL教程推薦
- MySQL自增列插入0值的解決方案
- mysql語句:SET NAMES UTF8
- 網(wǎng)站模板:以數(shù)據(jù)庫字段分組顯示數(shù)據(jù)的sql語句
- 解析MYSQL 數(shù)據(jù)庫導(dǎo)入SQL 文件出現(xiàn)亂碼的問題
- MySQL數(shù)據(jù)庫INSERT、UPDATE、DELETE以及REPLACE語句的用法詳解
- mysql解決遠(yuǎn)程不能訪問的二種方法
- SQL字符型字段按數(shù)字型字段排序?qū)崿F(xiàn)方法
- mysql手動(dòng)刪除BINLOG的方法
- MySQL 5.6 如何更改安全的處理密碼探討
- Mysql 常見問題匯總
猜你也喜歡看這些
- SQLServer 2008中的代碼安全(四) 主密鑰
- Server2005中更改sa的用戶名的多種方法
- 解讀MySQL中SQL的單字節(jié)注入與寬字節(jié)注入
- 解決SQL Server無法打開用戶默認(rèn)數(shù)據(jù)庫的問題
- 揭秘八個(gè)有用的WordPress的SQL語句
- 揭秘操作日期的SQL語句大全
- 關(guān)于sql server批量插入和更新的兩種解決方案
- 解讀在Oracle數(shù)據(jù)庫中高速導(dǎo)出/導(dǎo)入的方法
- 關(guān)于重新組織和重新生成索引sp_RefreshIndex的介紹
- 無法在com+ 目錄中安裝和配置程序集 錯(cuò)誤:-2146233087的解決方法[已測]
- 相關(guān)鏈接:
- 教程說明:
MySQL教程-基于mysql全文索引的深入理解
。