在本教學中,您將通過使用MATCH()
和AGAINST()
函數來瞭解MySQL自然語言全文搜索。
MySQL自然語言全文搜索簡介
在自然語言全文搜索中,MySQL查找與自由文本自然人類語言查詢相關的行或文檔,例如“如何使用MySQL自然語言全文搜索”。
相關性是一個正浮點數。 當相關性為零時,這意味著沒有相似性。MySQL根據各種因素計算相關性,包括文檔中的字數,文檔中的唯一字數,集合中的單詞總數以及包含特定單詞的文檔數(行)。
要執行自然語言全文搜索,您可以使用MATCH()
和AGAINST()
函數。 MATCH()
函數指定要搜索的列,AGAINST()
函數確定要使用的搜索運算式。
MySQL自然語言全文搜索示例
我們將使用示例資料庫(zaixiandb)中的products
表進行演示。
mysql> desc products;
+--------------------+---------------+------+-----+---------+------------------+
| Field | Type | Null | Key | Default | Extra |
+--------------------+---------------+------+-----+---------+------------------+
| productCode | varchar(15) | NO | PRI | | |
| productName | varchar(70) | NO | | NULL | |
| productLine | varchar(50) | NO | MUL | NULL | |
| productScale | varchar(10) | NO | | NULL | |
| productVendor | varchar(50) | NO | | NULL | |
| productDescription | text | NO | | NULL | |
| quantityInStock | smallint(6) | NO | | NULL | |
| buyPrice | decimal(10,2) | NO | | NULL | |
| MSRP | decimal(10,2) | NO | | NULL | |
| stockValue | double | YES | | NULL | STORED GENERATED |
+--------------------+---------------+------+-----+---------+------------------+
10 rows in set (0.22 sec)
首先,需要使用ALTER TABLE ADD FULLTEXT
語句在products
表的productLine
列中啟用全文搜索:
ALTER TABLE products
ADD FULLTEXT(productline);
其次,可以搜索產品系列包含Classic
的產品,使用MATCH()
和AGAINST()
函數,如下查詢:
SELECT productName, productline
FROM products
WHERE MATCH(productline) AGAINST('Classic');
執行上面查詢語句,得到以下結果 -
mysql> SELECT productName, productline
FROM products
WHERE MATCH(productline) AGAINST('Classic');
+-------------------------------------+--------------+
| productName | productline |
+-------------------------------------+--------------+
| 1952 Alpine Renault 1300 | Classic Cars |
| 1972 Alfa Romeo GTA | Classic Cars |
| 1962 LanciaA Delta 16V | Classic Cars |
| 1968 Ford Mustang | Classic Cars |
| 2001 Ferrari Enzo | Classic Cars |
| 1969 Corvair Monza | Classic Cars |
| 1968 Dodge Charger | Classic Cars |
| 1969 Ford Falcon | Classic Cars |
| 1970 Plymouth Hemi Cuda | Classic Cars |
| 1969 Dodge Charger | Classic Cars |
| 1993 Mazda RX-7 | Classic Cars |
| 1965 Aston Martin DB5 | Classic Cars |
| 1948 Porsche 356-A Roadster | Classic Cars |
| 1995 Honda Civic | Classic Cars |
| 1998 Chrysler Plymouth Prowler | Classic Cars |
| 1999 Indy 500 Monte Carlo SS | Classic Cars |
| 1992 Ferrari 360 Spider red | Classic Cars |
| 1985 Toyota Supra | Classic Cars |
| 1969 Dodge Super Bee | Classic Cars |
| 1976 Ford Gran Torino | Classic Cars |
| 1948 Porsche Type 356 Roadster | Classic Cars |
| 1970 Triumph Spitfire | Classic Cars |
| 1957 Corvette Convertible | Classic Cars |
| 1957 Ford Thunderbird | Classic Cars |
| 1970 Chevy Chevelle SS 454 | Classic Cars |
| 1970 Dodge Coronet | Classic Cars |
| 1966 Shelby Cobra 427 S/C | Classic Cars |
| 1949 Jaguar XK 120 | Classic Cars |
| 1958 Chevy Corvette Limited Edition | Classic Cars |
| 1952 Citroen-15CV | Classic Cars |
| 1982 Lamborghini Diablo | Classic Cars |
| 1969 Chevrolet Camaro Z28 | Classic Cars |
| 1971 Alpine Renault 1600s | Classic Cars |
| 2002 Chevy Corvette | Classic Cars |
| 1956 Porsche 356A Coupe | Classic Cars |
| 1992 Porsche Cayenne Turbo Silver | Classic Cars |
| 1961 Chevrolet Impala | Classic Cars |
| 1982 Camaro Z28 | Classic Cars |
+-------------------------------------+--------------+
38 rows in set
AGAINST()
函數默認使用IN NATURAL LANGUAGE MODE
搜索修飾符,因此您可以在查詢中省略它。還有其他搜索修飾符,例如IN BOOLEAN MODE
用於布爾文本搜索。
可以在查詢中顯式使用IN NATURAL LANGUAGE MODE
搜索修飾符,如下所示:
SELECT productName, productline
FROM products
WHERE MATCH(productline)
AGAINST('Classic,Vintage' IN NATURAL LANGUAGE MODE);
執行上面查詢語句,得到以下結果 -
mysql> SELECT productName, productline
FROM products
WHERE MATCH(productline)
AGAINST('Classic,Vintage' IN NATURAL LANGUAGE MODE);
+-------------------------------------------+--------------+
| productName | productline |
+-------------------------------------------+--------------+
| 1937 Lincoln Berline | Vintage Cars |
| 1936 Mercedes-Benz 500K Special Roadster | Vintage Cars |
| 1917 Grand Touring Sedan | Vintage Cars |
| 1911 Ford Town Car | Vintage Cars |
************ 此處省略了一大波數據 **************************
| 1971 Alpine Renault 1600s | Classic Cars |
| 2002 Chevy Corvette | Classic Cars |
| 1956 Porsche 356A Coupe | Classic Cars |
| 1992 Porsche Cayenne Turbo Silver | Classic Cars |
| 1961 Chevrolet Impala | Classic Cars |
| 1982 Camaro Z28 | Classic Cars |
+-------------------------------------------+--------------+
62 rows in set
默認情況下,MySQL以不區分大小寫的方式執行搜索。但是,您可以指示MySQL使用二進位排序規則對索引列進行區分大小寫搜索。
按相關性排序結果集
全文搜索的一個非常重要的特徵是MySQL根據其相關性對結果集中的行進行排序。 當WHERE子句中使用MATCH()
函數時,MySQL返回首先更相關的行。
以下示例顯示了MySQL如何根據相關性對結果集進行排序。
首先,可以為products
表的productName
列啟用全文搜索功能。
ALTER TABLE products
ADD FULLTEXT(productName);
其次,使用以下查詢搜索名稱包Ford
和/或1932
的產品:
SELECT productName, productline
FROM products
WHERE MATCH(productName) AGAINST('1932,Ford');
我們來查看輸出結果:
mysql> SELECT productName, productline
FROM products
WHERE MATCH(productName) AGAINST('1932,Ford');
+-------------------------------------+------------------+
| productName | productline |
+-------------------------------------+------------------+
| 1932 Model A Ford J-Coupe | Vintage Cars |
| 1932 Alfa Romeo 8C2300 Spider Sport | Vintage Cars |
| 1968 Ford Mustang | Classic Cars |
| 1969 Ford Falcon | Classic Cars |
| 1940 Ford Pickup Truck | Trucks and Buses |
| 1911 Ford Town Car | Vintage Cars |
| 1926 Ford Fire Engine | Trucks and Buses |
| 1913 Ford Model T Speedster | Vintage Cars |
| 1934 Ford V8 Coupe | Vintage Cars |
| 1903 Ford Model A | Vintage Cars |
| 1976 Ford Gran Torino | Classic Cars |
| 1940s Ford truck | Trucks and Buses |
| 1957 Ford Thunderbird | Classic Cars |
| 1912 Ford Model T Delivery Wagon | Vintage Cars |
| 1940 Ford Delivery Sedan | Vintage Cars |
| 1928 Ford Phaeton Deluxe | Vintage Cars |
+-------------------------------------+------------------+
16 rows in set
首先返回其名稱包含1932
和Ford
的產品,然後返回名稱包含唯一Ford
關鍵字的產品。
使用全文搜索時,應該記住一些重點:
- MySQL全文搜索引擎中定義的搜索項的最小長度為
4
,這意味著如果搜索長度小於4
的關鍵字,例如car
,cat
等,則不會得到任何結果。 - 停止詞被忽略,MySQL定義了MySQL源代碼分發
storage/myisam/ft_static.c
中的停止詞列表。
在本教學中,向您展示了如何使用MATCH()
和AGAINST()
函數在MySQL中執行自然語言搜索。