国产成人精品亚洲777人妖,欧美日韩精品一区视频,最新亚洲国产,国产乱码精品一区二区亚洲

您的位置:首頁技術(shù)文章
文章詳情頁

oracle正則表達式多項匹配時相似項有優(yōu)先級詳解

瀏覽:144日期:2023-09-12 20:47:51
目錄前言: 一、正則表達式用法(Regexp_Like為例)1、語法規(guī)則2、注釋3、實例二、正則表達式優(yōu)先級的注意點三、解決方案擴展:1、正則表達式過長2、替換規(guī)則失效四、總結(jié) 前言:

Oracle常用正則表達式函數(shù)主要以下5個:

REGEXP_LIKE:與LIKE的功能相似;REGEXP_SUBSTR :與SUBSTR的功能相似;REGEXP_INSTR :與INSTR的功能相似;REGEXP_REPLACE :與REPLACE的功能相似;REGEXP_COUNT :與COUNT的功能相似;

常用的正則表達式匹配符有以下運算符,本文重點來闡述“|”指定多個選項,容易被忽視的問題。

一、正則表達式用法(Regexp_Like為例)

Regexp_Like()函數(shù) 模糊匹配。

1、語法規(guī)則

regexp_like(source_string,pattern[match_parameter])

2、注釋source_string:傳入的字符串,可以是常量,也可以是某個值類型為串的列;pattern:要進行匹配的字符串;match_parameter:文本量,進一步訂制搜索,取值如下:‘i’ 用于不區(qū)分大小寫的匹配。‘c’ 用于區(qū)分大小寫的匹配。‘n’ 允許將句點“.”作為通配符來匹配換行符。如果省略該參數(shù),句點將不匹配換行符。‘m’ 將源串視為多行。即將“^”和“$”分別看做源串中任意位置任意行的開始和結(jié)束,而不是看作整個源串的開始或結(jié)束。如果省略該參數(shù),源串將被看作一行來處理。

如果取值不屬于上述中的某個,將會報錯。如果指定了多個互相矛盾的值,將使用最后一個值。如’ic’會被當(dāng)做’c’處理。省略該參數(shù)時:默認(rèn)區(qū)分大小寫、句點不匹配換行符、源串被看作一行。

3、實例

代碼:

select * from (select 'ABC你好' reg from dual union select 'a233' reg from dual)where regexp_like(reg,'[0-9]','c')--匹配有數(shù)字的字符串

效果:

解析:

可以看到正則表達式,通過后面的'[0-9]'的規(guī)則來獲取我們想要的數(shù)據(jù)。

二、正則表達式優(yōu)先級的注意點

當(dāng)我們使用REGEXP_REPLACE將多個表達式的數(shù)據(jù)替換時,這時候我們要考慮替換規(guī)則有沒有類似項,比如REGEXP_REPLACE(reg,'-BL|-BL1')即替換掉字符串reg里面包含-BL或者-BL1的字符串,此時如果我們按這種寫法REGEXP_REPLACE(reg,'-BL|-BL1'),實際效果是只會替換掉-BL,因為oracle會按照替換規(guī)則的順序來執(zhí)行,如果滿足了第一個條件,后面的就不會再去執(zhí)行了,這也是為了加快了程序的處理速度,但同時也會造成我們常常忽略的問題。

好的,我們來看看下面的具體案例吧。

代碼:

select reg, REGEXP_REPLACE(reg,'-BL|-BL1')reg_replace from (select 'A_123456D-BL1' reg FROM dual)

效果:

解析:

因為正則表達式,默認(rèn)會按順序執(zhí)行,此時正則表達式,-BL滿足規(guī)則了,就不會執(zhí)行-BL1了,因此就會得到的結(jié)果是對應(yīng)的REG字符串里面替換后還會多出了一個1。

三、解決方案

現(xiàn)實情況下,我們往往會有很多替換規(guī)則,少則幾個,多則好幾百,如果我們用replace函數(shù)估計要嵌套幾百次,估計你會直搖頭吧,雖然regexp_replace可以一次性將多個規(guī)則寫在一起,但是我們還是要注意上述提到的優(yōu)先級的問題。因此我們需要將相同的部分放到最后,如上面說到的“-BL”此時就能達到我們的需求了。

擴展:

我們來看個現(xiàn)實的案例。當(dāng)面對168個規(guī)則時我們會遇到哪些問題。

1、正則表達式過長

解決方法:嵌套多個正則表達式 ,像竹筍一樣多疊幾層即可。

2、替換規(guī)則失效

出來的數(shù)據(jù)還是有我們不想要的數(shù)據(jù),比如下面的三個批次,我們只想保存一條,如果我們替換規(guī)則不當(dāng)就會造成,這三個字符串替換后還是不相同的,無法達到我們想要的效果。

解決辦法:我們首先將所有的替換規(guī)則用EXCEL表例好,然后排好優(yōu)先級,然后再去修改正則表達式。如圖所示我們將規(guī)則列好,然后用不同顏色標(biāo)示優(yōu)先級。然后再整理表達式。如下圖所示小編將最小匹配項的表達式放到最后面了,這樣就能達到我們想要的效果了。

四、總結(jié)

針對復(fù)雜的數(shù)據(jù)分析,首先建議從業(yè)務(wù)角度去規(guī)范,因為雖然技術(shù)可以處理,但是歷史數(shù)據(jù)處理成本是巨大,因此一個企業(yè)的數(shù)據(jù)底座搭建,是離不開強標(biāo)準(zhǔn)化的數(shù)據(jù)治理的。

到此這篇關(guān)于oracle正則表達式多項匹配時相似項有優(yōu)先級的文章就介紹到這了,更多相關(guān)oracle正則表達式多項匹配內(nèi)容請搜索好吧啦網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持好吧啦網(wǎng)!

標(biāo)簽: Oracle 數(shù)據(jù)庫
主站蜘蛛池模板: 灌南县| 灵山县| 柳州市| 临漳县| 松潘县| 五华县| 潢川县| 呈贡县| 柳河县| 孝义市| 遂平县| 西昌市| 安仁县| 焦作市| 勐海县| 濉溪县| 南城县| 陆良县| 蓬溪县| 阳高县| 且末县| 海门市| 娱乐| 尤溪县| 泾阳县| 准格尔旗| 昌邑市| 嘉黎县| 县级市| 株洲县| 十堰市| 惠安县| 彩票| 大化| 措勤县| 揭西县| 石台县| 红河县| 明光市| 开封县| 班玛县|