এসকিউএল সার্ভারে RegEx ব্যবহার করা


94

আমি নীচে RegEx সেটিংস / প্যারামের উপর ভিত্তি করে RegEx ব্যবহার করে পাঠ্য প্রতিস্থাপন / এনকোড করার পদ্ধতিটি দেখছি:

RegEx.IgnoreCase = True     
RegEx.Global = True     
RegEx.Pattern = "[^a-z\d\s.]+"   

আমি রেজিএক্সে কয়েকটি উদাহরণ দেখেছি, তবে এটি কীভাবে এসকিউএল সার্ভারে প্রয়োগ করা যায় তা নিয়ে বিভ্রান্ত। কোন পরামর্শ সহায়ক হবে। ধন্যবাদ.


4
হাই এই নিবন্ধটি একবার দেখুন: কোডেপ্রজেক্ট
মোহসেন

এখানে একটা সূক্ষ্ম TSQL + + উইন্ডোস API এ সমাধান Robyn পেজ এবং ফিল ফ্যাক্টর এর যে উপর নির্ভর VBScript.RegExp বর্গ, যা, আমি belieave, Windows 2000 সাল থেকে প্রতিটি উইন্ডোজ সংস্করণ বিক্রী হয়
জুলিও Nobre

আপনার যদি টিএসকিউএল এর মাধ্যমে একেবারে ইতিবাচকভাবে RegEx দরকার হয় তবে এসকিউএল সার্ভার 2016 এবং তারপরের একটি বিকল্প হল আর পরিষেবাগুলি ব্যবহার করা
ডেভ ম্যাসন

উত্তর:


105

আপনি পরিচালিত কোড সহ যোগাযোগ করার জন্য যেমন আপনি ব্যবহার করতে পারেন প্রয়োজন হবে না মত :

CREATE TABLE #Sample(Field varchar(50), Result varchar(50))
GO
INSERT INTO #Sample (Field, Result) VALUES ('ABC123 ', 'Do not match')
INSERT INTO #Sample (Field, Result) VALUES ('ABC123.', 'Do not match')
INSERT INTO #Sample (Field, Result) VALUES ('ABC123&', 'Match')
SELECT * FROM #Sample WHERE Field LIKE '%[^a-z0-9 .]%'
GO
DROP TABLE #Sample

আপনার অভিব্যক্তিটি শেষ হওয়ার সাথে সাথে +আপনি যেতে পারেন'%[^a-z0-9 .][^a-z0-9 .]%'

সম্পাদনা : পরিষ্কার করার জন্য: এসকিউএল সার্ভার পরিচালিত কোড ব্যতীত নিয়মিত এক্সপ্রেশন সমর্থন করে না। পরিস্থিতির উপর নির্ভর করে LIKEঅপারেটর একটি বিকল্প হতে পারে, তবে এটি নিয়মিত প্রকাশের যে নমনীয়তা দেয় তার অভাব রয়েছে।


8
@ মাইক ইউইং, আপনি ঠিক বলেছেন এই উত্তরটি +কোয়ান্টিফায়ারকে ভুলভাবে সম্বোধন করে যেমন {1,2}এটি কখন নেওয়া উচিত {1, }। আশ্চর্যজনকভাবে, এটি ওপিতে কাজ করেছিল।
রুবেস ফারিয়াস

4
এটি স্কেল সার্ভারে কাজ করবে না কারণ এটি রেজেক্সকে সমর্থন করে না।
ভিভিএন

10
@ ভিভিএন, LIKEরেজেক্স নয় (এটি একটি আরও সীমিত প্যাটার্ন-মিলের বাক্য গঠন), সুতরাং রেগেক্স সমর্থনের অভাব মানে এই নয় যে এটি কাজ করবে না।
চার্লস ডাফি

@ রুবেসফারিয়াস @ মাইক-ইয়ংয়ের মন্তব্যের আলোকে উত্তরটি আপডেট করা ভাল লাগবে না?
সুধাংশু মিশ্র

8

জুলিওর উত্তরের সামান্য পরিবর্তিত সংস্করণ

-- MS SQL using VBScript Regex
-- select dbo.RegexReplace('aa bb cc','($1) ($2) ($3)','([^\s]*)\s*([^\s]*)\s*([^\s]*)')
-- $$ dollar sign, $1 - $9 back references, $& whole match

CREATE FUNCTION [dbo].[RegexReplace]
(   -- these match exactly the parameters of RegExp
    @searchstring varchar(4000),
    @replacestring varchar(4000),
    @pattern varchar(4000)
)
RETURNS varchar(4000)
AS
BEGIN
    declare @objRegexExp int, 
        @objErrorObj int,
        @strErrorMessage varchar(255),
        @res int,
        @result varchar(4000)

    if( @searchstring is null or len(ltrim(rtrim(@searchstring))) = 0) return null
    set @result=''
    exec @res=sp_OACreate 'VBScript.RegExp', @objRegexExp out
    if( @res <> 0) return '..VBScript did not initialize'
    exec @res=sp_OASetProperty @objRegexExp, 'Pattern', @pattern
    if( @res <> 0) return '..Pattern property set failed'
    exec @res=sp_OASetProperty @objRegexExp, 'IgnoreCase', 0
    if( @res <> 0) return '..IgnoreCase option failed'
    exec @res=sp_OAMethod @objRegexExp, 'Replace', @result OUT,
         @searchstring, @replacestring
    if( @res <> 0) return '..Bad search string'
    exec @res=sp_OADestroy @objRegexExp
    return @result
END

আপনার এসকিউএল-তে ওল অটোমেশন প্রক্রিয়াগুলি চালু করা দরকার:

exec sp_configure 'show advanced options',1; 
go
reconfigure; 
go
sp_configure 'Ole Automation Procedures', 1; 
go
reconfigure; 
go
sp_configure 'show advanced options',0; 
go
reconfigure;
go

4
বিটিডাব্লু, ক্যাশে এবং পুনঃব্যবহারের চেয়ে রেজেক্স অবজেক্টটিকে ধ্বংস এবং পুনরায় তৈরি করা অনেক দ্রুত। আমরা বস্তুর পুনঃব্যবহারযোগ্যভাবে উচ্চতর সংখ্যার সাথে 10,000 টি তুলনা করেছি।
জাচারি স্কট

8

এই নিবন্ধটি যেমন বর্ণনা করেছে আপনাকে আপনাকে একটি সিএলআর প্রক্রিয়া তৈরি করতে হবে যা রেজেক্স কার্যকারিতা সরবরাহ করে ।

তাদের উদাহরণ ফাংশন VB.NET ব্যবহার করে:

Imports System
Imports System.Data.Sql
Imports Microsoft.SqlServer.Server
Imports System.Data.SqlTypes
Imports System.Runtime.InteropServices
Imports System.Text.RegularExpressions
Imports System.Collections 'the IEnumerable interface is here  


Namespace SimpleTalk.Phil.Factor
    Public Class RegularExpressionFunctions
        'RegExIsMatch function
        <SqlFunction(IsDeterministic:=True, IsPrecise:=True)> _
        Public Shared Function RegExIsMatch( _
                                            ByVal pattern As SqlString, _
                                            ByVal input As SqlString, _
                                            ByVal Options As SqlInt32) As SqlBoolean
            If (input.IsNull OrElse pattern.IsNull) Then
                Return SqlBoolean.False
            End If
            Dim RegExOption As New System.Text.RegularExpressions.RegExOptions
            RegExOption = Options
            Return RegEx.IsMatch(input.Value, pattern.Value, RegExOption)
        End Function
    End Class      ' 
End Namespace

... এবং নিম্নলিখিত এসকিউএল ব্যবহার করে এসকিউএল সার্ভারে ইনস্টল করা আছে ('%' - তাদের প্রকৃত সমতুল্য দ্বারা পরিবর্তিত ভেরিয়েবলগুলি প্রতিস্থাপন:

sp_configure 'clr enabled', 1
RECONFIGURE WITH OVERRIDE

IF EXISTS ( SELECT   1
            FROM     sys.objects
            WHERE    object_id = OBJECT_ID(N'dbo.RegExIsMatch') ) 
   DROP FUNCTION dbo.RegExIsMatch
go

IF EXISTS ( SELECT   1
            FROM     sys.assemblies asms
            WHERE    asms.name = N'RegExFunction ' ) 
   DROP ASSEMBLY [RegExFunction]

CREATE ASSEMBLY RegExFunction 
           FROM '%FILE%'
GO

CREATE FUNCTION RegExIsMatch
   (
    @Pattern NVARCHAR(4000),
    @Input NVARCHAR(MAX),
    @Options int
   )
RETURNS BIT
AS EXTERNAL NAME 
   RegExFunction.[SimpleTalk.Phil.Factor.RegularExpressionFunctions].RegExIsMatch
GO

--a few tests
---Is this card a valid credit card?
SELECT dbo.RegExIsMatch ('^(?:4[0-9]{12}(?:[0-9]{3})?|5[1-5][0-9]{14}|6(?:011|5[0-9][0-9])[0-9]{12}|3[47][0-9]{13}|3(?:0[0-5]|[68][0-9])[0-9]{11}|(?:2131|1800|35\d{3})\d{11})$','4241825283987487',1)
--is there a number in this string
SELECT dbo.RegExIsMatch( '\d','there is 1 thing I hate',1)
--Verifies number Returns 1
DECLARE @pattern VARCHAR(255)
SELECT @pattern ='[a-zA-Z0-9]\d{2}[a-zA-Z0-9](-\d{3}){2}[A-Za-z0-9]'
SELECT  dbo.RegExIsMatch (@pattern, '1298-673-4192',1),
        dbo.RegExIsMatch (@pattern,'A08Z-931-468A',1),
        dbo.RegExIsMatch (@pattern,'[A90-123-129X',1),
        dbo.RegExIsMatch (@pattern,'12345-KKA-1230',1),
        dbo.RegExIsMatch (@pattern,'0919-2893-1256',1)

এটি ক্লাসিক এএসপিতে রয়েছে, এটি কি সমর্থন করে? আমার মনে হয় সিএলআরটি কেবল নেট নেট ফাংশনের জন্য, তাই না?
নিয়ন্ত্রণ ফ্রিক

4
সিএলআর পদ্ধতিগুলি এসকিউএল সার্ভার পরিবেশে ইনস্টল করা থাকে এবং অন্য যে কোনও সঞ্চিত পদ্ধতি বা ব্যবহারকারীর দ্বারা সংজ্ঞায়িত ফাংশনের মতোই আহ্বান জানানো যেতে পারে, সুতরাং ক্লাসিক এএসপি যদি কোনও সঞ্চিত পদ্ধতি বা ব্যবহারকারী-সংজ্ঞায়িত ফাংশনটি আহ্বান করতে পারে তবে এটি সিএলআর পদ্ধতিতে আবেদন করতে পারে।
mwigdahl

4
যদিও এই লিঙ্কটি প্রশ্নের উত্তর দিতে পারে, উত্তরের প্রয়োজনীয় অংশগুলি এখানে অন্তর্ভুক্ত করা এবং রেফারেন্সের জন্য লিঙ্কটি সরবরাহ করা ভাল। লিঙ্কযুক্ত পৃষ্ঠাগুলি পরিবর্তিত হলে লিঙ্ক-শুধুমাত্র উত্তরগুলি অবৈধ হতে পারে। - পর্যালোচনা থেকে
ফেডারিকো ক্লেজ কুলোকা

ধন্যবাদ @ ফেডারিকোক্লেজকুলোকা। এটি একটি পুরানো উত্তর ছিল এবং আমি সে অনুযায়ী এটি আপডেট করেছি।
mwigdahl

@ এমজিগডাহল এর জন্য ধন্যবাদ আমি দেখতে পেয়েছি এটি পুরানো, তবে এটি পর্যালোচনা সারিতে উঠে গেছে :)
ফেডেরিকো ক্লেজ কুলোকা

7

এসকিউএল সার্ভার ডেটাবেস বাস্তবায়ন ব্যবহারের নিয়মিত এক্সপ্রেশন

নিয়মিত প্রকাশ - বিবরণ
কোনো একটি অক্ষর মেলান
* কোন অক্ষর মেলে
+ + ম্যাচ অন্তত একটি সামনে প্রকাশের উদাহরণস্বরূপ
^ লাইন শুরুতে স্টার্ট
$ লাইনের শেষে অনুসন্ধান
< ম্যাচ শুধুমাত্র যদি এই সময়ে শব্দ শুরু
> ম্যাচ শুধুমাত্র যদি শব্দ এই সময়ে স্টপ
\ N একটি লাইন বিরতি মেলে
[] বন্ধনীগুলির মধ্যে যে কোনও অক্ষরের সাথে মেলে
[^ ...] character
[এবিকিউ]% এর পরে তালিকাভুক্ত নয় এমন কোনও চরিত্রের সাথে মেলে> স্ট্রিংটি অবশ্যই A, B বা Q অক্ষর দিয়ে শুরু হওয়া উচিত এবং এটি কোনও দৈর্ঘ্যের হতে পারে
[এ বি সি ডি]% স্ট্রিংটির দৈর্ঘ্য দুটি বা তার বেশি হতে হবে এবং এটি A বা B এর সাথে শুরু হতে হবে এবং দ্বিতীয় অক্ষর হিসাবে C বা D থাকতে হবে
[AZ]% স্ট্রিংটি কোনও দৈর্ঘ্যের হতে পারে এবং এ থেকে Z পর্যন্ত যে কোনও অক্ষর দিয়ে শুরু হওয়া আবশ্যক
[A] -Z0-9]% স্ট্রিংটি যে কোনও দৈর্ঘ্যের হতে পারে এবং এ থেকে জেড পর্যন্ত যে কোনও বর্ণ বা 0 থেকে 9 পর্যন্ত অঙ্ক হতে হবে
[^ এসি]% স্ট্রিংটি কোনও দৈর্ঘ্যের হতে পারে তবে A থেকে C অক্ষর দিয়ে শুরু হতে পারে না
% [এ জেড] স্ট্রিংটি কোনও দৈর্ঘ্যের হতে পারে এবং এ থেকে জেড
% পর্যন্ত কোনও অক্ষরের সাথে শেষ হওয়া আবশ্যক [% $ # @]% স্ট্রিংটি কোনও দৈর্ঘ্যের হতে পারে এবং এতে অন্তত একটি বিশেষ অক্ষর অন্তর্ভুক্ত থাকতে হবে বন্ধনী



1

@ Mwigdahl এর উত্তরের অনুরূপ পন্থা, আপনি সি # তে একটি নেট নেট সিআরআর প্রয়োগ করতে পারেন, যেমন কোড সহ;

using System.Data.SqlTypes;
using RX = System.Text.RegularExpressions;

public partial class UserDefinedFunctions
{
 [Microsoft.SqlServer.Server.SqlFunction]
 public static SqlString Regex(string input, string regex)
 {
  var match = RX.Regex.Match(input, regex).Groups[1].Value;
  return new SqlString (match);
 }
}

ইনস্টলেশন নির্দেশাবলী এখানে পাওয়া যাবে

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.