DIRegEx v8.6.8 for D4-XE10

DIRegEx is a library of Delphi (Embarcadero / CodeGear / Borland) components and procedures that implement regular expression pattern matching using the same syntax and semantics as Perl 5.10, with just a few differences. This includes support for UTF-8 encoded strings and Unicode general category properties.

DIRegEx offers two regular expression algorithms with their corresponding wrapper classes for easy usage:

  • TDIPerlRegEx implements a matching algorithm with the same syntax and semantics as Perl. Consider this the standard algorithm which you are used to from Perl and JavaScript. It is very fast and supports the complete pattern syntax. You will very likely be using it most of the time.
  • TDIDfaRegEx implements the DFA matching algorithm. Considerer this as a special purpose algorithm. If finds all possible matches and in particular, it finds the longest. It never needs to backtrack and supports partial matching much better, even for very long subject strings in several pieces.

DIRegEx v8.6.8 for D4-XE10Both classes descend from a common ancestor TDIRegEx which implements the complete functionality for working with regular expressions, regardless of which algorithm is currently in effect:

  • Matching and extraction of matches / substrings from the source text.
  • Searching for regular expressions within streams and memory buffers. To search within streams or files (of virtually unlimited size), use one of the specially optimized TDIRegExSearchStream class descendents.
  • Replacements on full and partial matches / substrings.
  • Listing of full and partial matches / substrings.
  • Formatting of matches.



Additional Features

DIRegEx can do a Format and Replace based on regular expressions, a feature often required for advanced text editors and word processors. It is possible to include parts of the originally matched text into the replacement.

The List function concatenates all reg-ex matches to a single string. It allows to build lists of phone numbers, e-mail addresses, etc. with a single function call only.

RegEx Mask Controls

DIRegEx v8.6.8 for D4-XE10DIRegEx also includes two regular expression edits: TDIRegExMaskEdit and TDIRegExComboBox. Both controls validate all keyboard input against a regular expression pattern. They work similar to Delphi's TMaskEdit, but are much more flexible and powerful.

The regular expression mask controls allow to:

  • Accept / reject certain characters at certain positions.
  • Allow / reject particular characters if they follow any character(s) of your choice.
  • Force the input text to begin / end with any character(s).
  • Not accept particular characters at the beginning / end of the input text.
  • Plus many more countless possibilities …


TDIRegExMaskEdit is an edit control that validates all keyboard input on a keystroke by keystroke basis. It accepts characters entered only if the new text matches the regular expression mask pattern. If the new text does not match, the character is silently rejected.


TDIRegExMaskComboBox is a combo box control with essentially the same regular expression validation as TDIRegExMaskEdit.


Version History

 DIRegEx 8.6.8 – 24 Nov 2015
  • Fixed a corner case of range optimization in JIT.
  • An incorrect error "overran compiling workspace" was given if there were exactly enough group forward references such that the last one extended into the workspace safety margin. The next one would have expanded the workspace. The test for overflow was not including the safety margin.
  • A match limit issue is fixed in JIT.
  • In a character class such as [\W\p{Any}] where both a negative-type escape ("not a word character") and a property escape were present, the property escape was being ignored.
  • Fix crash caused by very long (*MARK) or (*THEN) names.
  • A sequence such as [[:punct:]b] that is, a POSIX character class followed by a single ASCII character in a class item, was incorrectly compiled in UCP mode. The POSIX class got lost, but only if the single character followed it.
  • [:punct:] in UCP mode was matching some characters in the range 128-255 that should not have been matched.
  • If [:^ascii:] or [:^xdigit:] or [:^cntrl:] are present in a non-negated class, all characters with code points greater than 255 are in the class. When a Unicode property was also in the class (if PCRE_UCP is set, escapes such as \w are turned into Unicode properties), wide characters were not correctly handled, and could fail to match.

DIRegEx کتابخانه ای از کامپوننت ها و رویه های دلفی (Embarcadero/CodeGear/Borland) است که امکان اجرای تطبیق الگوی عبارت های منظم را با استفاده از سینتکس و معناشناسی یکسان مانند Perl 5.10 و کمی اختلاف امکان پذیر کرده است. از جمله قابلیت های DIRegEx می توان به پشتیبانی از رشته های انکود شده با UTF-8 و پراپرتی های عمومی یونیکد (Unicode) اشاره کرد.

DIRegEx برای استفاده آسان دو الگوریتم عبارت منظم را با کلاس های رپر مربوطه ارائه می دهد:

  • TDIPerlRegEx الگوریتم تطبیق را با سینتکس و معناشناسی Perl پیاده سازی می کند. TDIPerlRegEx یک الگوریتم استاندارد محسوب می شود که در گذشته در Perl و JavaScript مورد استفاده قرار می دادید. این اگلوریتم بسیار سریع بوده و از سینتکس الگوی کامل پشتیبانی می کند.
  • TDIDfaRegEx الگوریتم تطبیق DFA را پیاده سازی می کند. TDIDfaRegEx یک الگوریتم تک منظوره محسوب می شود. در صورتی که این الگوریتم تمام تطبیق های ممکن را بیابد، طولانی ترین آن ها را انتخاب می کند. TDIDfaRegEx به بازگشت نیازی ندارد و از تطبیق جزئی حتی در رشته های بسیار طولانی بهتر پشتیبانی می کند. این دو کلاس برگرفته از TDIRegEx می باشند که قابلیت کار با عبارت های منظم را دارد.

هر دو کلاس از ریشه های خود یعنی TDIRegEx گرفته شده اند که امکانات کامل برای کار با عبارت های منظم را صرف از نظر اینکه چه الگوریتم در دست کار است پیاده سازی می کند:

  • قابلیت مطابقت دادن و استخراج تطبیق ها/زیر رشته ها از متن منبع
  • قابلیت جستجو برای عبارت های منظم در رشته ها و بافرهای حافظه؛ برای جستجو در رشته ها یا فایل ها(با سایز نامحدود)، یکی از زیر شاخه های کلاس بهینه سازی شده TDIRegExSearchStream را مورد استفاده قرار دهید.
  • قابلیت جایگزین کردن تطبیق کامل یا زیر رشته جزئی
  • قابلیت فهرست کردن تطبیق های کامل یا زیر رشته های جزئی
  • قابلیت قالب بندی تطبیق ها

قابلیت های دیگر DIRegEx

DIRegEx می تواند تطبیق های عبارت منظم یا زیر رشته ای از آن را جایگزین، فهرست یا قالب بندی کند. این قابلیت برای ادتیورهای متن و واژه پردازها مناسب است. بخشی از تطبیق که می تواند در متن نتیجه قرار گیرد متغیر است. شما می توانید با عدد، زیر رشته یا حتی نام به تطبیق کامل اشاره کنید.

تابع List می تواند تمام تطبیق های reg-ex را در یک رشته قرار دهید. همچنین امکان ایجاد فهرست شماره تلفن، آدرس های ایمیل و ... را با یک فراخوانی تابع فراهم نموده است.

کنترل های ماسک RegEx

DIRegEx دارای دو ویرایش عبارت منظم TDIRegExMaskEdit و TDIRegExComboBox می باشد. این دو کنترل ورودی کیبورد را نسبت به عبارت منظم اعتبارسنجی می کند. عملکرد آن مشابه TMaskEdit دلفی می باشد اما نسبت به از قدرت و انعطاف بیشتری برخوردار است.

کنترل های ماسک عبارت منظم می توانند:

  • کاراکترهای خاصی را در موقعیت تعیین شده بپذیرند یا رد کنند.
  • کاراکترهای خاصی را پس از کاراکترهای معین بپذیرند یا رد کنند.
  • متن ورودی را محدود کند تا با کاراکترهای دقیقی آغاز شود یا پایان یابد.
  • کاراکترهای خاصی را در ابتدا یا انتهای متن ورودی نپذیرد.


TDIRegExMaskEdit از جمله کنترل های ادیتور می باشد که ورودی کیبورد را بر اساس فشردن کلید اعتبارسنجی می کند. TDIRegExMaskEdit تنها در صورتی کاراکترهای وارد شده را می پذیرد که متن جدید با الگوی ماسک عبارت منظم مطابقت داشته باشد. در صورتی که متن جدید مطابقت نداشته باشد کاراکتر رد خواهد شد.


TDIRegExMaskComboBox یک کنترل ComboBox با همان اعتبارسنجی عبارت منظم TDIRegExMaskEdit می باشد.

اپلیکیشن Workbench

DIRegEx Workbench به طراحی و تست عبارت های منظم کمک می کند. این محیط کاری امکان تنظیم آپشن ها، اندازه گیری زمان اجزا و ذخیره و بارگذاری تنظیمات برای کاربر بعد را امکان پذیر می کند.

تغییرات DIRegEx در نسخه اخیر (نسخه 8.6.8 در تاریخ 24 نوامبر 2015)

  • رفع مشکل عدم کارکرد صحیح بهینه سازی بازه در JIT
  • در صورتی که رفرنس های فوروارد گروهی کافی به گونه ای وجود داشت که رفرنس آخر به حاشیه امن فضای کاری می رسید، خطای «overran compiling workspace» به اشتباه داده می شد. رفرنس بعدی فضای کاری را بسط می داد. تست سر ریز شدن در حاشیه امن لحاظ نشده بود.
  • مشکل محدودیت تطبیق در JIT بر طرف شد.
  • در یک کلاس کاراکتر مانند [\W\p(Any)}] که فرار تایپ منفی («not a word character») و فرار پراپرتی وجود داشت، فرار پراپرتی نادیده گرفته می شد.
  • رفع مشکل کرش ناشی از نام های (*MARK) یا (*THEN) بسیار طولانی
  • یک توالی مانند [[:punct:]b] که یک کلاس کاراکتر POSIX بوده و به دنبال آن یک کاراکتر اسکی (ASCII) در آیتم کلاس قرار دارد، در حالت UCP به شکل اشتباه کامپایل می شد. کلاس POSIX از بین می رفت اما تنها در صورتی که یک کاراکتر واحد به دنبال آن قرار می گرفت.
  • [:punct:] در حالت UCP برخی از کاراکترهای محدوده 128 الی 255 را که نباید تطبیق داده می شدند را مطابقت می داد.
  • در صورتی که [:^ascii:] یا [:^xdigit:] یا [:^cntrl:] در کلاس غیر خنثی وجود داشته باشند، تمام کاراکترهای با کد پوینت (نقطه کد) بزرگتر از 255 در کلاس قرار خواهند داشت. هنگامی که یک پراپرتی Unicode نیز در کلاس قرار داشته باشد (اگر PCRE_UCP ست شده باشد، فرارهایی همچون \w به پراپرتی های Unicode تبدیل می شوند)، قابلیت کار صحیح با کاراکترهای عریض وجود ندارد و ممکن در عمل تطبیق خطا رخ دهد.
Post Details:
Rate : 5.0/5 based on 17
Download: 51
Visit: 1,477
Categories: Delphi

