{"id":25457,"date":"2017-10-25T19:43:27","date_gmt":"2017-10-25T14:13:27","guid":{"rendered":"https:\/\/www.wikitechy.com\/technology\/?p=25457"},"modified":"2017-10-25T19:43:27","modified_gmt":"2017-10-25T14:13:27","slug":"c-programming-searching-patterns-set-3-rabin","status":"publish","type":"post","link":"https:\/\/www.wikitechy.com\/technology\/c-programming-searching-patterns-set-3-rabin\/","title":{"rendered":"C++ programming for Searching for Patterns Set 3 Rabin-Karp Algorithm"},"content":{"rendered":"<p>Given a text txt[0..n-1] and a pattern pat[0..m-1], write a function search(char pat[], char txt[]) that prints all occurrences of pat[] in txt[]. You may assume that n > m.<\/p>\n<p><strong>Examples:<\/strong><\/p>\n<pre>Input:  txt[] = \"THIS IS A TEST TEXT\"\r\n        pat[] = \"TEST\"\r\nOutput: Pattern found at index 10\r\n\r\nInput:  txt[] =  \"AABAACAADAABAABA\"\r\n        pat[] =  \"AABA\"\r\nOutput: Pattern found at index 0\r\n        Pattern found at index 9\r\n        Pattern found at index 12\r\n<img fetchpriority=\"high\" decoding=\"async\" class=\"aligncenter size-full wp-image-25432\" src=\"https:\/\/www.wikitechy.com\/technology\/wp-content\/uploads\/2017\/05\/Searching-for-Patterns-Set-2-KMP-Algorithm.png\" alt=\"C++ programming for Searching for Patterns Set 2 KMP Algorithm\" width=\"704\" height=\"384\" srcset=\"https:\/\/www.wikitechy.com\/technology\/wp-content\/uploads\/2017\/05\/Searching-for-Patterns-Set-2-KMP-Algorithm.png 704w, https:\/\/www.wikitechy.com\/technology\/wp-content\/uploads\/2017\/05\/Searching-for-Patterns-Set-2-KMP-Algorithm-300x164.png 300w\" sizes=\"(max-width: 704px) 100vw, 704px\" \/><\/pre>\n<p>The Naive String Matching algorithm slides the pattern one by one. After each slide, it one by one checks characters at the current shift and if all characters match then prints the match.<\/p>\n[ad type=\u201dbanner\u201d]\nLike the Naive Algorithm, Rabin-Karp algorithm also slides the pattern one by one. But unlike the Naive algorithm, Rabin Karp algorithm matches the hash value of the pattern with the hash value of current substring of text, and if the hash values match then only it starts matching individual characters. So Rabin Karp algorithm needs to calculate hash values for following strings.<\/p>\n<p>1) Pattern itself.<br \/>\n2) All the substrings of text of length m.<\/p>\n<p>Since we need to efficiently calculate hash values for all the substrings of size m of text, we must have a hash function which has following property.<br \/>\nHash at the next shift must be efficiently computable from the current hash value and next character in text or we can say hash(txt[s+1 .. s+m]) must be efficiently computable from hash(txt[s .. s+m-1]) and txt[s+m] i.e., hash(txt[s+1 .. s+m])= rehash(txt[s+m], hash(txt[s .. s+m-1]) and rehash must be O(1) operation.<\/p>\n<p>The hash function suggested by Rabin and Karp calculates an integer value. The integer value for a string is numeric value of a string. For example, if all possible characters are from 1 to 10, the numeric value of \u201c122\u201d will be 122. The number of possible characters is higher than 10 (256 in general) and pattern length can be large. So the numeric values cannot be practically stored as an integer. Therefore, the numeric value is calculated using modular arithmetic to make sure that the hash values can be stored in an integer variable (can fit in memory words). To do rehashing, we need to take off the most significant digit and add the new least significant digit for in hash value. Rehashing is done using the following formula.<\/p>\n[ad type=\u201dbanner\u201d]\n<p>hash( txt[s+1 .. s+m] ) = d ( hash( txt[s .. s+m-1]) \u2013 txt[s]*h ) + txt[s + m] ) mod q<\/p>\n<p>hash( txt[s .. s+m-1] ) : Hash value at shift s.<br \/>\nhash( txt[s+1 .. s+m] ) : Hash value at next shift (or shift s+1)<br \/>\nd: Number of characters in the alphabet<br \/>\nq: A prime number<br \/>\nh: d^(m-1)<\/p>\n[pastacode lang=\u201dcpp\u201d manual=\u201d%2F*%20Following%20program%20is%20a%20C%2B%2B%20implementation%20of%20Rabin%20Karp%0AAlgorithm%20given%20in%20the%20CLRS%20book%20*%2F%0A%23include%3Cstdio.h%3E%0A%23include%3Cstring.h%3E%0A%20%0A%2F%2F%20d%20is%20the%20number%20of%20characters%20in%20input%20alphabet%0A%23define%20d%20256%0A%20%0A%2F*%20pat%20-%3E%20pattern%0A%20%20%20%20txt%20-%3E%20text%0A%20%20%20%20q%20-%3E%20A%20prime%20number%0A*%2F%0Avoid%20search(char%20pat%5B%5D%2C%20char%20txt%5B%5D%2C%20int%20q)%0A%7B%0A%20%20%20%20int%20M%20%3D%20strlen(pat)%3B%0A%20%20%20%20int%20N%20%3D%20strlen(txt)%3B%0A%20%20%20%20int%20i%2C%20j%3B%0A%20%20%20%20int%20p%20%3D%200%3B%20%2F%2F%20hash%20value%20for%20pattern%0A%20%20%20%20int%20t%20%3D%200%3B%20%2F%2F%20hash%20value%20for%20txt%0A%20%20%20%20int%20h%20%3D%201%3B%0A%20%0A%20%20%20%20%2F%2F%20The%20value%20of%20h%20would%20be%20%22pow(d%2C%20M-1)%25q%22%0A%20%20%20%20for%20(i%20%3D%200%3B%20i%20%3C%20M-1%3B%20i%2B%2B)%0A%20%20%20%20%20%20%20%20h%20%3D%20(h*d)%25q%3B%0A%20%0A%20%20%20%20%2F%2F%20Calculate%20the%20hash%20value%20of%20pattern%20and%20first%0A%20%20%20%20%2F%2F%20window%20of%20text%0A%20%20%20%20for%20(i%20%3D%200%3B%20i%20%3C%20M%3B%20i%2B%2B)%0A%20%20%20%20%7B%0A%20%20%20%20%20%20%20%20p%20%3D%20(d*p%20%2B%20pat%5Bi%5D)%25q%3B%0A%20%20%20%20%20%20%20%20t%20%3D%20(d*t%20%2B%20txt%5Bi%5D)%25q%3B%0A%20%20%20%20%7D%0A%20%0A%20%20%20%20%2F%2F%20Slide%20the%20pattern%20over%20text%20one%20by%20one%0A%20%20%20%20for%20(i%20%3D%200%3B%20i%20%3C%3D%20N%20-%20M%3B%20i%2B%2B)%0A%20%20%20%20%7B%0A%20%0A%20%20%20%20%20%20%20%20%2F%2F%20Check%20the%20hash%20values%20of%20current%20window%20of%20text%0A%20%20%20%20%20%20%20%20%2F%2F%20and%20pattern.%20If%20the%20hash%20values%20match%20then%20only%0A%20%20%20%20%20%20%20%20%2F%2F%20check%20for%20characters%20on%20by%20one%0A%20%20%20%20%20%20%20%20if%20(%20p%20%3D%3D%20t%20)%0A%20%20%20%20%20%20%20%20%7B%0A%20%20%20%20%20%20%20%20%20%20%20%20%2F*%20Check%20for%20characters%20one%20by%20one%20*%2F%0A%20%20%20%20%20%20%20%20%20%20%20%20for%20(j%20%3D%200%3B%20j%20%3C%20M%3B%20j%2B%2B)%0A%20%20%20%20%20%20%20%20%20%20%20%20%7B%0A%20%20%20%20%20%20%20%20%20%20%20%20%20%20%20%20if%20(txt%5Bi%2Bj%5D%20!%3D%20pat%5Bj%5D)%0A%20%20%20%20%20%20%20%20%20%20%20%20%20%20%20%20%20%20%20%20break%3B%0A%20%20%20%20%20%20%20%20%20%20%20%20%7D%0A%20%0A%20%20%20%20%20%20%20%20%20%20%20%20%2F%2F%20if%20p%20%3D%3D%20t%20and%20pat%5B0\u2026M-1%5D%20%3D%20txt%5Bi%2C%20i%2B1%2C%20\u2026i%2BM-1%5D%0A%20%20%20%20%20%20%20%20%20%20%20%20if%20(j%20%3D%3D%20M)%0A%20%20%20%20%20%20%20%20%20%20%20%20%20%20%20%20printf(%22Pattern%20found%20at%20index%20%25d%20%5Cn%22%2C%20i)%3B%0A%20%20%20%20%20%20%20%20%7D%0A%20%0A%20%20%20%20%20%20%20%20%2F%2F%20Calculate%20hash%20value%20for%20next%20window%20of%20text%3A%20Remove%0A%20%20%20%20%20%20%20%20%2F%2F%20leading%20digit%2C%20add%20trailing%20digit%0A%20%20%20%20%20%20%20%20if%20(%20i%20%3C%20N-M%20)%0A%20%20%20%20%20%20%20%20%7B%0A%20%20%20%20%20%20%20%20%20%20%20%20t%20%3D%20(d*(t%20-%20txt%5Bi%5D*h)%20%2B%20txt%5Bi%2BM%5D)%25q%3B%0A%20%0A%20%20%20%20%20%20%20%20%20%20%20%20%2F%2F%20We%20might%20get%20negative%20value%20of%20t%2C%20converting%20it%0A%20%20%20%20%20%20%20%20%20%20%20%20%2F%2F%20to%20positive%0A%20%20%20%20%20%20%20%20%20%20%20%20if%20(t%20%3C%200)%0A%20%20%20%20%20%20%20%20%20%20%20%20t%20%3D%20(t%20%2B%20q)%3B%0A%20%20%20%20%20%20%20%20%7D%0A%20%20%20%20%7D%0A%7D\u201d message=\u201dC++\u201d highlight=\u201d\u201d provider=\u201dmanual\u201d\/]\n<p><strong>Output:<\/strong><br \/>\nPattern found at index 0<br \/>\nPattern found at index 10<br \/>\nThe average and best case running time of the Rabin-Karp algorithm is O(n+m), but its worst-case time is O(nm). Worst case of Rabin-Karp algorithm occurs when all characters of pattern and text are same as the hash values of all the substrings of txt[] match with hash value of pat[]. For example pat[] = \u201cAAA\u201d and txt[] = \u201cAAAAAAA\u201d.<\/p>\n<p>Please write comments if you find anything incorrect, or you want to share more information about the topic discussed above.<\/p>\n[ad type=\u201dbanner\u201d]\n","protected":false},"excerpt":{"rendered":"<p>C++ programming for Searching for Patterns Set 3 Rabin &#8211; Karp Algorithm &#8211; Given a text txt[0..n-1] and a pattern pat[0..m-1], write a function search.<\/p>\n","protected":false},"author":1,"featured_media":0,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[69969,83556,71670],"tags":[73379,71314,73263,73383,73273,73385,73321,73300,73320,73322,73382,70256,71849,70233,73390,73384,73369,73392,73387,73388,73282,73393,73323,73183,73194,73283,73272,73189,73285,73270,73279,73296,73274,73386,73391,73288,73264,70272,70099,70315,70308,73184,73299,73188,73287,73266,73275,73286,73276,73389],"class_list":["post-25457","post","type-post","status-publish","format-standard","hentry","category-algorithm","category-karp-algorithm","category-searching-and-sorting","tag-algorithm-data-structure","tag-algorithm-in-c","tag-algorithm-to-compare-two-strings","tag-alphabet-pattern-programs-in-c","tag-best-pattern-matching-algorithm","tag-best-searching-algorithm-in-c","tag-boyer-moore-algorithm-example","tag-boyer-moore-algorithm-explanation","tag-boyer-moore-pattern-matching-algorithm","tag-boyer-moore-pattern-matching-algorithm-example","tag-daa-tutorial","tag-data-structure-algorithms","tag-data-structure-tutorial","tag-data-structures-and-algorithms","tag-data-structures-and-algorithms-definition","tag-data-structures-and-algorithms-java","tag-data-structures-and-algorithms-tutorial","tag-definition-of-algorithm-in-data-structure","tag-definition-of-data-structure-and-algorithm","tag-dna-pattern-matching-algorithm","tag-first-pattern-matching-algorithm","tag-hash-pattern","tag-hashing-algorithm-in-c","tag-kmp","tag-kmp-algorithm","tag-kmp-algorithm-explained","tag-kmp-program-in-c","tag-knuth-algorithm","tag-knuth-morris-pratt-example","tag-pattern-matching-algorithm","tag-pattern-matching-algorithm-in-c","tag-pattern-matching-algorithm-in-data-structure","tag-pattern-matching-algorithm-ppt","tag-rabin-definition","tag-rabin-fingerprint-algorithm","tag-rabin-karp-algorithm-animation","tag-rabin-karp-algorithm-code-in-c","tag-search-algorithms","tag-search-inc","tag-searching-algorithms-in-java","tag-searching-c","tag-string-algorithms","tag-string-algorithms-pdf","tag-string-match","tag-string-pattern-matching-algorithms","tag-string-top","tag-text-comparison-algorithm","tag-what-is-a-substring","tag-what-is-pattern-matching-algorithm","tag-what-is-search-algorithm"],"_links":{"self":[{"href":"https:\/\/www.wikitechy.com\/technology\/wp-json\/wp\/v2\/posts\/25457","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/www.wikitechy.com\/technology\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/www.wikitechy.com\/technology\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/www.wikitechy.com\/technology\/wp-json\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/www.wikitechy.com\/technology\/wp-json\/wp\/v2\/comments?post=25457"}],"version-history":[{"count":0,"href":"https:\/\/www.wikitechy.com\/technology\/wp-json\/wp\/v2\/posts\/25457\/revisions"}],"wp:attachment":[{"href":"https:\/\/www.wikitechy.com\/technology\/wp-json\/wp\/v2\/media?parent=25457"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/www.wikitechy.com\/technology\/wp-json\/wp\/v2\/categories?post=25457"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/www.wikitechy.com\/technology\/wp-json\/wp\/v2\/tags?post=25457"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}