2 lat temu · 6c5dfe4bee
--- a/README.md
+++ b/README.md
@@ -0,0 +1,19 @@
 
																+#  String Utilities in C++
															
 
																+
															
 
																+A couple of utilities for improving string usability
															
 
																+
															
 
																+## Join
															
 
																+
															
 
																+Concatenate the elements of a container with a joining token. Uses ostreams.
															
 
																+
															
 
																+## Tokenizer/Split
															
 
																+
															
 
																+Split a string into a vector of strings. There are two different versions of the tokenizer: normal 
															
 
																+and escapable. The EscapableTokenizer cannot return string\_views, because it may have to doctor 
															
 
																+the contents.
															
 
																+
															
 
																+## Cast - Coercing types from strings
															
 
																+
															
 
																+In GoogleMock, if you don't want to define an ostream operator for your type, you can define a 
															
 
																+function `PrintTo(T const &, std::ostream*)` in the same namespace as `T`. GoogleMock then uses ADL 
															
 
																+to find that function and use it to print out the formatted version.
															
--- a/include/string_utils/forwards.h
+++ b/include/string_utils/forwards.h
@@ -11,14 +11,22 @@
 
																 #include "string_utils/traits.h"
															
 
																 namespace string_utils {
															
 
																+
															
 
																+class Tokenizer;
															
 
																+class EscapedTokenizer;
															
 
																+
															
 
																 // A helper object for providing partial specializations for casting
															
 
																 template <typename, typename = void> struct cast_helper;
															
 
																 // The main parser
															
 
																 template <typename T> std::pair<T, bool> cast(std::string_view str) noexcept;
															
 
																-template <typename T, typename S> std::pair<T, bool> cast(std::vector<S> const &str) noexcept;
															
 
																+template <typename T, typename S>
															
 
																+std::pair<T, bool> cast(std::vector<S> const & str) noexcept;
															
 
																-template <typename S, typename T,
															
 
																-          typename = std::enable_if_t<detail::has_result<cast_helper<T>(S, T&)>{}>>
															
 
																-bool cast(S const &str, T & to) noexcept { return cast_helper<T>{}(str, to); }
															
 
																+template <
															
 
																+    typename S, typename T,
															
 
																+    typename = std::enable_if_t<detail::has_result<cast_helper<T>(S, T &)>{}>>
															
 
																+bool cast(S const & str, T & to) noexcept {
															
 
																+  return cast_helper<T>{}(str, to);
															
 
																+}
															
 
																 }
															
--- a/include/string_utils/tokenizer.h
+++ b/include/string_utils/tokenizer.h
@@ -11,48 +11,69 @@
 
																 #include <string>
															
 
																 #include <vector>
															
 
																+#include "string_utils/forwards.h"
															
 
																+
															
 
																 namespace string_utils {
															
 
																-class tokenizer {
															
 
																+class Tokenizer {
															
 
																 public:
															
 
																-  static constexpr size_t const infinite_outputs{~size_t(0)};
															
 
																-  struct quote {
															
 
																+  static constexpr size_t const UNLIMITED = ~0ul;
															
 
																+
															
 
																+protected:
															
 
																+  struct Quote {
															
 
																     char on;
															
 
																-    std::string escaped;
															
 
																+    std::string_view escaped;
															
 
																   };
															
 
																 private:
															
 
																-  std::string divider_;
															
 
																-  quote quote_;
															
 
																-  size_t max_outputs_{infinite_outputs};
															
 
																+  std::string_view divider_;
															
 
																+  Quote quote_{'\0', ""};
															
 
																+  size_t max_outputs_{UNLIMITED};
															
 
																   bool truncate_{false};
															
 
																   bool ignore_empty_tokens_{true};
															
 
																   bool escapable_{false};
															
 
																   bool reverse_search_{false};
															
 
																 public:
															
 
																-  tokenizer(std::string divider, struct quote quote = {'\0', ""});
															
 
																+  explicit Tokenizer(std::string_view divider);
															
 
																-  tokenizer & max_outputs(size_t new_max_outputs);
															
 
																-  tokenizer & truncate(bool new_truncate_overage);
															
 
																-  tokenizer & ignore_empty_tokens(bool new_ignore_empty_tokens);
															
 
																-  tokenizer & escapable(bool new_escapable);
															
 
																-  tokenizer & reverse_search(bool new_reverse);
															
 
																+  Tokenizer & max_outputs(size_t new_max_outputs);
															
 
																+  Tokenizer & truncate(bool new_truncate_overage);
															
 
																+  Tokenizer & ignore_empty_tokens(bool new_ignore_empty_tokens);
															
 
																+  Tokenizer & reverse_search(bool new_reverse);
															
 
																+  EscapedTokenizer escapable(Quote quote = Quote{'\0', ""}) const;
															
 
																-  std::vector<std::string> operator()(std::string input) const;
															
 
																+  std::vector<std::string> operator()(std::string && input) const;
															
 
																+  std::vector<std::string_view> operator()(std::string_view input) const;
															
 
																-private:
															
 
																-  size_t max_outputs() const;
															
 
																+protected:
															
 
																+  Tokenizer & quote(Quote quote);
															
 
																+  std::string unescape(std::string_view token) const;
															
 
																+};
															
 
																+
															
 
																+class EscapedTokenizer : public Tokenizer {
															
 
																+public:
															
 
																+  explicit EscapedTokenizer(std::string_view divider,
															
 
																+                            Quote quote = Quote{'\0', ""});
															
 
																+  explicit EscapedTokenizer(Tokenizer impl, Quote quote);
															
 
																+
															
 
																+  EscapedTokenizer & max_outputs(size_t new_max_outputs);
															
 
																+  EscapedTokenizer & truncate(bool new_truncate_overage);
															
 
																+  EscapedTokenizer & ignore_empty_tokens(bool new_ignore_empty_tokens);
															
 
																+  EscapedTokenizer & reverse_search(bool new_reverse);
															
 
																+
															
 
																+  std::vector<std::string> operator()(std::string && input) const;
															
 
																+  std::vector<std::string> operator()(std::string_view input) const;
															
 
																 };
															
 
																 inline auto split(std::string const & data, std::string const & on,
															
 
																-                  size_t max = tokenizer::infinite_outputs) {
															
 
																-  return tokenizer{on}.max_outputs(max)(data);
															
 
																+                  size_t max = Tokenizer::UNLIMITED) {
															
 
																+  return Tokenizer{on}.max_outputs(max)(data);
															
 
																 }
															
 
																 inline auto rsplit(std::string const & data, std::string const & on,
															
 
																-                   size_t max = tokenizer::infinite_outputs) {
															
 
																-  return tokenizer{on}.reverse_search(true).max_outputs(max)(data);
															
 
																+                   size_t max = Tokenizer::UNLIMITED) {
															
 
																+  return Tokenizer{on}.reverse_search(true).max_outputs(max)(data);
															
 
																 }
															
 
																 }
															
--- a/src/tokenizer.cxx
+++ b/src/tokenizer.cxx
@@ -8,103 +8,183 @@
 
																 #include "string_utils/tokenizer.h"
															
 
																-namespace string_utils {
															
 
																+namespace {
															
 
																+bool is_escaped(std::string_view str, std::size_t p) {
															
 
																+  if (p == 0 || str[p - 1] != '\\') { return false; }
															
 
																+  return ((p - str.find_last_not_of('\\', p - 1) - 1) & 1) == 1;
															
 
																+}
															
 
																-template <typename C> static void reverse(C & str) {
															
 
																-  std::reverse(str.begin(), str.end());
															
 
																+auto promote(std::vector<std::string_view> input) {
															
 
																+  return std::vector<std::string>(input.cbegin(), input.cend());
															
 
																 }
															
 
																-tokenizer::tokenizer(std::string divider, struct quote quote)
															
 
																-    : divider_(std::move(divider)), quote_(std::move(quote)) {}
															
 
																+bool current_token_is(std::string_view token, size_t offset,
															
 
																+                      std::string_view find) {
															
 
																+  return find.size() > 0 and token.compare(offset, find.size(), find) == 0;
															
 
																+};
															
 
																+}
															
 
																+
															
 
																+namespace string_utils {
															
 
																-tokenizer & tokenizer::max_outputs(size_t new_max_outputs) {
															
 
																+Tokenizer::Tokenizer(std::string_view divider) : divider_(divider) {}
															
 
																+
															
 
																+Tokenizer & Tokenizer::max_outputs(size_t new_max_outputs) {
															
 
																   max_outputs_ = new_max_outputs;
															
 
																   return *this;
															
 
																 }
															
 
																-tokenizer & tokenizer::truncate(bool new_truncate) {
															
 
																+Tokenizer & Tokenizer::truncate(bool new_truncate) {
															
 
																   truncate_ = new_truncate;
															
 
																   return *this;
															
 
																 }
															
 
																-tokenizer & tokenizer::ignore_empty_tokens(bool new_ignore_empty_tokens) {
															
 
																+Tokenizer & Tokenizer::ignore_empty_tokens(bool new_ignore_empty_tokens) {
															
 
																   ignore_empty_tokens_ = new_ignore_empty_tokens;
															
 
																   return *this;
															
 
																 }
															
 
																-tokenizer & tokenizer::escapable(bool new_escapable) {
															
 
																-  escapable_ = new_escapable;
															
 
																+Tokenizer & Tokenizer::reverse_search(bool new_reverse) {
															
 
																+  reverse_search_ = new_reverse;
															
 
																   return *this;
															
 
																 }
															
 
																-tokenizer & tokenizer::reverse_search(bool new_reverse) {
															
 
																-  if (reverse_search_ != new_reverse) {
															
 
																-    reverse(divider_);
															
 
																-    reverse(quote_.escaped);
															
 
																-  }
															
 
																-  reverse_search_ = new_reverse;
															
 
																+EscapedTokenizer::EscapedTokenizer(std::string_view divider, Quote quote)
															
 
																+    : EscapedTokenizer(Tokenizer(divider), quote) {}
															
 
																+
															
 
																+EscapedTokenizer::EscapedTokenizer(Tokenizer tok, Quote quote)
															
 
																+    : Tokenizer(tok) {
															
 
																+  this->quote(quote);
															
 
																+}
															
 
																+
															
 
																+EscapedTokenizer & EscapedTokenizer::max_outputs(size_t new_max_outputs) {
															
 
																+  Tokenizer::max_outputs(new_max_outputs);
															
 
																   return *this;
															
 
																 }
															
 
																-static std::size_t countback(std::string const & str, std::size_t p, char c) {
															
 
																-  if (p == 0 || str[p - 1] != c) return 0;
															
 
																-  return p - str.find_last_not_of(c, p - 1) - 1;
															
 
																+EscapedTokenizer & EscapedTokenizer::truncate(bool new_truncate) {
															
 
																+  Tokenizer::truncate(new_truncate);
															
 
																+  return *this;
															
 
																 }
															
 
																-std::vector<std::string> tokenizer::operator()(std::string input) const {
															
 
																-  auto equals_from = [&input](std::string const & token, std::size_t from) {
															
 
																-    return token.size() + from < input.size() &&
															
 
																-           std::strncmp(input.c_str() + from, token.c_str(), token.size()) == 0;
															
 
																-  };
															
 
																+EscapedTokenizer &
															
 
																+EscapedTokenizer::ignore_empty_tokens(bool new_ignore_empty_tokens) {
															
 
																+  Tokenizer::ignore_empty_tokens(new_ignore_empty_tokens);
															
 
																+  return *this;
															
 
																+}
															
 
																-  if (reverse_search_) { reverse(input); }
															
 
																+EscapedTokenizer & EscapedTokenizer::reverse_search(bool new_reverse) {
															
 
																+  Tokenizer::reverse_search(new_reverse);
															
 
																+  return *this;
															
 
																+}
															
 
																-  std::vector<std::string> rval;
															
 
																-  std::string buffer;
															
 
																-  buffer.reserve(input.size());
															
 
																+Tokenizer & Tokenizer::quote(Quote quote) {
															
 
																+  quote_ = quote;
															
 
																+  escapable_ = true;
															
 
																+  return *this;
															
 
																+}
															
 
																+
															
 
																+EscapedTokenizer Tokenizer::escapable(Quote quote) const {
															
 
																+  return EscapedTokenizer(*this, quote);
															
 
																+}
															
 
																+
															
 
																+std::vector<std::string_view>
															
 
																+Tokenizer::operator()(std::string_view input) const {
															
 
																+  //  if (reverse_search_) { reverse(input); }
															
 
																+
															
 
																+  std::vector<std::string_view> rval;
															
 
																   // If max_outputs_ == infinite_outputs, this will be infinite enough to work
															
 
																   // since we'll hit overflow on the string itself before this.
															
 
																   std::size_t const max = max_outputs_ - !truncate_;
															
 
																   std::size_t const qsz = quote_.escaped.size();
															
 
																-  std::size_t from = 0;
															
 
																+  size_t span = 0;
															
 
																   bool in_quote{false};
															
 
																-  for (std::size_t pos = 0; pos < input.size() && rval.size() < max; ++pos) {
															
 
																-    // We check for escaped-quotes before we check for quotes to minimise
															
 
																-    // complexity. Once in a quote, we simply append everything without checking
															
 
																-    // for the divider until the end quote is encountered (escaped quotes are
															
 
																-    // processed normally).
															
 
																-    if (qsz > 0 && equals_from(quote_.escaped, pos)) {
															
 
																-      buffer.append(1, quote_.on);
															
 
																-      pos += qsz - 1;
															
 
																-    } else if (input[pos] == quote_.on) {
															
 
																-      in_quote = !in_quote;
															
 
																-    } else if (in_quote || !equals_from(divider_, pos)) {
															
 
																-      buffer.append(1, input[pos]);
															
 
																-    } else if (escapable_ && countback(input, pos, '\\') % 2) {
															
 
																-      buffer.back() = input[pos];
															
 
																-    } else if (!in_quote) {
															
 
																-      if (!ignore_empty_tokens_ || buffer.size()) { rval.emplace_back(buffer); }
															
 
																-      from = pos + 1;
															
 
																-      buffer.clear();
															
 
																+  while (not input.empty() and rval.size() < max and span == 0) {
															
 
																+    for (span = 0; span < input.size(); ++span) {
															
 
																+      // We check for escaped-quotes before we check for quotes to minimise
															
 
																+      // complexity. Once in a quote, we simply append everything without
															
 
																+      // checking for the divider until the end quote is encountered (escaped
															
 
																+      // quotes are processed normally).
															
 
																+      if (not quote_.escaped.empty() and
															
 
																+          current_token_is(input, span, quote_.escaped)) {
															
 
																+        span += qsz - 1;
															
 
																+      } else if (input[span] == quote_.on) {
															
 
																+        in_quote = !in_quote;
															
 
																+      } else if (in_quote or not current_token_is(input, span, divider_)) {
															
 
																+        continue;
															
 
																+      } else if (escapable_ and is_escaped(input, span)) {
															
 
																+        continue;
															
 
																+      } else {
															
 
																+        if (not ignore_empty_tokens_ or span > 0) {
															
 
																+          rval.push_back(input.substr(0, span));
															
 
																+        }
															
 
																+        input.remove_prefix(span + divider_.size());
															
 
																+        span = 0;
															
 
																+        break;
															
 
																+      }
															
 
																     }
															
 
																   }
															
 
																   // Due to the special handling rules of the truncate feature, we need
															
 
																   // to add an additional layer of handling around empty tokens and buffer
															
 
																-  if (ignore_empty_tokens_ && equals_from(divider_, from)) { ++from; }
															
 
																+  if (ignore_empty_tokens_ and current_token_is(input, span, divider_)) {
															
 
																+    input.remove_prefix(divider_.size());
															
 
																+  }
															
 
																   // Additionally, we do not want to include the final element if there is
															
 
																   // actually no data remaining in the buffer/input string, even when we permit
															
 
																   // empty tokens in our output.
															
 
																-  if (rval.size() < max_outputs_ && !(buffer.empty() && from == input.size())) {
															
 
																-    rval.emplace_back(buffer.empty() ? input.substr(from) : buffer);
															
 
																+  if (rval.size() < max_outputs_ and not input.empty()) {
															
 
																+    rval.emplace_back(input);
															
 
																   }
															
 
																-  if (reverse_search_) {
															
 
																-    reverse(rval);
															
 
																-    for (auto & str : rval) {
															
 
																-      reverse(str);
															
 
																+  //  if (reverse_search_) {
															
 
																+  //    reverse(rval);
															
 
																+  //    for (auto & str : rval) {
															
 
																+  //      reverse(str);
															
 
																+  //    }
															
 
																+  //  }
															
 
																+  return rval;
															
 
																+}
															
 
																+
															
 
																+std::string Tokenizer::unescape(std::string_view token) const {
															
 
																+  std::string rval;
															
 
																+  rval.reserve(token.size());
															
 
																+  for (size_t i = 0; i < token.size(); ++i) {
															
 
																+    /*if (current_token_is(token, i, "\\\\")) {
															
 
																+      rval.append(1, '\\');
															
 
																+      ++i;
															
 
																+    } else */
															
 
																+    // The order of these tests is important!
															
 
																+    // First we check if the current token is an escaped-quote - if so,
															
 
																+    // replace it with the regular quote.
															
 
																+    if (current_token_is(token, i, quote_.escaped)) {
															
 
																+      rval.append(1, quote_.on);
															
 
																+    } else if (token[i] == '\\' and current_token_is(token, i + 1, divider_)) {
															
 
																+      // Then we check if we're looking at an escaped divider
															
 
																+      rval.append(divider_);
															
 
																+      i += divider_.size();
															
 
																+    } else if (token[i] != quote_.on) {
															
 
																+      // Lastly - we remote unescaped quotes
															
 
																+      rval.append(1, token[i]);
															
 
																     }
															
 
																   }
															
 
																   return rval;
															
 
																 }
															
 
																+std::vector<std::string> Tokenizer::operator()(std::string && input) const {
															
 
																+  return promote(operator()(std::string_view(input)));
															
 
																+}
															
 
																+
															
 
																+std::vector<std::string>
															
 
																+EscapedTokenizer::operator()(std::string_view input) const {
															
 
																+  auto rval = promote(Tokenizer::operator()(std::string_view(input)));
															
 
																+  for (auto & token : rval) {
															
 
																+    token = unescape(token);
															
 
																+  }
															
 
																+  return rval;
															
 
																+}
															
 
																+
															
 
																+std::vector<std::string>
															
 
																+EscapedTokenizer::operator()(std::string && input) const {
															
 
																+  return operator()(std::string_view(input));
															
 
																+}
															
 
																+
															
 
																 }
															
--- a/string-utils.xcodeproj/project.pbxproj
+++ b/string-utils.xcodeproj/project.pbxproj
@@ -70,6 +70,7 @@
 
																 		CD266880252FFA7E00B3E667 /* tokenizer_test.cxx */ = {isa = PBXFileReference; lastKnownFileType = sourcecode.cpp.cpp; path = tokenizer_test.cxx; sourceTree = "<group>"; };
															
 
																 		CD266886252FFAAE00B3E667 /* string_utils-test.xctest */ = {isa = PBXFileReference; explicitFileType = wrapper.cfbundle; includeInIndex = 0; path = "string_utils-test.xctest"; sourceTree = BUILT_PRODUCTS_DIR; };
															
 
																 		CD26688A252FFAAE00B3E667 /* Info.plist */ = {isa = PBXFileReference; lastKnownFileType = text.plist.xml; path = Info.plist; sourceTree = "<group>"; };
															
 
																+		CD87CD7E29BCC63600C5949D /* README.md */ = {isa = PBXFileReference; lastKnownFileType = net.daringfireball.markdown; path = README.md; sourceTree = "<group>"; };
															
 
																 		CDC883E228560A7C0088C91E /* any_of.h */ = {isa = PBXFileReference; fileEncoding = 4; lastKnownFileType = sourcecode.c.h; path = any_of.h; sourceTree = "<group>"; };
															
 
																 		CDC883E328560A7C0088C91E /* tokenizer.h */ = {isa = PBXFileReference; fileEncoding = 4; lastKnownFileType = sourcecode.c.h; path = tokenizer.h; sourceTree = "<group>"; };
															
 
																 		CDC883E428560A7C0088C91E /* cast.h */ = {isa = PBXFileReference; fileEncoding = 4; lastKnownFileType = sourcecode.c.h; path = cast.h; sourceTree = "<group>"; };
															
@@ -98,6 +99,7 @@
 
																 		CD266859252FF4B600B3E667 = {
															
 
																 			isa = PBXGroup;
															
 
																 			children = (
															
 
																+				CD87CD7E29BCC63600C5949D /* README.md */,
															
 
																 				CD26686D252FF51F00B3E667 /* GoogleMock.xcodeproj */,
															
 
																 				CD26686A252FF4E100B3E667 /* string_utils */,
															
 
																 				CDC883E028560A7C0088C91E /* include */,
															
--- a/test/tokenizer_test.cxx
+++ b/test/tokenizer_test.cxx
@@ -14,92 +14,92 @@ using namespace string_utils;
 
																 TEST(TokenizerTest, SplitsStringOverToken) {
															
 
																   std::string const input = "A.B.C.D";
															
 
																-  std::vector<std::string> const expected{"A", "B", "C", "D"};
															
 
																+  std::vector<std::string_view> const expected{"A", "B", "C", "D"};
															
 
																   EXPECT_THAT(split(input, "."), expected);
															
 
																 }
															
 
																 TEST(TokenizerTest, SplitsStringUpToNTimes) {
															
 
																   std::string const input = "A.B.C.D";
															
 
																-  std::vector<std::string> const expected{"A", "B", "C.D"};
															
 
																+  std::vector<std::string_view> const expected{"A", "B", "C.D"};
															
 
																   EXPECT_THAT(split(input, ".", 3), expected);
															
 
																 }
															
 
																 TEST(TokenizerTest, IgnoresEmptyElementsAtStart) {
															
 
																   std::string const input = ".A.B.C";
															
 
																-  std::vector<std::string> const expected{"A", "B", "C"};
															
 
																+  std::vector<std::string_view> const expected{"A", "B", "C"};
															
 
																   EXPECT_THAT(split(input, ".", 3), expected);
															
 
																 }
															
 
																 TEST(TokenizerTest, IgnoresEmptyElements) {
															
 
																   std::string const input = "A..B.C";
															
 
																-  std::vector<std::string> const expected{"A", "B", "C"};
															
 
																+  std::vector<std::string_view> const expected{"A", "B", "C"};
															
 
																   EXPECT_THAT(split(input, ".", 3), expected);
															
 
																 }
															
 
																 TEST(TokenizerTest, IgnoresEmptyElementsOnEnd) {
															
 
																   std::string const input = "A.B..C";
															
 
																-  std::vector<std::string> const expected{"A", "B", "C"};
															
 
																+  std::vector<std::string_view> const expected{"A", "B", "C"};
															
 
																   EXPECT_THAT(split(input, ".", 3), expected);
															
 
																 }
															
 
																 TEST(TokenizerTest, TruncateDiscardsOverageInsteadOfNotParsingPast) {
															
 
																   std::string const input = "A.B.C.D";
															
 
																-  std::vector<std::string> const expected{"A", "B", "C"};
															
 
																-  EXPECT_THAT(tokenizer(".").max_outputs(3).truncate(true)(input), expected);
															
 
																+  std::vector<std::string_view> const expected{"A", "B", "C"};
															
 
																+  EXPECT_THAT(Tokenizer(".").max_outputs(3).truncate(true)(input), expected);
															
 
																 }
															
 
																 TEST(TokenizerTest, EmptyIsPlacedCorrectlyWhenEnabled) {
															
 
																   std::string const input = "A..B.C";
															
 
																-  std::vector<std::string> const expected{"A", "", "B.C"};
															
 
																-  EXPECT_THAT(tokenizer(".").max_outputs(3).ignore_empty_tokens(false)(input),
															
 
																+  std::vector<std::string_view> const expected{"A", "", "B.C"};
															
 
																+  EXPECT_THAT(Tokenizer(".").max_outputs(3).ignore_empty_tokens(false)(input),
															
 
																               expected);
															
 
																 }
															
 
																 TEST(TokenizerTest, MaxSizeWithEmptyCanResultInTokenWithDividerPrefix) {
															
 
																   std::string const input = "A.B..C";
															
 
																-  std::vector<std::string> const expected{"A", "B", ".C"};
															
 
																-  EXPECT_THAT(tokenizer(".").max_outputs(3).ignore_empty_tokens(false)(input),
															
 
																+  std::vector<std::string_view> const expected{"A", "B", ".C"};
															
 
																+  EXPECT_THAT(Tokenizer(".").max_outputs(3).ignore_empty_tokens(false)(input),
															
 
																               expected);
															
 
																 }
															
 
																 TEST(TokenizerTest, EscapableTokensStickTogether) {
															
 
																   std::string const input = R"(A B\ C)";
															
 
																   std::vector<std::string> const expected{"A", "B C"};
															
 
																-  EXPECT_THAT(tokenizer(" ").escapable(true)(input), expected);
															
 
																+  EXPECT_THAT(EscapedTokenizer(" ")(input), expected);
															
 
																 }
															
 
																 TEST(TokenizerTest, CorrectlySplitsWhenEvenEscapes) {
															
 
																   std::string const input = R"(A B\\ C)";
															
 
																   std::vector<std::string> const expected{"A", R"(B\\)", "C"};
															
 
																-  EXPECT_THAT(tokenizer(" ").escapable(true)(input), expected);
															
 
																+  EXPECT_THAT(EscapedTokenizer(" ")(input), expected);
															
 
																 }
															
 
																 TEST(TokenizerTest, QuotesAreDiscarded) {
															
 
																   std::string const input = R"(A,"B",C)";
															
 
																   std::vector<std::string> const expected{"A", "B", "C"};
															
 
																-  EXPECT_THAT(tokenizer(",", {'"'})(input), expected);
															
 
																+  EXPECT_THAT(EscapedTokenizer(",", {'"'})(input), expected);
															
 
																 }
															
 
																 TEST(TokenizerTest, QuotedTokensStickTogether) {
															
 
																   std::string const input = R"(A,"B,C")";
															
 
																   std::vector<std::string> const expected{"A", "B,C"};
															
 
																-  EXPECT_THAT(tokenizer(",", {'"'})(input), expected);
															
 
																+  EXPECT_THAT(EscapedTokenizer(",", {'"'})(input), expected);
															
 
																 }
															
 
																 TEST(TokenizerTest, QuotedTokensAreEscapable) {
															
 
																   std::string const input = R"(A,"B\",C")";
															
 
																   std::vector<std::string> const expected{"A", "B\",C"};
															
 
																-  EXPECT_THAT(tokenizer(",", {'"', "\\\""})(input), expected);
															
 
																+  EXPECT_THAT(EscapedTokenizer(",", {'"', "\\\""})(input), expected);
															
 
																 }
															
 
																 TEST(TokenizerTest, QuoteTokenLiteralIsApplicable) {
															
 
																   std::string const input = R"(A,"B"",C")";
															
 
																   std::vector<std::string> const expected{"A", "B\",C"};
															
 
																-  EXPECT_THAT(tokenizer(",", {'"', "\"\""})(input), expected);
															
 
																+  EXPECT_THAT(EscapedTokenizer(",", {'"', "\"\""})(input), expected);
															
 
																 }
															
 
																 TEST(TokenizerTest, QuotesDontNeedToBeAtStartAndEnd) {
															
 
																   std::string const input = R"(A,B",C")";
															
 
																   std::vector<std::string> const expected{"A", "B,C"};
															
 
																-  EXPECT_THAT(tokenizer(",", {'"'})(input), expected);
															
 
																+  EXPECT_THAT(EscapedTokenizer(",", {'"'})(input), expected);
															
 
																 }