From 3eea69f980dbd95b518d531b295efeaf709cf23a Mon Sep 17 00:00:00 2001
From: psteinroe <philipp@steinroetter.com>
Date: Fri, 9 Aug 2024 13:08:18 +0200
Subject: [PATCH 01/19] fix: rewrite statement splitter wip

---
 crates/pg_statement_splitter/src/data.rs      | 109 +++++++
 crates/pg_statement_splitter/src/lib.rs       | 236 +++++++-------
 crates/pg_statement_splitter/src/parser.rs    |  14 +-
 .../src/statement_splitter.rs                 | 303 ++++++++++++++++++
 .../src/statement_tracker.rs                  | 128 ++++++++
 .../tests/statement_splitter_tests.rs         | 216 ++++++-------
 6 files changed, 776 insertions(+), 230 deletions(-)
 create mode 100644 crates/pg_statement_splitter/src/data.rs
 create mode 100644 crates/pg_statement_splitter/src/statement_splitter.rs
 create mode 100644 crates/pg_statement_splitter/src/statement_tracker.rs
diff --git a/crates/pg_statement_splitter/src/data.rs b/crates/pg_statement_splitter/src/data.rs
new file mode 100644
index 00000000..1cff7795
--- /dev/null
+++ b/crates/pg_statement_splitter/src/data.rs
@@ -0,0 +1,109 @@
+use pg_lexer::SyntaxKind;
+use std::{collections::HashMap, sync::LazyLock};
+
+#[derive(Debug)]
+pub enum SyntaxDefinition {
+    RequiredToken(SyntaxKind),
+    OptionalToken(SyntaxKind),
+    AnyTokens,
+    AnyToken,
+    OneOf(Vec<SyntaxKind>),
+}
+
+#[derive(Debug)]
+pub struct StatementDefinition {
+    pub stmt: SyntaxKind,
+    pub tokens: Vec<SyntaxDefinition>,
+}
+
+pub static STATEMENT_BRIDGE_DEFINITIONS: LazyLock<HashMap<SyntaxKind, Vec<StatementDefinition>>> =
+    LazyLock::new(|| {
+        let mut m: Vec<StatementDefinition> = Vec::new();
+
+        m.push(StatementDefinition {
+            stmt: SyntaxKind::SelectStmt,
+            tokens: vec![
+                SyntaxDefinition::RequiredToken(SyntaxKind::Union),
+                SyntaxDefinition::OptionalToken(SyntaxKind::All),
+            ],
+        });
+
+        m.push(StatementDefinition {
+            stmt: SyntaxKind::SelectStmt,
+            tokens: vec![
+                SyntaxDefinition::RequiredToken(SyntaxKind::Intersect),
+                SyntaxDefinition::OptionalToken(SyntaxKind::All),
+            ],
+        });
+
+        m.push(StatementDefinition {
+            stmt: SyntaxKind::SelectStmt,
+            tokens: vec![
+                SyntaxDefinition::RequiredToken(SyntaxKind::Except),
+                SyntaxDefinition::OptionalToken(SyntaxKind::All),
+            ],
+        });
+
+        let mut stmt_starts: HashMap<SyntaxKind, Vec<StatementDefinition>> = HashMap::new();
+
+        for stmt in m {
+            let first_token = stmt.tokens.get(0).unwrap();
+            if let SyntaxDefinition::RequiredToken(kind) = first_token {
+                stmt_starts.entry(*kind).or_insert(Vec::new()).push(stmt);
+            } else {
+                panic!("Expected RequiredToken as first token in bridge definition");
+            }
+        }
+
+        stmt_starts
+    });
+
+pub static STATEMENT_DEFINITIONS: LazyLock<HashMap<SyntaxKind, Vec<StatementDefinition>>> =
+    LazyLock::new(|| {
+        let mut m: Vec<StatementDefinition> = Vec::new();
+
+        m.push(StatementDefinition {
+            stmt: SyntaxKind::CreateTrigStmt,
+            tokens: vec![
+                SyntaxDefinition::RequiredToken(SyntaxKind::Create),
+                SyntaxDefinition::OptionalToken(SyntaxKind::Or),
+                SyntaxDefinition::OptionalToken(SyntaxKind::Replace),
+                SyntaxDefinition::OptionalToken(SyntaxKind::Constraint),
+                SyntaxDefinition::RequiredToken(SyntaxKind::Trigger),
+                SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
+                SyntaxDefinition::AnyTokens,
+                SyntaxDefinition::RequiredToken(SyntaxKind::On),
+                SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
+                SyntaxDefinition::AnyTokens,
+                SyntaxDefinition::RequiredToken(SyntaxKind::Execute),
+                SyntaxDefinition::OneOf(vec![SyntaxKind::Function, SyntaxKind::Procedure]),
+                SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
+            ],
+        });
+
+        m.push(StatementDefinition {
+            stmt: SyntaxKind::SelectStmt,
+            tokens: vec![SyntaxDefinition::RequiredToken(SyntaxKind::Select)],
+        });
+
+        m.push(StatementDefinition {
+            stmt: SyntaxKind::ExecuteStmt,
+            tokens: vec![
+                SyntaxDefinition::RequiredToken(SyntaxKind::Execute),
+                SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
+            ],
+        });
+
+        let mut stmt_starts: HashMap<SyntaxKind, Vec<StatementDefinition>> = HashMap::new();
+
+        for stmt in m {
+            let first_token = stmt.tokens.get(0).unwrap();
+            if let SyntaxDefinition::RequiredToken(kind) = first_token {
+                stmt_starts.entry(*kind).or_insert(Vec::new()).push(stmt);
+            } else {
+                panic!("Expected RequiredToken as first token in statement definition");
+            }
+        }
+
+        stmt_starts
+    });
diff --git a/crates/pg_statement_splitter/src/lib.rs b/crates/pg_statement_splitter/src/lib.rs
index adaea475..d66cc411 100644
--- a/crates/pg_statement_splitter/src/lib.rs
+++ b/crates/pg_statement_splitter/src/lib.rs
@@ -9,8 +9,11 @@
 /// We should expand the definition map to include an `Any*`, which must be followed by at least
 /// one required token and allows the parser to search for the end tokens of the statement. This
 /// will hopefully be enough to reduce collisions to zero.
+mod data;
 mod is_at_stmt_start;
 mod parser;
+mod statement_splitter;
+mod statement_tracker;
 mod syntax_error;
 
 use is_at_stmt_start::{is_at_stmt_start, TokenStatement, STATEMENT_START_TOKEN_MAPS};
@@ -19,119 +22,132 @@ use parser::{Parse, Parser};
 
 use pg_lexer::{lex, SyntaxKind};
 
-pub fn split(sql: &str) -> Parse {
-    let mut parser = Parser::new(lex(sql));
-
-    while !parser.eof() {
-        match is_at_stmt_start(&mut parser) {
-            Some(stmt) => {
-                parser.start_stmt();
-
-                // advance over all start tokens of the statement
-                for i in 0..STATEMENT_START_TOKEN_MAPS.len() {
-                    parser.eat_whitespace();
-                    let token = parser.nth(0, false);
-                    if let Some(result) = STATEMENT_START_TOKEN_MAPS[i].get(&token.kind) {
-                        let is_in_results = result
-                            .iter()
-                            .find(|x| match x {
-                                TokenStatement::EoS(y) | TokenStatement::Any(y) => y == &stmt,
-                            })
-                            .is_some();
-                        if i == 0 && !is_in_results {
-                            panic!("Expected statement start");
-                        } else if is_in_results {
-                            parser.expect(token.kind);
-                        } else {
-                            break;
-                        }
-                    }
-                }
-
-                // move until the end of the statement, or until the next statement start
-                let mut is_sub_stmt = 0;
-                let mut is_sub_trx = 0;
-                let mut ignore_next_non_whitespace = false;
-                while !parser.at(SyntaxKind::Ascii59) && !parser.eof() {
-                    match parser.nth(0, false).kind {
-                        SyntaxKind::All => {
-                            // ALL is never a statement start, but needs to be skipped when combining queries
-                            // (e.g. UNION ALL)
-                            parser.advance();
-                        }
-                        SyntaxKind::BeginP => {
-                            // BEGIN, consume until END
-                            is_sub_trx += 1;
-                            parser.advance();
-                        }
-                        SyntaxKind::EndP => {
-                            is_sub_trx -= 1;
-                            parser.advance();
-                        }
-                        // opening brackets "(", consume until closing bracket ")"
-                        SyntaxKind::Ascii40 => {
-                            is_sub_stmt += 1;
-                            parser.advance();
-                        }
-                        SyntaxKind::Ascii41 => {
-                            is_sub_stmt -= 1;
-                            parser.advance();
-                        }
-                        SyntaxKind::As
-                        | SyntaxKind::Union
-                        | SyntaxKind::Intersect
-                        | SyntaxKind::Except => {
-                            // ignore the next non-whitespace token
-                            ignore_next_non_whitespace = true;
-                            parser.advance();
-                        }
-                        _ => {
-                            // if another stmt FIRST is encountered, break
-                            // ignore if parsing sub stmt
-                            if ignore_next_non_whitespace == false
-                                && is_sub_stmt == 0
-                                && is_sub_trx == 0
-                                && is_at_stmt_start(&mut parser).is_some()
-                            {
-                                break;
-                            } else {
-                                if ignore_next_non_whitespace == true && !parser.at_whitespace() {
-                                    ignore_next_non_whitespace = false;
-                                }
-                                parser.advance();
-                            }
-                        }
-                    }
-                }
-
-                parser.expect(SyntaxKind::Ascii59);
-
-                parser.close_stmt();
-            }
-            None => {
-                parser.advance();
-            }
-        }
-    }
-
-    parser.finish()
-}
+// pub fn split(sql: &str) -> Parse {
+//     let mut parser = Parser::new(lex(sql));
+//
+//     while !parser.eof() {
+//         if parser.at_whitespace() {
+//             parser.advance();
+//             continue;
+//         }
+//         // check all current active statements if the token matches
+//         // check if there is a new statement starting at the current token
+//     }
+// }
+//
+// pub fn split(sql: &str) -> Parse {
+//     let mut parser = Parser::new(lex(sql));
+//
+//     while !parser.eof() {
+//         match is_at_stmt_start(&mut parser) {
+//             Some(stmt) => {
+//                 parser.start_stmt();
+//
+//                 // advance over all start tokens of the statement
+//                 for i in 0..STATEMENT_START_TOKEN_MAPS.len() {
+//                     parser.eat_whitespace();
+//                     let token = parser.nth(0, false);
+//                     if let Some(result) = STATEMENT_START_TOKEN_MAPS[i].get(&token.kind) {
+//                         let is_in_results = result
+//                             .iter()
+//                             .find(|x| match x {
+//                                 TokenStatement::EoS(y) | TokenStatement::Any(y) => y == &stmt,
+//                             })
+//                             .is_some();
+//                         if i == 0 && !is_in_results {
+//                             panic!("Expected statement start");
+//                         } else if is_in_results {
+//                             parser.expect(token.kind);
+//                         } else {
+//                             break;
+//                         }
+//                     }
+//                 }
+//
+//                 // move until the end of the statement, or until the next statement start
+//                 let mut is_sub_stmt = 0;
+//                 let mut is_sub_trx = 0;
+//                 let mut ignore_next_non_whitespace = false;
+//                 while !parser.at(SyntaxKind::Ascii59) && !parser.eof() {
+//                     match parser.nth(0, false).kind {
+//                         SyntaxKind::All => {
+//                             // ALL is never a statement start, but needs to be skipped when combining queries
+//                             // (e.g. UNION ALL)
+//                             parser.advance();
+//                         }
+//                         SyntaxKind::BeginP => {
+//                             // BEGIN, consume until END
+//                             is_sub_trx += 1;
+//                             parser.advance();
+//                         }
+//                         SyntaxKind::EndP => {
+//                             is_sub_trx -= 1;
+//                             parser.advance();
+//                         }
+//                         // opening brackets "(", consume until closing bracket ")"
+//                         SyntaxKind::Ascii40 => {
+//                             is_sub_stmt += 1;
+//                             parser.advance();
+//                         }
+//                         SyntaxKind::Ascii41 => {
+//                             is_sub_stmt -= 1;
+//                             parser.advance();
+//                         }
+//                         SyntaxKind::As
+//                         | SyntaxKind::Union
+//                         | SyntaxKind::Intersect
+//                         | SyntaxKind::Except => {
+//                             // ignore the next non-whitespace token
+//                             ignore_next_non_whitespace = true;
+//                             parser.advance();
+//                         }
+//                         _ => {
+//                             // if another stmt FIRST is encountered, break
+//                             // ignore if parsing sub stmt
+//                             if ignore_next_non_whitespace == false
+//                                 && is_sub_stmt == 0
+//                                 && is_sub_trx == 0
+//                                 && is_at_stmt_start(&mut parser).is_some()
+//                             {
+//                                 break;
+//                             } else {
+//                                 if ignore_next_non_whitespace == true && !parser.at_whitespace() {
+//                                     ignore_next_non_whitespace = false;
+//                                 }
+//                                 parser.advance();
+//                             }
+//                         }
+//                     }
+//                 }
+//
+//                 parser.expect(SyntaxKind::Ascii59);
+//
+//                 parser.close_stmt();
+//             }
+//             None => {
+//                 parser.advance();
+//             }
+//         }
+//     }
+//
+//     parser.finish()
+// }
 
 #[cfg(test)]
 mod tests {
     use super::*;
 
-    #[test]
-    fn test_splitter() {
-        let input = "select 1 from contact;\nselect 1;\nalter table test drop column id;";
-
-        let res = split(input);
-        assert_eq!(res.ranges.len(), 3);
-        assert_eq!("select 1 from contact;", input[res.ranges[0]].to_string());
-        assert_eq!("select 1;", input[res.ranges[1]].to_string());
-        assert_eq!(
-            "alter table test drop column id;",
-            input[res.ranges[2]].to_string()
-        );
-    }
+    // #[test]
+    // fn test_splitter() {
+    //     let input = "select 1 from contact;\nselect 1;\nalter table test drop column id;";
+    //
+    //     let res = split(input);
+    //     assert_eq!(res.ranges.len(), 3);
+    //     assert_eq!("select 1 from contact;", input[res.ranges[0]].to_string());
+    //     assert_eq!("select 1;", input[res.ranges[1]].to_string());
+    //     assert_eq!(
+    //         "alter table test drop column id;",
+    //         input[res.ranges[2]].to_string()
+    //     );
+    // }
 }
diff --git a/crates/pg_statement_splitter/src/parser.rs b/crates/pg_statement_splitter/src/parser.rs
index 1b3d0f8b..e50573f1 100644
--- a/crates/pg_statement_splitter/src/parser.rs
+++ b/crates/pg_statement_splitter/src/parser.rs
@@ -67,17 +67,6 @@ impl Parser {
         }
     }
 
-    pub fn start_stmt(&mut self) {
-        assert!(self.current_stmt_start.is_none());
-        self.current_stmt_start = Some(self.pos);
-    }
-
-    pub fn close_stmt(&mut self) {
-        assert!(self.current_stmt_start.is_some());
-        self.ranges
-            .push((self.current_stmt_start.take().unwrap(), self.pos));
-    }
-
     /// collects an SyntaxError with an `error` message at `pos`
     pub fn error_at_pos(&mut self, error: String, pos: usize) {
         self.errors.push(SyntaxError::new_at_offset(
@@ -93,7 +82,8 @@ impl Parser {
     /// applies token and advances
     pub fn advance(&mut self) {
         assert!(!self.eof());
-        if self.nth(0, false).kind == SyntaxKind::Whitespace {
+        let token = self.nth(0, false);
+        if token.kind == SyntaxKind::Whitespace {
             if self.whitespace_token_buffer.is_none() {
                 self.whitespace_token_buffer = Some(self.pos);
             }
diff --git a/crates/pg_statement_splitter/src/statement_splitter.rs b/crates/pg_statement_splitter/src/statement_splitter.rs
new file mode 100644
index 00000000..55e041cc
--- /dev/null
+++ b/crates/pg_statement_splitter/src/statement_splitter.rs
@@ -0,0 +1,303 @@
+use pg_lexer::{SyntaxKind, WHITESPACE_TOKENS};
+use text_size::{TextRange, TextSize};
+
+use crate::{
+    data::{STATEMENT_BRIDGE_DEFINITIONS, STATEMENT_DEFINITIONS},
+    parser::Parser,
+    statement_tracker::StatementTracker,
+};
+
+pub(crate) struct StatementSplitter<'a> {
+    parser: Parser,
+    tracked_statements: Vec<StatementTracker<'a>>,
+    active_bridges: Vec<StatementTracker<'a>>,
+    sub_trx_depth: usize,
+    sub_stmt_depth: usize,
+}
+
+impl<'a> StatementSplitter<'a> {
+    pub fn new(sql: &str) -> Self {
+        Self {
+            parser: Parser::new(pg_lexer::lex(sql)),
+            tracked_statements: Vec::new(),
+            active_bridges: Vec::new(),
+            sub_trx_depth: 0,
+            sub_stmt_depth: 0,
+        }
+    }
+
+    pub fn run(&mut self) -> Vec<TextRange> {
+        let mut ranges = Vec::new();
+
+        while !self.parser.eof() {
+            let at_token = self.parser.nth(0, false);
+            // TODO rename vars and add helpers to make distinciton between pos and text pos clear
+
+            if at_token.kind == SyntaxKind::BeginP {
+                self.sub_trx_depth += 1;
+            } else if at_token.kind == SyntaxKind::EndP {
+                self.sub_trx_depth -= 1;
+            } else if at_token.kind == SyntaxKind::Ascii40 {
+                // "("
+                self.sub_stmt_depth += 1;
+            } else if at_token.kind == SyntaxKind::Ascii41 {
+                // ")"
+                self.sub_stmt_depth -= 1;
+            }
+
+            self.tracked_statements
+                .retain_mut(|stmt| stmt.advance_with(&at_token.kind));
+
+            if self.sub_trx_depth == 0 && self.sub_stmt_depth == 0 {
+                if let Some(stmts) = STATEMENT_DEFINITIONS.get(&at_token.kind) {
+                    self.tracked_statements.append(
+                        &mut stmts
+                            .iter()
+                            .filter_map(|stmt| {
+                                if self.active_bridges.iter().any(|b| b.def.stmt == stmt.stmt) {
+                                    None
+                                } else {
+                                    Some(StatementTracker::new_at(stmt, self.parser.pos))
+                                }
+                            })
+                            .collect(),
+                    );
+                };
+            }
+
+            self.active_bridges
+                .retain_mut(|stmt| stmt.advance_with(&at_token.kind));
+
+            if let Some(bridges) = STATEMENT_BRIDGE_DEFINITIONS.get(&at_token.kind) {
+                self.active_bridges.append(
+                    &mut bridges
+                        .iter()
+                        .map(|stmt| StatementTracker::new_at(stmt, self.parser.pos))
+                        .collect(),
+                );
+            }
+
+            // if a statement is complete, check if there are any complete statements that start
+            // before the just completed one
+
+            // Step 1: Find the latest completed statement
+            let latest_completed_stmt_started_at = self
+                .tracked_statements
+                .iter()
+                .filter(|s| s.could_be_complete())
+                .max_by_key(|stmt| stmt.started_at)
+                .map(|stmt| stmt.started_at);
+
+            if let Some(latest_completed_stmt_started_at) = latest_completed_stmt_started_at {
+                // Step 2: Find the latest complete statement before the latest completed statement
+                let latest_complete_before_started_at = self
+                    .tracked_statements
+                    .iter()
+                    .rev()
+                    .filter(|s| {
+                        s.could_be_complete() && s.started_at < latest_completed_stmt_started_at
+                    })
+                    .max_by_key(|stmt| stmt.started_at)
+                    .map(|stmt| stmt.started_at);
+
+                if let Some(latest_complete_before_started_at) = latest_complete_before_started_at {
+                    let count = self
+                        .tracked_statements
+                        .iter()
+                        .filter(|s| {
+                            s.started_at == latest_complete_before_started_at
+                                && s.could_be_complete()
+                        })
+                        .count();
+
+                    assert_eq!(count, 1);
+
+                    // Step 3: save range for the statement
+
+                    // end is the last non-whitespace token before the start of the latest complete
+                    // statement
+
+                    // TODO optimize
+                    let latest_text_pos = self
+                        .parser
+                        .tokens
+                        .get(latest_completed_stmt_started_at)
+                        .unwrap()
+                        .span
+                        .start();
+                    let end_pos = self
+                        .parser
+                        .tokens
+                        .iter()
+                        .filter_map(|t| {
+                            if t.span.start() < latest_text_pos
+                                && !WHITESPACE_TOKENS.contains(&t.kind)
+                            {
+                                Some(t.span.end())
+                            } else {
+                                None
+                            }
+                        })
+                        .max()
+                        .unwrap();
+
+                    ranges.push(TextRange::new(
+                        TextSize::try_from(
+                            self.parser
+                                .tokens
+                                .get(latest_complete_before_started_at)
+                                .unwrap()
+                                .span
+                                .start(),
+                        )
+                        .unwrap(),
+                        end_pos,
+                    ));
+
+                    // Step 4: remove all statements that started before or at the position
+                    self.tracked_statements
+                        .retain(|s| s.started_at > latest_complete_before_started_at);
+                }
+            }
+
+            self.parser.advance();
+        }
+
+        // get the earliest statement that is complete
+        if let Some(earliest_complete_stmt) = self
+            .tracked_statements
+            .iter()
+            .filter(|s| s.could_be_complete())
+            .min_by_key(|stmt| stmt.started_at)
+        {
+            let earliest_text_pos = self
+                .parser
+                .tokens
+                .get(earliest_complete_stmt.started_at)
+                .unwrap()
+                .span
+                .start();
+            let end_pos = self
+                .parser
+                .tokens
+                .iter()
+                .filter_map(|t| {
+                    if t.span.start() > earliest_text_pos && !WHITESPACE_TOKENS.contains(&t.kind) {
+                        Some(t.span.end())
+                    } else {
+                        None
+                    }
+                })
+                .max()
+                .unwrap();
+            let start_pos = TextSize::try_from(
+                self.parser
+                    .tokens
+                    .get(earliest_complete_stmt.started_at)
+                    .unwrap()
+                    .span
+                    .start(),
+            )
+            .unwrap();
+            ranges.push(TextRange::new(start_pos, end_pos));
+        }
+
+        ranges
+    }
+}
+
+#[cfg(test)]
+mod tests {
+    use crate::statement_splitter::StatementSplitter;
+
+    #[test]
+    fn test_create_or_replace() {
+        let input = "CREATE OR REPLACE TRIGGER check_update
+    BEFORE UPDATE OF balance ON accounts
+    FOR EACH ROW
+    EXECUTE FUNCTION check_account_update();\nexecute test;";
+
+        let ranges = StatementSplitter::new(input).run();
+
+        assert_eq!(ranges.len(), 2);
+        assert_eq!(
+            "CREATE OR REPLACE TRIGGER check_update\n    BEFORE UPDATE OF balance ON accounts\n    FOR EACH ROW\n    EXECUTE FUNCTION check_account_update();",
+            input[ranges[0]].to_string()
+        );
+        assert_eq!("execute test;", input[ranges[1]].to_string());
+    }
+
+    #[test]
+    fn test_sub_statement() {
+        let input = "select 1 from (select 2 from contact) c;\nselect 4;";
+
+        let ranges = StatementSplitter::new(input).run();
+
+        assert_eq!(ranges.len(), 2);
+        assert_eq!(
+            "select 1 from (select 2 from contact) c;",
+            input[ranges[0]].to_string()
+        );
+        assert_eq!("select 4;", input[ranges[1]].to_string());
+    }
+
+    #[test]
+    fn test_semicolon_precedence() {
+        let input = "select 1 from ;\nselect 4;";
+
+        let ranges = StatementSplitter::new(input).run();
+
+        assert_eq!(ranges.len(), 2);
+        assert_eq!("select 1 from ;", input[ranges[0]].to_string());
+        assert_eq!("select 4;", input[ranges[1]].to_string());
+    }
+
+    #[test]
+    fn test_union_with_semicolon() {
+        let input = "select 1 from contact union;\nselect 4;";
+
+        let ranges = StatementSplitter::new(input).run();
+
+        assert_eq!(ranges.len(), 2);
+        assert_eq!("select 1 from contact union;", input[ranges[0]].to_string());
+        assert_eq!("select 4;", input[ranges[1]].to_string());
+    }
+
+    #[test]
+    fn test_union() {
+        let input = "select 1 from contact union select 1;\nselect 4;";
+
+        let ranges = StatementSplitter::new(input).run();
+
+        assert_eq!(ranges.len(), 2);
+        assert_eq!(
+            "select 1 from contact union select 1;",
+            input[ranges[0]].to_string()
+        );
+        assert_eq!("select 4;", input[ranges[1]].to_string());
+    }
+
+    #[test]
+    fn test_splitter() {
+        let input = "select 1 from contact;\nselect 1;\nselect 4;";
+
+        let ranges = StatementSplitter::new(input).run();
+
+        assert_eq!(ranges.len(), 3);
+        assert_eq!("select 1 from contact;", input[ranges[0]].to_string());
+        assert_eq!("select 1;", input[ranges[1]].to_string());
+        assert_eq!("select 4;", input[ranges[2]].to_string());
+    }
+
+    #[test]
+    fn test_no_semicolons() {
+        let input = "select 1 from contact\nselect 1\nselect 4";
+
+        let ranges = StatementSplitter::new(input).run();
+
+        assert_eq!(ranges.len(), 3);
+        assert_eq!("select 1 from contact", input[ranges[0]].to_string());
+        assert_eq!("select 1", input[ranges[1]].to_string());
+        assert_eq!("select 4", input[ranges[2]].to_string());
+    }
+}
diff --git a/crates/pg_statement_splitter/src/statement_tracker.rs b/crates/pg_statement_splitter/src/statement_tracker.rs
new file mode 100644
index 00000000..24b54dc4
--- /dev/null
+++ b/crates/pg_statement_splitter/src/statement_tracker.rs
@@ -0,0 +1,128 @@
+use pg_lexer::{SyntaxKind, WHITESPACE_TOKENS};
+
+use crate::data::{StatementDefinition, SyntaxDefinition};
+
+#[derive(Debug)]
+pub struct StatementTracker<'a> {
+    pub def: &'a StatementDefinition,
+
+    /// position in the definition
+    current_pos: usize,
+
+    /// position in the global token stream
+    pub started_at: usize,
+}
+
+impl<'a> StatementTracker<'a> {
+    pub fn new_at(def: &'a StatementDefinition, at: usize) -> Self {
+        Self {
+            def,
+            current_pos: 1,
+            started_at: at,
+        }
+    }
+
+    fn next_possible_tokens(&self) -> Vec<(usize, SyntaxKind)> {
+        let mut tokens = Vec::new();
+
+        for (pos, token) in self.def.tokens.iter().enumerate().skip(self.current_pos) {
+            match token {
+                SyntaxDefinition::RequiredToken(k) => {
+                    tokens.push((pos, *k));
+                    break;
+                }
+                SyntaxDefinition::OptionalToken(k) => {
+                    tokens.push((pos, *k));
+                }
+                SyntaxDefinition::AnyTokens => {
+                    //
+                }
+                SyntaxDefinition::AnyToken => {
+                    //
+                }
+                SyntaxDefinition::OneOf(kinds) => {
+                    tokens.extend(kinds.iter().map(|x| (pos, *x)));
+                    break;
+                }
+            }
+        }
+
+        tokens
+    }
+
+    pub fn advance_with(&mut self, kind: &SyntaxKind) -> bool {
+        if WHITESPACE_TOKENS.contains(kind) {
+            return true;
+        }
+
+        let is_valid = match self.def.tokens.get(self.current_pos) {
+            Some(SyntaxDefinition::RequiredToken(k)) => {
+                self.current_pos += 1;
+                k == kind
+            }
+            Some(SyntaxDefinition::OptionalToken(k)) => {
+                if k == kind {
+                    self.current_pos += 1;
+                } else if let Some(next_token) =
+                    self.next_possible_tokens().iter().find(|x| x.1 == *kind)
+                {
+                    self.current_pos = next_token.0 + 1;
+                } else if self.def.tokens.len() - 1 == self.current_pos {
+                    // if the optional token is the last one and the previous one is not optional
+                    // we must be at the end of the statement
+                    if let SyntaxDefinition::RequiredToken(_) =
+                        self.def.tokens.get(self.current_pos - 1).unwrap()
+                    {
+                        return false;
+                    }
+                }
+
+                true
+            }
+            Some(SyntaxDefinition::AnyTokens) => {
+                assert!(self.next_possible_tokens().len() > 0);
+
+                if let Some(next_token) = self.next_possible_tokens().iter().find(|x| x.1 == *kind)
+                {
+                    self.current_pos = next_token.0 + 1;
+                }
+
+                true
+            }
+            Some(SyntaxDefinition::AnyToken) => {
+                self.current_pos += 1;
+                true
+            }
+            Some(SyntaxDefinition::OneOf(kinds)) => {
+                if kinds.iter().any(|x| x == kind) {
+                    self.current_pos += 1;
+                    true
+                } else {
+                    false
+                }
+            }
+            None => true,
+        };
+
+        is_valid
+    }
+
+    pub fn could_be_complete(&self) -> bool {
+        self.next_required_token().is_none()
+    }
+
+    /// returns the next "required" token we are expecting
+    ///
+    /// None if we are no required tokens left
+    fn next_required_token(&self) -> Option<&SyntaxDefinition> {
+        self.def
+            .tokens
+            .iter()
+            .skip(self.current_pos)
+            .find(|x| match x {
+                SyntaxDefinition::RequiredToken(_) => true,
+                SyntaxDefinition::OneOf(_) => true,
+                _ => false,
+            })
+    }
+}
diff --git a/crates/pg_statement_splitter/tests/statement_splitter_tests.rs b/crates/pg_statement_splitter/tests/statement_splitter_tests.rs
index fb639fef..7e47dc08 100644
--- a/crates/pg_statement_splitter/tests/statement_splitter_tests.rs
+++ b/crates/pg_statement_splitter/tests/statement_splitter_tests.rs
@@ -4,111 +4,111 @@ const DATA_DIR_PATH: &str = "tests/data/";
 const POSTGRES_REGRESS_PATH: &str = "../../libpg_query/test/sql/postgres_regress/";
 const SKIPPED_REGRESS_TESTS: &str = include_str!("skipped.txt");
 
-#[test]
-fn test_postgres_regress() {
-    // all postgres regress tests are valid and complete statements, so we can use `split_with_parser` and compare with our own splitter
-
-    let mut paths: Vec<_> = fs::read_dir(POSTGRES_REGRESS_PATH)
-        .unwrap()
-        .map(|r| r.unwrap())
-        .collect();
-    paths.sort_by_key(|dir| dir.path());
-
-    for f in paths.iter() {
-        let path = f.path();
-
-        let test_name = path.file_stem().unwrap().to_str().unwrap();
-
-        // these require fixes in the parser
-        if SKIPPED_REGRESS_TESTS
-            .lines()
-            .collect::<Vec<_>>()
-            .contains(&test_name)
-        {
-            continue;
-        }
-
-        // remove \commands because pg_query doesn't support them
-        let contents = fs::read_to_string(&path)
-            .unwrap()
-            .lines()
-            .filter(|l| !l.starts_with("\\") && !l.ends_with("\\gset"))
-            .collect::<Vec<_>>()
-            .join(" ");
-
-        let libpg_query_split = pg_query::split_with_parser(&contents).unwrap();
-
-        let parser_split = pg_statement_splitter::split(&contents);
-
-        assert_eq!(
-            parser_split.errors.len(),
-            0,
-            "Unexpected errors when parsing file {}:\n{:#?}",
-            test_name,
-            parser_split.errors
-        );
-
-        assert_eq!(
-            libpg_query_split.len(),
-            parser_split.ranges.len(),
-            "Mismatch in statement count for file {}: Expected {} statements, got {}",
-            test_name,
-            libpg_query_split.len(),
-            parser_split.ranges.len()
-        );
-
-        for (libpg_query_stmt, parser_range) in
-            libpg_query_split.iter().zip(parser_split.ranges.iter())
-        {
-            let parser_stmt = &contents[parser_range.clone()].trim();
-
-            let libpg_query_stmt = if libpg_query_stmt.ends_with(';') {
-                libpg_query_stmt.to_string()
-            } else {
-                format!("{};", libpg_query_stmt.trim())
-            };
-
-            let libpg_query_stmt_trimmed = libpg_query_stmt.trim();
-            let parser_stmt_trimmed = parser_stmt.trim();
-
-            assert_eq!(
-                libpg_query_stmt_trimmed, parser_stmt_trimmed,
-                "Mismatch in statement {}:\nlibg_query: '{}'\nsplitter:   '{}'",
-                test_name, libpg_query_stmt_trimmed, parser_stmt_trimmed
-            );
-        }
-    }
-}
-
-#[test]
-fn test_statement_splitter() {
-    let mut paths: Vec<_> = fs::read_dir(DATA_DIR_PATH)
-        .unwrap()
-        .map(|r| r.unwrap())
-        .collect();
-    paths.sort_by_key(|dir| dir.path());
-
-    for f in paths.iter() {
-        let path = f.path();
-        let test_name = path.file_stem().unwrap().to_str().unwrap();
-        let expected_count = test_name
-            .split("__")
-            .last()
-            .unwrap()
-            .parse::<usize>()
-            .unwrap();
-
-        let contents = fs::read_to_string(&path).unwrap();
-
-        let split = pg_statement_splitter::split(&contents);
-
-        assert_eq!(
-            split.ranges.len(),
-            expected_count,
-            "Mismatch in statement count for file {}: Expected {} statements, got {}",
-            test_name,
-            expected_count,
-            split.ranges.len()
-        );
-    }
-}
+// #[test]
+// fn test_postgres_regress() {
+//     // all postgres regress tests are valid and complete statements, so we can use `split_with_parser` and compare with our own splitter
+//
+//     let mut paths: Vec<_> = fs::read_dir(POSTGRES_REGRESS_PATH)
+//         .unwrap()
+//         .map(|r| r.unwrap())
+//         .collect();
+//     paths.sort_by_key(|dir| dir.path());
+//
+//     for f in paths.iter() {
+//         let path = f.path();
+//
+//         let test_name = path.file_stem().unwrap().to_str().unwrap();
+//
+//         // these require fixes in the parser
+//         if SKIPPED_REGRESS_TESTS
+//             .lines()
+//             .collect::<Vec<_>>()
+//             .contains(&test_name)
+//         {
+//             continue;
+//         }
+//
+//         // remove \commands because pg_query doesn't support them
+//         let contents = fs::read_to_string(&path)
+//             .unwrap()
+//             .lines()
+//             .filter(|l| !l.starts_with("\\") && !l.ends_with("\\gset"))
+//             .collect::<Vec<_>>()
+//             .join(" ");
+//
+//         let libpg_query_split = pg_query::split_with_parser(&contents).unwrap();
+//
+//         let parser_split = pg_statement_splitter::split(&contents);
+//
+//         assert_eq!(
+//             parser_split.errors.len(),
+//             0,
+//             "Unexpected errors when parsing file {}:\n{:#?}",
+//             test_name,
+//             parser_split.errors
+//         );
+//
+//         assert_eq!(
+//             libpg_query_split.len(),
+//             parser_split.ranges.len(),
+//             "Mismatch in statement count for file {}: Expected {} statements, got {}",
+//             test_name,
+//             libpg_query_split.len(),
+//             parser_split.ranges.len()
+//         );
+//
+//         for (libpg_query_stmt, parser_range) in
+//             libpg_query_split.iter().zip(parser_split.ranges.iter())
+//         {
+//             let parser_stmt = &contents[parser_range.clone()].trim();
+//
+//             let libpg_query_stmt = if libpg_query_stmt.ends_with(';') {
+//                 libpg_query_stmt.to_string()
+//             } else {
+//                 format!("{};", libpg_query_stmt.trim())
+//             };
+//
+//             let libpg_query_stmt_trimmed = libpg_query_stmt.trim();
+//             let parser_stmt_trimmed = parser_stmt.trim();
+//
+//             assert_eq!(
+//                 libpg_query_stmt_trimmed, parser_stmt_trimmed,
+//                 "Mismatch in statement {}:\nlibg_query: '{}'\nsplitter:   '{}'",
+//                 test_name, libpg_query_stmt_trimmed, parser_stmt_trimmed
+//             );
+//         }
+//     }
+// }
+//
+// #[test]
+// fn test_statement_splitter() {
+//     let mut paths: Vec<_> = fs::read_dir(DATA_DIR_PATH)
+//         .unwrap()
+//         .map(|r| r.unwrap())
+//         .collect();
+//     paths.sort_by_key(|dir| dir.path());
+//
+//     for f in paths.iter() {
+//         let path = f.path();
+//         let test_name = path.file_stem().unwrap().to_str().unwrap();
+//         let expected_count = test_name
+//             .split("__")
+//             .last()
+//             .unwrap()
+//             .parse::<usize>()
+//             .unwrap();
+//
+//         let contents = fs::read_to_string(&path).unwrap();
+//
+//         let split = pg_statement_splitter::split(&contents);
+//
+//         assert_eq!(
+//             split.ranges.len(),
+//             expected_count,
+//             "Mismatch in statement count for file {}: Expected {} statements, got {}",
+//             test_name,
+//             expected_count,
+//             split.ranges.len()
+//         );
+//     }
+// }

From c237c6ac0e7ffa1a9fed75c1b8c6fc18ceeae236 Mon Sep 17 00:00:00 2001
From: psteinroe <philipp@steinroetter.com>
Date: Fri, 9 Aug 2024 18:21:11 +0200
Subject: [PATCH 02/19] feat: migrate more stmt types to the new def language

---
 crates/pg_statement_splitter/src/data.rs      | 1007 ++++++++++++++++
 .../src/is_at_stmt_start.rs                   | 1015 -----------------
 crates/pg_statement_splitter/src/lib.rs       |  150 +--
 .../src/statement_splitter.rs                 |   64 +-
 .../src/{statement_tracker.rs => tracker.rs}  |    4 +-
 .../tests/statement_splitter_tests.rs         |  206 ++--
 6 files changed, 1187 insertions(+), 1259 deletions(-)
 delete mode 100644 crates/pg_statement_splitter/src/is_at_stmt_start.rs
 rename crates/pg_statement_splitter/src/{statement_tracker.rs => tracker.rs} (98%)

diff --git a/crates/pg_statement_splitter/src/data.rs b/crates/pg_statement_splitter/src/data.rs
index 1cff7795..f2164225 100644
--- a/crates/pg_statement_splitter/src/data.rs
+++ b/crates/pg_statement_splitter/src/data.rs
@@ -86,6 +86,97 @@ pub static STATEMENT_DEFINITIONS: LazyLock<HashMap<SyntaxKind, Vec<StatementDefi
             tokens: vec![SyntaxDefinition::RequiredToken(SyntaxKind::Select)],
         });
 
+        m.push(StatementDefinition {
+            stmt: SyntaxKind::InsertStmt,
+            tokens: vec![
+                SyntaxDefinition::RequiredToken(SyntaxKind::Insert),
+                SyntaxDefinition::RequiredToken(SyntaxKind::Into),
+                SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
+            ],
+        });
+
+        m.push(StatementDefinition {
+            stmt: SyntaxKind::DeleteStmt,
+            tokens: vec![
+                SyntaxDefinition::RequiredToken(SyntaxKind::DeleteP),
+                SyntaxDefinition::RequiredToken(SyntaxKind::From),
+                SyntaxDefinition::OptionalToken(SyntaxKind::Only),
+                SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
+            ],
+        });
+
+        m.push(StatementDefinition {
+            stmt: SyntaxKind::UpdateStmt,
+            tokens: vec![
+                SyntaxDefinition::RequiredToken(SyntaxKind::Update),
+                SyntaxDefinition::OptionalToken(SyntaxKind::Only),
+                SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
+            ],
+        });
+
+        m.push(StatementDefinition {
+            stmt: SyntaxKind::MergeStmt,
+            tokens: vec![
+                SyntaxDefinition::RequiredToken(SyntaxKind::Merge),
+                SyntaxDefinition::RequiredToken(SyntaxKind::Into),
+                SyntaxDefinition::OptionalToken(SyntaxKind::Only),
+                SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
+            ],
+        });
+
+        m.push(StatementDefinition {
+            stmt: SyntaxKind::AlterTableStmt,
+            tokens: vec![
+                SyntaxDefinition::RequiredToken(SyntaxKind::Alter),
+                SyntaxDefinition::RequiredToken(SyntaxKind::Table),
+                SyntaxDefinition::OptionalToken(SyntaxKind::IfP),
+                SyntaxDefinition::OptionalToken(SyntaxKind::Exists),
+                SyntaxDefinition::OptionalToken(SyntaxKind::Only),
+                SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
+            ],
+        });
+
+        m.push(StatementDefinition {
+            stmt: SyntaxKind::RenameStmt,
+            tokens: vec![
+                SyntaxDefinition::RequiredToken(SyntaxKind::Alter),
+                SyntaxDefinition::RequiredToken(SyntaxKind::Table),
+                SyntaxDefinition::OptionalToken(SyntaxKind::IfP),
+                SyntaxDefinition::OptionalToken(SyntaxKind::Exists),
+                SyntaxDefinition::OptionalToken(SyntaxKind::Only),
+                SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
+                SyntaxDefinition::RequiredToken(SyntaxKind::Rename),
+            ],
+        });
+
+        m.push(StatementDefinition {
+            stmt: SyntaxKind::AlterDomainStmt,
+            tokens: vec![
+                SyntaxDefinition::RequiredToken(SyntaxKind::Alter),
+                SyntaxDefinition::RequiredToken(SyntaxKind::DomainP),
+                SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
+            ],
+        });
+
+        m.push(StatementDefinition {
+            stmt: SyntaxKind::AlterDefaultPrivilegesStmt,
+            tokens: vec![
+                SyntaxDefinition::RequiredToken(SyntaxKind::Alter),
+                SyntaxDefinition::RequiredToken(SyntaxKind::Default),
+                SyntaxDefinition::RequiredToken(SyntaxKind::Privileges),
+            ],
+        });
+
+        m.push(StatementDefinition {
+            stmt: SyntaxKind::ClusterStmt,
+            tokens: vec![SyntaxDefinition::RequiredToken(SyntaxKind::Cluster)],
+        });
+
+        m.push(StatementDefinition {
+            stmt: SyntaxKind::CopyStmt,
+            tokens: vec![SyntaxDefinition::RequiredToken(SyntaxKind::Copy)],
+        });
+
         m.push(StatementDefinition {
             stmt: SyntaxKind::ExecuteStmt,
             tokens: vec![
@@ -94,6 +185,898 @@ pub static STATEMENT_DEFINITIONS: LazyLock<HashMap<SyntaxKind, Vec<StatementDefi
             ],
         });
 
+        // TODO we might need to add new types to handle this properly
+        m.push(StatementDefinition {
+            stmt: SyntaxKind::CreateStmt,
+            tokens: vec![
+                SyntaxDefinition::RequiredToken(SyntaxKind::Create),
+                SyntaxDefinition::OptionalToken(SyntaxKind::Global),
+                SyntaxDefinition::OptionalToken(SyntaxKind::Local),
+                SyntaxDefinition::OptionalToken(SyntaxKind::Temporary),
+                SyntaxDefinition::OptionalToken(SyntaxKind::Temp),
+                SyntaxDefinition::OptionalToken(SyntaxKind::Unlogged),
+                SyntaxDefinition::OptionalToken(SyntaxKind::IfP),
+                SyntaxDefinition::OptionalToken(SyntaxKind::Not),
+                SyntaxDefinition::OptionalToken(SyntaxKind::Exists),
+                SyntaxDefinition::RequiredToken(SyntaxKind::Table),
+                SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
+            ],
+        });
+
+        m.push(StatementDefinition {
+            stmt: SyntaxKind::DefineStmt,
+            tokens: vec![
+                SyntaxDefinition::RequiredToken(SyntaxKind::Execute),
+                SyntaxDefinition::OptionalToken(SyntaxKind::Or),
+                SyntaxDefinition::OptionalToken(SyntaxKind::Replace),
+                SyntaxDefinition::RequiredToken(SyntaxKind::Aggregate),
+            ],
+        });
+
+        m.push(StatementDefinition {
+            stmt: SyntaxKind::DefineStmt,
+            tokens: vec![
+                SyntaxDefinition::RequiredToken(SyntaxKind::Create),
+                SyntaxDefinition::RequiredToken(SyntaxKind::Operator),
+            ],
+        });
+
+        m.push(StatementDefinition {
+            stmt: SyntaxKind::DefineStmt,
+            tokens: vec![
+                SyntaxDefinition::RequiredToken(SyntaxKind::Create),
+                SyntaxDefinition::RequiredToken(SyntaxKind::TypeP),
+                SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
+            ],
+        });
+
+        m.push(StatementDefinition {
+            stmt: SyntaxKind::CompositeTypeStmt,
+            tokens: vec![
+                SyntaxDefinition::RequiredToken(SyntaxKind::Create),
+                SyntaxDefinition::RequiredToken(SyntaxKind::TypeP),
+                SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
+                SyntaxDefinition::RequiredToken(SyntaxKind::As),
+            ],
+        });
+
+        m.push(StatementDefinition {
+            stmt: SyntaxKind::CreateEnumStmt,
+            tokens: vec![
+                SyntaxDefinition::RequiredToken(SyntaxKind::Create),
+                SyntaxDefinition::RequiredToken(SyntaxKind::TypeP),
+                SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
+                SyntaxDefinition::RequiredToken(SyntaxKind::As),
+                SyntaxDefinition::RequiredToken(SyntaxKind::EnumP),
+            ],
+        });
+
+        m.push(StatementDefinition {
+            stmt: SyntaxKind::CreateRangeStmt,
+            tokens: vec![
+                SyntaxDefinition::RequiredToken(SyntaxKind::Create),
+                SyntaxDefinition::RequiredToken(SyntaxKind::TypeP),
+                SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
+                SyntaxDefinition::RequiredToken(SyntaxKind::As),
+                SyntaxDefinition::RequiredToken(SyntaxKind::Range),
+            ],
+        });
+
+        m.push(StatementDefinition {
+            stmt: SyntaxKind::Drop,
+            tokens: vec![SyntaxDefinition::RequiredToken(SyntaxKind::Drop)],
+        });
+
+        m.push(StatementDefinition {
+            stmt: SyntaxKind::Truncate,
+            tokens: vec![
+                SyntaxDefinition::RequiredToken(SyntaxKind::Truncate),
+                SyntaxDefinition::OptionalToken(SyntaxKind::Table),
+                SyntaxDefinition::OptionalToken(SyntaxKind::Only),
+                SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
+            ],
+        });
+
+        m.push(StatementDefinition {
+            stmt: SyntaxKind::CommentStmt,
+            tokens: vec![
+                SyntaxDefinition::RequiredToken(SyntaxKind::Comment),
+                SyntaxDefinition::RequiredToken(SyntaxKind::On),
+            ],
+        });
+
+        m.push(StatementDefinition {
+            stmt: SyntaxKind::FetchStmt,
+            tokens: vec![
+                SyntaxDefinition::RequiredToken(SyntaxKind::Fetch),
+                SyntaxDefinition::AnyTokens,
+                SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
+            ],
+        });
+
+        m.push(StatementDefinition {
+            stmt: SyntaxKind::IndexStmt,
+            tokens: vec![
+                SyntaxDefinition::RequiredToken(SyntaxKind::Create),
+                SyntaxDefinition::OptionalToken(SyntaxKind::Unique),
+                SyntaxDefinition::RequiredToken(SyntaxKind::Index),
+                SyntaxDefinition::OptionalToken(SyntaxKind::Concurrently),
+                SyntaxDefinition::AnyTokens,
+                SyntaxDefinition::RequiredToken(SyntaxKind::On),
+                SyntaxDefinition::OptionalToken(SyntaxKind::Only),
+                SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
+            ],
+        });
+
+        m.push(StatementDefinition {
+            stmt: SyntaxKind::CreateFunctionStmt,
+            tokens: vec![
+                SyntaxDefinition::RequiredToken(SyntaxKind::Create),
+                SyntaxDefinition::OptionalToken(SyntaxKind::Or),
+                SyntaxDefinition::OptionalToken(SyntaxKind::Replace),
+                SyntaxDefinition::RequiredToken(SyntaxKind::Function),
+                SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
+                SyntaxDefinition::RequiredToken(SyntaxKind::Ascii40),
+                SyntaxDefinition::AnyTokens,
+                SyntaxDefinition::RequiredToken(SyntaxKind::Ascii41),
+            ],
+        });
+
+        m.push(StatementDefinition {
+            stmt: SyntaxKind::AlterFunctionStmt,
+            tokens: vec![
+                SyntaxDefinition::RequiredToken(SyntaxKind::Alter),
+                SyntaxDefinition::RequiredToken(SyntaxKind::Function),
+                SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
+            ],
+        });
+
+        m.push(StatementDefinition {
+            stmt: SyntaxKind::DoStmt,
+            tokens: vec![SyntaxDefinition::RequiredToken(SyntaxKind::Do)],
+        });
+
+        m.push(StatementDefinition {
+            stmt: SyntaxKind::RuleStmt,
+            tokens: vec![
+                SyntaxDefinition::RequiredToken(SyntaxKind::Create),
+                SyntaxDefinition::OptionalToken(SyntaxKind::Or),
+                SyntaxDefinition::OptionalToken(SyntaxKind::Replace),
+                SyntaxDefinition::RequiredToken(SyntaxKind::Rule),
+                SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
+                SyntaxDefinition::RequiredToken(SyntaxKind::As),
+                SyntaxDefinition::RequiredToken(SyntaxKind::On),
+                SyntaxDefinition::OneOf(vec![
+                    SyntaxKind::Select,
+                    SyntaxKind::Insert,
+                    SyntaxKind::Update,
+                    SyntaxKind::DeleteP,
+                ]),
+                SyntaxDefinition::RequiredToken(SyntaxKind::To),
+            ],
+        });
+
+        m.push(StatementDefinition {
+            stmt: SyntaxKind::NotifyStmt,
+            tokens: vec![
+                SyntaxDefinition::RequiredToken(SyntaxKind::Notify),
+                SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
+            ],
+        });
+
+        m.push(StatementDefinition {
+            stmt: SyntaxKind::ListenStmt,
+            tokens: vec![
+                SyntaxDefinition::RequiredToken(SyntaxKind::Listen),
+                SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
+            ],
+        });
+
+        m.push(StatementDefinition {
+            stmt: SyntaxKind::UnlistenStmt,
+            tokens: vec![
+                SyntaxDefinition::RequiredToken(SyntaxKind::Unlisten),
+                SyntaxDefinition::OneOf(vec![SyntaxKind::Ident, SyntaxKind::Ascii42]),
+            ],
+        });
+
+        m.push(StatementDefinition {
+            stmt: SyntaxKind::TransactionStmt,
+            tokens: vec![SyntaxDefinition::RequiredToken(SyntaxKind::BeginP)],
+        });
+
+        m.push(StatementDefinition {
+            stmt: SyntaxKind::TransactionStmt,
+            tokens: vec![SyntaxDefinition::RequiredToken(SyntaxKind::Commit)],
+        });
+
+        m.push(StatementDefinition {
+            stmt: SyntaxKind::ViewStmt,
+            tokens: vec![
+                SyntaxDefinition::RequiredToken(SyntaxKind::Create),
+                SyntaxDefinition::OptionalToken(SyntaxKind::Or),
+                SyntaxDefinition::OptionalToken(SyntaxKind::Replace),
+                SyntaxDefinition::OptionalToken(SyntaxKind::Temporary),
+                SyntaxDefinition::OptionalToken(SyntaxKind::Temp),
+                SyntaxDefinition::OptionalToken(SyntaxKind::Recursive),
+                SyntaxDefinition::RequiredToken(SyntaxKind::View),
+                SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
+                SyntaxDefinition::AnyTokens,
+                SyntaxDefinition::RequiredToken(SyntaxKind::As),
+                SyntaxDefinition::OneOf(vec![SyntaxKind::With, SyntaxKind::Select]),
+            ],
+        });
+
+        m.push(StatementDefinition {
+            stmt: SyntaxKind::LoadStmt,
+            tokens: vec![SyntaxDefinition::RequiredToken(SyntaxKind::Load)],
+        });
+
+        m.push(StatementDefinition {
+            stmt: SyntaxKind::CreateDomainStmt,
+            tokens: vec![
+                SyntaxDefinition::RequiredToken(SyntaxKind::Create),
+                SyntaxDefinition::RequiredToken(SyntaxKind::DomainP),
+                SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
+            ],
+        });
+
+        m.push(StatementDefinition {
+            stmt: SyntaxKind::CreatedbStmt,
+            tokens: vec![
+                SyntaxDefinition::RequiredToken(SyntaxKind::Create),
+                SyntaxDefinition::RequiredToken(SyntaxKind::Database),
+                SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
+            ],
+        });
+
+        m.push(StatementDefinition {
+            stmt: SyntaxKind::DropdbStmt,
+            tokens: vec![
+                SyntaxDefinition::RequiredToken(SyntaxKind::Drop),
+                SyntaxDefinition::RequiredToken(SyntaxKind::Database),
+                SyntaxDefinition::OptionalToken(SyntaxKind::IfP),
+                SyntaxDefinition::OptionalToken(SyntaxKind::Exists),
+                SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
+            ],
+        });
+
+        m.push(StatementDefinition {
+            stmt: SyntaxKind::VacuumStmt,
+            tokens: vec![SyntaxDefinition::RequiredToken(SyntaxKind::Vacuum)],
+        });
+
+        m.push(StatementDefinition {
+            stmt: SyntaxKind::ExplainStmt,
+            tokens: vec![SyntaxDefinition::RequiredToken(SyntaxKind::Explain)],
+        });
+
+        m.push(StatementDefinition {
+            stmt: SyntaxKind::CreateTableAsStmt,
+            tokens: vec![
+                SyntaxDefinition::RequiredToken(SyntaxKind::Create),
+                SyntaxDefinition::OptionalToken(SyntaxKind::Global),
+                SyntaxDefinition::OptionalToken(SyntaxKind::Local),
+                SyntaxDefinition::OptionalToken(SyntaxKind::Temporary),
+                SyntaxDefinition::OptionalToken(SyntaxKind::Temp),
+                SyntaxDefinition::RequiredToken(SyntaxKind::Table),
+                SyntaxDefinition::OptionalToken(SyntaxKind::IfP),
+                SyntaxDefinition::OptionalToken(SyntaxKind::Not),
+                SyntaxDefinition::OptionalToken(SyntaxKind::Exists),
+                SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
+                SyntaxDefinition::AnyTokens,
+                SyntaxDefinition::RequiredToken(SyntaxKind::As),
+                SyntaxDefinition::OneOf(vec![SyntaxKind::With, SyntaxKind::Select]),
+            ],
+        });
+
+        m.push(StatementDefinition {
+            stmt: SyntaxKind::ExplainStmt,
+            tokens: vec![SyntaxDefinition::RequiredToken(SyntaxKind::Explain)],
+        });
+
+        m.push(StatementDefinition {
+            stmt: SyntaxKind::CreateSeqStmt,
+            tokens: vec![
+                SyntaxDefinition::RequiredToken(SyntaxKind::Create),
+                SyntaxDefinition::OptionalToken(SyntaxKind::Temporary),
+                SyntaxDefinition::OptionalToken(SyntaxKind::Temp),
+                SyntaxDefinition::OptionalToken(SyntaxKind::Unlogged),
+                SyntaxDefinition::RequiredToken(SyntaxKind::Sequence),
+                SyntaxDefinition::OptionalToken(SyntaxKind::IfP),
+                SyntaxDefinition::OptionalToken(SyntaxKind::Not),
+                SyntaxDefinition::OptionalToken(SyntaxKind::Exists),
+                SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
+            ],
+        });
+
+        m.push(StatementDefinition {
+            stmt: SyntaxKind::AlterSeqStmt,
+            tokens: vec![
+                SyntaxDefinition::RequiredToken(SyntaxKind::Alter),
+                SyntaxDefinition::RequiredToken(SyntaxKind::Sequence),
+                SyntaxDefinition::OptionalToken(SyntaxKind::IfP),
+                SyntaxDefinition::OptionalToken(SyntaxKind::Exists),
+                SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
+            ],
+        });
+
+        m.push(StatementDefinition {
+            stmt: SyntaxKind::VariableSetStmt,
+            tokens: vec![
+                SyntaxDefinition::RequiredToken(SyntaxKind::Set),
+                SyntaxDefinition::OptionalToken(SyntaxKind::Session),
+                SyntaxDefinition::OptionalToken(SyntaxKind::Local),
+            ],
+        });
+
+        m.push(StatementDefinition {
+            stmt: SyntaxKind::VariableShowStmt,
+            tokens: vec![
+                SyntaxDefinition::RequiredToken(SyntaxKind::Show),
+                SyntaxDefinition::OneOf(vec![SyntaxKind::Ident, SyntaxKind::All]),
+            ],
+        });
+
+        m.push(StatementDefinition {
+            stmt: SyntaxKind::DiscardStmt,
+            tokens: vec![
+                SyntaxDefinition::RequiredToken(SyntaxKind::Discard),
+                SyntaxDefinition::OneOf(vec![
+                    SyntaxKind::All,
+                    SyntaxKind::Plans,
+                    SyntaxKind::Sequences,
+                    SyntaxKind::Temp,
+                    SyntaxKind::Temporary,
+                ]),
+            ],
+        });
+
+        m.push(StatementDefinition {
+            stmt: SyntaxKind::CreateRoleStmt,
+            tokens: vec![
+                SyntaxDefinition::RequiredToken(SyntaxKind::Create),
+                SyntaxDefinition::RequiredToken(SyntaxKind::Role),
+                SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
+            ],
+        });
+
+        m.push(StatementDefinition {
+            stmt: SyntaxKind::AlterRoleStmt,
+            tokens: vec![
+                SyntaxDefinition::RequiredToken(SyntaxKind::Alter),
+                SyntaxDefinition::RequiredToken(SyntaxKind::Role),
+                SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
+            ],
+        });
+
+        m.push(StatementDefinition {
+            stmt: SyntaxKind::DropRoleStmt,
+            tokens: vec![
+                SyntaxDefinition::RequiredToken(SyntaxKind::Drop),
+                SyntaxDefinition::RequiredToken(SyntaxKind::Role),
+                SyntaxDefinition::OptionalToken(SyntaxKind::IfP),
+                SyntaxDefinition::OptionalToken(SyntaxKind::Exists),
+                SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
+            ],
+        });
+
+        m.push(StatementDefinition {
+            stmt: SyntaxKind::LockStmt,
+            tokens: vec![
+                SyntaxDefinition::RequiredToken(SyntaxKind::LockP),
+                SyntaxDefinition::OptionalToken(SyntaxKind::Table),
+                SyntaxDefinition::OptionalToken(SyntaxKind::Only),
+                SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
+            ],
+        });
+
+        m.push(StatementDefinition {
+            stmt: SyntaxKind::ConstraintsSetStmt,
+            tokens: vec![
+                SyntaxDefinition::RequiredToken(SyntaxKind::Set),
+                SyntaxDefinition::RequiredToken(SyntaxKind::Constraints),
+            ],
+        });
+
+        m.push(StatementDefinition {
+            stmt: SyntaxKind::ReindexStmt,
+            tokens: vec![
+                SyntaxDefinition::RequiredToken(SyntaxKind::Reindex),
+                SyntaxDefinition::OptionalToken(SyntaxKind::Concurrently),
+                SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
+            ],
+        });
+
+        m.push(StatementDefinition {
+            stmt: SyntaxKind::CheckPointStmt,
+            tokens: vec![SyntaxDefinition::RequiredToken(SyntaxKind::Checkpoint)],
+        });
+
+        m.push(StatementDefinition {
+            stmt: SyntaxKind::CreateSchemaStmt,
+            tokens: vec![
+                SyntaxDefinition::RequiredToken(SyntaxKind::Create),
+                SyntaxDefinition::OptionalToken(SyntaxKind::Schema),
+            ],
+        });
+
+        m.push(StatementDefinition {
+            stmt: SyntaxKind::AlterDatabaseStmt,
+            tokens: vec![
+                SyntaxDefinition::RequiredToken(SyntaxKind::Alter),
+                SyntaxDefinition::RequiredToken(SyntaxKind::Database),
+                SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
+            ],
+        });
+
+        m.push(StatementDefinition {
+            stmt: SyntaxKind::AlterDatabaseRefreshCollStmt,
+            tokens: vec![
+                SyntaxDefinition::RequiredToken(SyntaxKind::Alter),
+                SyntaxDefinition::RequiredToken(SyntaxKind::Database),
+                SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
+                SyntaxDefinition::RequiredToken(SyntaxKind::Refresh),
+                SyntaxDefinition::RequiredToken(SyntaxKind::Collation),
+                SyntaxDefinition::RequiredToken(SyntaxKind::VersionP),
+            ],
+        });
+
+        m.push(StatementDefinition {
+            stmt: SyntaxKind::AlterDatabaseSetStmt,
+            tokens: vec![
+                SyntaxDefinition::RequiredToken(SyntaxKind::Alter),
+                SyntaxDefinition::RequiredToken(SyntaxKind::Database),
+                SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
+                SyntaxDefinition::RequiredToken(SyntaxKind::Set),
+            ],
+        });
+
+        m.push(StatementDefinition {
+            stmt: SyntaxKind::AlterDatabaseSetStmt,
+            tokens: vec![
+                SyntaxDefinition::RequiredToken(SyntaxKind::Alter),
+                SyntaxDefinition::RequiredToken(SyntaxKind::Database),
+                SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
+                SyntaxDefinition::RequiredToken(SyntaxKind::Reset),
+            ],
+        });
+
+        m.push(StatementDefinition {
+            stmt: SyntaxKind::CreateConversionStmt,
+            tokens: vec![
+                SyntaxDefinition::RequiredToken(SyntaxKind::Create),
+                SyntaxDefinition::OptionalToken(SyntaxKind::Default),
+                SyntaxDefinition::RequiredToken(SyntaxKind::ConversionP),
+                SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
+                SyntaxDefinition::RequiredToken(SyntaxKind::For),
+                SyntaxDefinition::RequiredToken(SyntaxKind::Sconst),
+                SyntaxDefinition::RequiredToken(SyntaxKind::To),
+                SyntaxDefinition::RequiredToken(SyntaxKind::Sconst),
+                SyntaxDefinition::RequiredToken(SyntaxKind::From),
+                SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
+            ],
+        });
+
+        m.push(StatementDefinition {
+            stmt: SyntaxKind::CreateCastStmt,
+            tokens: vec![
+                SyntaxDefinition::RequiredToken(SyntaxKind::Create),
+                SyntaxDefinition::RequiredToken(SyntaxKind::Cast),
+                SyntaxDefinition::RequiredToken(SyntaxKind::Ascii40),
+                SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
+                SyntaxDefinition::RequiredToken(SyntaxKind::As),
+                SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
+                SyntaxDefinition::RequiredToken(SyntaxKind::Ascii41),
+            ],
+        });
+
+        m.push(StatementDefinition {
+            stmt: SyntaxKind::CreateOpFamilyStmt,
+            tokens: vec![
+                SyntaxDefinition::RequiredToken(SyntaxKind::Create),
+                SyntaxDefinition::RequiredToken(SyntaxKind::Operator),
+                SyntaxDefinition::RequiredToken(SyntaxKind::Family),
+                SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
+            ],
+        });
+
+        m.push(StatementDefinition {
+            stmt: SyntaxKind::AlterOpFamilyStmt,
+            tokens: vec![
+                SyntaxDefinition::RequiredToken(SyntaxKind::Alter),
+                SyntaxDefinition::RequiredToken(SyntaxKind::Operator),
+                SyntaxDefinition::RequiredToken(SyntaxKind::Family),
+                SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
+                SyntaxDefinition::RequiredToken(SyntaxKind::Using),
+                SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
+            ],
+        });
+
+        m.push(StatementDefinition {
+            stmt: SyntaxKind::PrepareStmt,
+            tokens: vec![
+                SyntaxDefinition::RequiredToken(SyntaxKind::Prepare),
+                SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
+                SyntaxDefinition::AnyToken,
+                SyntaxDefinition::RequiredToken(SyntaxKind::As),
+                SyntaxDefinition::OneOf(vec![SyntaxKind::With, SyntaxKind::Select]),
+            ],
+        });
+
+        m.push(StatementDefinition {
+            stmt: SyntaxKind::DeallocateStmt,
+            tokens: vec![
+                SyntaxDefinition::RequiredToken(SyntaxKind::Deallocate),
+                SyntaxDefinition::OptionalToken(SyntaxKind::Prepare),
+                SyntaxDefinition::OneOf(vec![SyntaxKind::Ident, SyntaxKind::All]),
+            ],
+        });
+
+        m.push(StatementDefinition {
+            stmt: SyntaxKind::CreateTableSpaceStmt,
+            tokens: vec![
+                SyntaxDefinition::RequiredToken(SyntaxKind::Create),
+                SyntaxDefinition::RequiredToken(SyntaxKind::Tablespace),
+                SyntaxDefinition::AnyTokens,
+                SyntaxDefinition::RequiredToken(SyntaxKind::Location),
+            ],
+        });
+
+        m.push(StatementDefinition {
+            stmt: SyntaxKind::DropTableSpaceStmt,
+            tokens: vec![
+                SyntaxDefinition::RequiredToken(SyntaxKind::Drop),
+                SyntaxDefinition::RequiredToken(SyntaxKind::Tablespace),
+                SyntaxDefinition::OptionalToken(SyntaxKind::IfP),
+                SyntaxDefinition::OptionalToken(SyntaxKind::Exists),
+                SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
+            ],
+        });
+
+        m.push(StatementDefinition {
+            stmt: SyntaxKind::AlterOperatorStmt,
+            tokens: vec![
+                SyntaxDefinition::RequiredToken(SyntaxKind::Alter),
+                SyntaxDefinition::RequiredToken(SyntaxKind::Operator),
+            ],
+        });
+
+        m.push(StatementDefinition {
+            stmt: SyntaxKind::AlterTypeStmt,
+            tokens: vec![
+                SyntaxDefinition::RequiredToken(SyntaxKind::Alter),
+                SyntaxDefinition::RequiredToken(SyntaxKind::TypeP),
+                SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
+            ],
+        });
+
+        m.push(StatementDefinition {
+            stmt: SyntaxKind::DropOwnedStmt,
+            tokens: vec![
+                SyntaxDefinition::RequiredToken(SyntaxKind::Drop),
+                SyntaxDefinition::RequiredToken(SyntaxKind::Owned),
+                SyntaxDefinition::RequiredToken(SyntaxKind::By),
+            ],
+        });
+
+        m.push(StatementDefinition {
+            stmt: SyntaxKind::ReassignOwnedStmt,
+            tokens: vec![
+                SyntaxDefinition::RequiredToken(SyntaxKind::Reassign),
+                SyntaxDefinition::RequiredToken(SyntaxKind::Owned),
+                SyntaxDefinition::RequiredToken(SyntaxKind::By),
+                SyntaxDefinition::AnyTokens,
+                SyntaxDefinition::RequiredToken(SyntaxKind::To),
+            ],
+        });
+
+        m.push(StatementDefinition {
+            stmt: SyntaxKind::CreateFdwStmt,
+            tokens: vec![
+                SyntaxDefinition::RequiredToken(SyntaxKind::Create),
+                SyntaxDefinition::RequiredToken(SyntaxKind::Foreign),
+                SyntaxDefinition::RequiredToken(SyntaxKind::DataP),
+                SyntaxDefinition::RequiredToken(SyntaxKind::Wrapper),
+                SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
+            ],
+        });
+
+        m.push(StatementDefinition {
+            stmt: SyntaxKind::AlterFdwStmt,
+            tokens: vec![
+                SyntaxDefinition::RequiredToken(SyntaxKind::Alter),
+                SyntaxDefinition::RequiredToken(SyntaxKind::Foreign),
+                SyntaxDefinition::RequiredToken(SyntaxKind::DataP),
+                SyntaxDefinition::RequiredToken(SyntaxKind::Wrapper),
+                SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
+            ],
+        });
+
+        m.push(StatementDefinition {
+            stmt: SyntaxKind::CreateForeignServerStmt,
+            tokens: vec![
+                SyntaxDefinition::RequiredToken(SyntaxKind::Create),
+                SyntaxDefinition::RequiredToken(SyntaxKind::Server),
+                SyntaxDefinition::OptionalToken(SyntaxKind::IfP),
+                SyntaxDefinition::OptionalToken(SyntaxKind::Not),
+                SyntaxDefinition::OptionalToken(SyntaxKind::Exists),
+                SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
+                SyntaxDefinition::AnyTokens,
+                SyntaxDefinition::RequiredToken(SyntaxKind::Foreign),
+                SyntaxDefinition::RequiredToken(SyntaxKind::DataP),
+                SyntaxDefinition::RequiredToken(SyntaxKind::Wrapper),
+                SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
+            ],
+        });
+
+        m.push(StatementDefinition {
+            stmt: SyntaxKind::AlterForeignServerStmt,
+            tokens: vec![
+                SyntaxDefinition::RequiredToken(SyntaxKind::Alter),
+                SyntaxDefinition::RequiredToken(SyntaxKind::Server),
+                SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
+            ],
+        });
+
+        m.push(StatementDefinition {
+            stmt: SyntaxKind::CreateUserMappingStmt,
+            tokens: vec![
+                SyntaxDefinition::RequiredToken(SyntaxKind::Create),
+                SyntaxDefinition::RequiredToken(SyntaxKind::User),
+                SyntaxDefinition::RequiredToken(SyntaxKind::Mapping),
+                SyntaxDefinition::OptionalToken(SyntaxKind::IfP),
+                SyntaxDefinition::OptionalToken(SyntaxKind::Not),
+                SyntaxDefinition::OptionalToken(SyntaxKind::Exists),
+                SyntaxDefinition::RequiredToken(SyntaxKind::For),
+                SyntaxDefinition::AnyTokens,
+                SyntaxDefinition::RequiredToken(SyntaxKind::Server),
+                SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
+            ],
+        });
+
+        m.push(StatementDefinition {
+            stmt: SyntaxKind::AlterUserMappingStmt,
+            tokens: vec![
+                SyntaxDefinition::RequiredToken(SyntaxKind::Alter),
+                SyntaxDefinition::RequiredToken(SyntaxKind::User),
+                SyntaxDefinition::RequiredToken(SyntaxKind::Mapping),
+                SyntaxDefinition::OptionalToken(SyntaxKind::For),
+                SyntaxDefinition::AnyTokens,
+                SyntaxDefinition::RequiredToken(SyntaxKind::Server),
+                SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
+                SyntaxDefinition::RequiredToken(SyntaxKind::Options),
+            ],
+        });
+
+        m.push(StatementDefinition {
+            stmt: SyntaxKind::DropUserMappingStmt,
+            tokens: vec![
+                SyntaxDefinition::RequiredToken(SyntaxKind::Alter),
+                SyntaxDefinition::RequiredToken(SyntaxKind::User),
+                SyntaxDefinition::RequiredToken(SyntaxKind::Mapping),
+                SyntaxDefinition::OptionalToken(SyntaxKind::IfP),
+                SyntaxDefinition::OptionalToken(SyntaxKind::Exists),
+                SyntaxDefinition::OptionalToken(SyntaxKind::For),
+                SyntaxDefinition::AnyTokens,
+                SyntaxDefinition::RequiredToken(SyntaxKind::Server),
+                SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
+            ],
+        });
+
+        m.push(StatementDefinition {
+            stmt: SyntaxKind::SecLabelStmt,
+            tokens: vec![
+                SyntaxDefinition::RequiredToken(SyntaxKind::Security),
+                SyntaxDefinition::RequiredToken(SyntaxKind::Label),
+                SyntaxDefinition::OptionalToken(SyntaxKind::For),
+                SyntaxDefinition::OptionalToken(SyntaxKind::Ident),
+                SyntaxDefinition::RequiredToken(SyntaxKind::On),
+            ],
+        });
+
+        m.push(StatementDefinition {
+            stmt: SyntaxKind::CreateForeignTableStmt,
+            tokens: vec![
+                SyntaxDefinition::RequiredToken(SyntaxKind::Create),
+                SyntaxDefinition::RequiredToken(SyntaxKind::Foreign),
+                SyntaxDefinition::RequiredToken(SyntaxKind::Table),
+                SyntaxDefinition::OptionalToken(SyntaxKind::IfP),
+                SyntaxDefinition::OptionalToken(SyntaxKind::Not),
+                SyntaxDefinition::OptionalToken(SyntaxKind::Exists),
+                SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
+                SyntaxDefinition::AnyTokens,
+                SyntaxDefinition::RequiredToken(SyntaxKind::Server),
+                SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
+            ],
+        });
+
+        m.push(StatementDefinition {
+            stmt: SyntaxKind::ImportForeignSchemaStmt,
+            tokens: vec![
+                SyntaxDefinition::RequiredToken(SyntaxKind::Import),
+                SyntaxDefinition::RequiredToken(SyntaxKind::Foreign),
+                SyntaxDefinition::RequiredToken(SyntaxKind::Schema),
+                SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
+                SyntaxDefinition::AnyTokens,
+                SyntaxDefinition::RequiredToken(SyntaxKind::From),
+                SyntaxDefinition::RequiredToken(SyntaxKind::Server),
+                SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
+                SyntaxDefinition::RequiredToken(SyntaxKind::Into),
+                SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
+            ],
+        });
+
+        m.push(StatementDefinition {
+            stmt: SyntaxKind::CreateExtensionStmt,
+            tokens: vec![
+                SyntaxDefinition::RequiredToken(SyntaxKind::Create),
+                SyntaxDefinition::RequiredToken(SyntaxKind::Extension),
+                SyntaxDefinition::OptionalToken(SyntaxKind::IfP),
+                SyntaxDefinition::OptionalToken(SyntaxKind::Not),
+                SyntaxDefinition::OptionalToken(SyntaxKind::Exists),
+                SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
+            ],
+        });
+
+        m.push(StatementDefinition {
+            stmt: SyntaxKind::AlterExtensionStmt,
+            tokens: vec![
+                SyntaxDefinition::RequiredToken(SyntaxKind::Alter),
+                SyntaxDefinition::RequiredToken(SyntaxKind::Extension),
+                SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
+            ],
+        });
+
+        m.push(StatementDefinition {
+            stmt: SyntaxKind::CreateEventTrigStmt,
+            tokens: vec![
+                SyntaxDefinition::RequiredToken(SyntaxKind::Create),
+                SyntaxDefinition::RequiredToken(SyntaxKind::Event),
+                SyntaxDefinition::RequiredToken(SyntaxKind::Trigger),
+                SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
+                SyntaxDefinition::RequiredToken(SyntaxKind::On),
+                SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
+                SyntaxDefinition::AnyTokens,
+                SyntaxDefinition::RequiredToken(SyntaxKind::Execute),
+                SyntaxDefinition::OneOf(vec![SyntaxKind::Function, SyntaxKind::Procedure]),
+                SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
+                SyntaxDefinition::RequiredToken(SyntaxKind::Ascii40),
+                SyntaxDefinition::RequiredToken(SyntaxKind::Ascii41),
+            ],
+        });
+
+        m.push(StatementDefinition {
+            stmt: SyntaxKind::AlterEventTrigStmt,
+            tokens: vec![
+                SyntaxDefinition::RequiredToken(SyntaxKind::Alter),
+                SyntaxDefinition::RequiredToken(SyntaxKind::Event),
+                SyntaxDefinition::RequiredToken(SyntaxKind::Trigger),
+                SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
+            ],
+        });
+
+        m.push(StatementDefinition {
+            stmt: SyntaxKind::RefreshMatViewStmt,
+            tokens: vec![
+                SyntaxDefinition::RequiredToken(SyntaxKind::Refresh),
+                SyntaxDefinition::RequiredToken(SyntaxKind::Materialized),
+                SyntaxDefinition::RequiredToken(SyntaxKind::View),
+                SyntaxDefinition::OptionalToken(SyntaxKind::Concurrently),
+                SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
+            ],
+        });
+
+        m.push(StatementDefinition {
+            stmt: SyntaxKind::AlterSystemStmt,
+            tokens: vec![
+                SyntaxDefinition::RequiredToken(SyntaxKind::Alter),
+                SyntaxDefinition::RequiredToken(SyntaxKind::SystemP),
+                SyntaxDefinition::OneOf(vec![SyntaxKind::Set, SyntaxKind::Reset]),
+            ],
+        });
+
+        m.push(StatementDefinition {
+            stmt: SyntaxKind::CreatePolicyStmt,
+            tokens: vec![
+                SyntaxDefinition::RequiredToken(SyntaxKind::Create),
+                SyntaxDefinition::RequiredToken(SyntaxKind::Policy),
+                SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
+                SyntaxDefinition::RequiredToken(SyntaxKind::On),
+                SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
+            ],
+        });
+
+        m.push(StatementDefinition {
+            stmt: SyntaxKind::AlterPolicyStmt,
+            tokens: vec![
+                SyntaxDefinition::RequiredToken(SyntaxKind::Alter),
+                SyntaxDefinition::RequiredToken(SyntaxKind::Policy),
+                SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
+                SyntaxDefinition::RequiredToken(SyntaxKind::On),
+                SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
+            ],
+        });
+
+        m.push(StatementDefinition {
+            stmt: SyntaxKind::CreateTransformStmt,
+            tokens: vec![
+                SyntaxDefinition::RequiredToken(SyntaxKind::Create),
+                SyntaxDefinition::OptionalToken(SyntaxKind::Or),
+                SyntaxDefinition::OptionalToken(SyntaxKind::Replace),
+                SyntaxDefinition::RequiredToken(SyntaxKind::Transform),
+                SyntaxDefinition::RequiredToken(SyntaxKind::For),
+                SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
+                SyntaxDefinition::RequiredToken(SyntaxKind::Language),
+                SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
+                SyntaxDefinition::RequiredToken(SyntaxKind::Ascii40),
+                SyntaxDefinition::AnyTokens,
+                SyntaxDefinition::RequiredToken(SyntaxKind::Ascii41),
+            ],
+        });
+
+        m.push(StatementDefinition {
+            stmt: SyntaxKind::CreateAmStmt,
+            tokens: vec![
+                SyntaxDefinition::RequiredToken(SyntaxKind::Create),
+                SyntaxDefinition::RequiredToken(SyntaxKind::Access),
+                SyntaxDefinition::RequiredToken(SyntaxKind::Method),
+                SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
+                SyntaxDefinition::RequiredToken(SyntaxKind::TypeP),
+            ],
+        });
+
+        m.push(StatementDefinition {
+            stmt: SyntaxKind::CreatePublicationStmt,
+            tokens: vec![
+                SyntaxDefinition::RequiredToken(SyntaxKind::Create),
+                SyntaxDefinition::RequiredToken(SyntaxKind::Publication),
+                SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
+            ],
+        });
+
+        m.push(StatementDefinition {
+            stmt: SyntaxKind::AlterPublicationStmt,
+            tokens: vec![
+                SyntaxDefinition::RequiredToken(SyntaxKind::Alter),
+                SyntaxDefinition::RequiredToken(SyntaxKind::Publication),
+                SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
+            ],
+        });
+
+        m.push(StatementDefinition {
+            stmt: SyntaxKind::CreateSubscriptionStmt,
+            tokens: vec![
+                SyntaxDefinition::RequiredToken(SyntaxKind::Create),
+                SyntaxDefinition::RequiredToken(SyntaxKind::Subscription),
+                SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
+                SyntaxDefinition::RequiredToken(SyntaxKind::Connection),
+                SyntaxDefinition::RequiredToken(SyntaxKind::Sconst),
+                SyntaxDefinition::RequiredToken(SyntaxKind::Publication),
+                SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
+            ],
+        });
+
+        m.push(StatementDefinition {
+            stmt: SyntaxKind::AlterSubscriptionStmt,
+            tokens: vec![
+                SyntaxDefinition::RequiredToken(SyntaxKind::Alter),
+                SyntaxDefinition::RequiredToken(SyntaxKind::Subscription),
+                SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
+            ],
+        });
+
+        m.push(StatementDefinition {
+            stmt: SyntaxKind::DropSubscriptionStmt,
+            tokens: vec![
+                SyntaxDefinition::RequiredToken(SyntaxKind::Drop),
+                SyntaxDefinition::RequiredToken(SyntaxKind::Subscription),
+                SyntaxDefinition::OptionalToken(SyntaxKind::IfP),
+                SyntaxDefinition::OptionalToken(SyntaxKind::Exists),
+                SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
+            ],
+        });
+
         let mut stmt_starts: HashMap<SyntaxKind, Vec<StatementDefinition>> = HashMap::new();
 
         for stmt in m {
@@ -107,3 +1090,27 @@ pub static STATEMENT_DEFINITIONS: LazyLock<HashMap<SyntaxKind, Vec<StatementDefi
 
         stmt_starts
     });
+
+// TODO: complete the hashmap above with all statements:
+// RETURN statement (inside SQL function body)
+// ReturnStmt,
+// SetOperationStmt,
+//
+// TODO: parsing ambiguity, check docs for solution
+// GrantStmt(super::GrantStmt),
+// GrantRoleStmt(super::GrantRoleStmt),
+// ClosePortalStmt,
+// CreatePlangStmt,
+// AlterRoleSetStmt,
+// DeclareCursorStmt,
+// AlterObjectDependsStmt,
+// AlterObjectSchemaStmt,
+// AlterOwnerStmt,
+// AlterEnumStmt,
+// AlterTsdictionaryStmt,
+// AlterTsconfigurationStmt,
+// AlterTableSpaceOptionsStmt,
+// AlterTableMoveAllStmt,
+// AlterExtensionContentsStmt,
+// ReplicaIdentityStmt,
+//
diff --git a/crates/pg_statement_splitter/src/is_at_stmt_start.rs b/crates/pg_statement_splitter/src/is_at_stmt_start.rs
deleted file mode 100644
index ec1b83ea..00000000
--- a/crates/pg_statement_splitter/src/is_at_stmt_start.rs
+++ /dev/null
@@ -1,1015 +0,0 @@
-use std::collections::HashMap;
-use std::sync::LazyLock;
-
-use super::Parser;
-use pg_lexer::SyntaxKind;
-
-pub enum SyntaxToken {
-    Required(SyntaxKind),
-    Optional(SyntaxKind),
-}
-
-#[derive(Debug, Clone, Hash)]
-pub enum TokenStatement {
-    // The respective token is the last token of the statement
-    EoS(SyntaxKind),
-    Any(SyntaxKind),
-}
-
-impl TokenStatement {
-    fn is_eos(&self) -> bool {
-        match self {
-            TokenStatement::EoS(_) => true,
-            _ => false,
-        }
-    }
-
-    fn kind(&self) -> SyntaxKind {
-        match self {
-            TokenStatement::EoS(k) => k.to_owned(),
-            TokenStatement::Any(k) => k.to_owned(),
-        }
-    }
-}
-
-impl PartialEq for TokenStatement {
-    fn eq(&self, other: &Self) -> bool {
-        let a = match self {
-            TokenStatement::EoS(s) => s,
-            TokenStatement::Any(s) => s,
-        };
-
-        let b = match other {
-            TokenStatement::EoS(s) => s,
-            TokenStatement::Any(s) => s,
-        };
-
-        return a == b;
-    }
-}
-
-// vector of hashmaps, where each hashmap returns the list of possible statements for a token at
-// the respective index.
-//
-// For example, at idx 0, the hashmap contains a superset of
-// ```
-//{
-//     Create: [
-//         IndexStmt,
-//         CreateFunctionStmt,
-//         CreateStmt,
-//         ViewStmt,
-//     ],
-//     Select: [
-//         SelectStmt,
-//     ],
-// },
-// ```
-//
-// the idea is to trim down the possible options for each token, until only one statement is left.
-//
-// The vector is lazily constructed out of another vector of tuples, where each tuple contains a
-// statement, and a list of `SyntaxToken`s that are to be found at the start of the statement.
-pub static STATEMENT_START_TOKEN_MAPS: LazyLock<Vec<HashMap<SyntaxKind, Vec<TokenStatement>>>> =
-    LazyLock::new(|| {
-        let mut m: Vec<(SyntaxKind, &'static [SyntaxToken])> = Vec::new();
-
-        m.push((
-            SyntaxKind::InsertStmt,
-            &[
-                SyntaxToken::Required(SyntaxKind::Insert),
-                SyntaxToken::Required(SyntaxKind::Into),
-            ],
-        ));
-
-        m.push((
-            SyntaxKind::DeleteStmt,
-            &[
-                SyntaxToken::Required(SyntaxKind::DeleteP),
-                SyntaxToken::Required(SyntaxKind::From),
-            ],
-        ));
-
-        m.push((
-            SyntaxKind::UpdateStmt,
-            &[SyntaxToken::Required(SyntaxKind::Update)],
-        ));
-
-        m.push((
-            SyntaxKind::MergeStmt,
-            &[
-                SyntaxToken::Required(SyntaxKind::Merge),
-                SyntaxToken::Required(SyntaxKind::Into),
-            ],
-        ));
-
-        m.push((
-            SyntaxKind::SelectStmt,
-            &[SyntaxToken::Required(SyntaxKind::Select)],
-        ));
-
-        m.push((
-            SyntaxKind::AlterTableStmt,
-            &[
-                SyntaxToken::Required(SyntaxKind::Alter),
-                SyntaxToken::Required(SyntaxKind::Table),
-                SyntaxToken::Optional(SyntaxKind::IfP),
-                SyntaxToken::Optional(SyntaxKind::Exists),
-                SyntaxToken::Optional(SyntaxKind::Only),
-                SyntaxToken::Required(SyntaxKind::Ident),
-            ],
-        ));
-
-        // ALTER TABLE x RENAME ... is different to e.g. alter table alter column...
-        m.push((
-            SyntaxKind::RenameStmt,
-            &[
-                SyntaxToken::Required(SyntaxKind::Alter),
-                SyntaxToken::Required(SyntaxKind::Table),
-                SyntaxToken::Optional(SyntaxKind::IfP),
-                SyntaxToken::Optional(SyntaxKind::Exists),
-                SyntaxToken::Optional(SyntaxKind::Only),
-                SyntaxToken::Required(SyntaxKind::Ident),
-                SyntaxToken::Required(SyntaxKind::Rename),
-            ],
-        ));
-
-        m.push((
-            SyntaxKind::AlterDomainStmt,
-            &[
-                SyntaxToken::Required(SyntaxKind::Alter),
-                SyntaxToken::Required(SyntaxKind::DomainP),
-            ],
-        ));
-
-        m.push((
-            SyntaxKind::AlterDefaultPrivilegesStmt,
-            &[
-                SyntaxToken::Required(SyntaxKind::Alter),
-                SyntaxToken::Required(SyntaxKind::Default),
-                SyntaxToken::Required(SyntaxKind::Privileges),
-            ],
-        ));
-
-        m.push((
-            SyntaxKind::ClusterStmt,
-            &[SyntaxToken::Required(SyntaxKind::Cluster)],
-        ));
-
-        m.push((
-            SyntaxKind::CopyStmt,
-            &[SyntaxToken::Required(SyntaxKind::Copy)],
-        ));
-
-        // CREATE [ [ GLOBAL | LOCAL ] { TEMPORARY | TEMP } | UNLOGGED ] TABLE
-        // this is overly simplified, but it should be good enough for now
-        m.push((
-            SyntaxKind::CreateStmt,
-            &[
-                SyntaxToken::Required(SyntaxKind::Create),
-                SyntaxToken::Optional(SyntaxKind::Global),
-                SyntaxToken::Optional(SyntaxKind::Local),
-                SyntaxToken::Optional(SyntaxKind::Temporary),
-                SyntaxToken::Optional(SyntaxKind::Temp),
-                SyntaxToken::Optional(SyntaxKind::Unlogged),
-                SyntaxToken::Optional(SyntaxKind::IfP),
-                SyntaxToken::Optional(SyntaxKind::Not),
-                SyntaxToken::Optional(SyntaxKind::Exists),
-                SyntaxToken::Required(SyntaxKind::Table),
-                SyntaxToken::Required(SyntaxKind::Ident),
-            ],
-        ));
-
-        // CREATE [ OR REPLACE ] AGGREGATE
-        m.push((
-            SyntaxKind::DefineStmt,
-            &[
-                SyntaxToken::Required(SyntaxKind::Create),
-                SyntaxToken::Optional(SyntaxKind::Or),
-                SyntaxToken::Optional(SyntaxKind::Replace),
-                SyntaxToken::Required(SyntaxKind::Aggregate),
-            ],
-        ));
-
-        // CREATE OPERATOR
-        m.push((
-            SyntaxKind::DefineStmt,
-            &[
-                SyntaxToken::Required(SyntaxKind::Create),
-                SyntaxToken::Required(SyntaxKind::Operator),
-            ],
-        ));
-
-        // CREATE TYPE name
-        m.push((
-            SyntaxKind::DefineStmt,
-            &[
-                SyntaxToken::Required(SyntaxKind::Create),
-                SyntaxToken::Required(SyntaxKind::TypeP),
-                SyntaxToken::Required(SyntaxKind::Ident),
-            ],
-        ));
-
-        // CREATE TYPE name AS
-        m.push((
-            SyntaxKind::CompositeTypeStmt,
-            &[
-                SyntaxToken::Required(SyntaxKind::Create),
-                SyntaxToken::Required(SyntaxKind::TypeP),
-                SyntaxToken::Required(SyntaxKind::Ident),
-                SyntaxToken::Required(SyntaxKind::As),
-            ],
-        ));
-
-        // CREATE TYPE name AS ENUM
-        m.push((
-            SyntaxKind::CreateEnumStmt,
-            &[
-                SyntaxToken::Required(SyntaxKind::Create),
-                SyntaxToken::Required(SyntaxKind::TypeP),
-                SyntaxToken::Required(SyntaxKind::Ident),
-                SyntaxToken::Required(SyntaxKind::As),
-                SyntaxToken::Required(SyntaxKind::EnumP),
-            ],
-        ));
-
-        // CREATE TYPE name AS RANGE
-        m.push((
-            SyntaxKind::CreateRangeStmt,
-            &[
-                SyntaxToken::Required(SyntaxKind::Create),
-                SyntaxToken::Required(SyntaxKind::TypeP),
-                SyntaxToken::Required(SyntaxKind::Ident),
-                SyntaxToken::Required(SyntaxKind::As),
-                SyntaxToken::Required(SyntaxKind::Range),
-            ],
-        ));
-
-        // m.push((
-        //     SyntaxKind::DropStmt,
-        //     &[
-        //         SyntaxToken::Required(SyntaxKind::Drop),
-        //     ],
-        // ));
-
-        m.push((
-            SyntaxKind::TruncateStmt,
-            &[SyntaxToken::Required(SyntaxKind::Truncate)],
-        ));
-
-        m.push((
-            SyntaxKind::CommentStmt,
-            &[
-                SyntaxToken::Required(SyntaxKind::Comment),
-                SyntaxToken::Required(SyntaxKind::On),
-            ],
-        ));
-
-        m.push((
-            SyntaxKind::FetchStmt,
-            &[SyntaxToken::Required(SyntaxKind::Fetch)],
-        ));
-
-        // CREATE [ UNIQUE ] INDEX
-        m.push((
-            SyntaxKind::IndexStmt,
-            &[
-                SyntaxToken::Required(SyntaxKind::Create),
-                SyntaxToken::Optional(SyntaxKind::Unique),
-                SyntaxToken::Required(SyntaxKind::Index),
-            ],
-        ));
-
-        // CREATE [ OR REPLACE ] FUNCTION
-        m.push((
-            SyntaxKind::CreateFunctionStmt,
-            &[
-                SyntaxToken::Required(SyntaxKind::Create),
-                SyntaxToken::Optional(SyntaxKind::Or),
-                SyntaxToken::Optional(SyntaxKind::Replace),
-                SyntaxToken::Required(SyntaxKind::Function),
-            ],
-        ));
-
-        m.push((
-            SyntaxKind::AlterFunctionStmt,
-            &[
-                SyntaxToken::Required(SyntaxKind::Alter),
-                SyntaxToken::Required(SyntaxKind::Function),
-            ],
-        ));
-
-        m.push((SyntaxKind::DoStmt, &[SyntaxToken::Required(SyntaxKind::Do)]));
-
-        // CREATE [ OR REPLACE ] RULE
-        m.push((
-            SyntaxKind::RuleStmt,
-            &[
-                SyntaxToken::Required(SyntaxKind::Create),
-                SyntaxToken::Optional(SyntaxKind::Or),
-                SyntaxToken::Optional(SyntaxKind::Replace),
-                SyntaxToken::Required(SyntaxKind::Rule),
-            ],
-        ));
-
-        m.push((
-            SyntaxKind::NotifyStmt,
-            &[SyntaxToken::Required(SyntaxKind::Notify)],
-        ));
-        m.push((
-            SyntaxKind::ListenStmt,
-            &[SyntaxToken::Required(SyntaxKind::Listen)],
-        ));
-        m.push((
-            SyntaxKind::UnlistenStmt,
-            &[SyntaxToken::Required(SyntaxKind::Unlisten)],
-        ));
-
-        // TransactionStmt can be Begin or Commit
-        m.push((
-            SyntaxKind::TransactionStmt,
-            &[SyntaxToken::Required(SyntaxKind::BeginP)],
-        ));
-        m.push((
-            SyntaxKind::TransactionStmt,
-            &[SyntaxToken::Required(SyntaxKind::Commit)],
-        ));
-
-        // CREATE [ OR REPLACE ] [ TEMP | TEMPORARY ] [ RECURSIVE ] VIEW
-        // this is overly simplified, but it should be good enough for now
-        m.push((
-            SyntaxKind::ViewStmt,
-            &[
-                SyntaxToken::Required(SyntaxKind::Create),
-                SyntaxToken::Optional(SyntaxKind::Or),
-                SyntaxToken::Optional(SyntaxKind::Replace),
-                SyntaxToken::Optional(SyntaxKind::Temporary),
-                SyntaxToken::Optional(SyntaxKind::Temp),
-                SyntaxToken::Optional(SyntaxKind::Recursive),
-                SyntaxToken::Required(SyntaxKind::View),
-            ],
-        ));
-
-        m.push((
-            SyntaxKind::LoadStmt,
-            &[SyntaxToken::Required(SyntaxKind::Load)],
-        ));
-
-        m.push((
-            SyntaxKind::CreateDomainStmt,
-            &[
-                SyntaxToken::Required(SyntaxKind::Create),
-                SyntaxToken::Required(SyntaxKind::DomainP),
-            ],
-        ));
-
-        m.push((
-            SyntaxKind::CreatedbStmt,
-            &[
-                SyntaxToken::Required(SyntaxKind::Create),
-                SyntaxToken::Required(SyntaxKind::Database),
-            ],
-        ));
-
-        m.push((
-            SyntaxKind::DropdbStmt,
-            &[
-                SyntaxToken::Required(SyntaxKind::Drop),
-                SyntaxToken::Required(SyntaxKind::Database),
-            ],
-        ));
-
-        m.push((
-            SyntaxKind::VacuumStmt,
-            &[SyntaxToken::Required(SyntaxKind::Vacuum)],
-        ));
-
-        m.push((
-            SyntaxKind::ExplainStmt,
-            &[SyntaxToken::Required(SyntaxKind::Explain)],
-        ));
-
-        // CREATE [ [ GLOBAL | LOCAL ] { TEMPORARY | TEMP } ] TABLE AS
-        // this is overly simplified, but it should be good enough for now
-        m.push((
-            SyntaxKind::CreateTableAsStmt,
-            &[
-                SyntaxToken::Required(SyntaxKind::Create),
-                SyntaxToken::Optional(SyntaxKind::Global),
-                SyntaxToken::Optional(SyntaxKind::Local),
-                SyntaxToken::Optional(SyntaxKind::Temporary),
-                SyntaxToken::Optional(SyntaxKind::Temp),
-                SyntaxToken::Required(SyntaxKind::Table),
-                SyntaxToken::Required(SyntaxKind::Ident),
-                SyntaxToken::Required(SyntaxKind::As),
-            ],
-        ));
-
-        m.push((
-            SyntaxKind::CreateSeqStmt,
-            &[
-                SyntaxToken::Required(SyntaxKind::Create),
-                SyntaxToken::Optional(SyntaxKind::Temporary),
-                SyntaxToken::Optional(SyntaxKind::Temp),
-                SyntaxToken::Optional(SyntaxKind::Unlogged),
-                SyntaxToken::Required(SyntaxKind::Sequence),
-            ],
-        ));
-
-        m.push((
-            SyntaxKind::AlterSeqStmt,
-            &[
-                SyntaxToken::Required(SyntaxKind::Alter),
-                SyntaxToken::Required(SyntaxKind::Sequence),
-            ],
-        ));
-
-        m.push((
-            SyntaxKind::VariableSetStmt,
-            &[SyntaxToken::Required(SyntaxKind::Set)],
-        ));
-
-        m.push((
-            SyntaxKind::VariableShowStmt,
-            &[SyntaxToken::Required(SyntaxKind::Show)],
-        ));
-
-        m.push((
-            SyntaxKind::DiscardStmt,
-            &[SyntaxToken::Required(SyntaxKind::Discard)],
-        ));
-
-        // CREATE [ OR REPLACE ] [ CONSTRAINT ] TRIGGER
-        m.push((
-            SyntaxKind::CreateTrigStmt,
-            &[
-                SyntaxToken::Required(SyntaxKind::Create),
-                SyntaxToken::Optional(SyntaxKind::Or),
-                SyntaxToken::Optional(SyntaxKind::Replace),
-                SyntaxToken::Optional(SyntaxKind::Constraint),
-                SyntaxToken::Required(SyntaxKind::Trigger),
-            ],
-        ));
-
-        m.push((
-            SyntaxKind::CreateRoleStmt,
-            &[
-                SyntaxToken::Required(SyntaxKind::Create),
-                SyntaxToken::Required(SyntaxKind::Role),
-            ],
-        ));
-
-        m.push((
-            SyntaxKind::AlterRoleStmt,
-            &[
-                SyntaxToken::Required(SyntaxKind::Alter),
-                SyntaxToken::Required(SyntaxKind::Role),
-            ],
-        ));
-
-        m.push((
-            SyntaxKind::DropRoleStmt,
-            &[
-                SyntaxToken::Required(SyntaxKind::Drop),
-                SyntaxToken::Required(SyntaxKind::Role),
-            ],
-        ));
-
-        m.push((
-            SyntaxKind::LockStmt,
-            &[SyntaxToken::Required(SyntaxKind::LockP)],
-        ));
-
-        m.push((
-            SyntaxKind::ConstraintsSetStmt,
-            &[
-                SyntaxToken::Required(SyntaxKind::Set),
-                SyntaxToken::Required(SyntaxKind::Constraints),
-            ],
-        ));
-
-        m.push((
-            SyntaxKind::ReindexStmt,
-            &[SyntaxToken::Required(SyntaxKind::Reindex)],
-        ));
-
-        m.push((
-            SyntaxKind::CheckPointStmt,
-            &[SyntaxToken::Required(SyntaxKind::Checkpoint)],
-        ));
-
-        m.push((
-            SyntaxKind::CreateSchemaStmt,
-            &[
-                SyntaxToken::Required(SyntaxKind::Create),
-                SyntaxToken::Required(SyntaxKind::Schema),
-            ],
-        ));
-
-        m.push((
-            SyntaxKind::AlterDatabaseStmt,
-            &[
-                SyntaxToken::Required(SyntaxKind::Alter),
-                SyntaxToken::Required(SyntaxKind::Database),
-                SyntaxToken::Required(SyntaxKind::Ident),
-            ],
-        ));
-
-        m.push((
-            SyntaxKind::AlterDatabaseRefreshCollStmt,
-            &[
-                SyntaxToken::Required(SyntaxKind::Alter),
-                SyntaxToken::Required(SyntaxKind::Database),
-                SyntaxToken::Required(SyntaxKind::Ident),
-                SyntaxToken::Required(SyntaxKind::Refresh),
-                SyntaxToken::Required(SyntaxKind::Collation),
-                SyntaxToken::Required(SyntaxKind::VersionP),
-            ],
-        ));
-
-        m.push((
-            SyntaxKind::AlterDatabaseSetStmt,
-            &[
-                SyntaxToken::Required(SyntaxKind::Alter),
-                SyntaxToken::Required(SyntaxKind::Database),
-                SyntaxToken::Required(SyntaxKind::Ident),
-                SyntaxToken::Required(SyntaxKind::Set),
-            ],
-        ));
-
-        m.push((
-            SyntaxKind::AlterDatabaseSetStmt,
-            &[
-                SyntaxToken::Required(SyntaxKind::Alter),
-                SyntaxToken::Required(SyntaxKind::Database),
-                SyntaxToken::Required(SyntaxKind::Ident),
-                SyntaxToken::Required(SyntaxKind::Reset),
-            ],
-        ));
-
-        m.push((
-            SyntaxKind::CreateConversionStmt,
-            &[
-                SyntaxToken::Required(SyntaxKind::Create),
-                SyntaxToken::Optional(SyntaxKind::Default),
-                SyntaxToken::Required(SyntaxKind::ConversionP),
-            ],
-        ));
-
-        m.push((
-            SyntaxKind::CreateCastStmt,
-            &[
-                SyntaxToken::Required(SyntaxKind::Create),
-                SyntaxToken::Required(SyntaxKind::Cast),
-            ],
-        ));
-
-        m.push((
-            SyntaxKind::CreateOpClassStmt,
-            &[
-                SyntaxToken::Required(SyntaxKind::Create),
-                SyntaxToken::Required(SyntaxKind::Operator),
-                SyntaxToken::Required(SyntaxKind::Class),
-            ],
-        ));
-
-        m.push((
-            SyntaxKind::CreateOpFamilyStmt,
-            &[
-                SyntaxToken::Required(SyntaxKind::Create),
-                SyntaxToken::Required(SyntaxKind::Operator),
-                SyntaxToken::Required(SyntaxKind::Family),
-            ],
-        ));
-
-        m.push((
-            SyntaxKind::AlterOpFamilyStmt,
-            &[
-                SyntaxToken::Required(SyntaxKind::Alter),
-                SyntaxToken::Required(SyntaxKind::Operator),
-                SyntaxToken::Required(SyntaxKind::Family),
-            ],
-        ));
-
-        m.push((
-            SyntaxKind::PrepareStmt,
-            &[SyntaxToken::Required(SyntaxKind::Prepare)],
-        ));
-
-        // m.push((
-        //     SyntaxKind::ExecuteStmt,
-        //     &[SyntaxToken::Required(SyntaxKind::Execute)],
-        // ));
-
-        m.push((
-            SyntaxKind::DeallocateStmt,
-            &[SyntaxToken::Required(SyntaxKind::Deallocate)],
-        ));
-
-        m.push((
-            SyntaxKind::CreateTableSpaceStmt,
-            &[
-                SyntaxToken::Required(SyntaxKind::Create),
-                SyntaxToken::Required(SyntaxKind::Tablespace),
-            ],
-        ));
-
-        m.push((
-            SyntaxKind::DropTableSpaceStmt,
-            &[
-                SyntaxToken::Required(SyntaxKind::Drop),
-                SyntaxToken::Required(SyntaxKind::Tablespace),
-            ],
-        ));
-
-        m.push((
-            SyntaxKind::AlterOperatorStmt,
-            &[
-                SyntaxToken::Required(SyntaxKind::Alter),
-                SyntaxToken::Required(SyntaxKind::Operator),
-            ],
-        ));
-
-        m.push((
-            SyntaxKind::AlterTypeStmt,
-            &[
-                SyntaxToken::Required(SyntaxKind::Alter),
-                SyntaxToken::Required(SyntaxKind::TypeP),
-            ],
-        ));
-
-        m.push((
-            SyntaxKind::DropOwnedStmt,
-            &[
-                SyntaxToken::Required(SyntaxKind::Drop),
-                SyntaxToken::Required(SyntaxKind::Owned),
-                SyntaxToken::Required(SyntaxKind::By),
-            ],
-        ));
-
-        m.push((
-            SyntaxKind::ReassignOwnedStmt,
-            &[
-                SyntaxToken::Required(SyntaxKind::Reassign),
-                SyntaxToken::Required(SyntaxKind::Owned),
-                SyntaxToken::Required(SyntaxKind::By),
-            ],
-        ));
-
-        m.push((
-            SyntaxKind::CreateFdwStmt,
-            &[
-                SyntaxToken::Required(SyntaxKind::Create),
-                SyntaxToken::Required(SyntaxKind::Foreign),
-                SyntaxToken::Required(SyntaxKind::DataP),
-                SyntaxToken::Required(SyntaxKind::Wrapper),
-            ],
-        ));
-
-        m.push((
-            SyntaxKind::AlterFdwStmt,
-            &[
-                SyntaxToken::Required(SyntaxKind::Alter),
-                SyntaxToken::Required(SyntaxKind::Foreign),
-                SyntaxToken::Required(SyntaxKind::DataP),
-                SyntaxToken::Required(SyntaxKind::Wrapper),
-            ],
-        ));
-
-        m.push((
-            SyntaxKind::CreateForeignServerStmt,
-            &[
-                SyntaxToken::Required(SyntaxKind::Create),
-                SyntaxToken::Required(SyntaxKind::Server),
-            ],
-        ));
-
-        m.push((
-            SyntaxKind::AlterForeignServerStmt,
-            &[
-                SyntaxToken::Required(SyntaxKind::Alter),
-                SyntaxToken::Required(SyntaxKind::Server),
-            ],
-        ));
-
-        m.push((
-            SyntaxKind::CreateUserMappingStmt,
-            &[
-                SyntaxToken::Required(SyntaxKind::Create),
-                SyntaxToken::Required(SyntaxKind::User),
-                SyntaxToken::Required(SyntaxKind::Mapping),
-            ],
-        ));
-
-        m.push((
-            SyntaxKind::AlterUserMappingStmt,
-            &[
-                SyntaxToken::Required(SyntaxKind::Alter),
-                SyntaxToken::Required(SyntaxKind::User),
-                SyntaxToken::Required(SyntaxKind::Mapping),
-                SyntaxToken::Required(SyntaxKind::For),
-            ],
-        ));
-
-        m.push((
-            SyntaxKind::DropUserMappingStmt,
-            &[
-                SyntaxToken::Required(SyntaxKind::Drop),
-                SyntaxToken::Required(SyntaxKind::User),
-                SyntaxToken::Required(SyntaxKind::Mapping),
-            ],
-        ));
-
-        m.push((
-            SyntaxKind::SecLabelStmt,
-            &[
-                SyntaxToken::Required(SyntaxKind::Security),
-                SyntaxToken::Required(SyntaxKind::Label),
-            ],
-        ));
-
-        m.push((
-            SyntaxKind::CreateForeignTableStmt,
-            &[
-                SyntaxToken::Required(SyntaxKind::Create),
-                SyntaxToken::Required(SyntaxKind::Foreign),
-                SyntaxToken::Required(SyntaxKind::Table),
-            ],
-        ));
-
-        m.push((
-            SyntaxKind::ImportForeignSchemaStmt,
-            &[
-                SyntaxToken::Required(SyntaxKind::ImportP),
-                SyntaxToken::Required(SyntaxKind::Foreign),
-                SyntaxToken::Required(SyntaxKind::Schema),
-            ],
-        ));
-
-        m.push((
-            SyntaxKind::CreateExtensionStmt,
-            &[
-                SyntaxToken::Required(SyntaxKind::Create),
-                SyntaxToken::Required(SyntaxKind::Extension),
-            ],
-        ));
-
-        m.push((
-            SyntaxKind::AlterExtensionStmt,
-            &[
-                SyntaxToken::Required(SyntaxKind::Alter),
-                SyntaxToken::Required(SyntaxKind::Extension),
-            ],
-        ));
-
-        m.push((
-            SyntaxKind::CreateEventTrigStmt,
-            &[
-                SyntaxToken::Required(SyntaxKind::Create),
-                SyntaxToken::Required(SyntaxKind::Event),
-                SyntaxToken::Required(SyntaxKind::Trigger),
-            ],
-        ));
-
-        m.push((
-            SyntaxKind::AlterEventTrigStmt,
-            &[
-                SyntaxToken::Required(SyntaxKind::Alter),
-                SyntaxToken::Required(SyntaxKind::Event),
-                SyntaxToken::Required(SyntaxKind::Trigger),
-            ],
-        ));
-
-        m.push((
-            SyntaxKind::RefreshMatViewStmt,
-            &[
-                SyntaxToken::Required(SyntaxKind::Refresh),
-                SyntaxToken::Required(SyntaxKind::Materialized),
-                SyntaxToken::Required(SyntaxKind::View),
-            ],
-        ));
-
-        m.push((
-            SyntaxKind::AlterSystemStmt,
-            &[
-                SyntaxToken::Required(SyntaxKind::Alter),
-                SyntaxToken::Required(SyntaxKind::SystemP),
-            ],
-        ));
-
-        m.push((
-            SyntaxKind::CreatePolicyStmt,
-            &[
-                SyntaxToken::Required(SyntaxKind::Create),
-                SyntaxToken::Required(SyntaxKind::Policy),
-            ],
-        ));
-
-        m.push((
-            SyntaxKind::AlterPolicyStmt,
-            &[
-                SyntaxToken::Required(SyntaxKind::Alter),
-                SyntaxToken::Required(SyntaxKind::Policy),
-            ],
-        ));
-
-        m.push((
-            SyntaxKind::CreateTransformStmt,
-            &[
-                SyntaxToken::Required(SyntaxKind::Create),
-                SyntaxToken::Optional(SyntaxKind::Or),
-                SyntaxToken::Optional(SyntaxKind::Replace),
-                SyntaxToken::Required(SyntaxKind::Transform),
-                SyntaxToken::Required(SyntaxKind::For),
-            ],
-        ));
-
-        m.push((
-            SyntaxKind::CreateAmStmt,
-            &[
-                SyntaxToken::Required(SyntaxKind::Create),
-                SyntaxToken::Required(SyntaxKind::Access),
-                SyntaxToken::Required(SyntaxKind::Method),
-            ],
-        ));
-
-        m.push((
-            SyntaxKind::CreatePublicationStmt,
-            &[
-                SyntaxToken::Required(SyntaxKind::Create),
-                SyntaxToken::Required(SyntaxKind::Publication),
-            ],
-        ));
-
-        m.push((
-            SyntaxKind::AlterPublicationStmt,
-            &[
-                SyntaxToken::Required(SyntaxKind::Alter),
-                SyntaxToken::Required(SyntaxKind::Publication),
-            ],
-        ));
-
-        m.push((
-            SyntaxKind::CreateSubscriptionStmt,
-            &[
-                SyntaxToken::Required(SyntaxKind::Create),
-                SyntaxToken::Required(SyntaxKind::Subscription),
-            ],
-        ));
-
-        m.push((
-            SyntaxKind::AlterSubscriptionStmt,
-            &[
-                SyntaxToken::Required(SyntaxKind::Alter),
-                SyntaxToken::Required(SyntaxKind::Subscription),
-            ],
-        ));
-
-        m.push((
-            SyntaxKind::DropSubscriptionStmt,
-            &[
-                SyntaxToken::Required(SyntaxKind::Drop),
-                SyntaxToken::Required(SyntaxKind::Subscription),
-            ],
-        ));
-
-        m.push((
-            SyntaxKind::CreateStatsStmt,
-            &[
-                SyntaxToken::Required(SyntaxKind::Create),
-                SyntaxToken::Required(SyntaxKind::Statistics),
-            ],
-        ));
-
-        m.push((
-            SyntaxKind::AlterCollationStmt,
-            &[
-                SyntaxToken::Required(SyntaxKind::Alter),
-                SyntaxToken::Required(SyntaxKind::Collation),
-            ],
-        ));
-
-        m.push((
-            SyntaxKind::CallStmt,
-            &[SyntaxToken::Required(SyntaxKind::Call)],
-        ));
-
-        m.push((
-            SyntaxKind::AlterStatsStmt,
-            &[
-                SyntaxToken::Required(SyntaxKind::Alter),
-                SyntaxToken::Required(SyntaxKind::Statistics),
-            ],
-        ));
-
-        let mut vec: Vec<HashMap<SyntaxKind, Vec<TokenStatement>>> = Vec::new();
-
-        m.iter().for_each(|(statement, tokens)| {
-            let mut left_pull: usize = 0;
-            tokens.iter().enumerate().for_each(|(idx, token)| {
-                if vec.len() <= idx {
-                    vec.push(HashMap::new());
-                }
-
-                let is_last = idx == tokens.len() - 1;
-
-                match token {
-                    SyntaxToken::Required(t) => {
-                        for i in (idx - left_pull)..(idx + 1) {
-                            let list_entry = vec[i].entry(t.to_owned());
-                            list_entry
-                                .and_modify(|list| {
-                                    list.push(if is_last {
-                                        TokenStatement::EoS(statement.to_owned())
-                                    } else {
-                                        TokenStatement::Any(statement.to_owned())
-                                    });
-                                })
-                                .or_insert(vec![if is_last {
-                                    TokenStatement::EoS(statement.to_owned())
-                                } else {
-                                    TokenStatement::Any(statement.to_owned())
-                                }]);
-                        }
-                    }
-                    SyntaxToken::Optional(t) => {
-                        if is_last {
-                            panic!("Optional token cannot be last token");
-                        }
-                        for i in (idx - left_pull)..(idx + 1) {
-                            let list_entry = vec[i].entry(t.to_owned());
-                            list_entry
-                                .and_modify(|list| {
-                                    list.push(TokenStatement::Any(statement.to_owned()));
-                                })
-                                .or_insert(vec![TokenStatement::Any(statement.to_owned())]);
-                        }
-                        left_pull += 1;
-                    }
-                }
-            });
-        });
-
-        vec
-    });
-
-// TODO: complete the hashmap above with all statements:
-// RETURN statement (inside SQL function body)
-// ReturnStmt,
-// SetOperationStmt,
-//
-// TODO: parsing ambiguity, check docs for solution
-// GrantStmt(super::GrantStmt),
-// GrantRoleStmt(super::GrantRoleStmt),
-// ClosePortalStmt,
-// CreatePlangStmt,
-// AlterRoleSetStmt,
-// DeclareCursorStmt,
-// AlterObjectDependsStmt,
-// AlterObjectSchemaStmt,
-// AlterOwnerStmt,
-// AlterEnumStmt,
-// AlterTsdictionaryStmt,
-// AlterTsconfigurationStmt,
-// AlterTableSpaceOptionsStmt,
-// AlterTableMoveAllStmt,
-// AlterExtensionContentsStmt,
-// ReplicaIdentityStmt,
-//
-
-/// Returns the statement at which the parser is currently at, if any
-pub fn is_at_stmt_start(parser: &mut Parser) -> Option<SyntaxKind> {
-    let mut options = Vec::new();
-    for i in 0..STATEMENT_START_TOKEN_MAPS.len() {
-        // important, else infinite loop: only ignore whitespaces after first token
-        let token = parser.nth(i, i != 0).kind;
-        if let Some(result) = STATEMENT_START_TOKEN_MAPS[i].get(&token) {
-            if i == 0 {
-                options = result.clone();
-            } else {
-                options = result
-                    .iter()
-                    .filter(|o| options.contains(o))
-                    .cloned()
-                    .collect();
-            }
-        } else if options.len() > 1 {
-            // no result is found, and there is currently more than one option
-            // filter the options for all statements that are complete at this point
-            options.retain(|o| o.is_eos());
-        }
-
-        if options.len() == 0 {
-            break;
-        } else if options.len() == 1 && options.get(0).unwrap().is_eos() {
-            break;
-        }
-    }
-    if options.len() == 0 {
-        None
-    } else if options.len() == 1 && options.get(0).unwrap().is_eos() {
-        Some(options.get(0).unwrap().kind())
-    } else {
-        panic!("Ambiguous statement");
-    }
-}
diff --git a/crates/pg_statement_splitter/src/lib.rs b/crates/pg_statement_splitter/src/lib.rs
index d66cc411..97386ca4 100644
--- a/crates/pg_statement_splitter/src/lib.rs
+++ b/crates/pg_statement_splitter/src/lib.rs
@@ -10,144 +10,36 @@
 /// one required token and allows the parser to search for the end tokens of the statement. This
 /// will hopefully be enough to reduce collisions to zero.
 mod data;
-mod is_at_stmt_start;
 mod parser;
 mod statement_splitter;
-mod statement_tracker;
 mod syntax_error;
+mod tracker;
 
-use is_at_stmt_start::{is_at_stmt_start, TokenStatement, STATEMENT_START_TOKEN_MAPS};
+use statement_splitter::StatementSplitter;
+use text_size::TextRange;
 
-use parser::{Parse, Parser};
+// TODO check that the data defintiion stmt matches the real one in tests
+// TODO we might want to expose the stmt type for testing purposes or via a second api
 
-use pg_lexer::{lex, SyntaxKind};
-
-// pub fn split(sql: &str) -> Parse {
-//     let mut parser = Parser::new(lex(sql));
-//
-//     while !parser.eof() {
-//         if parser.at_whitespace() {
-//             parser.advance();
-//             continue;
-//         }
-//         // check all current active statements if the token matches
-//         // check if there is a new statement starting at the current token
-//     }
-// }
-//
-// pub fn split(sql: &str) -> Parse {
-//     let mut parser = Parser::new(lex(sql));
-//
-//     while !parser.eof() {
-//         match is_at_stmt_start(&mut parser) {
-//             Some(stmt) => {
-//                 parser.start_stmt();
-//
-//                 // advance over all start tokens of the statement
-//                 for i in 0..STATEMENT_START_TOKEN_MAPS.len() {
-//                     parser.eat_whitespace();
-//                     let token = parser.nth(0, false);
-//                     if let Some(result) = STATEMENT_START_TOKEN_MAPS[i].get(&token.kind) {
-//                         let is_in_results = result
-//                             .iter()
-//                             .find(|x| match x {
-//                                 TokenStatement::EoS(y) | TokenStatement::Any(y) => y == &stmt,
-//                             })
-//                             .is_some();
-//                         if i == 0 && !is_in_results {
-//                             panic!("Expected statement start");
-//                         } else if is_in_results {
-//                             parser.expect(token.kind);
-//                         } else {
-//                             break;
-//                         }
-//                     }
-//                 }
-//
-//                 // move until the end of the statement, or until the next statement start
-//                 let mut is_sub_stmt = 0;
-//                 let mut is_sub_trx = 0;
-//                 let mut ignore_next_non_whitespace = false;
-//                 while !parser.at(SyntaxKind::Ascii59) && !parser.eof() {
-//                     match parser.nth(0, false).kind {
-//                         SyntaxKind::All => {
-//                             // ALL is never a statement start, but needs to be skipped when combining queries
-//                             // (e.g. UNION ALL)
-//                             parser.advance();
-//                         }
-//                         SyntaxKind::BeginP => {
-//                             // BEGIN, consume until END
-//                             is_sub_trx += 1;
-//                             parser.advance();
-//                         }
-//                         SyntaxKind::EndP => {
-//                             is_sub_trx -= 1;
-//                             parser.advance();
-//                         }
-//                         // opening brackets "(", consume until closing bracket ")"
-//                         SyntaxKind::Ascii40 => {
-//                             is_sub_stmt += 1;
-//                             parser.advance();
-//                         }
-//                         SyntaxKind::Ascii41 => {
-//                             is_sub_stmt -= 1;
-//                             parser.advance();
-//                         }
-//                         SyntaxKind::As
-//                         | SyntaxKind::Union
-//                         | SyntaxKind::Intersect
-//                         | SyntaxKind::Except => {
-//                             // ignore the next non-whitespace token
-//                             ignore_next_non_whitespace = true;
-//                             parser.advance();
-//                         }
-//                         _ => {
-//                             // if another stmt FIRST is encountered, break
-//                             // ignore if parsing sub stmt
-//                             if ignore_next_non_whitespace == false
-//                                 && is_sub_stmt == 0
-//                                 && is_sub_trx == 0
-//                                 && is_at_stmt_start(&mut parser).is_some()
-//                             {
-//                                 break;
-//                             } else {
-//                                 if ignore_next_non_whitespace == true && !parser.at_whitespace() {
-//                                     ignore_next_non_whitespace = false;
-//                                 }
-//                                 parser.advance();
-//                             }
-//                         }
-//                     }
-//                 }
-//
-//                 parser.expect(SyntaxKind::Ascii59);
-//
-//                 parser.close_stmt();
-//             }
-//             None => {
-//                 parser.advance();
-//             }
-//         }
-//     }
-//
-//     parser.finish()
-// }
+pub fn split(sql: &str) -> Vec<TextRange> {
+    StatementSplitter::new(sql).run()
+}
 
 #[cfg(test)]
 mod tests {
     use super::*;
 
-    // #[test]
-    // fn test_splitter() {
-    //     let input = "select 1 from contact;\nselect 1;\nalter table test drop column id;";
-    //
-    //     let res = split(input);
-    //     assert_eq!(res.ranges.len(), 3);
-    //     assert_eq!("select 1 from contact;", input[res.ranges[0]].to_string());
-    //     assert_eq!("select 1;", input[res.ranges[1]].to_string());
-    //     assert_eq!(
-    //         "alter table test drop column id;",
-    //         input[res.ranges[2]].to_string()
-    //     );
-    // }
+    #[test]
+    fn test_splitter() {
+        let input = "select 1 from contact;\nselect 1;\nalter table test drop column id;";
+
+        let res = split(input);
+        assert_eq!(res.len(), 3);
+        assert_eq!("select 1 from contact;", input[res[0]].to_string());
+        assert_eq!("select 1;", input[res[1]].to_string());
+        assert_eq!(
+            "alter table test drop column id;",
+            input[res[2]].to_string()
+        );
+    }
 }
diff --git a/crates/pg_statement_splitter/src/statement_splitter.rs b/crates/pg_statement_splitter/src/statement_splitter.rs
index 55e041cc..6ab224aa 100644
--- a/crates/pg_statement_splitter/src/statement_splitter.rs
+++ b/crates/pg_statement_splitter/src/statement_splitter.rs
@@ -4,13 +4,13 @@ use text_size::{TextRange, TextSize};
 use crate::{
     data::{STATEMENT_BRIDGE_DEFINITIONS, STATEMENT_DEFINITIONS},
     parser::Parser,
-    statement_tracker::StatementTracker,
+    tracker::Tracker,
 };
 
 pub(crate) struct StatementSplitter<'a> {
     parser: Parser,
-    tracked_statements: Vec<StatementTracker<'a>>,
-    active_bridges: Vec<StatementTracker<'a>>,
+    tracked_statements: Vec<Tracker<'a>>,
+    active_bridges: Vec<Tracker<'a>>,
     sub_trx_depth: usize,
     sub_stmt_depth: usize,
 }
@@ -57,7 +57,7 @@ impl<'a> StatementSplitter<'a> {
                                 if self.active_bridges.iter().any(|b| b.def.stmt == stmt.stmt) {
                                     None
                                 } else {
-                                    Some(StatementTracker::new_at(stmt, self.parser.pos))
+                                    Some(Tracker::new_at(stmt, self.parser.pos))
                                 }
                             })
                             .collect(),
@@ -72,7 +72,7 @@ impl<'a> StatementSplitter<'a> {
                 self.active_bridges.append(
                     &mut bridges
                         .iter()
-                        .map(|stmt| StatementTracker::new_at(stmt, self.parser.pos))
+                        .map(|stmt| Tracker::new_at(stmt, self.parser.pos))
                         .collect(),
                 );
             }
@@ -300,4 +300,58 @@ mod tests {
         assert_eq!("select 1", input[ranges[1]].to_string());
         assert_eq!("select 4", input[ranges[2]].to_string());
     }
+
+    #[test]
+    fn test_explain() {
+        let input = "explain select 1 from contact\nselect 1\nselect 4";
+
+        let ranges = StatementSplitter::new(input).run();
+
+        assert_eq!(ranges.len(), 3);
+        assert_eq!(
+            "explain select 1 from contact",
+            input[ranges[0]].to_string()
+        );
+        assert_eq!("select 1", input[ranges[1]].to_string());
+        assert_eq!("select 4", input[ranges[2]].to_string());
+    }
+
+    #[test]
+    fn test_explain_analyze() {
+        let input = "explain analyze select 1 from contact\nselect 1\nselect 4";
+
+        let ranges = StatementSplitter::new(input).run();
+
+        assert_eq!(ranges.len(), 3);
+        assert_eq!(
+            "explain analyze select 1 from contact",
+            input[ranges[0]].to_string()
+        );
+        assert_eq!("select 1", input[ranges[1]].to_string());
+        assert_eq!("select 4", input[ranges[2]].to_string());
+    }
+
+    #[test]
+    fn test_cast() {
+        let input = "SELECT CAST(42 AS float8);\nselect 1";
+
+        let ranges = StatementSplitter::new(input).run();
+
+        assert_eq!(ranges.len(), 2);
+        assert_eq!("SELECT CAST(42 AS float8);", input[ranges[0]].to_string());
+        assert_eq!("select 1", input[ranges[1]].to_string());
+    }
+
+    #[test]
+    fn test_create_conversion() {
+        let input = "CREATE CONVERSION myconv FOR 'UTF8' TO 'LATIN1' FROM myfunc;";
+
+        let ranges = StatementSplitter::new(input).run();
+
+        assert_eq!(ranges.len(), 1);
+        assert_eq!(
+            "CREATE CONVERSION myconv FOR 'UTF8' TO 'LATIN1' FROM myfunc;",
+            input[ranges[0]].to_string()
+        );
+    }
 }
diff --git a/crates/pg_statement_splitter/src/statement_tracker.rs b/crates/pg_statement_splitter/src/tracker.rs
similarity index 98%
rename from crates/pg_statement_splitter/src/statement_tracker.rs
rename to crates/pg_statement_splitter/src/tracker.rs
index 24b54dc4..7c84815c 100644
--- a/crates/pg_statement_splitter/src/statement_tracker.rs
+++ b/crates/pg_statement_splitter/src/tracker.rs
@@ -3,7 +3,7 @@ use pg_lexer::{SyntaxKind, WHITESPACE_TOKENS};
 use crate::data::{StatementDefinition, SyntaxDefinition};
 
 #[derive(Debug)]
-pub struct StatementTracker<'a> {
+pub struct Tracker<'a> {
     pub def: &'a StatementDefinition,
 
     /// position in the definition
@@ -13,7 +13,7 @@ pub struct StatementTracker<'a> {
     pub started_at: usize,
 }
 
-impl<'a> StatementTracker<'a> {
+impl<'a> Tracker<'a> {
     pub fn new_at(def: &'a StatementDefinition, at: usize) -> Self {
         Self {
             def,
diff --git a/crates/pg_statement_splitter/tests/statement_splitter_tests.rs b/crates/pg_statement_splitter/tests/statement_splitter_tests.rs
index 7e47dc08..4313c2ad 100644
--- a/crates/pg_statement_splitter/tests/statement_splitter_tests.rs
+++ b/crates/pg_statement_splitter/tests/statement_splitter_tests.rs
@@ -4,111 +4,101 @@ const DATA_DIR_PATH: &str = "tests/data/";
 const POSTGRES_REGRESS_PATH: &str = "../../libpg_query/test/sql/postgres_regress/";
 const SKIPPED_REGRESS_TESTS: &str = include_str!("skipped.txt");
 
-// #[test]
-// fn test_postgres_regress() {
-//     // all postgres regress tests are valid and complete statements, so we can use `split_with_parser` and compare with our own splitter
-//
-//     let mut paths: Vec<_> = fs::read_dir(POSTGRES_REGRESS_PATH)
-//         .unwrap()
-//         .map(|r| r.unwrap())
-//         .collect();
-//     paths.sort_by_key(|dir| dir.path());
-//
-//     for f in paths.iter() {
-//         let path = f.path();
-//
-//         let test_name = path.file_stem().unwrap().to_str().unwrap();
-//
-//         // these require fixes in the parser
-//         if SKIPPED_REGRESS_TESTS
-//             .lines()
-//             .collect::<Vec<_>>()
-//             .contains(&test_name)
-//         {
-//             continue;
-//         }
-//
-//         // remove \commands because pg_query doesn't support them
-//         let contents = fs::read_to_string(&path)
-//             .unwrap()
-//             .lines()
-//             .filter(|l| !l.starts_with("\\") && !l.ends_with("\\gset"))
-//             .collect::<Vec<_>>()
-//             .join(" ");
-//
-//         let libpg_query_split = pg_query::split_with_parser(&contents).unwrap();
-//
-//         let parser_split = pg_statement_splitter::split(&contents);
-//
-//         assert_eq!(
-//             parser_split.errors.len(),
-//             0,
-//             "Unexpected errors when parsing file {}:\n{:#?}",
-//             test_name,
-//             parser_split.errors
-//         );
-//
-//         assert_eq!(
-//             libpg_query_split.len(),
-//             parser_split.ranges.len(),
-//             "Mismatch in statement count for file {}: Expected {} statements, got {}",
-//             test_name,
-//             libpg_query_split.len(),
-//             parser_split.ranges.len()
-//         );
-//
-//         for (libpg_query_stmt, parser_range) in
-//             libpg_query_split.iter().zip(parser_split.ranges.iter())
-//         {
-//             let parser_stmt = &contents[parser_range.clone()].trim();
-//
-//             let libpg_query_stmt = if libpg_query_stmt.ends_with(';') {
-//                 libpg_query_stmt.to_string()
-//             } else {
-//                 format!("{};", libpg_query_stmt.trim())
-//             };
-//
-//             let libpg_query_stmt_trimmed = libpg_query_stmt.trim();
-//             let parser_stmt_trimmed = parser_stmt.trim();
-//
-//             assert_eq!(
-//                 libpg_query_stmt_trimmed, parser_stmt_trimmed,
-//                 "Mismatch in statement {}:\nlibg_query: '{}'\nsplitter:   '{}'",
-//                 test_name, libpg_query_stmt_trimmed, parser_stmt_trimmed
-//             );
-//         }
-//     }
-// }
-//
-// #[test]
-// fn test_statement_splitter() {
-//     let mut paths: Vec<_> = fs::read_dir(DATA_DIR_PATH)
-//         .unwrap()
-//         .map(|r| r.unwrap())
-//         .collect();
-//     paths.sort_by_key(|dir| dir.path());
-//
-//     for f in paths.iter() {
-//         let path = f.path();
-//         let test_name = path.file_stem().unwrap().to_str().unwrap();
-//         let expected_count = test_name
-//             .split("__")
-//             .last()
-//             .unwrap()
-//             .parse::<usize>()
-//             .unwrap();
-//
-//         let contents = fs::read_to_string(&path).unwrap();
-//
-//         let split = pg_statement_splitter::split(&contents);
-//
-//         assert_eq!(
-//             split.ranges.len(),
-//             expected_count,
-//             "Mismatch in statement count for file {}: Expected {} statements, got {}",
-//             test_name,
-//             expected_count,
-//             split.ranges.len()
-//         );
-//     }
-// }
+#[test]
+fn test_postgres_regress() {
+    // all postgres regress tests are valid and complete statements, so we can use `split_with_parser` and compare with our own splitter
+
+    let mut paths: Vec<_> = fs::read_dir(POSTGRES_REGRESS_PATH)
+        .unwrap()
+        .map(|r| r.unwrap())
+        .collect();
+    paths.sort_by_key(|dir| dir.path());
+
+    for f in paths.iter() {
+        let path = f.path();
+
+        let test_name = path.file_stem().unwrap().to_str().unwrap();
+
+        // these require fixes in the parser
+        if SKIPPED_REGRESS_TESTS
+            .lines()
+            .collect::<Vec<_>>()
+            .contains(&test_name)
+        {
+            continue;
+        }
+
+        // remove \commands because pg_query doesn't support them
+        let contents = fs::read_to_string(&path)
+            .unwrap()
+            .lines()
+            .filter(|l| !l.starts_with("\\") && !l.ends_with("\\gset"))
+            .collect::<Vec<_>>()
+            .join(" ");
+
+        let libpg_query_split = pg_query::split_with_parser(&contents).unwrap();
+
+        let parser_ranges = pg_statement_splitter::split(&contents);
+
+        assert_eq!(
+            libpg_query_split.len(),
+            parser_ranges.len(),
+            "Mismatch in statement count for file {}: Expected {} statements, got {}",
+            test_name,
+            libpg_query_split.len(),
+            parser_ranges.len()
+        );
+
+        for (libpg_query_stmt, parser_range) in libpg_query_split.iter().zip(parser_ranges.iter()) {
+            let parser_stmt = &contents[parser_range.clone()].trim();
+
+            let libpg_query_stmt = if libpg_query_stmt.ends_with(';') {
+                libpg_query_stmt.to_string()
+            } else {
+                format!("{};", libpg_query_stmt.trim())
+            };
+
+            let libpg_query_stmt_trimmed = libpg_query_stmt.trim();
+            let parser_stmt_trimmed = parser_stmt.trim();
+
+            assert_eq!(
+                libpg_query_stmt_trimmed, parser_stmt_trimmed,
+                "Mismatch in statement {}:\nlibg_query: '{}'\nsplitter:   '{}'",
+                test_name, libpg_query_stmt_trimmed, parser_stmt_trimmed
+            );
+        }
+    }
+}
+
+#[test]
+fn test_statement_splitter() {
+    let mut paths: Vec<_> = fs::read_dir(DATA_DIR_PATH)
+        .unwrap()
+        .map(|r| r.unwrap())
+        .collect();
+    paths.sort_by_key(|dir| dir.path());
+
+    for f in paths.iter() {
+        let path = f.path();
+        let test_name = path.file_stem().unwrap().to_str().unwrap();
+        let expected_count = test_name
+            .split("__")
+            .last()
+            .unwrap()
+            .parse::<usize>()
+            .unwrap();
+
+        let contents = fs::read_to_string(&path).unwrap();
+
+        let ranges = pg_statement_splitter::split(&contents);
+
+        assert_eq!(
+            ranges.len(),
+            expected_count,
+            "Mismatch in statement count for file {}: Expected {} statements, got {}",
+            test_name,
+            expected_count,
+            ranges.len()
+        );
+    }
+}

From 2f17cc659e9e3f7b761f0f9973483ad09b83e3e4 Mon Sep 17 00:00:00 2001
From: psteinroe <philipp@steinroetter.com>
Date: Sat, 10 Aug 2024 19:49:07 +0200
Subject: [PATCH 03/19] fix: more tests and minor compatibility fixes

---
 Cargo.lock                                    |   1 +
 crates/pg_statement_splitter/Cargo.toml       |   1 +
 crates/pg_statement_splitter/src/data.rs      |  53 +++-
 crates/pg_statement_splitter/src/lib.rs       |  15 +-
 .../src/statement_splitter.rs                 | 281 +++++++++++++-----
 crates/pg_statement_splitter/src/tracker.rs   |  15 +-
 ...simple_select__4.sql => simple_select.sql} |   0
 .../pg_statement_splitter/tests/skipped.txt   |   1 +
 .../tests/snapshots/data/simple_select.snap   |  26 ++
 .../tests/statement_splitter_tests.rs         |  94 ++++--
 10 files changed, 360 insertions(+), 127 deletions(-)
 rename crates/pg_statement_splitter/tests/data/{simple_select__4.sql => simple_select.sql} (100%)
 create mode 100644 crates/pg_statement_splitter/tests/snapshots/data/simple_select.snap

diff --git a/Cargo.lock b/Cargo.lock
index 0044279e..71ef619c 100644
--- a/Cargo.lock
+++ b/Cargo.lock
@@ -1507,6 +1507,7 @@ dependencies = [
 name = "pg_statement_splitter"
 version = "0.0.0"
 dependencies = [
+ "insta",
  "pg_lexer",
  "pg_query",
  "text-size",
diff --git a/crates/pg_statement_splitter/Cargo.toml b/crates/pg_statement_splitter/Cargo.toml
index 15a30680..243655ff 100644
--- a/crates/pg_statement_splitter/Cargo.toml
+++ b/crates/pg_statement_splitter/Cargo.toml
@@ -9,4 +9,5 @@ text-size = "1.1.1"
 
 [dev-dependencies]
 pg_query = "0.8"
+insta = "1.31.0"
 
diff --git a/crates/pg_statement_splitter/src/data.rs b/crates/pg_statement_splitter/src/data.rs
index f2164225..f3d4d608 100644
--- a/crates/pg_statement_splitter/src/data.rs
+++ b/crates/pg_statement_splitter/src/data.rs
@@ -83,7 +83,10 @@ pub static STATEMENT_DEFINITIONS: LazyLock<HashMap<SyntaxKind, Vec<StatementDefi
 
         m.push(StatementDefinition {
             stmt: SyntaxKind::SelectStmt,
-            tokens: vec![SyntaxDefinition::RequiredToken(SyntaxKind::Select)],
+            tokens: vec![
+                SyntaxDefinition::RequiredToken(SyntaxKind::Select),
+                SyntaxDefinition::AnyToken,
+            ],
         });
 
         m.push(StatementDefinition {
@@ -133,6 +136,7 @@ pub static STATEMENT_DEFINITIONS: LazyLock<HashMap<SyntaxKind, Vec<StatementDefi
                 SyntaxDefinition::OptionalToken(SyntaxKind::Exists),
                 SyntaxDefinition::OptionalToken(SyntaxKind::Only),
                 SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
+                SyntaxDefinition::AnyToken,
             ],
         });
 
@@ -262,11 +266,6 @@ pub static STATEMENT_DEFINITIONS: LazyLock<HashMap<SyntaxKind, Vec<StatementDefi
             ],
         });
 
-        m.push(StatementDefinition {
-            stmt: SyntaxKind::Drop,
-            tokens: vec![SyntaxDefinition::RequiredToken(SyntaxKind::Drop)],
-        });
-
         m.push(StatementDefinition {
             stmt: SyntaxKind::Truncate,
             tokens: vec![
@@ -390,6 +389,11 @@ pub static STATEMENT_DEFINITIONS: LazyLock<HashMap<SyntaxKind, Vec<StatementDefi
             tokens: vec![SyntaxDefinition::RequiredToken(SyntaxKind::Commit)],
         });
 
+        m.push(StatementDefinition {
+            stmt: SyntaxKind::TransactionStmt,
+            tokens: vec![SyntaxDefinition::RequiredToken(SyntaxKind::Rollback)],
+        });
+
         m.push(StatementDefinition {
             stmt: SyntaxKind::ViewStmt,
             tokens: vec![
@@ -446,11 +450,6 @@ pub static STATEMENT_DEFINITIONS: LazyLock<HashMap<SyntaxKind, Vec<StatementDefi
             tokens: vec![SyntaxDefinition::RequiredToken(SyntaxKind::Vacuum)],
         });
 
-        m.push(StatementDefinition {
-            stmt: SyntaxKind::ExplainStmt,
-            tokens: vec![SyntaxDefinition::RequiredToken(SyntaxKind::Explain)],
-        });
-
         m.push(StatementDefinition {
             stmt: SyntaxKind::CreateTableAsStmt,
             tokens: vec![
@@ -472,7 +471,20 @@ pub static STATEMENT_DEFINITIONS: LazyLock<HashMap<SyntaxKind, Vec<StatementDefi
 
         m.push(StatementDefinition {
             stmt: SyntaxKind::ExplainStmt,
-            tokens: vec![SyntaxDefinition::RequiredToken(SyntaxKind::Explain)],
+            tokens: vec![
+                SyntaxDefinition::RequiredToken(SyntaxKind::Explain),
+                SyntaxDefinition::AnyTokens,
+                SyntaxDefinition::OneOf(vec![
+                    SyntaxKind::With,
+                    SyntaxKind::Select,
+                    SyntaxKind::Insert,
+                    SyntaxKind::DeleteP,
+                    SyntaxKind::Update,
+                    SyntaxKind::Merge,
+                    SyntaxKind::Execute,
+                ]),
+                SyntaxDefinition::AnyToken,
+            ],
         });
 
         m.push(StatementDefinition {
@@ -507,6 +519,21 @@ pub static STATEMENT_DEFINITIONS: LazyLock<HashMap<SyntaxKind, Vec<StatementDefi
                 SyntaxDefinition::RequiredToken(SyntaxKind::Set),
                 SyntaxDefinition::OptionalToken(SyntaxKind::Session),
                 SyntaxDefinition::OptionalToken(SyntaxKind::Local),
+                SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
+                SyntaxDefinition::OneOf(vec![SyntaxKind::To, SyntaxKind::Ascii61]),
+                SyntaxDefinition::AnyToken,
+            ],
+        });
+
+        m.push(StatementDefinition {
+            stmt: SyntaxKind::VariableSetStmt,
+            tokens: vec![
+                SyntaxDefinition::RequiredToken(SyntaxKind::Set),
+                SyntaxDefinition::OptionalToken(SyntaxKind::Session),
+                SyntaxDefinition::OptionalToken(SyntaxKind::Local),
+                SyntaxDefinition::RequiredToken(SyntaxKind::Time),
+                SyntaxDefinition::RequiredToken(SyntaxKind::Zone),
+                SyntaxDefinition::AnyToken,
             ],
         });
 
@@ -894,7 +921,7 @@ pub static STATEMENT_DEFINITIONS: LazyLock<HashMap<SyntaxKind, Vec<StatementDefi
         m.push(StatementDefinition {
             stmt: SyntaxKind::ImportForeignSchemaStmt,
             tokens: vec![
-                SyntaxDefinition::RequiredToken(SyntaxKind::Import),
+                SyntaxDefinition::RequiredToken(SyntaxKind::ImportP),
                 SyntaxDefinition::RequiredToken(SyntaxKind::Foreign),
                 SyntaxDefinition::RequiredToken(SyntaxKind::Schema),
                 SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
diff --git a/crates/pg_statement_splitter/src/lib.rs b/crates/pg_statement_splitter/src/lib.rs
index 97386ca4..049ec533 100644
--- a/crates/pg_statement_splitter/src/lib.rs
+++ b/crates/pg_statement_splitter/src/lib.rs
@@ -15,13 +15,19 @@ mod statement_splitter;
 mod syntax_error;
 mod tracker;
 
-use statement_splitter::StatementSplitter;
+use statement_splitter::{StatementPosition, StatementSplitter};
 use text_size::TextRange;
 
-// TODO check that the data defintiion stmt matches the real one in tests
-// TODO we might want to expose the stmt type for testing purposes or via a second api
-
 pub fn split(sql: &str) -> Vec<TextRange> {
+    StatementSplitter::new(sql)
+        .run()
+        .iter()
+        .map(|x| x.range)
+        .collect()
+}
+
+/// mostly used for testing
+pub fn statements(sql: &str) -> Vec<StatementPosition> {
     StatementSplitter::new(sql).run()
 }
 
@@ -34,6 +40,7 @@ mod tests {
         let input = "select 1 from contact;\nselect 1;\nalter table test drop column id;";
 
         let res = split(input);
+
         assert_eq!(res.len(), 3);
         assert_eq!("select 1 from contact;", input[res[0]].to_string());
         assert_eq!("select 1;", input[res[1]].to_string());
diff --git a/crates/pg_statement_splitter/src/statement_splitter.rs b/crates/pg_statement_splitter/src/statement_splitter.rs
index 6ab224aa..5f759c3b 100644
--- a/crates/pg_statement_splitter/src/statement_splitter.rs
+++ b/crates/pg_statement_splitter/src/statement_splitter.rs
@@ -15,6 +15,12 @@ pub(crate) struct StatementSplitter<'a> {
     sub_stmt_depth: usize,
 }
 
+#[derive(Debug)]
+pub struct StatementPosition {
+    pub kind: SyntaxKind,
+    pub range: TextRange,
+}
+
 impl<'a> StatementSplitter<'a> {
     pub fn new(sql: &str) -> Self {
         Self {
@@ -26,17 +32,25 @@ impl<'a> StatementSplitter<'a> {
         }
     }
 
-    pub fn run(&mut self) -> Vec<TextRange> {
+    pub fn run(&mut self) -> Vec<StatementPosition> {
         let mut ranges = Vec::new();
 
         while !self.parser.eof() {
             let at_token = self.parser.nth(0, false);
+            // println!("{:?}", at_token.kind);
+            // println!(
+            //     "tracked stmts before {:?}",
+            //     self.tracked_statements
+            //         .iter()
+            //         .map(|s| s.def.stmt)
+            //         .collect::<Vec<_>>()
+            // );
             // TODO rename vars and add helpers to make distinciton between pos and text pos clear
 
             if at_token.kind == SyntaxKind::BeginP {
-                self.sub_trx_depth += 1;
+                // self.sub_trx_depth += 1;
             } else if at_token.kind == SyntaxKind::EndP {
-                self.sub_trx_depth -= 1;
+                // self.sub_trx_depth -= 1;
             } else if at_token.kind == SyntaxKind::Ascii40 {
                 // "("
                 self.sub_stmt_depth += 1;
@@ -48,7 +62,19 @@ impl<'a> StatementSplitter<'a> {
             self.tracked_statements
                 .retain_mut(|stmt| stmt.advance_with(&at_token.kind));
 
-            if self.sub_trx_depth == 0 && self.sub_stmt_depth == 0 {
+            if self.sub_trx_depth == 0
+                && self.sub_stmt_depth == 0
+                    // it onyl makes sense to start tracking new statements if at least one of the
+                    // currently tracked statements could be complete. or if none are tracked yet.
+                    // this is important for statements such as `explain select 1;` where `select 1`
+                    // would mark a completed statement that would move `explain` into completed,
+                    // even though the latter is part of the former.
+                && (self.tracked_statements.len() == 0
+                    || self
+                        .tracked_statements
+                        .iter()
+                        .any(|s| s.could_be_complete()))
+            {
                 if let Some(stmts) = STATEMENT_DEFINITIONS.get(&at_token.kind) {
                     self.tracked_statements.append(
                         &mut stmts
@@ -93,7 +119,6 @@ impl<'a> StatementSplitter<'a> {
                 let latest_complete_before_started_at = self
                     .tracked_statements
                     .iter()
-                    .rev()
                     .filter(|s| {
                         s.could_be_complete() && s.started_at < latest_completed_stmt_started_at
                     })
@@ -101,16 +126,29 @@ impl<'a> StatementSplitter<'a> {
                     .map(|stmt| stmt.started_at);
 
                 if let Some(latest_complete_before_started_at) = latest_complete_before_started_at {
-                    let count = self
+                    let latest_complete_before = self
                         .tracked_statements
                         .iter()
                         .filter(|s| {
                             s.started_at == latest_complete_before_started_at
                                 && s.could_be_complete()
                         })
-                        .count();
+                        .max_by_key(|stmt| stmt.current_pos)
+                        .cloned()
+                        .unwrap();
 
-                    assert_eq!(count, 1);
+                    assert_eq!(
+                        1,
+                        self.tracked_statements
+                            .iter()
+                            .filter(|s| {
+                                s.started_at == latest_complete_before_started_at
+                                    && s.could_be_complete()
+                                    && s.current_pos == latest_complete_before.current_pos
+                            })
+                            .count(),
+                        "multiple complete statements at the same position"
+                    );
 
                     // Step 3: save range for the statement
 
@@ -141,22 +179,27 @@ impl<'a> StatementSplitter<'a> {
                         .max()
                         .unwrap();
 
-                    ranges.push(TextRange::new(
-                        TextSize::try_from(
-                            self.parser
-                                .tokens
-                                .get(latest_complete_before_started_at)
-                                .unwrap()
-                                .span
-                                .start(),
-                        )
-                        .unwrap(),
-                        end_pos,
-                    ));
+                    // println!("adding stmt: {:?}", latest_complete_before.def.stmt);
+
+                    ranges.push(StatementPosition {
+                        kind: latest_complete_before.def.stmt,
+                        range: TextRange::new(
+                            TextSize::try_from(
+                                self.parser
+                                    .tokens
+                                    .get(latest_complete_before.started_at)
+                                    .unwrap()
+                                    .span
+                                    .start(),
+                            )
+                            .unwrap(),
+                            end_pos,
+                        ),
+                    });
 
                     // Step 4: remove all statements that started before or at the position
                     self.tracked_statements
-                        .retain(|s| s.started_at > latest_complete_before_started_at);
+                        .retain(|s| s.started_at > latest_complete_before.started_at);
                 }
             }
 
@@ -164,12 +207,35 @@ impl<'a> StatementSplitter<'a> {
         }
 
         // get the earliest statement that is complete
-        if let Some(earliest_complete_stmt) = self
+        if let Some(earliest_complete_stmt_started_at) = self
             .tracked_statements
             .iter()
             .filter(|s| s.could_be_complete())
             .min_by_key(|stmt| stmt.started_at)
+            .map(|stmt| stmt.started_at)
         {
+            let earliest_complete_stmt = self
+                .tracked_statements
+                .iter()
+                .filter(|s| {
+                    s.started_at == earliest_complete_stmt_started_at && s.could_be_complete()
+                })
+                .max_by_key(|stmt| stmt.current_pos)
+                .unwrap();
+
+            assert_eq!(
+                1,
+                self.tracked_statements
+                    .iter()
+                    .filter(|s| {
+                        s.started_at == earliest_complete_stmt_started_at
+                            && s.could_be_complete()
+                            && s.current_pos == earliest_complete_stmt.current_pos
+                    })
+                    .count(),
+                "multiple complete statements at the same position"
+            );
+
             let earliest_text_pos = self
                 .parser
                 .tokens
@@ -199,7 +265,10 @@ impl<'a> StatementSplitter<'a> {
                     .start(),
             )
             .unwrap();
-            ranges.push(TextRange::new(start_pos, end_pos));
+            ranges.push(StatementPosition {
+                kind: earliest_complete_stmt.def.stmt,
+                range: TextRange::new(start_pos, end_pos),
+            });
         }
 
         ranges
@@ -208,6 +277,8 @@ impl<'a> StatementSplitter<'a> {
 
 #[cfg(test)]
 mod tests {
+    use pg_lexer::SyntaxKind;
+
     use crate::statement_splitter::StatementSplitter;
 
     #[test]
@@ -217,141 +288,211 @@ mod tests {
     FOR EACH ROW
     EXECUTE FUNCTION check_account_update();\nexecute test;";
 
-        let ranges = StatementSplitter::new(input).run();
+        let result = StatementSplitter::new(input).run();
 
-        assert_eq!(ranges.len(), 2);
+        assert_eq!(result.len(), 2);
         assert_eq!(
             "CREATE OR REPLACE TRIGGER check_update\n    BEFORE UPDATE OF balance ON accounts\n    FOR EACH ROW\n    EXECUTE FUNCTION check_account_update();",
-            input[ranges[0]].to_string()
+            input[result[0].range].to_string()
         );
-        assert_eq!("execute test;", input[ranges[1]].to_string());
+        assert_eq!(SyntaxKind::CreateTrigStmt, result[0].kind);
+        assert_eq!("execute test;", input[result[1].range].to_string());
+        assert_eq!(SyntaxKind::ExecuteStmt, result[1].kind);
     }
 
     #[test]
     fn test_sub_statement() {
         let input = "select 1 from (select 2 from contact) c;\nselect 4;";
 
-        let ranges = StatementSplitter::new(input).run();
+        let result = StatementSplitter::new(input).run();
 
-        assert_eq!(ranges.len(), 2);
+        assert_eq!(result.len(), 2);
         assert_eq!(
             "select 1 from (select 2 from contact) c;",
-            input[ranges[0]].to_string()
+            input[result[0].range].to_string()
         );
-        assert_eq!("select 4;", input[ranges[1]].to_string());
+        assert_eq!(SyntaxKind::SelectStmt, result[0].kind);
+        assert_eq!("select 4;", input[result[1].range].to_string());
+        assert_eq!(SyntaxKind::SelectStmt, result[1].kind);
     }
 
     #[test]
     fn test_semicolon_precedence() {
         let input = "select 1 from ;\nselect 4;";
 
-        let ranges = StatementSplitter::new(input).run();
+        let result = StatementSplitter::new(input).run();
 
-        assert_eq!(ranges.len(), 2);
-        assert_eq!("select 1 from ;", input[ranges[0]].to_string());
-        assert_eq!("select 4;", input[ranges[1]].to_string());
+        assert_eq!(result.len(), 2);
+        assert_eq!("select 1 from ;", input[result[0].range].to_string());
+        assert_eq!(SyntaxKind::SelectStmt, result[0].kind);
+        assert_eq!("select 4;", input[result[1].range].to_string());
+        assert_eq!(SyntaxKind::SelectStmt, result[1].kind);
     }
 
     #[test]
     fn test_union_with_semicolon() {
         let input = "select 1 from contact union;\nselect 4;";
 
-        let ranges = StatementSplitter::new(input).run();
+        let result = StatementSplitter::new(input).run();
 
-        assert_eq!(ranges.len(), 2);
-        assert_eq!("select 1 from contact union;", input[ranges[0]].to_string());
-        assert_eq!("select 4;", input[ranges[1]].to_string());
+        assert_eq!(result.len(), 2);
+        assert_eq!(
+            "select 1 from contact union;",
+            input[result[0].range].to_string()
+        );
+        assert_eq!("select 4;", input[result[1].range].to_string());
     }
 
     #[test]
     fn test_union() {
         let input = "select 1 from contact union select 1;\nselect 4;";
 
-        let ranges = StatementSplitter::new(input).run();
+        let result = StatementSplitter::new(input).run();
 
-        assert_eq!(ranges.len(), 2);
+        assert_eq!(result.len(), 2);
         assert_eq!(
             "select 1 from contact union select 1;",
-            input[ranges[0]].to_string()
+            input[result[0].range].to_string()
         );
-        assert_eq!("select 4;", input[ranges[1]].to_string());
+        assert_eq!(SyntaxKind::SelectStmt, result[0].kind);
+        assert_eq!("select 4;", input[result[1].range].to_string());
+        assert_eq!(SyntaxKind::SelectStmt, result[1].kind);
     }
 
     #[test]
     fn test_splitter() {
         let input = "select 1 from contact;\nselect 1;\nselect 4;";
 
-        let ranges = StatementSplitter::new(input).run();
+        let result = StatementSplitter::new(input).run();
 
-        assert_eq!(ranges.len(), 3);
-        assert_eq!("select 1 from contact;", input[ranges[0]].to_string());
-        assert_eq!("select 1;", input[ranges[1]].to_string());
-        assert_eq!("select 4;", input[ranges[2]].to_string());
+        assert_eq!(result.len(), 3);
+        assert_eq!("select 1 from contact;", input[result[0].range].to_string());
+        assert_eq!(SyntaxKind::SelectStmt, result[0].kind);
+        assert_eq!("select 1;", input[result[1].range].to_string());
+        assert_eq!(SyntaxKind::SelectStmt, result[1].kind);
+        assert_eq!("select 4;", input[result[2].range].to_string());
+        assert_eq!(SyntaxKind::SelectStmt, result[2].kind);
     }
 
     #[test]
     fn test_no_semicolons() {
         let input = "select 1 from contact\nselect 1\nselect 4";
 
-        let ranges = StatementSplitter::new(input).run();
+        let result = StatementSplitter::new(input).run();
 
-        assert_eq!(ranges.len(), 3);
-        assert_eq!("select 1 from contact", input[ranges[0]].to_string());
-        assert_eq!("select 1", input[ranges[1]].to_string());
-        assert_eq!("select 4", input[ranges[2]].to_string());
+        assert_eq!(result.len(), 3);
+        assert_eq!("select 1 from contact", input[result[0].range].to_string());
+        assert_eq!(SyntaxKind::SelectStmt, result[0].kind);
+        assert_eq!("select 1", input[result[1].range].to_string());
+        assert_eq!(SyntaxKind::SelectStmt, result[1].kind);
+        assert_eq!("select 4", input[result[2].range].to_string());
+        assert_eq!(SyntaxKind::SelectStmt, result[2].kind);
     }
 
     #[test]
     fn test_explain() {
         let input = "explain select 1 from contact\nselect 1\nselect 4";
 
-        let ranges = StatementSplitter::new(input).run();
+        let result = StatementSplitter::new(input).run();
 
-        assert_eq!(ranges.len(), 3);
+        assert_eq!(result.len(), 3);
         assert_eq!(
             "explain select 1 from contact",
-            input[ranges[0]].to_string()
+            input[result[0].range].to_string()
         );
-        assert_eq!("select 1", input[ranges[1]].to_string());
-        assert_eq!("select 4", input[ranges[2]].to_string());
+        assert_eq!(SyntaxKind::ExplainStmt, result[0].kind);
+        assert_eq!("select 1", input[result[1].range].to_string());
+        assert_eq!(SyntaxKind::SelectStmt, result[1].kind);
+        assert_eq!("select 4", input[result[2].range].to_string());
+        assert_eq!(SyntaxKind::SelectStmt, result[2].kind);
     }
 
     #[test]
     fn test_explain_analyze() {
         let input = "explain analyze select 1 from contact\nselect 1\nselect 4";
 
-        let ranges = StatementSplitter::new(input).run();
+        let result = StatementSplitter::new(input).run();
 
-        assert_eq!(ranges.len(), 3);
+        assert_eq!(result.len(), 3);
         assert_eq!(
             "explain analyze select 1 from contact",
-            input[ranges[0]].to_string()
+            input[result[0].range].to_string()
         );
-        assert_eq!("select 1", input[ranges[1]].to_string());
-        assert_eq!("select 4", input[ranges[2]].to_string());
+        assert_eq!(SyntaxKind::ExplainStmt, result[0].kind);
+        assert_eq!("select 1", input[result[1].range].to_string());
+        assert_eq!(SyntaxKind::SelectStmt, result[1].kind);
+        assert_eq!("select 4", input[result[2].range].to_string());
+        assert_eq!(SyntaxKind::SelectStmt, result[2].kind);
     }
 
     #[test]
     fn test_cast() {
         let input = "SELECT CAST(42 AS float8);\nselect 1";
 
-        let ranges = StatementSplitter::new(input).run();
+        let result = StatementSplitter::new(input).run();
 
-        assert_eq!(ranges.len(), 2);
-        assert_eq!("SELECT CAST(42 AS float8);", input[ranges[0]].to_string());
-        assert_eq!("select 1", input[ranges[1]].to_string());
+        assert_eq!(result.len(), 2);
+        assert_eq!(
+            "SELECT CAST(42 AS float8);",
+            input[result[0].range].to_string()
+        );
+        assert_eq!(SyntaxKind::SelectStmt, result[0].kind);
+        assert_eq!("select 1", input[result[1].range].to_string());
+        assert_eq!(SyntaxKind::SelectStmt, result[1].kind);
     }
 
     #[test]
     fn test_create_conversion() {
         let input = "CREATE CONVERSION myconv FOR 'UTF8' TO 'LATIN1' FROM myfunc;";
 
-        let ranges = StatementSplitter::new(input).run();
+        let result = StatementSplitter::new(input).run();
 
-        assert_eq!(ranges.len(), 1);
+        assert_eq!(result.len(), 1);
         assert_eq!(
             "CREATE CONVERSION myconv FOR 'UTF8' TO 'LATIN1' FROM myfunc;",
-            input[ranges[0]].to_string()
+            input[result[0].range].to_string()
+        );
+        assert_eq!(SyntaxKind::CreateConversionStmt, result[0].kind);
+    }
+
+    #[test]
+    fn test_with_comment() {
+        let input = "--\n-- ADVISORY LOCKS\n--\n\nBEGIN;\n\nSELECT\n\tpg_advisory_xact_lock(1), pg_advisory_xact_lock_shared(2),\n\tpg_advisory_xact_lock(1, 1), pg_advisory_xact_lock_shared(2, 2);\n\nSELECT locktype, classid, objid, objsubid, mode, granted\n\tFROM pg_locks WHERE locktype = 'advisory'\n\tORDER BY classid, objid, objsubid;\n\n\n-- pg_advisory_unlock_all() shouldn't release xact locks\nSELECT pg_advisory_unlock_all();\n\nSELECT count(*) FROM pg_locks WHERE locktype = 'advisory';\n\n\n-- can't unlock xact locks\nSELECT\n\tpg_advisory_unlock(1), pg_advisory_unlock_shared(2),\n\tpg_advisory_unlock(1, 1), pg_advisory_unlock_shared(2, 2);\n\n\n-- automatically release xact locks at commit\nCOMMIT;";
+
+        let result = StatementSplitter::new(input).run();
+
+        assert_eq!(result.len(), 7);
+    }
+
+    #[test]
+    fn test_composite_type() {
+        let input = "create type avg_state as (total bigint, count bigint);\ncreate type test;";
+
+        let result = StatementSplitter::new(input).run();
+
+        assert_eq!(result.len(), 2);
+        assert_eq!(
+            "create type avg_state as (total bigint, count bigint);",
+            input[result[0].range].to_string()
         );
+        assert_eq!(SyntaxKind::CompositeTypeStmt, result[0].kind);
+        assert_eq!("create type test;", input[result[1].range].to_string());
+        assert_eq!(SyntaxKind::DefineStmt, result[1].kind);
+    }
+
+    #[test]
+    fn test_set() {
+        let input = "CREATE FUNCTION test_opclass_options_func(internal)
+    RETURNS void
+    AS :'regresslib', 'test_opclass_options_func'
+    LANGUAGE C;
+
+SET client_min_messages TO 'warning';
+
+DROP ROLE IF EXISTS regress_alter_generic_user1;";
+
+        let result = StatementSplitter::new(input).run();
+
+        assert_eq!(result.len(), 3);
     }
 }
diff --git a/crates/pg_statement_splitter/src/tracker.rs b/crates/pg_statement_splitter/src/tracker.rs
index 7c84815c..c445f810 100644
--- a/crates/pg_statement_splitter/src/tracker.rs
+++ b/crates/pg_statement_splitter/src/tracker.rs
@@ -2,12 +2,12 @@ use pg_lexer::{SyntaxKind, WHITESPACE_TOKENS};
 
 use crate::data::{StatementDefinition, SyntaxDefinition};
 
-#[derive(Debug)]
+#[derive(Debug, Clone)]
 pub struct Tracker<'a> {
     pub def: &'a StatementDefinition,
 
     /// position in the definition
-    current_pos: usize,
+    pub current_pos: usize,
 
     /// position in the global token stream
     pub started_at: usize,
@@ -67,14 +67,8 @@ impl<'a> Tracker<'a> {
                     self.next_possible_tokens().iter().find(|x| x.1 == *kind)
                 {
                     self.current_pos = next_token.0 + 1;
-                } else if self.def.tokens.len() - 1 == self.current_pos {
-                    // if the optional token is the last one and the previous one is not optional
-                    // we must be at the end of the statement
-                    if let SyntaxDefinition::RequiredToken(_) =
-                        self.def.tokens.get(self.current_pos - 1).unwrap()
-                    {
-                        return false;
-                    }
+                } else {
+                    return false;
                 }
 
                 true
@@ -122,6 +116,7 @@ impl<'a> Tracker<'a> {
             .find(|x| match x {
                 SyntaxDefinition::RequiredToken(_) => true,
                 SyntaxDefinition::OneOf(_) => true,
+                SyntaxDefinition::AnyToken => true,
                 _ => false,
             })
     }
diff --git a/crates/pg_statement_splitter/tests/data/simple_select__4.sql b/crates/pg_statement_splitter/tests/data/simple_select.sql
similarity index 100%
rename from crates/pg_statement_splitter/tests/data/simple_select__4.sql
rename to crates/pg_statement_splitter/tests/data/simple_select.sql
diff --git a/crates/pg_statement_splitter/tests/skipped.txt b/crates/pg_statement_splitter/tests/skipped.txt
index 480089b9..5c6c8e56 100644
--- a/crates/pg_statement_splitter/tests/skipped.txt
+++ b/crates/pg_statement_splitter/tests/skipped.txt
@@ -10,3 +10,4 @@ drop_operator
 replica_identity
 unicode
 xmlmap
+aggregates
diff --git a/crates/pg_statement_splitter/tests/snapshots/data/simple_select.snap b/crates/pg_statement_splitter/tests/snapshots/data/simple_select.snap
new file mode 100644
index 00000000..d27571f4
--- /dev/null
+++ b/crates/pg_statement_splitter/tests/snapshots/data/simple_select.snap
@@ -0,0 +1,26 @@
+---
+source: crates/pg_statement_splitter/tests/statement_splitter_tests.rs
+description: "select id, name, test1231234123, unknown from co;\n\nselect 14433313331333\n\nalter table test drop column id;\n\nselect lower('test');\n\n"
+---
+[
+    (
+        SelectStmt,
+        0..49,
+        "select id, name, test1231234123, unknown from co;",
+    ),
+    (
+        SelectStmt,
+        51..72,
+        "select 14433313331333",
+    ),
+    (
+        AlterTableStmt,
+        74..106,
+        "alter table test drop column id;",
+    ),
+    (
+        SelectStmt,
+        108..129,
+        "select lower('test');",
+    ),
+]
diff --git a/crates/pg_statement_splitter/tests/statement_splitter_tests.rs b/crates/pg_statement_splitter/tests/statement_splitter_tests.rs
index 4313c2ad..63b31403 100644
--- a/crates/pg_statement_splitter/tests/statement_splitter_tests.rs
+++ b/crates/pg_statement_splitter/tests/statement_splitter_tests.rs
@@ -1,9 +1,14 @@
+use insta::{assert_debug_snapshot, Settings};
 use std::fs::{self};
 
+use pg_lexer::SyntaxKind;
+
 const DATA_DIR_PATH: &str = "tests/data/";
 const POSTGRES_REGRESS_PATH: &str = "../../libpg_query/test/sql/postgres_regress/";
 const SKIPPED_REGRESS_TESTS: &str = include_str!("skipped.txt");
 
+const SNAPSHOTS_PATH: &str = "snapshots/data";
+
 #[test]
 fn test_postgres_regress() {
     // all postgres regress tests are valid and complete statements, so we can use `split_with_parser` and compare with our own splitter
@@ -28,29 +33,38 @@ fn test_postgres_regress() {
             continue;
         }
 
+        println!("Running test: {}", test_name);
+
         // remove \commands because pg_query doesn't support them
         let contents = fs::read_to_string(&path)
             .unwrap()
             .lines()
-            .filter(|l| !l.starts_with("\\") && !l.ends_with("\\gset"))
+            .filter(|l| {
+                !l.starts_with("\\")
+                    && !l.ends_with("\\gset")
+                    && !l.starts_with("--")
+                    && !l.contains(":'")
+                    && l.split("\t").count() <= 2
+            })
             .collect::<Vec<_>>()
-            .join(" ");
+            .join("\n");
 
-        let libpg_query_split = pg_query::split_with_parser(&contents).unwrap();
+        let libpg_query_split = pg_query::split_with_parser(&contents).expect("Failed to split");
 
-        let parser_ranges = pg_statement_splitter::split(&contents);
+        let split = pg_statement_splitter::statements(&contents);
 
-        assert_eq!(
-            libpg_query_split.len(),
-            parser_ranges.len(),
-            "Mismatch in statement count for file {}: Expected {} statements, got {}",
-            test_name,
-            libpg_query_split.len(),
-            parser_ranges.len()
-        );
+        // assert_eq!(
+        //     libpg_query_split.len(),
+        //     split.len(),
+        //     "[{}] Mismatch in statement count: Expected {} statements, got {}. Contents:\n{}",
+        //     test_name,
+        //     libpg_query_split.len(),
+        //     split.len(),
+        //     contents
+        // );
 
-        for (libpg_query_stmt, parser_range) in libpg_query_split.iter().zip(parser_ranges.iter()) {
-            let parser_stmt = &contents[parser_range.clone()].trim();
+        for (libpg_query_stmt, parser_result) in libpg_query_split.iter().zip(split.iter()) {
+            let parser_stmt = &contents[parser_result.range.clone()].trim();
 
             let libpg_query_stmt = if libpg_query_stmt.ends_with(';') {
                 libpg_query_stmt.to_string()
@@ -63,9 +77,30 @@ fn test_postgres_regress() {
 
             assert_eq!(
                 libpg_query_stmt_trimmed, parser_stmt_trimmed,
-                "Mismatch in statement {}:\nlibg_query: '{}'\nsplitter:   '{}'",
+                "[{}] Mismatch in statement:\nlibg_query: '{}'\nsplitter:   '{}'",
                 test_name, libpg_query_stmt_trimmed, parser_stmt_trimmed
             );
+
+            let root = pg_query::parse(libpg_query_stmt_trimmed).map(|parsed| {
+                parsed
+                    .protobuf
+                    .nodes()
+                    .iter()
+                    .find(|n| n.1 == 1)
+                    .unwrap()
+                    .0
+                    .to_enum()
+            });
+
+            let syntax_kind = SyntaxKind::from(&root.expect("Failed to parse statement"));
+
+            assert_eq!(
+                syntax_kind, parser_result.kind,
+                "[{}] Mismatch in statement type. Expected {:?}, got {:?}",
+                test_name, parser_result.kind, syntax_kind
+            );
+
+            println!("[{}] Matched {}", test_name, parser_stmt_trimmed);
         }
     }
 }
@@ -81,24 +116,23 @@ fn test_statement_splitter() {
     for f in paths.iter() {
         let path = f.path();
         let test_name = path.file_stem().unwrap().to_str().unwrap();
-        let expected_count = test_name
-            .split("__")
-            .last()
-            .unwrap()
-            .parse::<usize>()
-            .unwrap();
 
         let contents = fs::read_to_string(&path).unwrap();
 
-        let ranges = pg_statement_splitter::split(&contents);
+        let statements = pg_statement_splitter::statements(&contents);
+
+        let result = statements
+            .iter()
+            .map(|x| (x.kind, x.range, &contents[x.range.clone()]))
+            .collect::<Vec<_>>();
+
+        let mut settings = Settings::clone_current();
+        settings.set_input_file(&path);
+        settings.set_prepend_module_to_snapshot(false);
+        settings.set_description(contents.to_string());
+        settings.set_omit_expression(true);
+        settings.set_snapshot_path(SNAPSHOTS_PATH);
 
-        assert_eq!(
-            ranges.len(),
-            expected_count,
-            "Mismatch in statement count for file {}: Expected {} statements, got {}",
-            test_name,
-            expected_count,
-            ranges.len()
-        );
+        settings.bind(|| assert_debug_snapshot!(test_name, result));
     }
 }

From 866ee7458539d1f0dc5da93d492ed1ec30a02790 Mon Sep 17 00:00:00 2001
From: psteinroe <philipp@steinroetter.com>
Date: Sat, 10 Aug 2024 21:42:52 +0200
Subject: [PATCH 04/19] fix: more tests and minor compatibility fixes

---
 crates/pg_statement_splitter/src/data.rs      |   2 +-
 crates/pg_statement_splitter/src/parser.rs    |  32 +++
 .../src/statement_splitter.rs                 | 209 +++++++++++++++++-
 .../tests/statement_splitter_tests.rs         | 190 ++++++++--------
 4 files changed, 326 insertions(+), 107 deletions(-)

diff --git a/crates/pg_statement_splitter/src/data.rs b/crates/pg_statement_splitter/src/data.rs
index f3d4d608..5cd5675d 100644
--- a/crates/pg_statement_splitter/src/data.rs
+++ b/crates/pg_statement_splitter/src/data.rs
@@ -624,7 +624,7 @@ pub static STATEMENT_DEFINITIONS: LazyLock<HashMap<SyntaxKind, Vec<StatementDefi
             stmt: SyntaxKind::CreateSchemaStmt,
             tokens: vec![
                 SyntaxDefinition::RequiredToken(SyntaxKind::Create),
-                SyntaxDefinition::OptionalToken(SyntaxKind::Schema),
+                SyntaxDefinition::RequiredToken(SyntaxKind::Schema),
             ],
         });
 
diff --git a/crates/pg_statement_splitter/src/parser.rs b/crates/pg_statement_splitter/src/parser.rs
index e50573f1..fc22db83 100644
--- a/crates/pg_statement_splitter/src/parser.rs
+++ b/crates/pg_statement_splitter/src/parser.rs
@@ -127,6 +127,38 @@ impl Parser {
         self.pos == self.tokens.len()
     }
 
+    /// lookbehind method.
+    ///
+    /// if `ignore_whitespace` is true, it will skip all whitespace tokens
+    pub fn lookbehind(&self, lookbehind: usize, ignore_whitespace: bool) -> Option<&Token> {
+        if ignore_whitespace {
+            let mut idx = 0;
+            let mut non_whitespace_token_ctr = 0;
+            loop {
+                match self.tokens.get(self.pos - idx) {
+                    Some(token) => {
+                        if !WHITESPACE_TOKENS.contains(&token.kind) {
+                            non_whitespace_token_ctr += 1;
+                            if non_whitespace_token_ctr == lookbehind {
+                                return Some(token);
+                            }
+                        }
+                        idx += 1;
+                    }
+                    None => {
+                        if (self.pos - idx) > 0 {
+                            idx += 1;
+                        } else {
+                            return None;
+                        }
+                    }
+                }
+            }
+        } else {
+            self.tokens.get(self.pos - lookbehind)
+        }
+    }
+
     /// lookahead method.
     ///
     /// if `ignore_whitespace` is true, it will skip all whitespace tokens
diff --git a/crates/pg_statement_splitter/src/statement_splitter.rs b/crates/pg_statement_splitter/src/statement_splitter.rs
index 5f759c3b..38d73989 100644
--- a/crates/pg_statement_splitter/src/statement_splitter.rs
+++ b/crates/pg_statement_splitter/src/statement_splitter.rs
@@ -37,14 +37,14 @@ impl<'a> StatementSplitter<'a> {
 
         while !self.parser.eof() {
             let at_token = self.parser.nth(0, false);
-            // println!("{:?}", at_token.kind);
-            // println!(
-            //     "tracked stmts before {:?}",
-            //     self.tracked_statements
-            //         .iter()
-            //         .map(|s| s.def.stmt)
-            //         .collect::<Vec<_>>()
-            // );
+            println!("{:?}", at_token.kind);
+            println!(
+                "tracked stmts before {:?}",
+                self.tracked_statements
+                    .iter()
+                    .map(|s| s.def.stmt)
+                    .collect::<Vec<_>>()
+            );
             // TODO rename vars and add helpers to make distinciton between pos and text pos clear
 
             if at_token.kind == SyntaxKind::BeginP {
@@ -59,8 +59,44 @@ impl<'a> StatementSplitter<'a> {
                 self.sub_stmt_depth -= 1;
             }
 
-            self.tracked_statements
-                .retain_mut(|stmt| stmt.advance_with(&at_token.kind));
+            let mut removed_items = Vec::new();
+
+            self.tracked_statements.retain_mut(|stmt| {
+                let keep = stmt.advance_with(&at_token.kind);
+                if !keep {
+                    removed_items.push(stmt.started_at);
+                }
+                keep
+            });
+
+            if self.tracked_statements.len() == 0 && removed_items.len() > 0 {
+                let any_stmt_after = removed_items.iter().min().unwrap();
+                println!("adding any statement: {:?}", any_stmt_after,);
+                ranges.push(StatementPosition {
+                    kind: SyntaxKind::Any,
+                    range: TextRange::new(
+                        TextSize::try_from(
+                            self.parser
+                                .tokens
+                                .get(*any_stmt_after)
+                                .unwrap()
+                                .span
+                                .start(),
+                        )
+                        .unwrap(),
+                        TextSize::try_from(self.parser.lookbehind(2, true).unwrap().span.end())
+                            .unwrap(),
+                    ),
+                });
+            }
+
+            println!(
+                "tracked stmts after advance {:?}",
+                self.tracked_statements
+                    .iter()
+                    .map(|s| s.def.stmt)
+                    .collect::<Vec<_>>()
+            );
 
             if self.sub_trx_depth == 0
                 && self.sub_stmt_depth == 0
@@ -103,6 +139,71 @@ impl<'a> StatementSplitter<'a> {
                 );
             }
 
+            println!(
+                "tracked stmts after {:?}",
+                self.tracked_statements
+                    .iter()
+                    .map(|s| s.def.stmt)
+                    .collect::<Vec<_>>()
+            );
+
+            if at_token.kind == SyntaxKind::Ascii59 {
+                // ;
+                // get earliest statement
+                if let Some(earliest_complete_stmt_started_at) = self
+                    .tracked_statements
+                    .iter()
+                    .filter(|s| s.could_be_complete())
+                    .min_by_key(|stmt| stmt.started_at)
+                    .map(|stmt| stmt.started_at)
+                {
+                    let earliest_complete_stmt = self
+                        .tracked_statements
+                        .iter()
+                        .filter(|s| {
+                            s.started_at == earliest_complete_stmt_started_at
+                                && s.could_be_complete()
+                        })
+                        .max_by_key(|stmt| stmt.current_pos)
+                        .unwrap();
+
+                    assert_eq!(
+                        1,
+                        self.tracked_statements
+                            .iter()
+                            .filter(|s| {
+                                s.started_at == earliest_complete_stmt_started_at
+                                    && s.could_be_complete()
+                                    && s.current_pos == earliest_complete_stmt.current_pos
+                            })
+                            .count(),
+                        "multiple complete statements at the same position"
+                    );
+
+                    let end_pos = at_token.span.end();
+                    let start_pos = TextSize::try_from(
+                        self.parser
+                            .tokens
+                            .get(earliest_complete_stmt.started_at)
+                            .unwrap()
+                            .span
+                            .start(),
+                    )
+                    .unwrap();
+                    println!(
+                        "adding stmt from ';': {:?}",
+                        earliest_complete_stmt.def.stmt
+                    );
+                    ranges.push(StatementPosition {
+                        kind: earliest_complete_stmt.def.stmt,
+                        range: TextRange::new(start_pos, end_pos),
+                    });
+                }
+
+                self.tracked_statements.clear();
+                self.active_bridges.clear();
+            }
+
             // if a statement is complete, check if there are any complete statements that start
             // before the just completed one
 
@@ -167,6 +268,7 @@ impl<'a> StatementSplitter<'a> {
                         .parser
                         .tokens
                         .iter()
+                        // .skip(latest_completed_stmt_started_at)
                         .filter_map(|t| {
                             if t.span.start() < latest_text_pos
                                 && !WHITESPACE_TOKENS.contains(&t.kind)
@@ -179,7 +281,7 @@ impl<'a> StatementSplitter<'a> {
                         .max()
                         .unwrap();
 
-                    // println!("adding stmt: {:?}", latest_complete_before.def.stmt);
+                    println!("adding stmt: {:?}", latest_complete_before.def.stmt);
 
                     ranges.push(StatementPosition {
                         kind: latest_complete_before.def.stmt,
@@ -247,6 +349,7 @@ impl<'a> StatementSplitter<'a> {
                 .parser
                 .tokens
                 .iter()
+                .skip(earliest_complete_stmt.started_at)
                 .filter_map(|t| {
                     if t.span.start() > earliest_text_pos && !WHITESPACE_TOKENS.contains(&t.kind) {
                         Some(t.span.end())
@@ -265,10 +368,38 @@ impl<'a> StatementSplitter<'a> {
                     .start(),
             )
             .unwrap();
+            println!("adding stmt at end: {:?}", earliest_complete_stmt.def.stmt);
+            println!("start: {:?}, end: {:?}", start_pos, end_pos);
             ranges.push(StatementPosition {
                 kind: earliest_complete_stmt.def.stmt,
                 range: TextRange::new(start_pos, end_pos),
             });
+
+            self.tracked_statements
+                .retain(|s| s.started_at > earliest_complete_stmt_started_at);
+        }
+
+        if let Some(earliest_stmt_started_at) = self
+            .tracked_statements
+            .iter()
+            .min_by_key(|stmt| stmt.started_at)
+            .map(|stmt| stmt.started_at)
+        {
+            let start_pos = TextSize::try_from(
+                self.parser
+                    .tokens
+                    .get(earliest_stmt_started_at)
+                    .unwrap()
+                    .span
+                    .start(),
+            );
+            // end position is last non-whitespace token before or at the current position
+            let end_pos = TextSize::try_from(self.parser.lookbehind(1, true).unwrap().span.end());
+            println!("adding any stmt at end");
+            ranges.push(StatementPosition {
+                kind: SyntaxKind::Any,
+                range: TextRange::new(start_pos.unwrap(), end_pos.unwrap()),
+            });
         }
 
         ranges
@@ -494,5 +625,61 @@ DROP ROLE IF EXISTS regress_alter_generic_user1;";
         let result = StatementSplitter::new(input).run();
 
         assert_eq!(result.len(), 3);
+        assert_eq!(
+            "CREATE FUNCTION test_opclass_options_func(internal)\n    RETURNS void\n    AS :'regresslib', 'test_opclass_options_func'\n    LANGUAGE C;",
+            input[result[0].range].to_string()
+        );
+        assert_eq!(SyntaxKind::CreateFunctionStmt, result[0].kind);
+        assert_eq!(
+            "SET client_min_messages TO 'warning';",
+            input[result[1].range].to_string()
+        );
+        assert_eq!(SyntaxKind::VariableSetStmt, result[1].kind);
+        assert_eq!(
+            "DROP ROLE IF EXISTS regress_alter_generic_user1;",
+            input[result[2].range].to_string()
+        );
+        assert_eq!(SyntaxKind::DropRoleStmt, result[2].kind);
+    }
+
+    #[test]
+    fn test_incomplete_statement() {
+        let input = "create\nselect 1;";
+
+        let result = StatementSplitter::new(input).run();
+
+        for r in &result {
+            println!("{:?} {:?}", r.kind, input[r.range].to_string());
+        }
+
+        assert_eq!(result.len(), 2);
+        assert_eq!("create", input[result[0].range].to_string());
+        assert_eq!(SyntaxKind::Any, result[0].kind);
+        assert_eq!("select 1;", input[result[1].range].to_string());
+        assert_eq!(SyntaxKind::SelectStmt, result[1].kind);
+    }
+
+    #[test]
+    fn test_incomplete_statement_at_end() {
+        let input = "select 1;\ncreate";
+
+        let result = StatementSplitter::new(input).run();
+
+        assert_eq!(result.len(), 2);
+        assert_eq!("select 1;", input[result[0].range].to_string());
+        assert_eq!(SyntaxKind::SelectStmt, result[0].kind);
+        assert_eq!("create", input[result[1].range].to_string());
+        assert_eq!(SyntaxKind::Any, result[1].kind);
+    }
+
+    #[test]
+    fn test_only_incomplete_statement() {
+        let input = "   create    ";
+
+        let result = StatementSplitter::new(input).run();
+
+        assert_eq!(result.len(), 1);
+        assert_eq!("create", input[result[0].range].to_string());
+        assert_eq!(SyntaxKind::Any, result[0].kind);
     }
 }
diff --git a/crates/pg_statement_splitter/tests/statement_splitter_tests.rs b/crates/pg_statement_splitter/tests/statement_splitter_tests.rs
index 63b31403..e1f74731 100644
--- a/crates/pg_statement_splitter/tests/statement_splitter_tests.rs
+++ b/crates/pg_statement_splitter/tests/statement_splitter_tests.rs
@@ -9,101 +9,101 @@ const SKIPPED_REGRESS_TESTS: &str = include_str!("skipped.txt");
 
 const SNAPSHOTS_PATH: &str = "snapshots/data";
 
-#[test]
-fn test_postgres_regress() {
-    // all postgres regress tests are valid and complete statements, so we can use `split_with_parser` and compare with our own splitter
-
-    let mut paths: Vec<_> = fs::read_dir(POSTGRES_REGRESS_PATH)
-        .unwrap()
-        .map(|r| r.unwrap())
-        .collect();
-    paths.sort_by_key(|dir| dir.path());
-
-    for f in paths.iter() {
-        let path = f.path();
-
-        let test_name = path.file_stem().unwrap().to_str().unwrap();
-
-        // these require fixes in the parser
-        if SKIPPED_REGRESS_TESTS
-            .lines()
-            .collect::<Vec<_>>()
-            .contains(&test_name)
-        {
-            continue;
-        }
-
-        println!("Running test: {}", test_name);
-
-        // remove \commands because pg_query doesn't support them
-        let contents = fs::read_to_string(&path)
-            .unwrap()
-            .lines()
-            .filter(|l| {
-                !l.starts_with("\\")
-                    && !l.ends_with("\\gset")
-                    && !l.starts_with("--")
-                    && !l.contains(":'")
-                    && l.split("\t").count() <= 2
-            })
-            .collect::<Vec<_>>()
-            .join("\n");
-
-        let libpg_query_split = pg_query::split_with_parser(&contents).expect("Failed to split");
-
-        let split = pg_statement_splitter::statements(&contents);
-
-        // assert_eq!(
-        //     libpg_query_split.len(),
-        //     split.len(),
-        //     "[{}] Mismatch in statement count: Expected {} statements, got {}. Contents:\n{}",
-        //     test_name,
-        //     libpg_query_split.len(),
-        //     split.len(),
-        //     contents
-        // );
-
-        for (libpg_query_stmt, parser_result) in libpg_query_split.iter().zip(split.iter()) {
-            let parser_stmt = &contents[parser_result.range.clone()].trim();
-
-            let libpg_query_stmt = if libpg_query_stmt.ends_with(';') {
-                libpg_query_stmt.to_string()
-            } else {
-                format!("{};", libpg_query_stmt.trim())
-            };
-
-            let libpg_query_stmt_trimmed = libpg_query_stmt.trim();
-            let parser_stmt_trimmed = parser_stmt.trim();
-
-            assert_eq!(
-                libpg_query_stmt_trimmed, parser_stmt_trimmed,
-                "[{}] Mismatch in statement:\nlibg_query: '{}'\nsplitter:   '{}'",
-                test_name, libpg_query_stmt_trimmed, parser_stmt_trimmed
-            );
-
-            let root = pg_query::parse(libpg_query_stmt_trimmed).map(|parsed| {
-                parsed
-                    .protobuf
-                    .nodes()
-                    .iter()
-                    .find(|n| n.1 == 1)
-                    .unwrap()
-                    .0
-                    .to_enum()
-            });
-
-            let syntax_kind = SyntaxKind::from(&root.expect("Failed to parse statement"));
-
-            assert_eq!(
-                syntax_kind, parser_result.kind,
-                "[{}] Mismatch in statement type. Expected {:?}, got {:?}",
-                test_name, parser_result.kind, syntax_kind
-            );
-
-            println!("[{}] Matched {}", test_name, parser_stmt_trimmed);
-        }
-    }
-}
+// #[test]
+// fn test_postgres_regress() {
+//     // all postgres regress tests are valid and complete statements, so we can use `split_with_parser` and compare with our own splitter
+//
+//     let mut paths: Vec<_> = fs::read_dir(POSTGRES_REGRESS_PATH)
+//         .unwrap()
+//         .map(|r| r.unwrap())
+//         .collect();
+//     paths.sort_by_key(|dir| dir.path());
+//
+//     for f in paths.iter() {
+//         let path = f.path();
+//
+//         let test_name = path.file_stem().unwrap().to_str().unwrap();
+//
+//         // these require fixes in the parser
+//         if SKIPPED_REGRESS_TESTS
+//             .lines()
+//             .collect::<Vec<_>>()
+//             .contains(&test_name)
+//         {
+//             continue;
+//         }
+//
+//         println!("Running test: {}", test_name);
+//
+//         // remove \commands because pg_query doesn't support them
+//         let contents = fs::read_to_string(&path)
+//             .unwrap()
+//             .lines()
+//             .filter(|l| {
+//                 !l.starts_with("\\")
+//                     && !l.ends_with("\\gset")
+//                     && !l.starts_with("--")
+//                     && !l.contains(":'")
+//                     && l.split("\t").count() <= 2
+//             })
+//             .collect::<Vec<_>>()
+//             .join("\n");
+//
+//         let libpg_query_split = pg_query::split_with_parser(&contents).expect("Failed to split");
+//
+//         let split = pg_statement_splitter::statements(&contents);
+//
+//         // assert_eq!(
+//         //     libpg_query_split.len(),
+//         //     split.len(),
+//         //     "[{}] Mismatch in statement count: Expected {} statements, got {}. Contents:\n{}",
+//         //     test_name,
+//         //     libpg_query_split.len(),
+//         //     split.len(),
+//         //     contents
+//         // );
+//
+//         for (libpg_query_stmt, parser_result) in libpg_query_split.iter().zip(split.iter()) {
+//             let parser_stmt = &contents[parser_result.range.clone()].trim();
+//
+//             let libpg_query_stmt = if libpg_query_stmt.ends_with(';') {
+//                 libpg_query_stmt.to_string()
+//             } else {
+//                 format!("{};", libpg_query_stmt.trim())
+//             };
+//
+//             let libpg_query_stmt_trimmed = libpg_query_stmt.trim();
+//             let parser_stmt_trimmed = parser_stmt.trim();
+//
+//             assert_eq!(
+//                 libpg_query_stmt_trimmed, parser_stmt_trimmed,
+//                 "[{}] Mismatch in statement:\nlibg_query: '{}'\nsplitter:   '{}'",
+//                 test_name, libpg_query_stmt_trimmed, parser_stmt_trimmed
+//             );
+//
+//             let root = pg_query::parse(libpg_query_stmt_trimmed).map(|parsed| {
+//                 parsed
+//                     .protobuf
+//                     .nodes()
+//                     .iter()
+//                     .find(|n| n.1 == 1)
+//                     .unwrap()
+//                     .0
+//                     .to_enum()
+//             });
+//
+//             let syntax_kind = SyntaxKind::from(&root.expect("Failed to parse statement"));
+//
+//             assert_eq!(
+//                 syntax_kind, parser_result.kind,
+//                 "[{}] Mismatch in statement type. Expected {:?}, got {:?}",
+//                 test_name, parser_result.kind, syntax_kind
+//             );
+//
+//             println!("[{}] Matched {}", test_name, parser_stmt_trimmed);
+//         }
+//     }
+// }
 
 #[test]
 fn test_statement_splitter() {

From b762b8f33f04b61b3cc23008e27c2ff3c657e447 Mon Sep 17 00:00:00 2001
From: psteinroe <philipp@steinroetter.com>
Date: Sat, 10 Aug 2024 21:57:57 +0200
Subject: [PATCH 05/19] fix: add test

---
 .../pg_statement_splitter/src/statement_splitter.rs | 13 +++++++++++++
 1 file changed, 13 insertions(+)

diff --git a/crates/pg_statement_splitter/src/statement_splitter.rs b/crates/pg_statement_splitter/src/statement_splitter.rs
index 38d73989..660cdb07 100644
--- a/crates/pg_statement_splitter/src/statement_splitter.rs
+++ b/crates/pg_statement_splitter/src/statement_splitter.rs
@@ -672,6 +672,19 @@ DROP ROLE IF EXISTS regress_alter_generic_user1;";
         assert_eq!(SyntaxKind::Any, result[1].kind);
     }
 
+    #[test]
+    fn test_only_incomplete_statement_semicolon() {
+        let input = "create;\nselect 1;";
+
+        let result = StatementSplitter::new(input).run();
+
+        assert_eq!(result.len(), 2);
+        assert_eq!("create", input[result[0].range].to_string());
+        assert_eq!(SyntaxKind::Any, result[0].kind);
+        assert_eq!("select 1;", input[result[1].range].to_string());
+        assert_eq!(SyntaxKind::SelectStmt, result[1].kind);
+    }
+
     #[test]
     fn test_only_incomplete_statement() {
         let input = "   create    ";

From 0886090e3307c2707aa0029dce07bc9a323bee95 Mon Sep 17 00:00:00 2001
From: psteinroe <philipp@steinroetter.com>
Date: Fri, 16 Aug 2024 20:25:44 +0200
Subject: [PATCH 06/19] fix: more tests and minor compatibility fixes

---
 crates/pg_statement_splitter/src/data.rs      | 423 ++++++++++++++-
 .../src/statement_splitter.rs                 | 487 +++++++++++++++++-
 .../pg_statement_splitter/tests/skipped.txt   |   1 +
 .../tests/statement_splitter_tests.rs         | 216 ++++----
 4 files changed, 1022 insertions(+), 105 deletions(-)

diff --git a/crates/pg_statement_splitter/src/data.rs b/crates/pg_statement_splitter/src/data.rs
index 5cd5675d..f494f689 100644
--- a/crates/pg_statement_splitter/src/data.rs
+++ b/crates/pg_statement_splitter/src/data.rs
@@ -95,6 +95,11 @@ pub static STATEMENT_DEFINITIONS: LazyLock<HashMap<SyntaxKind, Vec<StatementDefi
                 SyntaxDefinition::RequiredToken(SyntaxKind::Insert),
                 SyntaxDefinition::RequiredToken(SyntaxKind::Into),
                 SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
+                // the minimum required tokens for an insert statement are DEFAULT VALUES
+                // this is important to not conflict with a SELECT statement
+                // when within an insert into table select ...
+                SyntaxDefinition::AnyToken,
+                SyntaxDefinition::AnyToken,
             ],
         });
 
@@ -114,6 +119,9 @@ pub static STATEMENT_DEFINITIONS: LazyLock<HashMap<SyntaxKind, Vec<StatementDefi
                 SyntaxDefinition::RequiredToken(SyntaxKind::Update),
                 SyntaxDefinition::OptionalToken(SyntaxKind::Only),
                 SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
+                SyntaxDefinition::AnyTokens,
+                SyntaxDefinition::RequiredToken(SyntaxKind::Set),
+                SyntaxDefinition::AnyToken,
             ],
         });
 
@@ -131,7 +139,7 @@ pub static STATEMENT_DEFINITIONS: LazyLock<HashMap<SyntaxKind, Vec<StatementDefi
             stmt: SyntaxKind::AlterTableStmt,
             tokens: vec![
                 SyntaxDefinition::RequiredToken(SyntaxKind::Alter),
-                SyntaxDefinition::RequiredToken(SyntaxKind::Table),
+                SyntaxDefinition::OneOf(vec![SyntaxKind::Table, SyntaxKind::Index]),
                 SyntaxDefinition::OptionalToken(SyntaxKind::IfP),
                 SyntaxDefinition::OptionalToken(SyntaxKind::Exists),
                 SyntaxDefinition::OptionalToken(SyntaxKind::Only),
@@ -140,6 +148,19 @@ pub static STATEMENT_DEFINITIONS: LazyLock<HashMap<SyntaxKind, Vec<StatementDefi
             ],
         });
 
+        m.push(StatementDefinition {
+            stmt: SyntaxKind::RenameStmt,
+            tokens: vec![
+                SyntaxDefinition::RequiredToken(SyntaxKind::Alter),
+                SyntaxDefinition::AnyTokens,
+                SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
+                SyntaxDefinition::AnyTokens,
+                SyntaxDefinition::RequiredToken(SyntaxKind::Rename),
+                SyntaxDefinition::RequiredToken(SyntaxKind::To),
+                SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
+            ],
+        });
+
         m.push(StatementDefinition {
             stmt: SyntaxKind::RenameStmt,
             tokens: vec![
@@ -199,24 +220,213 @@ pub static STATEMENT_DEFINITIONS: LazyLock<HashMap<SyntaxKind, Vec<StatementDefi
                 SyntaxDefinition::OptionalToken(SyntaxKind::Temporary),
                 SyntaxDefinition::OptionalToken(SyntaxKind::Temp),
                 SyntaxDefinition::OptionalToken(SyntaxKind::Unlogged),
+                SyntaxDefinition::RequiredToken(SyntaxKind::Table),
                 SyntaxDefinition::OptionalToken(SyntaxKind::IfP),
                 SyntaxDefinition::OptionalToken(SyntaxKind::Not),
                 SyntaxDefinition::OptionalToken(SyntaxKind::Exists),
-                SyntaxDefinition::RequiredToken(SyntaxKind::Table),
                 SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
+                SyntaxDefinition::AnyTokens,
+                SyntaxDefinition::RequiredToken(SyntaxKind::Ascii40),
+                SyntaxDefinition::AnyTokens,
+                SyntaxDefinition::RequiredToken(SyntaxKind::Ascii41),
             ],
         });
 
         m.push(StatementDefinition {
             stmt: SyntaxKind::DefineStmt,
             tokens: vec![
-                SyntaxDefinition::RequiredToken(SyntaxKind::Execute),
+                SyntaxDefinition::RequiredToken(SyntaxKind::Create),
                 SyntaxDefinition::OptionalToken(SyntaxKind::Or),
                 SyntaxDefinition::OptionalToken(SyntaxKind::Replace),
                 SyntaxDefinition::RequiredToken(SyntaxKind::Aggregate),
             ],
         });
 
+        m.push(StatementDefinition {
+            stmt: SyntaxKind::CreateOpClassStmt,
+            tokens: vec![
+                SyntaxDefinition::RequiredToken(SyntaxKind::Create),
+                SyntaxDefinition::RequiredToken(SyntaxKind::Operator),
+                SyntaxDefinition::RequiredToken(SyntaxKind::Class),
+                SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
+                SyntaxDefinition::OptionalToken(SyntaxKind::Default),
+                SyntaxDefinition::RequiredToken(SyntaxKind::For),
+                SyntaxDefinition::RequiredToken(SyntaxKind::TypeP),
+                SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
+                SyntaxDefinition::RequiredToken(SyntaxKind::Using),
+            ],
+        });
+
+        m.push(StatementDefinition {
+            stmt: SyntaxKind::DropStmt,
+            tokens: vec![
+                SyntaxDefinition::RequiredToken(SyntaxKind::Drop),
+                SyntaxDefinition::RequiredToken(SyntaxKind::Foreign),
+                SyntaxDefinition::RequiredToken(SyntaxKind::DataP),
+                SyntaxDefinition::RequiredToken(SyntaxKind::Wrapper),
+                SyntaxDefinition::OptionalToken(SyntaxKind::IfP),
+                SyntaxDefinition::OptionalToken(SyntaxKind::Exists),
+                SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
+            ],
+        });
+
+        m.push(StatementDefinition {
+            stmt: SyntaxKind::DropStmt,
+            tokens: vec![
+                SyntaxDefinition::RequiredToken(SyntaxKind::Drop),
+                SyntaxDefinition::RequiredToken(SyntaxKind::Table),
+                SyntaxDefinition::OptionalToken(SyntaxKind::IfP),
+                SyntaxDefinition::OptionalToken(SyntaxKind::Exists),
+                SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
+            ],
+        });
+
+        m.push(StatementDefinition {
+            stmt: SyntaxKind::DropStmt,
+            tokens: vec![
+                SyntaxDefinition::RequiredToken(SyntaxKind::Drop),
+                SyntaxDefinition::RequiredToken(SyntaxKind::Index),
+                SyntaxDefinition::OptionalToken(SyntaxKind::Concurrently),
+                SyntaxDefinition::OptionalToken(SyntaxKind::IfP),
+                SyntaxDefinition::OptionalToken(SyntaxKind::Exists),
+                SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
+            ],
+        });
+
+        m.push(StatementDefinition {
+            stmt: SyntaxKind::DropStmt,
+            tokens: vec![
+                SyntaxDefinition::RequiredToken(SyntaxKind::Drop),
+                SyntaxDefinition::RequiredToken(SyntaxKind::TypeP),
+                SyntaxDefinition::OptionalToken(SyntaxKind::IfP),
+                SyntaxDefinition::OptionalToken(SyntaxKind::Exists),
+                SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
+            ],
+        });
+
+        m.push(StatementDefinition {
+            stmt: SyntaxKind::DropStmt,
+            tokens: vec![
+                SyntaxDefinition::RequiredToken(SyntaxKind::Drop),
+                SyntaxDefinition::RequiredToken(SyntaxKind::Operator),
+                SyntaxDefinition::OptionalToken(SyntaxKind::IfP),
+                SyntaxDefinition::OptionalToken(SyntaxKind::Exists),
+                SyntaxDefinition::OneOf(vec![SyntaxKind::Op, SyntaxKind::Ident]),
+                SyntaxDefinition::RequiredToken(SyntaxKind::Ascii40),
+                SyntaxDefinition::AnyTokens,
+                SyntaxDefinition::RequiredToken(SyntaxKind::Ascii41),
+            ],
+        });
+
+        m.push(StatementDefinition {
+            stmt: SyntaxKind::DropStmt,
+            tokens: vec![
+                SyntaxDefinition::RequiredToken(SyntaxKind::Drop),
+                SyntaxDefinition::RequiredToken(SyntaxKind::Function),
+                SyntaxDefinition::OptionalToken(SyntaxKind::IfP),
+                SyntaxDefinition::OptionalToken(SyntaxKind::Exists),
+                SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
+                SyntaxDefinition::RequiredToken(SyntaxKind::Ascii40),
+                SyntaxDefinition::AnyTokens,
+                SyntaxDefinition::RequiredToken(SyntaxKind::Ascii41),
+            ],
+        });
+
+        m.push(StatementDefinition {
+            stmt: SyntaxKind::DropStmt,
+            tokens: vec![
+                SyntaxDefinition::RequiredToken(SyntaxKind::Drop),
+                SyntaxDefinition::RequiredToken(SyntaxKind::Schema),
+                SyntaxDefinition::OptionalToken(SyntaxKind::IfP),
+                SyntaxDefinition::OptionalToken(SyntaxKind::Exists),
+                SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
+            ],
+        });
+
+        m.push(StatementDefinition {
+            stmt: SyntaxKind::DropStmt,
+            tokens: vec![
+                SyntaxDefinition::RequiredToken(SyntaxKind::Drop),
+                SyntaxDefinition::OptionalToken(SyntaxKind::Procedural),
+                SyntaxDefinition::RequiredToken(SyntaxKind::Language),
+                SyntaxDefinition::OptionalToken(SyntaxKind::IfP),
+                SyntaxDefinition::OptionalToken(SyntaxKind::Exists),
+                SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
+                SyntaxDefinition::OneOf(vec![SyntaxKind::Cascade, SyntaxKind::Restrict]),
+            ],
+        });
+
+        m.push(StatementDefinition {
+            stmt: SyntaxKind::DropStmt,
+            tokens: vec![
+                SyntaxDefinition::RequiredToken(SyntaxKind::Drop),
+                SyntaxDefinition::RequiredToken(SyntaxKind::Operator),
+                SyntaxDefinition::RequiredToken(SyntaxKind::Family),
+                SyntaxDefinition::OptionalToken(SyntaxKind::IfP),
+                SyntaxDefinition::OptionalToken(SyntaxKind::Exists),
+                SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
+                SyntaxDefinition::RequiredToken(SyntaxKind::Using),
+                SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
+            ],
+        });
+
+        // CREATE TEXT SEARCH DICTIONARY alt_ts_dict1 (template=simple);
+        m.push(StatementDefinition {
+            stmt: SyntaxKind::DefineStmt,
+            tokens: vec![
+                SyntaxDefinition::RequiredToken(SyntaxKind::Create),
+                SyntaxDefinition::RequiredToken(SyntaxKind::TextP),
+                SyntaxDefinition::RequiredToken(SyntaxKind::Search),
+                SyntaxDefinition::RequiredToken(SyntaxKind::Dictionary),
+                SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
+                SyntaxDefinition::RequiredToken(SyntaxKind::Ascii40),
+                SyntaxDefinition::AnyTokens,
+                SyntaxDefinition::RequiredToken(SyntaxKind::Ascii41),
+            ],
+        });
+
+        m.push(StatementDefinition {
+            stmt: SyntaxKind::DefineStmt,
+            tokens: vec![
+                SyntaxDefinition::RequiredToken(SyntaxKind::Create),
+                SyntaxDefinition::RequiredToken(SyntaxKind::TextP),
+                SyntaxDefinition::RequiredToken(SyntaxKind::Search),
+                SyntaxDefinition::RequiredToken(SyntaxKind::Configuration),
+                SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
+                SyntaxDefinition::RequiredToken(SyntaxKind::Ascii40),
+                SyntaxDefinition::AnyTokens,
+                SyntaxDefinition::RequiredToken(SyntaxKind::Ascii41),
+            ],
+        });
+
+        m.push(StatementDefinition {
+            stmt: SyntaxKind::DefineStmt,
+            tokens: vec![
+                SyntaxDefinition::RequiredToken(SyntaxKind::Create),
+                SyntaxDefinition::RequiredToken(SyntaxKind::TextP),
+                SyntaxDefinition::RequiredToken(SyntaxKind::Search),
+                SyntaxDefinition::RequiredToken(SyntaxKind::Template),
+                SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
+                SyntaxDefinition::RequiredToken(SyntaxKind::Ascii40),
+                SyntaxDefinition::AnyTokens,
+                SyntaxDefinition::RequiredToken(SyntaxKind::Ascii41),
+            ],
+        });
+
+        m.push(StatementDefinition {
+            stmt: SyntaxKind::DefineStmt,
+            tokens: vec![
+                SyntaxDefinition::RequiredToken(SyntaxKind::Create),
+                SyntaxDefinition::RequiredToken(SyntaxKind::TextP),
+                SyntaxDefinition::RequiredToken(SyntaxKind::Search),
+                SyntaxDefinition::RequiredToken(SyntaxKind::Parser),
+                SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
+                SyntaxDefinition::RequiredToken(SyntaxKind::Ascii40),
+                SyntaxDefinition::AnyTokens,
+                SyntaxDefinition::RequiredToken(SyntaxKind::Ascii41),
+            ],
+        });
+
         m.push(StatementDefinition {
             stmt: SyntaxKind::DefineStmt,
             tokens: vec![
@@ -225,6 +435,20 @@ pub static STATEMENT_DEFINITIONS: LazyLock<HashMap<SyntaxKind, Vec<StatementDefi
             ],
         });
 
+        m.push(StatementDefinition {
+            stmt: SyntaxKind::DefineStmt,
+            tokens: vec![
+                SyntaxDefinition::RequiredToken(SyntaxKind::Create),
+                SyntaxDefinition::OptionalToken(SyntaxKind::Or),
+                SyntaxDefinition::OptionalToken(SyntaxKind::Replace),
+                SyntaxDefinition::RequiredToken(SyntaxKind::Aggregate),
+                SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
+                SyntaxDefinition::RequiredToken(SyntaxKind::Ascii40),
+                SyntaxDefinition::AnyTokens,
+                SyntaxDefinition::RequiredToken(SyntaxKind::Ascii41),
+            ],
+        });
+
         m.push(StatementDefinition {
             stmt: SyntaxKind::DefineStmt,
             tokens: vec![
@@ -267,7 +491,7 @@ pub static STATEMENT_DEFINITIONS: LazyLock<HashMap<SyntaxKind, Vec<StatementDefi
         });
 
         m.push(StatementDefinition {
-            stmt: SyntaxKind::Truncate,
+            stmt: SyntaxKind::TruncateStmt,
             tokens: vec![
                 SyntaxDefinition::RequiredToken(SyntaxKind::Truncate),
                 SyntaxDefinition::OptionalToken(SyntaxKind::Table),
@@ -293,13 +517,17 @@ pub static STATEMENT_DEFINITIONS: LazyLock<HashMap<SyntaxKind, Vec<StatementDefi
             ],
         });
 
+        m.push(StatementDefinition {
+            stmt: SyntaxKind::VacuumStmt,
+            tokens: vec![SyntaxDefinition::RequiredToken(SyntaxKind::Analyze)],
+        });
+
         m.push(StatementDefinition {
             stmt: SyntaxKind::IndexStmt,
             tokens: vec![
                 SyntaxDefinition::RequiredToken(SyntaxKind::Create),
                 SyntaxDefinition::OptionalToken(SyntaxKind::Unique),
                 SyntaxDefinition::RequiredToken(SyntaxKind::Index),
-                SyntaxDefinition::OptionalToken(SyntaxKind::Concurrently),
                 SyntaxDefinition::AnyTokens,
                 SyntaxDefinition::RequiredToken(SyntaxKind::On),
                 SyntaxDefinition::OptionalToken(SyntaxKind::Only),
@@ -332,7 +560,12 @@ pub static STATEMENT_DEFINITIONS: LazyLock<HashMap<SyntaxKind, Vec<StatementDefi
 
         m.push(StatementDefinition {
             stmt: SyntaxKind::DoStmt,
-            tokens: vec![SyntaxDefinition::RequiredToken(SyntaxKind::Do)],
+            tokens: vec![
+                SyntaxDefinition::RequiredToken(SyntaxKind::Do),
+                SyntaxDefinition::OptionalToken(SyntaxKind::Language),
+                SyntaxDefinition::OptionalToken(SyntaxKind::Ident),
+                SyntaxDefinition::RequiredToken(SyntaxKind::Sconst),
+            ],
         });
 
         m.push(StatementDefinition {
@@ -379,6 +612,29 @@ pub static STATEMENT_DEFINITIONS: LazyLock<HashMap<SyntaxKind, Vec<StatementDefi
             ],
         });
 
+        // DECLARE c CURSOR FOR SELECT ctid,cmin,* FROM combocidtest
+        m.push(StatementDefinition {
+            stmt: SyntaxKind::DeclareCursorStmt,
+            tokens: vec![
+                SyntaxDefinition::RequiredToken(SyntaxKind::Declare),
+                SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
+                SyntaxDefinition::AnyTokens,
+                SyntaxDefinition::RequiredToken(SyntaxKind::Cursor),
+                SyntaxDefinition::AnyTokens,
+                SyntaxDefinition::RequiredToken(SyntaxKind::For),
+                SyntaxDefinition::OneOf(vec![SyntaxKind::Select, SyntaxKind::With]),
+                SyntaxDefinition::AnyToken,
+            ],
+        });
+
+        m.push(StatementDefinition {
+            stmt: SyntaxKind::TransactionStmt,
+            tokens: vec![
+                SyntaxDefinition::RequiredToken(SyntaxKind::Savepoint),
+                SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
+            ],
+        });
+
         m.push(StatementDefinition {
             stmt: SyntaxKind::TransactionStmt,
             tokens: vec![SyntaxDefinition::RequiredToken(SyntaxKind::BeginP)],
@@ -391,7 +647,22 @@ pub static STATEMENT_DEFINITIONS: LazyLock<HashMap<SyntaxKind, Vec<StatementDefi
 
         m.push(StatementDefinition {
             stmt: SyntaxKind::TransactionStmt,
-            tokens: vec![SyntaxDefinition::RequiredToken(SyntaxKind::Rollback)],
+            tokens: vec![
+                SyntaxDefinition::RequiredToken(SyntaxKind::Rollback),
+                SyntaxDefinition::AnyTokens,
+                SyntaxDefinition::RequiredToken(SyntaxKind::To),
+                SyntaxDefinition::OptionalToken(SyntaxKind::Savepoint),
+                SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
+            ],
+        });
+
+        m.push(StatementDefinition {
+            stmt: SyntaxKind::TransactionStmt,
+            tokens: vec![
+                SyntaxDefinition::RequiredToken(SyntaxKind::Rollback),
+                // FIXME: without the ";", this would conflict with ROLLBACK TO SAVEPOINT
+                SyntaxDefinition::RequiredToken(SyntaxKind::Ascii59),
+            ],
         });
 
         m.push(StatementDefinition {
@@ -466,6 +737,7 @@ pub static STATEMENT_DEFINITIONS: LazyLock<HashMap<SyntaxKind, Vec<StatementDefi
                 SyntaxDefinition::AnyTokens,
                 SyntaxDefinition::RequiredToken(SyntaxKind::As),
                 SyntaxDefinition::OneOf(vec![SyntaxKind::With, SyntaxKind::Select]),
+                SyntaxDefinition::AnyToken,
             ],
         });
 
@@ -513,6 +785,52 @@ pub static STATEMENT_DEFINITIONS: LazyLock<HashMap<SyntaxKind, Vec<StatementDefi
             ],
         });
 
+        // RESET SESSION AUTHORIZATION
+        m.push(StatementDefinition {
+            stmt: SyntaxKind::VariableSetStmt,
+            tokens: vec![
+                SyntaxDefinition::RequiredToken(SyntaxKind::Reset),
+                SyntaxDefinition::RequiredToken(SyntaxKind::Session),
+                SyntaxDefinition::RequiredToken(SyntaxKind::Authorization),
+            ],
+        });
+
+        m.push(StatementDefinition {
+            stmt: SyntaxKind::VariableSetStmt,
+            tokens: vec![
+                SyntaxDefinition::RequiredToken(SyntaxKind::Set),
+                SyntaxDefinition::RequiredToken(SyntaxKind::Role),
+                SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
+            ],
+        });
+
+        m.push(StatementDefinition {
+            stmt: SyntaxKind::VariableSetStmt,
+            tokens: vec![
+                SyntaxDefinition::RequiredToken(SyntaxKind::Reset),
+                SyntaxDefinition::RequiredToken(SyntaxKind::Role),
+            ],
+        });
+
+        m.push(StatementDefinition {
+            stmt: SyntaxKind::VariableSetStmt,
+            tokens: vec![
+                SyntaxDefinition::RequiredToken(SyntaxKind::Reset),
+                SyntaxDefinition::OneOf(vec![SyntaxKind::All, SyntaxKind::Ident]),
+            ],
+        });
+
+        // ref: https://www.postgresql.org/docs/current/sql-set-session-authorization.html
+        m.push(StatementDefinition {
+            stmt: SyntaxKind::VariableSetStmt,
+            tokens: vec![
+                SyntaxDefinition::RequiredToken(SyntaxKind::Set),
+                SyntaxDefinition::RequiredToken(SyntaxKind::Session),
+                SyntaxDefinition::RequiredToken(SyntaxKind::Authorization),
+                SyntaxDefinition::OneOf(vec![SyntaxKind::Ident, SyntaxKind::Sconst]),
+            ],
+        });
+
         m.push(StatementDefinition {
             stmt: SyntaxKind::VariableSetStmt,
             tokens: vec![
@@ -568,6 +886,16 @@ pub static STATEMENT_DEFINITIONS: LazyLock<HashMap<SyntaxKind, Vec<StatementDefi
             ],
         });
 
+        // this is not a mistake - a create user statement is the same as a create role statement
+        m.push(StatementDefinition {
+            stmt: SyntaxKind::CreateRoleStmt,
+            tokens: vec![
+                SyntaxDefinition::RequiredToken(SyntaxKind::Create),
+                SyntaxDefinition::RequiredToken(SyntaxKind::User),
+                SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
+            ],
+        });
+
         m.push(StatementDefinition {
             stmt: SyntaxKind::AlterRoleStmt,
             tokens: vec![
@@ -581,7 +909,7 @@ pub static STATEMENT_DEFINITIONS: LazyLock<HashMap<SyntaxKind, Vec<StatementDefi
             stmt: SyntaxKind::DropRoleStmt,
             tokens: vec![
                 SyntaxDefinition::RequiredToken(SyntaxKind::Drop),
-                SyntaxDefinition::RequiredToken(SyntaxKind::Role),
+                SyntaxDefinition::OneOf(vec![SyntaxKind::Role, SyntaxKind::User]),
                 SyntaxDefinition::OptionalToken(SyntaxKind::IfP),
                 SyntaxDefinition::OptionalToken(SyntaxKind::Exists),
                 SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
@@ -714,9 +1042,15 @@ pub static STATEMENT_DEFINITIONS: LazyLock<HashMap<SyntaxKind, Vec<StatementDefi
                 SyntaxDefinition::RequiredToken(SyntaxKind::Alter),
                 SyntaxDefinition::RequiredToken(SyntaxKind::Operator),
                 SyntaxDefinition::RequiredToken(SyntaxKind::Family),
-                SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
+                // for schemas, this should be put into all definitions...
+                // SyntaxDefinition::OptionalToken(SyntaxKind::Ident),
+                // SyntaxDefinition::OptionalToken(SyntaxKind::Ascii46),
+                SyntaxDefinition::AnyTokens,
+                // SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
                 SyntaxDefinition::RequiredToken(SyntaxKind::Using),
                 SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
+                // this is important to not conflict with RenameStmt
+                SyntaxDefinition::OneOf(vec![SyntaxKind::Drop, SyntaxKind::AddP]),
             ],
         });
 
@@ -1104,6 +1438,77 @@ pub static STATEMENT_DEFINITIONS: LazyLock<HashMap<SyntaxKind, Vec<StatementDefi
             ],
         });
 
+        // GRANT ALL ON SCHEMA alt_nsp1, alt_nsp2 TO public;
+        m.push(StatementDefinition {
+            stmt: SyntaxKind::GrantStmt,
+            tokens: vec![
+                SyntaxDefinition::RequiredToken(SyntaxKind::Grant),
+                SyntaxDefinition::AnyTokens,
+                SyntaxDefinition::RequiredToken(SyntaxKind::On),
+                SyntaxDefinition::AnyTokens,
+                SyntaxDefinition::RequiredToken(SyntaxKind::To),
+            ],
+        });
+
+        // REVOKE ALL ON SCHEMA alt_nsp6 FROM regress_alter_generic_user6;
+        m.push(StatementDefinition {
+            stmt: SyntaxKind::GrantStmt,
+            tokens: vec![
+                SyntaxDefinition::RequiredToken(SyntaxKind::Revoke),
+                SyntaxDefinition::AnyTokens,
+                SyntaxDefinition::RequiredToken(SyntaxKind::On),
+            ],
+        });
+
+        m.push(StatementDefinition {
+            stmt: SyntaxKind::AlterOwnerStmt,
+            tokens: vec![
+                SyntaxDefinition::RequiredToken(SyntaxKind::Alter),
+                SyntaxDefinition::AnyTokens,
+                SyntaxDefinition::RequiredToken(SyntaxKind::Owner),
+                SyntaxDefinition::RequiredToken(SyntaxKind::To),
+                SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
+            ],
+        });
+
+        // ALTER AGGREGATE alt_func1(int) SET SCHEMA alt_nsp2;
+        m.push(StatementDefinition {
+            stmt: SyntaxKind::AlterObjectSchemaStmt,
+            tokens: vec![
+                SyntaxDefinition::RequiredToken(SyntaxKind::Alter),
+                SyntaxDefinition::AnyTokens,
+                SyntaxDefinition::RequiredToken(SyntaxKind::Set),
+                SyntaxDefinition::RequiredToken(SyntaxKind::Schema),
+                SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
+            ],
+        });
+
+        m.push(StatementDefinition {
+            stmt: SyntaxKind::CreatePlangStmt,
+            tokens: vec![
+                SyntaxDefinition::RequiredToken(SyntaxKind::Create),
+                SyntaxDefinition::OptionalToken(SyntaxKind::Or),
+                SyntaxDefinition::OptionalToken(SyntaxKind::Replace),
+                SyntaxDefinition::OptionalToken(SyntaxKind::Trusted),
+                SyntaxDefinition::OptionalToken(SyntaxKind::Procedural),
+                SyntaxDefinition::RequiredToken(SyntaxKind::Language),
+                SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
+            ],
+        });
+
+        m.push(StatementDefinition {
+            stmt: SyntaxKind::CreateStatsStmt,
+            tokens: vec![
+                SyntaxDefinition::RequiredToken(SyntaxKind::Create),
+                SyntaxDefinition::RequiredToken(SyntaxKind::Statistics),
+                SyntaxDefinition::AnyTokens,
+                SyntaxDefinition::RequiredToken(SyntaxKind::On),
+                SyntaxDefinition::AnyTokens,
+                SyntaxDefinition::RequiredToken(SyntaxKind::From),
+                SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
+            ],
+        });
+
         let mut stmt_starts: HashMap<SyntaxKind, Vec<StatementDefinition>> = HashMap::new();
 
         for stmt in m {
diff --git a/crates/pg_statement_splitter/src/statement_splitter.rs b/crates/pg_statement_splitter/src/statement_splitter.rs
index 660cdb07..23366231 100644
--- a/crates/pg_statement_splitter/src/statement_splitter.rs
+++ b/crates/pg_statement_splitter/src/statement_splitter.rs
@@ -112,6 +112,16 @@ impl<'a> StatementSplitter<'a> {
                         .any(|s| s.could_be_complete()))
             {
                 if let Some(stmts) = STATEMENT_DEFINITIONS.get(&at_token.kind) {
+                    println!(
+                        "adding stmts: {:?}, completed are {:?}",
+                        stmts.iter().map(|s| s.stmt).collect::<Vec<_>>(),
+                        self.tracked_statements
+                            .iter()
+                            .filter(|s| s.could_be_complete())
+                            .map(|s| s.def.stmt)
+                            .collect::<Vec<_>>()
+                    );
+
                     self.tracked_statements.append(
                         &mut stmts
                             .iter()
@@ -408,7 +418,7 @@ impl<'a> StatementSplitter<'a> {
 
 #[cfg(test)]
 mod tests {
-    use pg_lexer::SyntaxKind;
+    use pg_lexer::{lex, SyntaxKind};
 
     use crate::statement_splitter::StatementSplitter;
 
@@ -695,4 +705,479 @@ DROP ROLE IF EXISTS regress_alter_generic_user1;";
         assert_eq!("create", input[result[0].range].to_string());
         assert_eq!(SyntaxKind::Any, result[0].kind);
     }
+
+    #[test]
+    fn test_reset() {
+        let input = "
+DROP ROLE IF EXISTS regress_alter_generic_user3;
+
+RESET client_min_messages;
+
+CREATE USER regress_alter_generic_user3;
+";
+
+        let result = StatementSplitter::new(input).run();
+
+        assert_eq!(result.len(), 3);
+        assert_eq!(SyntaxKind::DropRoleStmt, result[0].kind);
+        assert_eq!(SyntaxKind::VariableSetStmt, result[1].kind);
+        assert_eq!(SyntaxKind::CreateRoleStmt, result[2].kind);
+    }
+
+    #[test]
+    fn test_grant_and_set_session_auth() {
+        let input = "
+CREATE SCHEMA alt_nsp2;
+
+GRANT ALL ON SCHEMA alt_nsp1, alt_nsp2 TO public;
+
+SET search_path = alt_nsp1, public;
+
+SET SESSION AUTHORIZATION regress_alter_generic_user1;
+";
+
+        let result = StatementSplitter::new(input).run();
+
+        assert_eq!(result.len(), 4);
+        assert_eq!(SyntaxKind::CreateSchemaStmt, result[0].kind);
+        assert_eq!(SyntaxKind::GrantStmt, result[1].kind);
+        assert_eq!(SyntaxKind::VariableSetStmt, result[2].kind);
+        assert_eq!(SyntaxKind::VariableSetStmt, result[3].kind);
+    }
+
+    #[test]
+    fn test_create_fn_and_agg() {
+        let input = "
+CREATE FUNCTION alt_func1(int) RETURNS int LANGUAGE sql
+  AS 'SELECT $1 + 1';
+CREATE FUNCTION alt_func2(int) RETURNS int LANGUAGE sql
+  AS 'SELECT $1 - 1';
+CREATE AGGREGATE alt_agg1 (
+  sfunc1 = int4pl, basetype = int4, stype1 = int4, initcond = 0
+);
+CREATE AGGREGATE alt_agg2 (
+  sfunc1 = int4mi, basetype = int4, stype1 = int4, initcond = 0
+);
+";
+        let result = StatementSplitter::new(input).run();
+
+        assert_eq!(result.len(), 4);
+        assert_eq!(SyntaxKind::CreateFunctionStmt, result[0].kind);
+        assert_eq!(SyntaxKind::CreateFunctionStmt, result[1].kind);
+        assert_eq!(SyntaxKind::DefineStmt, result[2].kind);
+        assert_eq!(SyntaxKind::DefineStmt, result[3].kind);
+    }
+
+    #[test]
+    fn test_create_alter_agg() {
+        let input = "
+CREATE AGGREGATE alt_agg2 (
+  sfunc1 = int4mi, basetype = int4, stype1 = int4, initcond = 0
+);
+ALTER AGGREGATE alt_func1(int) RENAME TO alt_func3;
+ALTER AGGREGATE alt_func1(int) OWNER TO regress_alter_generic_user3;
+ALTER AGGREGATE alt_func1(int) SET SCHEMA alt_nsp2;
+";
+        let result = StatementSplitter::new(input).run();
+
+        assert_eq!(result.len(), 4);
+        assert_eq!(SyntaxKind::DefineStmt, result[0].kind);
+        assert_eq!(SyntaxKind::RenameStmt, result[1].kind);
+        assert_eq!(SyntaxKind::AlterOwnerStmt, result[2].kind);
+        assert_eq!(SyntaxKind::AlterObjectSchemaStmt, result[3].kind);
+    }
+
+    #[test]
+    fn test_reset_session() {
+        let input = "
+ALTER AGGREGATE alt_agg2(int) SET SCHEMA alt_nsp2;
+
+RESET SESSION AUTHORIZATION;
+";
+        let result = StatementSplitter::new(input).run();
+
+        assert_eq!(result.len(), 2);
+        assert_eq!(SyntaxKind::AlterObjectSchemaStmt, result[0].kind);
+        assert_eq!(SyntaxKind::VariableSetStmt, result[1].kind);
+    }
+
+    #[test]
+    fn test_rename_fdw() {
+        let input = "
+CREATE SERVER alt_fserv2 FOREIGN DATA WRAPPER alt_fdw2;
+
+ALTER FOREIGN DATA WRAPPER alt_fdw1 RENAME TO alt_fdw2;
+ALTER FOREIGN DATA WRAPPER alt_fdw1 RENAME TO alt_fdw3;
+";
+
+        let result = StatementSplitter::new(input).run();
+
+        assert_eq!(result.len(), 3);
+        assert_eq!(SyntaxKind::CreateForeignServerStmt, result[0].kind);
+        assert_eq!(SyntaxKind::RenameStmt, result[1].kind);
+        assert_eq!(SyntaxKind::RenameStmt, result[2].kind);
+    }
+
+    #[test]
+    fn test_ops() {
+        let input = "
+ALTER OPERATOR FAMILY alt_opf4 USING btree DROP
+  -- int4 vs int2
+  OPERATOR 1 (int4, int2) ,
+  OPERATOR 2 (int4, int2) ,
+  OPERATOR 3 (int4, int2) ,
+  OPERATOR 4 (int4, int2) ,
+  OPERATOR 5 (int4, int2) ,
+  FUNCTION 1 (int4, int2) ;
+DROP OPERATOR FAMILY alt_opf4 USING btree;
+";
+
+        let result = StatementSplitter::new(input).run();
+
+        assert_eq!(result.len(), 2);
+        assert_eq!(SyntaxKind::AlterOpFamilyStmt, result[0].kind);
+        assert_eq!(SyntaxKind::DropStmt, result[1].kind);
+    }
+
+    #[test]
+    fn test_temp_table() {
+        let input = "
+CREATE TEMP TABLE foo (f1 int, f2 int, f3 int, f4 int);
+
+CREATE INDEX fooindex ON foo (f1 desc, f2 asc, f3 nulls first, f4 nulls last);
+";
+
+        let result = StatementSplitter::new(input).run();
+
+        assert_eq!(result.len(), 2);
+        assert_eq!(SyntaxKind::CreateStmt, result[0].kind);
+        assert_eq!(SyntaxKind::IndexStmt, result[1].kind);
+    }
+
+    #[test]
+    fn test_create_table_as() {
+        let input = "
+CREATE TEMP TABLE point_tbl AS SELECT * FROM public.point_tbl;
+";
+        let result = StatementSplitter::new(input).run();
+
+        assert_eq!(result.len(), 1);
+        assert_eq!(SyntaxKind::CreateTableAsStmt, result[0].kind);
+    }
+
+    #[test]
+    fn test_analyze() {
+        let input = "
+ANALYZE array_op_test;
+INSERT INTO arrtest (a[1:5], b[1:1][1:2][1:2], c, d, f, g)
+   VALUES ('{1,2,3,4,5}', '{{{0,0},{1,2}}}', '{}', '{}', '{}', '{}');
+";
+        let result = StatementSplitter::new(input).run();
+
+        assert_eq!(result.len(), 2);
+        assert_eq!(SyntaxKind::VacuumStmt, result[0].kind);
+        assert_eq!(SyntaxKind::InsertStmt, result[1].kind);
+    }
+
+    #[test]
+    fn test_drop_operator() {
+        let input = "
+DROP OPERATOR === (boolean, boolean);
+";
+
+        let result = StatementSplitter::new(input).run();
+
+        assert_eq!(result.len(), 1);
+        assert_eq!(SyntaxKind::DropStmt, result[0].kind);
+    }
+
+    #[test]
+    fn test_language() {
+        let input = "
+CREATE LANGUAGE alt_lang1 HANDLER plpgsql_call_handler;
+CREATE LANGUAGE alt_lang2 HANDLER plpgsql_call_handler;
+
+ALTER LANGUAGE alt_lang1 OWNER TO regress_alter_generic_user1;
+ALTER LANGUAGE alt_lang2 OWNER TO regress_alter_generic_user2;
+";
+
+        let result = StatementSplitter::new(input).run();
+
+        assert_eq!(result.len(), 4);
+        assert_eq!(SyntaxKind::CreatePlangStmt, result[0].kind);
+        assert_eq!(SyntaxKind::CreatePlangStmt, result[1].kind);
+        assert_eq!(SyntaxKind::AlterOwnerStmt, result[2].kind);
+        assert_eq!(SyntaxKind::AlterOwnerStmt, result[3].kind);
+    }
+
+    #[test]
+    fn test_alter_op_family() {
+        let input = "
+ALTER OPERATOR FAMILY alt_opf1 USING hash OWNER TO regress_alter_generic_user1;
+";
+
+        let result = StatementSplitter::new(input).run();
+
+        assert_eq!(result.len(), 1);
+        assert_eq!(SyntaxKind::AlterOwnerStmt, result[0].kind);
+    }
+
+    #[test]
+    fn test_drop_op_family() {
+        let input = "
+DROP OPERATOR FAMILY alt_opf4 USING btree;
+";
+
+        let result = StatementSplitter::new(input).run();
+
+        assert_eq!(result.len(), 1);
+        assert_eq!(SyntaxKind::DropStmt, result[0].kind);
+    }
+
+    #[test]
+    fn test_set_role() {
+        let input = "
+SET ROLE regress_alter_generic_user5;
+";
+
+        let result = StatementSplitter::new(input).run();
+
+        assert_eq!(result.len(), 1);
+        assert_eq!(SyntaxKind::VariableSetStmt, result[0].kind);
+    }
+
+    #[test]
+    fn test_revoke() {
+        let input = "
+CREATE ROLE regress_alter_generic_user6;
+CREATE SCHEMA alt_nsp6;
+REVOKE ALL ON SCHEMA alt_nsp6 FROM regress_alter_generic_user6;
+CREATE OPERATOR FAMILY alt_nsp6.alt_opf6 USING btree;
+SET ROLE regress_alter_generic_user6;
+ALTER OPERATOR FAMILY alt_nsp6.alt_opf6 USING btree ADD OPERATOR 1 < (int4, int2);
+";
+
+        let result = StatementSplitter::new(input).run();
+
+        assert_eq!(result.len(), 6);
+        assert_eq!(SyntaxKind::CreateRoleStmt, result[0].kind);
+        assert_eq!(SyntaxKind::CreateSchemaStmt, result[1].kind);
+        assert_eq!(SyntaxKind::GrantStmt, result[2].kind);
+        assert_eq!(SyntaxKind::CreateOpFamilyStmt, result[3].kind);
+        assert_eq!(SyntaxKind::VariableSetStmt, result[4].kind);
+        assert_eq!(SyntaxKind::AlterOpFamilyStmt, result[5].kind);
+    }
+
+    #[test]
+    fn test_alter_op_family_2() {
+        let input = "
+CREATE OPERATOR FAMILY alt_opf4 USING btree;
+ALTER OPERATOR FAMILY schema.alt_opf4 USING btree ADD
+  -- int4 vs int2
+  OPERATOR 1 < (int4, int2) ,
+  OPERATOR 2 <= (int4, int2) ,
+  OPERATOR 3 = (int4, int2) ,
+  OPERATOR 4 >= (int4, int2) ,
+  OPERATOR 5 > (int4, int2) ,
+  FUNCTION 1 btint42cmp(int4, int2);
+";
+
+        let result = StatementSplitter::new(input).run();
+
+        assert_eq!(result.len(), 2);
+        assert_eq!(SyntaxKind::CreateOpFamilyStmt, result[0].kind);
+        assert_eq!(SyntaxKind::AlterOpFamilyStmt, result[1].kind);
+    }
+
+    #[test]
+    fn test_create_stat() {
+        let input = "
+CREATE STATISTICS alt_stat1 ON a, b FROM alt_regress_1;
+";
+
+        let result = StatementSplitter::new(input).run();
+
+        assert_eq!(result.len(), 1);
+        assert_eq!(SyntaxKind::CreateStatsStmt, result[0].kind);
+    }
+
+    #[test]
+    fn test_create_text_search_dictionary() {
+        let input = "
+CREATE TEXT SEARCH DICTIONARY alt_ts_dict1 (template=simple);
+";
+
+        let result = StatementSplitter::new(input).run();
+
+        assert_eq!(result.len(), 1);
+        assert_eq!(SyntaxKind::DefineStmt, result[0].kind);
+    }
+
+    #[test]
+    fn test_create_text_search_configuration() {
+        let input = "
+CREATE TEXT SEARCH CONFIGURATION alt_ts_conf1 (copy=english);
+";
+
+        let result = StatementSplitter::new(input).run();
+
+        assert_eq!(result.len(), 1);
+        assert_eq!(SyntaxKind::DefineStmt, result[0].kind);
+    }
+
+    #[test]
+    fn test_alter_operator() {
+        let input = "
+ALTER OPERATOR === (boolean, boolean) SET (RESTRICT = NONE);
+";
+
+        let result = StatementSplitter::new(input).run();
+
+        assert_eq!(result.len(), 1);
+        assert_eq!(SyntaxKind::AlterOperatorStmt, result[0].kind);
+    }
+
+    #[test]
+    fn test_drop_fdw() {
+        let input = "
+DROP FOREIGN DATA WRAPPER alt_fdw2 CASCADE;
+";
+
+        let result = StatementSplitter::new(input).run();
+
+        assert_eq!(result.len(), 1);
+        assert_eq!(SyntaxKind::DropStmt, result[0].kind);
+    }
+
+    #[test]
+    fn test_insert_select() {
+        let input = "
+insert into src select string_agg(random()::text,'') from generate_series(1,10000);
+";
+
+        let result = StatementSplitter::new(input).run();
+
+        assert_eq!(result.len(), 1);
+        assert_eq!(SyntaxKind::InsertStmt, result[0].kind);
+    }
+
+    #[test]
+    fn test_on_conflict() {
+        let input = "
+insert into arr_pk_tbl values (1, '{3,4,5}') on conflict (pk)\n  do update set f1[1] = excluded.f1[1], f1[3] = excluded.f1[3]\n  returning pk, f1;
+";
+
+        let result = StatementSplitter::new(input).run();
+
+        assert_eq!(result.len(), 1);
+        assert_eq!(SyntaxKind::InsertStmt, result[0].kind);
+    }
+
+    #[test]
+    fn test_alter_index() {
+        let input = "
+ALTER INDEX btree_tall_idx2 ALTER COLUMN id SET (n_distinct=100);
+";
+
+        let result = StatementSplitter::new(input).run();
+
+        assert_eq!(result.len(), 1);
+        assert_eq!(SyntaxKind::AlterTableStmt, result[0].kind);
+    }
+
+    #[test]
+    fn test_update_set() {
+        let input = "
+UPDATE CASE_TBL\n  SET i = CASE WHEN i >= 3 THEN (- i)\n                ELSE (2 * i) END;
+";
+
+        let result = StatementSplitter::new(input).run();
+
+        assert_eq!(result.len(), 1);
+        assert_eq!(SyntaxKind::UpdateStmt, result[0].kind);
+    }
+
+    #[test]
+    fn test_savepoint() {
+        let input = "
+SAVEPOINT s1;
+";
+
+        let result = StatementSplitter::new(input).run();
+
+        assert_eq!(result.len(), 1);
+        assert_eq!(SyntaxKind::TransactionStmt, result[0].kind);
+    }
+
+    #[test]
+    fn test_declare_cursor() {
+        let input = "
+DECLARE c CURSOR FOR SELECT ctid,cmin,* FROM combocidtest;
+";
+
+        let result = StatementSplitter::new(input).run();
+
+        assert_eq!(result.len(), 1);
+        assert_eq!(SyntaxKind::DeclareCursorStmt, result[0].kind);
+    }
+
+    #[test]
+    fn test_create_empty_table() {
+        let input = "
+CREATE TABLE IF NOT EXISTS testcase(
+);
+";
+
+        let result = StatementSplitter::new(input).run();
+
+        assert_eq!(result.len(), 1);
+        assert_eq!(SyntaxKind::CreateStmt, result[0].kind);
+    }
+
+    #[test]
+    fn test_rollback_to() {
+        let input = "
+ROLLBACK TO SAVEPOINT subxact;
+";
+
+        let result = StatementSplitter::new(input).run();
+
+        assert_eq!(result.len(), 1);
+        assert_eq!(SyntaxKind::TransactionStmt, result[0].kind);
+    }
+
+    #[allow(clippy::must_use)]
+    fn debug(input: &str) {
+        for s in input.split(';').filter_map(|s| {
+            if s.trim().is_empty() {
+                None
+            } else {
+                Some(s.trim())
+            }
+        }) {
+            println!("Statement: '{:?}'", s);
+
+            let res = pg_query::parse(s)
+                .map(|parsed| {
+                    parsed
+                        .protobuf
+                        .nodes()
+                        .iter()
+                        .find(|n| n.1 == 1)
+                        .unwrap()
+                        .0
+                        .to_enum()
+                })
+                .unwrap();
+            println!("Result: {:?}", res);
+        }
+
+        let result = StatementSplitter::new(input).run();
+
+        for r in &result {
+            println!("{:?} {:?}", r.kind, input[r.range].to_string());
+        }
+
+        assert!(false);
+    }
 }
diff --git a/crates/pg_statement_splitter/tests/skipped.txt b/crates/pg_statement_splitter/tests/skipped.txt
index 5c6c8e56..2fd6333b 100644
--- a/crates/pg_statement_splitter/tests/skipped.txt
+++ b/crates/pg_statement_splitter/tests/skipped.txt
@@ -11,3 +11,4 @@ replica_identity
 unicode
 xmlmap
 aggregates
+comments
diff --git a/crates/pg_statement_splitter/tests/statement_splitter_tests.rs b/crates/pg_statement_splitter/tests/statement_splitter_tests.rs
index e1f74731..8aa3b4c9 100644
--- a/crates/pg_statement_splitter/tests/statement_splitter_tests.rs
+++ b/crates/pg_statement_splitter/tests/statement_splitter_tests.rs
@@ -9,101 +9,127 @@ const SKIPPED_REGRESS_TESTS: &str = include_str!("skipped.txt");
 
 const SNAPSHOTS_PATH: &str = "snapshots/data";
 
-// #[test]
-// fn test_postgres_regress() {
-//     // all postgres regress tests are valid and complete statements, so we can use `split_with_parser` and compare with our own splitter
-//
-//     let mut paths: Vec<_> = fs::read_dir(POSTGRES_REGRESS_PATH)
-//         .unwrap()
-//         .map(|r| r.unwrap())
-//         .collect();
-//     paths.sort_by_key(|dir| dir.path());
-//
-//     for f in paths.iter() {
-//         let path = f.path();
-//
-//         let test_name = path.file_stem().unwrap().to_str().unwrap();
-//
-//         // these require fixes in the parser
-//         if SKIPPED_REGRESS_TESTS
-//             .lines()
-//             .collect::<Vec<_>>()
-//             .contains(&test_name)
-//         {
-//             continue;
-//         }
-//
-//         println!("Running test: {}", test_name);
-//
-//         // remove \commands because pg_query doesn't support them
-//         let contents = fs::read_to_string(&path)
-//             .unwrap()
-//             .lines()
-//             .filter(|l| {
-//                 !l.starts_with("\\")
-//                     && !l.ends_with("\\gset")
-//                     && !l.starts_with("--")
-//                     && !l.contains(":'")
-//                     && l.split("\t").count() <= 2
-//             })
-//             .collect::<Vec<_>>()
-//             .join("\n");
-//
-//         let libpg_query_split = pg_query::split_with_parser(&contents).expect("Failed to split");
-//
-//         let split = pg_statement_splitter::statements(&contents);
-//
-//         // assert_eq!(
-//         //     libpg_query_split.len(),
-//         //     split.len(),
-//         //     "[{}] Mismatch in statement count: Expected {} statements, got {}. Contents:\n{}",
-//         //     test_name,
-//         //     libpg_query_split.len(),
-//         //     split.len(),
-//         //     contents
-//         // );
-//
-//         for (libpg_query_stmt, parser_result) in libpg_query_split.iter().zip(split.iter()) {
-//             let parser_stmt = &contents[parser_result.range.clone()].trim();
-//
-//             let libpg_query_stmt = if libpg_query_stmt.ends_with(';') {
-//                 libpg_query_stmt.to_string()
-//             } else {
-//                 format!("{};", libpg_query_stmt.trim())
-//             };
-//
-//             let libpg_query_stmt_trimmed = libpg_query_stmt.trim();
-//             let parser_stmt_trimmed = parser_stmt.trim();
-//
-//             assert_eq!(
-//                 libpg_query_stmt_trimmed, parser_stmt_trimmed,
-//                 "[{}] Mismatch in statement:\nlibg_query: '{}'\nsplitter:   '{}'",
-//                 test_name, libpg_query_stmt_trimmed, parser_stmt_trimmed
-//             );
-//
-//             let root = pg_query::parse(libpg_query_stmt_trimmed).map(|parsed| {
-//                 parsed
-//                     .protobuf
-//                     .nodes()
-//                     .iter()
-//                     .find(|n| n.1 == 1)
-//                     .unwrap()
-//                     .0
-//                     .to_enum()
-//             });
-//
-//             let syntax_kind = SyntaxKind::from(&root.expect("Failed to parse statement"));
-//
-//             assert_eq!(
-//                 syntax_kind, parser_result.kind,
-//                 "[{}] Mismatch in statement type. Expected {:?}, got {:?}",
-//                 test_name, parser_result.kind, syntax_kind
-//             );
-//
-//             println!("[{}] Matched {}", test_name, parser_stmt_trimmed);
-//         }
-//     }
-// }
+#[test]
+fn test_postgres_regress() {
+    // all postgres regress tests are valid and complete statements, so we can use `split_with_parser` and compare with our own splitter
+
+    let mut paths: Vec<_> = fs::read_dir(POSTGRES_REGRESS_PATH)
+        .unwrap()
+        .map(|r| r.unwrap())
+        .collect();
+    paths.sort_by_key(|dir| dir.path());
+
+    for f in paths.iter() {
+        let path = f.path();
+
+        let test_name = path.file_stem().unwrap().to_str().unwrap();
+
+        // these require fixes in the parser
+        if SKIPPED_REGRESS_TESTS
+            .lines()
+            .collect::<Vec<_>>()
+            .contains(&test_name)
+        {
+            continue;
+        }
+
+        println!("Running test: {}", test_name);
+
+        // remove \commands because pg_query doesn't support them
+        let contents = fs::read_to_string(&path)
+            .unwrap()
+            .lines()
+            .filter_map(|l| {
+                if !l.starts_with("\\")
+                    && !l.ends_with("\\gset")
+                    && !l.starts_with("--")
+                    && !l.contains(":'")
+                    && l.split("\t").count() <= 1
+                    && l != "ALTER INDEX attmp_idx ALTER COLUMN 0 SET STATISTICS 1000;"
+                {
+                    if let Some(index) = l.find("--") {
+                        Some(l[..index].to_string())
+                    } else {
+                        Some(l.to_string())
+                    }
+                } else {
+                    None
+                }
+            })
+            .collect::<Vec<_>>()
+            .join("\n");
+
+        let libpg_query_split_result = pg_query::split_with_parser(&contents);
+
+        if libpg_query_split_result.is_err() {
+            eprintln!(
+                "Failed to split statements for test '{}': {:?}",
+                test_name, libpg_query_split_result
+            );
+            continue;
+        }
+
+        let libpg_query_split = libpg_query_split_result.unwrap();
+
+        let split = pg_statement_splitter::statements(&contents);
+
+        // assert_eq!(
+        //     libpg_query_split.len(),
+        //     split.len(),
+        //     "[{}] Mismatch in statement count: Expected {} statements, got {}. Contents:\n{}",
+        //     test_name,
+        //     libpg_query_split.len(),
+        //     split.len(),
+        //     contents
+        // );
+
+        for (libpg_query_stmt, parser_result) in libpg_query_split.iter().zip(split.iter()) {
+            let mut parser_stmt = contents[parser_result.range.clone()].trim().to_string();
+
+            if parser_stmt.ends_with(';') {
+                let mut s = parser_stmt.chars().rev().skip(1).collect::<String>();
+                s = s.chars().rev().collect();
+                parser_stmt = format!("{}{}", s.trim(), ";");
+            }
+
+            let libpg_query_stmt = if libpg_query_stmt.ends_with(';') {
+                libpg_query_stmt.to_string()
+            } else {
+                format!("{};", libpg_query_stmt.trim())
+            };
+
+            let libpg_query_stmt_trimmed = libpg_query_stmt.trim();
+            let parser_stmt_trimmed = parser_stmt.trim();
+
+            assert_eq!(
+                libpg_query_stmt_trimmed, parser_stmt_trimmed,
+                "[{}] Mismatch in statement:\nlibg_query: '{}'\nsplitter:   '{}'",
+                test_name, libpg_query_stmt_trimmed, parser_stmt_trimmed
+            );
+
+            let root = pg_query::parse(libpg_query_stmt_trimmed).map(|parsed| {
+                parsed
+                    .protobuf
+                    .nodes()
+                    .iter()
+                    .find(|n| n.1 == 1)
+                    .unwrap()
+                    .0
+                    .to_enum()
+            });
+
+            let syntax_kind = SyntaxKind::from(&root.expect("Failed to parse statement"));
+
+            assert_eq!(
+                syntax_kind, parser_result.kind,
+                "[{}] Mismatch in statement type. Expected {:?}, got {:?} for statement '{}'",
+                test_name, syntax_kind, parser_result.kind, parser_stmt_trimmed
+            );
+
+            println!("[{}] Matched {}", test_name, parser_stmt_trimmed);
+        }
+    }
+}
 
 #[test]
 fn test_statement_splitter() {

From e9639861078404888d66d341837a2f1dace9e04b Mon Sep 17 00:00:00 2001
From: psteinroe <philipp@steinroetter.com>
Date: Wed, 21 Aug 2024 14:19:56 +0200
Subject: [PATCH 07/19] fix: save

---
 crates/pg_statement_splitter/src/data.rs      | 378 ++++++++++++++++--
 crates/pg_statement_splitter/src/parser.rs    |   3 +
 .../src/statement_splitter.rs                 | 126 +++++-
 .../pg_statement_splitter/tests/skipped.txt   |   3 +
 .../tests/statement_splitter_tests.rs         |  34 +-
 5 files changed, 495 insertions(+), 49 deletions(-)

diff --git a/crates/pg_statement_splitter/src/data.rs b/crates/pg_statement_splitter/src/data.rs
index f494f689..d7219a56 100644
--- a/crates/pg_statement_splitter/src/data.rs
+++ b/crates/pg_statement_splitter/src/data.rs
@@ -16,6 +16,20 @@ pub struct StatementDefinition {
     pub tokens: Vec<SyntaxDefinition>,
 }
 
+// in some edge cases such as create rule ... do also delete ... its close to
+// impossible to make sure the delete statement is part of the create rule
+// statement. this is why we only start new statements if the previous token
+// was not one of a fixed set of tokens that can only be part of a statement
+//
+// FIXME: this is a workaround for the current limitations of the parser
+// FIXME2: find a better name :D
+pub const SPECIAL_TOKENS: [SyntaxKind; 4] = [
+    SyntaxKind::Do,
+    SyntaxKind::Also,
+    SyntaxKind::Instead,
+    SyntaxKind::As,
+];
+
 pub static STATEMENT_BRIDGE_DEFINITIONS: LazyLock<HashMap<SyntaxKind, Vec<StatementDefinition>>> =
     LazyLock::new(|| {
         let mut m: Vec<StatementDefinition> = Vec::new();
@@ -139,7 +153,12 @@ pub static STATEMENT_DEFINITIONS: LazyLock<HashMap<SyntaxKind, Vec<StatementDefi
             stmt: SyntaxKind::AlterTableStmt,
             tokens: vec![
                 SyntaxDefinition::RequiredToken(SyntaxKind::Alter),
-                SyntaxDefinition::OneOf(vec![SyntaxKind::Table, SyntaxKind::Index]),
+                SyntaxDefinition::OptionalToken(SyntaxKind::Materialized),
+                SyntaxDefinition::OneOf(vec![
+                    SyntaxKind::Table,
+                    SyntaxKind::Index,
+                    SyntaxKind::View,
+                ]),
                 SyntaxDefinition::OptionalToken(SyntaxKind::IfP),
                 SyntaxDefinition::OptionalToken(SyntaxKind::Exists),
                 SyntaxDefinition::OptionalToken(SyntaxKind::Only),
@@ -183,6 +202,17 @@ pub static STATEMENT_DEFINITIONS: LazyLock<HashMap<SyntaxKind, Vec<StatementDefi
             ],
         });
 
+        m.push(StatementDefinition {
+            stmt: SyntaxKind::CallStmt,
+            tokens: vec![
+                SyntaxDefinition::RequiredToken(SyntaxKind::Call),
+                SyntaxDefinition::OneOf(vec![SyntaxKind::Ident, SyntaxKind::VersionP]),
+                SyntaxDefinition::RequiredToken(SyntaxKind::Ascii40),
+                SyntaxDefinition::AnyTokens,
+                SyntaxDefinition::RequiredToken(SyntaxKind::Ascii41),
+            ],
+        });
+
         m.push(StatementDefinition {
             stmt: SyntaxKind::AlterDefaultPrivilegesStmt,
             tokens: vec![
@@ -225,10 +255,6 @@ pub static STATEMENT_DEFINITIONS: LazyLock<HashMap<SyntaxKind, Vec<StatementDefi
                 SyntaxDefinition::OptionalToken(SyntaxKind::Not),
                 SyntaxDefinition::OptionalToken(SyntaxKind::Exists),
                 SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
-                SyntaxDefinition::AnyTokens,
-                SyntaxDefinition::RequiredToken(SyntaxKind::Ascii40),
-                SyntaxDefinition::AnyTokens,
-                SyntaxDefinition::RequiredToken(SyntaxKind::Ascii41),
             ],
         });
 
@@ -257,6 +283,201 @@ pub static STATEMENT_DEFINITIONS: LazyLock<HashMap<SyntaxKind, Vec<StatementDefi
             ],
         });
 
+        m.push(StatementDefinition {
+            stmt: SyntaxKind::DropStmt,
+            tokens: vec![
+                SyntaxDefinition::RequiredToken(SyntaxKind::Drop),
+                SyntaxDefinition::RequiredToken(SyntaxKind::Operator),
+                SyntaxDefinition::RequiredToken(SyntaxKind::Class),
+                SyntaxDefinition::OptionalToken(SyntaxKind::IfP),
+                SyntaxDefinition::OptionalToken(SyntaxKind::Exists),
+                SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
+                SyntaxDefinition::RequiredToken(SyntaxKind::Using),
+                SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
+            ],
+        });
+
+        m.push(StatementDefinition {
+            stmt: SyntaxKind::DropStmt,
+            tokens: vec![
+                SyntaxDefinition::RequiredToken(SyntaxKind::Drop),
+                SyntaxDefinition::RequiredToken(SyntaxKind::Access),
+                SyntaxDefinition::RequiredToken(SyntaxKind::Method),
+                SyntaxDefinition::OptionalToken(SyntaxKind::IfP),
+                SyntaxDefinition::OptionalToken(SyntaxKind::Exists),
+                SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
+            ],
+        });
+
+        m.push(StatementDefinition {
+            stmt: SyntaxKind::DropStmt,
+            tokens: vec![
+                SyntaxDefinition::RequiredToken(SyntaxKind::Drop),
+                SyntaxDefinition::RequiredToken(SyntaxKind::Server),
+                SyntaxDefinition::OptionalToken(SyntaxKind::IfP),
+                SyntaxDefinition::OptionalToken(SyntaxKind::Exists),
+                SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
+            ],
+        });
+
+        m.push(StatementDefinition {
+            stmt: SyntaxKind::DropStmt,
+            tokens: vec![
+                SyntaxDefinition::RequiredToken(SyntaxKind::Drop),
+                SyntaxDefinition::RequiredToken(SyntaxKind::Trigger),
+                SyntaxDefinition::OptionalToken(SyntaxKind::IfP),
+                SyntaxDefinition::OptionalToken(SyntaxKind::Exists),
+                SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
+                SyntaxDefinition::RequiredToken(SyntaxKind::On),
+                SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
+            ],
+        });
+
+        m.push(StatementDefinition {
+            stmt: SyntaxKind::DropStmt,
+            tokens: vec![
+                SyntaxDefinition::RequiredToken(SyntaxKind::Drop),
+                SyntaxDefinition::RequiredToken(SyntaxKind::Collation),
+                SyntaxDefinition::OptionalToken(SyntaxKind::IfP),
+                SyntaxDefinition::OptionalToken(SyntaxKind::Exists),
+                SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
+            ],
+        });
+
+        m.push(StatementDefinition {
+            stmt: SyntaxKind::DropStmt,
+            tokens: vec![
+                SyntaxDefinition::RequiredToken(SyntaxKind::Drop),
+                SyntaxDefinition::RequiredToken(SyntaxKind::ConversionP),
+                SyntaxDefinition::OptionalToken(SyntaxKind::IfP),
+                SyntaxDefinition::OptionalToken(SyntaxKind::Exists),
+                SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
+            ],
+        });
+
+        m.push(StatementDefinition {
+            stmt: SyntaxKind::DropStmt,
+            tokens: vec![
+                SyntaxDefinition::RequiredToken(SyntaxKind::Drop),
+                SyntaxDefinition::RequiredToken(SyntaxKind::TextP),
+                SyntaxDefinition::RequiredToken(SyntaxKind::Search),
+                SyntaxDefinition::RequiredToken(SyntaxKind::Parser),
+                SyntaxDefinition::OptionalToken(SyntaxKind::IfP),
+                SyntaxDefinition::OptionalToken(SyntaxKind::Exists),
+                SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
+            ],
+        });
+
+        m.push(StatementDefinition {
+            stmt: SyntaxKind::DropStmt,
+            tokens: vec![
+                SyntaxDefinition::RequiredToken(SyntaxKind::Drop),
+                SyntaxDefinition::RequiredToken(SyntaxKind::TextP),
+                SyntaxDefinition::RequiredToken(SyntaxKind::Search),
+                SyntaxDefinition::RequiredToken(SyntaxKind::Dictionary),
+                SyntaxDefinition::OptionalToken(SyntaxKind::IfP),
+                SyntaxDefinition::OptionalToken(SyntaxKind::Exists),
+                SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
+            ],
+        });
+
+        m.push(StatementDefinition {
+            stmt: SyntaxKind::DropStmt,
+            tokens: vec![
+                SyntaxDefinition::RequiredToken(SyntaxKind::Drop),
+                SyntaxDefinition::RequiredToken(SyntaxKind::TextP),
+                SyntaxDefinition::RequiredToken(SyntaxKind::Search),
+                SyntaxDefinition::RequiredToken(SyntaxKind::Template),
+                SyntaxDefinition::OptionalToken(SyntaxKind::IfP),
+                SyntaxDefinition::OptionalToken(SyntaxKind::Exists),
+                SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
+            ],
+        });
+
+        m.push(StatementDefinition {
+            stmt: SyntaxKind::DropStmt,
+            tokens: vec![
+                SyntaxDefinition::RequiredToken(SyntaxKind::Drop),
+                SyntaxDefinition::RequiredToken(SyntaxKind::TextP),
+                SyntaxDefinition::RequiredToken(SyntaxKind::Search),
+                SyntaxDefinition::RequiredToken(SyntaxKind::Configuration),
+                SyntaxDefinition::OptionalToken(SyntaxKind::IfP),
+                SyntaxDefinition::OptionalToken(SyntaxKind::Exists),
+                SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
+            ],
+        });
+
+        m.push(StatementDefinition {
+            stmt: SyntaxKind::DropStmt,
+            tokens: vec![
+                SyntaxDefinition::RequiredToken(SyntaxKind::Drop),
+                SyntaxDefinition::RequiredToken(SyntaxKind::Extension),
+                SyntaxDefinition::OptionalToken(SyntaxKind::IfP),
+                SyntaxDefinition::OptionalToken(SyntaxKind::Exists),
+                SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
+            ],
+        });
+
+        m.push(StatementDefinition {
+            stmt: SyntaxKind::DropStmt,
+            tokens: vec![
+                SyntaxDefinition::RequiredToken(SyntaxKind::Drop),
+                SyntaxDefinition::RequiredToken(SyntaxKind::Aggregate),
+                SyntaxDefinition::OptionalToken(SyntaxKind::IfP),
+                SyntaxDefinition::OptionalToken(SyntaxKind::Exists),
+                SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
+            ],
+        });
+
+        m.push(StatementDefinition {
+            stmt: SyntaxKind::DropStmt,
+            tokens: vec![
+                SyntaxDefinition::RequiredToken(SyntaxKind::Drop),
+                SyntaxDefinition::RequiredToken(SyntaxKind::DomainP),
+                SyntaxDefinition::OptionalToken(SyntaxKind::IfP),
+                SyntaxDefinition::OptionalToken(SyntaxKind::Exists),
+                SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
+            ],
+        });
+
+        m.push(StatementDefinition {
+            stmt: SyntaxKind::DropStmt,
+            tokens: vec![
+                SyntaxDefinition::RequiredToken(SyntaxKind::Drop),
+                SyntaxDefinition::RequiredToken(SyntaxKind::Sequence),
+                SyntaxDefinition::OptionalToken(SyntaxKind::IfP),
+                SyntaxDefinition::OptionalToken(SyntaxKind::Exists),
+                SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
+            ],
+        });
+
+        m.push(StatementDefinition {
+            stmt: SyntaxKind::DropStmt,
+            tokens: vec![
+                SyntaxDefinition::RequiredToken(SyntaxKind::Drop),
+                SyntaxDefinition::RequiredToken(SyntaxKind::Foreign),
+                SyntaxDefinition::RequiredToken(SyntaxKind::Table),
+                SyntaxDefinition::OptionalToken(SyntaxKind::IfP),
+                SyntaxDefinition::OptionalToken(SyntaxKind::Exists),
+                SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
+            ],
+        });
+
+        m.push(StatementDefinition {
+            stmt: SyntaxKind::DropStmt,
+            tokens: vec![
+                SyntaxDefinition::RequiredToken(SyntaxKind::Drop),
+                SyntaxDefinition::RequiredToken(SyntaxKind::Cast),
+                SyntaxDefinition::OptionalToken(SyntaxKind::IfP),
+                SyntaxDefinition::OptionalToken(SyntaxKind::Exists),
+                SyntaxDefinition::RequiredToken(SyntaxKind::Ascii40),
+                SyntaxDefinition::AnyTokens,
+                SyntaxDefinition::RequiredToken(SyntaxKind::As),
+                SyntaxDefinition::AnyTokens,
+                SyntaxDefinition::RequiredToken(SyntaxKind::Ascii41),
+            ],
+        });
+
         m.push(StatementDefinition {
             stmt: SyntaxKind::DropStmt,
             tokens: vec![
@@ -293,6 +514,19 @@ pub static STATEMENT_DEFINITIONS: LazyLock<HashMap<SyntaxKind, Vec<StatementDefi
             ],
         });
 
+        m.push(StatementDefinition {
+            stmt: SyntaxKind::DropStmt,
+            tokens: vec![
+                SyntaxDefinition::RequiredToken(SyntaxKind::Drop),
+                SyntaxDefinition::RequiredToken(SyntaxKind::Rule),
+                SyntaxDefinition::OptionalToken(SyntaxKind::IfP),
+                SyntaxDefinition::OptionalToken(SyntaxKind::Exists),
+                SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
+                SyntaxDefinition::RequiredToken(SyntaxKind::On),
+                SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
+            ],
+        });
+
         m.push(StatementDefinition {
             stmt: SyntaxKind::DropStmt,
             tokens: vec![
@@ -318,6 +552,28 @@ pub static STATEMENT_DEFINITIONS: LazyLock<HashMap<SyntaxKind, Vec<StatementDefi
             ],
         });
 
+        m.push(StatementDefinition {
+            stmt: SyntaxKind::DropStmt,
+            tokens: vec![
+                SyntaxDefinition::RequiredToken(SyntaxKind::Drop),
+                SyntaxDefinition::RequiredToken(SyntaxKind::Routine),
+                SyntaxDefinition::OptionalToken(SyntaxKind::IfP),
+                SyntaxDefinition::OptionalToken(SyntaxKind::Exists),
+                SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
+            ],
+        });
+
+        m.push(StatementDefinition {
+            stmt: SyntaxKind::DropStmt,
+            tokens: vec![
+                SyntaxDefinition::RequiredToken(SyntaxKind::Drop),
+                SyntaxDefinition::RequiredToken(SyntaxKind::Procedure),
+                SyntaxDefinition::OptionalToken(SyntaxKind::IfP),
+                SyntaxDefinition::OptionalToken(SyntaxKind::Exists),
+                SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
+            ],
+        });
+
         m.push(StatementDefinition {
             stmt: SyntaxKind::DropStmt,
             tokens: vec![
@@ -343,6 +599,28 @@ pub static STATEMENT_DEFINITIONS: LazyLock<HashMap<SyntaxKind, Vec<StatementDefi
             ],
         });
 
+        m.push(StatementDefinition {
+            stmt: SyntaxKind::DropStmt,
+            tokens: vec![
+                SyntaxDefinition::RequiredToken(SyntaxKind::Drop),
+                SyntaxDefinition::RequiredToken(SyntaxKind::View),
+                SyntaxDefinition::OptionalToken(SyntaxKind::IfP),
+                SyntaxDefinition::OptionalToken(SyntaxKind::Exists),
+                SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
+            ],
+        });
+
+        m.push(StatementDefinition {
+            stmt: SyntaxKind::DropStmt,
+            tokens: vec![
+                SyntaxDefinition::RequiredToken(SyntaxKind::Drop),
+                SyntaxDefinition::RequiredToken(SyntaxKind::Language),
+                SyntaxDefinition::OptionalToken(SyntaxKind::IfP),
+                SyntaxDefinition::OptionalToken(SyntaxKind::Exists),
+                SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
+            ],
+        });
+
         m.push(StatementDefinition {
             stmt: SyntaxKind::DropStmt,
             tokens: vec![
@@ -541,8 +819,8 @@ pub static STATEMENT_DEFINITIONS: LazyLock<HashMap<SyntaxKind, Vec<StatementDefi
                 SyntaxDefinition::RequiredToken(SyntaxKind::Create),
                 SyntaxDefinition::OptionalToken(SyntaxKind::Or),
                 SyntaxDefinition::OptionalToken(SyntaxKind::Replace),
-                SyntaxDefinition::RequiredToken(SyntaxKind::Function),
-                SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
+                SyntaxDefinition::OneOf(vec![SyntaxKind::Function, SyntaxKind::Procedure]),
+                SyntaxDefinition::AnyTokens,
                 SyntaxDefinition::RequiredToken(SyntaxKind::Ascii40),
                 SyntaxDefinition::AnyTokens,
                 SyntaxDefinition::RequiredToken(SyntaxKind::Ascii41),
@@ -553,7 +831,7 @@ pub static STATEMENT_DEFINITIONS: LazyLock<HashMap<SyntaxKind, Vec<StatementDefi
             stmt: SyntaxKind::AlterFunctionStmt,
             tokens: vec![
                 SyntaxDefinition::RequiredToken(SyntaxKind::Alter),
-                SyntaxDefinition::RequiredToken(SyntaxKind::Function),
+                SyntaxDefinition::OneOf(vec![SyntaxKind::Function, SyntaxKind::Procedure]),
                 SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
             ],
         });
@@ -585,6 +863,8 @@ pub static STATEMENT_DEFINITIONS: LazyLock<HashMap<SyntaxKind, Vec<StatementDefi
                     SyntaxKind::DeleteP,
                 ]),
                 SyntaxDefinition::RequiredToken(SyntaxKind::To),
+                SyntaxDefinition::AnyTokens,
+                SyntaxDefinition::RequiredToken(SyntaxKind::Do),
             ],
         });
 
@@ -637,7 +917,19 @@ pub static STATEMENT_DEFINITIONS: LazyLock<HashMap<SyntaxKind, Vec<StatementDefi
 
         m.push(StatementDefinition {
             stmt: SyntaxKind::TransactionStmt,
-            tokens: vec![SyntaxDefinition::RequiredToken(SyntaxKind::BeginP)],
+            tokens: vec![
+                SyntaxDefinition::RequiredToken(SyntaxKind::BeginP),
+                // FIXME: without the ";", this would conflict with BEGIN ATOMIC
+                SyntaxDefinition::RequiredToken(SyntaxKind::Ascii59),
+            ],
+        });
+
+        m.push(StatementDefinition {
+            stmt: SyntaxKind::TransactionStmt,
+            tokens: vec![
+                SyntaxDefinition::RequiredToken(SyntaxKind::BeginP),
+                SyntaxDefinition::RequiredToken(SyntaxKind::Transaction),
+            ],
         });
 
         m.push(StatementDefinition {
@@ -721,6 +1013,27 @@ pub static STATEMENT_DEFINITIONS: LazyLock<HashMap<SyntaxKind, Vec<StatementDefi
             tokens: vec![SyntaxDefinition::RequiredToken(SyntaxKind::Vacuum)],
         });
 
+        m.push(StatementDefinition {
+            stmt: SyntaxKind::CreateTableAsStmt,
+            tokens: vec![
+                SyntaxDefinition::RequiredToken(SyntaxKind::Create),
+                SyntaxDefinition::OptionalToken(SyntaxKind::Global),
+                SyntaxDefinition::OptionalToken(SyntaxKind::Local),
+                SyntaxDefinition::OptionalToken(SyntaxKind::Temporary),
+                SyntaxDefinition::OptionalToken(SyntaxKind::Temp),
+                SyntaxDefinition::RequiredToken(SyntaxKind::Materialized),
+                SyntaxDefinition::RequiredToken(SyntaxKind::View),
+                SyntaxDefinition::OptionalToken(SyntaxKind::IfP),
+                SyntaxDefinition::OptionalToken(SyntaxKind::Not),
+                SyntaxDefinition::OptionalToken(SyntaxKind::Exists),
+                SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
+                SyntaxDefinition::AnyTokens,
+                SyntaxDefinition::RequiredToken(SyntaxKind::As),
+                SyntaxDefinition::OneOf(vec![SyntaxKind::With, SyntaxKind::Select]),
+                SyntaxDefinition::AnyToken,
+            ],
+        });
+
         m.push(StatementDefinition {
             stmt: SyntaxKind::CreateTableAsStmt,
             tokens: vec![
@@ -741,6 +1054,27 @@ pub static STATEMENT_DEFINITIONS: LazyLock<HashMap<SyntaxKind, Vec<StatementDefi
             ],
         });
 
+        m.push(StatementDefinition {
+            stmt: SyntaxKind::ViewStmt,
+            tokens: vec![
+                SyntaxDefinition::RequiredToken(SyntaxKind::Create),
+                SyntaxDefinition::OptionalToken(SyntaxKind::Or),
+                SyntaxDefinition::OptionalToken(SyntaxKind::Replace),
+                SyntaxDefinition::OptionalToken(SyntaxKind::Temporary),
+                SyntaxDefinition::OptionalToken(SyntaxKind::Temp),
+                SyntaxDefinition::OptionalToken(SyntaxKind::Recursive),
+                SyntaxDefinition::RequiredToken(SyntaxKind::View),
+                SyntaxDefinition::OptionalToken(SyntaxKind::IfP),
+                SyntaxDefinition::OptionalToken(SyntaxKind::Not),
+                SyntaxDefinition::OptionalToken(SyntaxKind::Exists),
+                SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
+                SyntaxDefinition::AnyTokens,
+                SyntaxDefinition::RequiredToken(SyntaxKind::As),
+                SyntaxDefinition::OneOf(vec![SyntaxKind::With, SyntaxKind::Select]),
+                SyntaxDefinition::AnyToken,
+            ],
+        });
+
         m.push(StatementDefinition {
             stmt: SyntaxKind::ExplainStmt,
             tokens: vec![
@@ -881,17 +1215,11 @@ pub static STATEMENT_DEFINITIONS: LazyLock<HashMap<SyntaxKind, Vec<StatementDefi
             stmt: SyntaxKind::CreateRoleStmt,
             tokens: vec![
                 SyntaxDefinition::RequiredToken(SyntaxKind::Create),
-                SyntaxDefinition::RequiredToken(SyntaxKind::Role),
-                SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
-            ],
-        });
-
-        // this is not a mistake - a create user statement is the same as a create role statement
-        m.push(StatementDefinition {
-            stmt: SyntaxKind::CreateRoleStmt,
-            tokens: vec![
-                SyntaxDefinition::RequiredToken(SyntaxKind::Create),
-                SyntaxDefinition::RequiredToken(SyntaxKind::User),
+                SyntaxDefinition::OneOf(vec![
+                    SyntaxKind::Role,
+                    SyntaxKind::GroupP,
+                    SyntaxKind::User,
+                ]),
                 SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
             ],
         });
@@ -909,7 +1237,11 @@ pub static STATEMENT_DEFINITIONS: LazyLock<HashMap<SyntaxKind, Vec<StatementDefi
             stmt: SyntaxKind::DropRoleStmt,
             tokens: vec![
                 SyntaxDefinition::RequiredToken(SyntaxKind::Drop),
-                SyntaxDefinition::OneOf(vec![SyntaxKind::Role, SyntaxKind::User]),
+                SyntaxDefinition::OneOf(vec![
+                    SyntaxKind::Role,
+                    SyntaxKind::User,
+                    SyntaxKind::GroupP,
+                ]),
                 SyntaxDefinition::OptionalToken(SyntaxKind::IfP),
                 SyntaxDefinition::OptionalToken(SyntaxKind::Exists),
                 SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
@@ -1019,9 +1351,9 @@ pub static STATEMENT_DEFINITIONS: LazyLock<HashMap<SyntaxKind, Vec<StatementDefi
                 SyntaxDefinition::RequiredToken(SyntaxKind::Create),
                 SyntaxDefinition::RequiredToken(SyntaxKind::Cast),
                 SyntaxDefinition::RequiredToken(SyntaxKind::Ascii40),
-                SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
+                SyntaxDefinition::AnyTokens,
                 SyntaxDefinition::RequiredToken(SyntaxKind::As),
-                SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
+                SyntaxDefinition::AnyTokens,
                 SyntaxDefinition::RequiredToken(SyntaxKind::Ascii41),
             ],
         });
diff --git a/crates/pg_statement_splitter/src/parser.rs b/crates/pg_statement_splitter/src/parser.rs
index fc22db83..f8de749b 100644
--- a/crates/pg_statement_splitter/src/parser.rs
+++ b/crates/pg_statement_splitter/src/parser.rs
@@ -135,6 +135,9 @@ impl Parser {
             let mut idx = 0;
             let mut non_whitespace_token_ctr = 0;
             loop {
+                if idx > self.pos {
+                    return None;
+                }
                 match self.tokens.get(self.pos - idx) {
                     Some(token) => {
                         if !WHITESPACE_TOKENS.contains(&token.kind) {
diff --git a/crates/pg_statement_splitter/src/statement_splitter.rs b/crates/pg_statement_splitter/src/statement_splitter.rs
index 23366231..1893a8a2 100644
--- a/crates/pg_statement_splitter/src/statement_splitter.rs
+++ b/crates/pg_statement_splitter/src/statement_splitter.rs
@@ -2,7 +2,7 @@ use pg_lexer::{SyntaxKind, WHITESPACE_TOKENS};
 use text_size::{TextRange, TextSize};
 
 use crate::{
-    data::{STATEMENT_BRIDGE_DEFINITIONS, STATEMENT_DEFINITIONS},
+    data::{SPECIAL_TOKENS, STATEMENT_BRIDGE_DEFINITIONS, STATEMENT_DEFINITIONS},
     parser::Parser,
     tracker::Tracker,
 };
@@ -13,6 +13,7 @@ pub(crate) struct StatementSplitter<'a> {
     active_bridges: Vec<Tracker<'a>>,
     sub_trx_depth: usize,
     sub_stmt_depth: usize,
+    is_within_atomic_block: bool,
 }
 
 #[derive(Debug)]
@@ -29,6 +30,7 @@ impl<'a> StatementSplitter<'a> {
             active_bridges: Vec::new(),
             sub_trx_depth: 0,
             sub_stmt_depth: 0,
+            is_within_atomic_block: false,
         }
     }
 
@@ -47,16 +49,23 @@ impl<'a> StatementSplitter<'a> {
             );
             // TODO rename vars and add helpers to make distinciton between pos and text pos clear
 
+            // TODO handle BEGIN ATOMIC ... END here
             if at_token.kind == SyntaxKind::BeginP {
                 // self.sub_trx_depth += 1;
             } else if at_token.kind == SyntaxKind::EndP {
                 // self.sub_trx_depth -= 1;
+
+                self.is_within_atomic_block = false;
             } else if at_token.kind == SyntaxKind::Ascii40 {
                 // "("
                 self.sub_stmt_depth += 1;
             } else if at_token.kind == SyntaxKind::Ascii41 {
                 // ")"
                 self.sub_stmt_depth -= 1;
+            } else if at_token.kind == SyntaxKind::Atomic
+                && self.parser.lookbehind(2, true).map(|t| t.kind) == Some(SyntaxKind::BeginP)
+            {
+                self.is_within_atomic_block = true;
             }
 
             let mut removed_items = Vec::new();
@@ -90,16 +99,12 @@ impl<'a> StatementSplitter<'a> {
                 });
             }
 
-            println!(
-                "tracked stmts after advance {:?}",
-                self.tracked_statements
-                    .iter()
-                    .map(|s| s.def.stmt)
-                    .collect::<Vec<_>>()
-            );
+            // we already moved, so we need to lookbehind 2
+            let lookbehind = self.parser.lookbehind(2, true);
 
             if self.sub_trx_depth == 0
-                && self.sub_stmt_depth == 0
+                && self.sub_stmt_depth == 0 && self.is_within_atomic_block == false
+                    && (lookbehind.is_none() || !SPECIAL_TOKENS.contains(&lookbehind.unwrap().kind))
                     // it onyl makes sense to start tracking new statements if at least one of the
                     // currently tracked statements could be complete. or if none are tracked yet.
                     // this is important for statements such as `explain select 1;` where `select 1`
@@ -157,7 +162,14 @@ impl<'a> StatementSplitter<'a> {
                     .collect::<Vec<_>>()
             );
 
-            if at_token.kind == SyntaxKind::Ascii59 {
+            // i didnt believe it myself at first, but there are statements where a ";" is valid
+            // within a sub statement, e.g.:
+            // "create rule qqq as on insert to copydml_test do instead (delete from copydml_test; delete from copydml_test);"
+            // so we need to check for sub statement depth here
+            if at_token.kind == SyntaxKind::Ascii59
+                && self.sub_stmt_depth == 0
+                && self.is_within_atomic_block == false
+            {
                 // ;
                 // get earliest statement
                 if let Some(earliest_complete_stmt_started_at) = self
@@ -1146,6 +1158,96 @@ ROLLBACK TO SAVEPOINT subxact;
         assert_eq!(SyntaxKind::TransactionStmt, result[0].kind);
     }
 
+    #[test]
+    fn test_rule_delete_from() {
+        let input = "
+create rule qqq as on insert to copydml_test do also delete from copydml_test;
+";
+
+        let result = StatementSplitter::new(input).run();
+
+        assert_eq!(result.len(), 1);
+        assert_eq!(SyntaxKind::RuleStmt, result[0].kind);
+    }
+
+    #[test]
+    fn test_create_cast() {
+        let input = "
+CREATE CAST (text AS casttesttype) WITHOUT FUNCTION;
+";
+
+        let result = StatementSplitter::new(input).run();
+
+        assert_eq!(result.len(), 1);
+        assert_eq!(SyntaxKind::CreateCastStmt, result[0].kind);
+    }
+
+    #[test]
+    fn test_begin_atomic() {
+        let input = "
+CREATE PROCEDURE ptest1s(x text)\nLANGUAGE SQL\nBEGIN ATOMIC\n  INSERT INTO cp_test VALUES (1, x);\nEND;\nselect 1;
+";
+
+        let result = StatementSplitter::new(input).run();
+
+        assert_eq!(result.len(), 2);
+        assert_eq!(SyntaxKind::CreateFunctionStmt, result[0].kind);
+        assert_eq!(SyntaxKind::SelectStmt, result[1].kind);
+    }
+
+    #[test]
+    fn test_drop_procedure() {
+        let input = "
+CREATE PROCEDURE ptest4b(INOUT b int, INOUT a int)
+LANGUAGE SQL
+AS $$
+CALL ptest4a(a, b)
+$$;
+
+DROP PROCEDURE ptest4a;
+
+CREATE OR REPLACE PROCEDURE ptest5(a int, b text, c int default 100)
+LANGUAGE SQL
+AS $$
+INSERT INTO cp_test VALUES(a, b)
+$$;
+";
+        let result = StatementSplitter::new(input).run();
+
+        assert_eq!(result.len(), 3);
+        assert_eq!(SyntaxKind::CreateFunctionStmt, result[0].kind);
+        assert_eq!(SyntaxKind::DropStmt, result[1].kind);
+        assert_eq!(SyntaxKind::CreateFunctionStmt, result[2].kind);
+    }
+
+    #[test]
+    fn test_call_version() {
+        let input = "
+CALL version();
+CALL sum(1);
+";
+        let result = StatementSplitter::new(input).run();
+
+        assert_eq!(result.len(), 2);
+        assert_eq!(SyntaxKind::CallStmt, result[0].kind);
+        assert_eq!(SyntaxKind::CallStmt, result[1].kind);
+    }
+
+    #[test]
+    fn test_drop_lang() {
+        let input = "
+DROP OPERATOR @#@ (int8, int8);
+DROP LANGUAGE test_language_exists;
+DROP LANGUAGE IF EXISTS test_language_exists;
+";
+        let result = StatementSplitter::new(input).run();
+
+        assert_eq!(result.len(), 3);
+        assert_eq!(SyntaxKind::DropStmt, result[0].kind);
+        assert_eq!(SyntaxKind::DropStmt, result[1].kind);
+        assert_eq!(SyntaxKind::DropStmt, result[2].kind);
+    }
+
     #[allow(clippy::must_use)]
     fn debug(input: &str) {
         for s in input.split(';').filter_map(|s| {
@@ -1178,6 +1280,10 @@ ROLLBACK TO SAVEPOINT subxact;
             println!("{:?} {:?}", r.kind, input[r.range].to_string());
         }
 
+        for t in lex(input) {
+            println!("{:?}", t.kind);
+        }
+
         assert!(false);
     }
 }
diff --git a/crates/pg_statement_splitter/tests/skipped.txt b/crates/pg_statement_splitter/tests/skipped.txt
index 2fd6333b..f62d2256 100644
--- a/crates/pg_statement_splitter/tests/skipped.txt
+++ b/crates/pg_statement_splitter/tests/skipped.txt
@@ -12,3 +12,6 @@ unicode
 xmlmap
 aggregates
 comments
+dependency
+drop_if_exists
+
diff --git a/crates/pg_statement_splitter/tests/statement_splitter_tests.rs b/crates/pg_statement_splitter/tests/statement_splitter_tests.rs
index 8aa3b4c9..429f18fd 100644
--- a/crates/pg_statement_splitter/tests/statement_splitter_tests.rs
+++ b/crates/pg_statement_splitter/tests/statement_splitter_tests.rs
@@ -101,29 +101,31 @@ fn test_postgres_regress() {
             let libpg_query_stmt_trimmed = libpg_query_stmt.trim();
             let parser_stmt_trimmed = parser_stmt.trim();
 
+            let root = pg_query::parse(libpg_query_stmt_trimmed)
+                .map(|parsed| {
+                    parsed
+                        .protobuf
+                        .nodes()
+                        .iter()
+                        .find(|n| n.1 == 1)
+                        .unwrap()
+                        .0
+                        .to_enum()
+                })
+                .expect("Failed to parse statement");
+
             assert_eq!(
                 libpg_query_stmt_trimmed, parser_stmt_trimmed,
-                "[{}] Mismatch in statement:\nlibg_query: '{}'\nsplitter:   '{}'",
-                test_name, libpg_query_stmt_trimmed, parser_stmt_trimmed
+                "[{}] Mismatch in statement:\nlibg_query: '{}'\nsplitter:   '{}'\n Root Node: {:?}",
+                test_name, libpg_query_stmt_trimmed, parser_stmt_trimmed, root
             );
 
-            let root = pg_query::parse(libpg_query_stmt_trimmed).map(|parsed| {
-                parsed
-                    .protobuf
-                    .nodes()
-                    .iter()
-                    .find(|n| n.1 == 1)
-                    .unwrap()
-                    .0
-                    .to_enum()
-            });
-
-            let syntax_kind = SyntaxKind::from(&root.expect("Failed to parse statement"));
+            let syntax_kind = SyntaxKind::from(&root);
 
             assert_eq!(
                 syntax_kind, parser_result.kind,
-                "[{}] Mismatch in statement type. Expected {:?}, got {:?} for statement '{}'",
-                test_name, syntax_kind, parser_result.kind, parser_stmt_trimmed
+                "[{}] Mismatch in statement type. Expected {:?}, got {:?} for statement '{}'. Root Node: {:?}",
+                test_name, syntax_kind, parser_result.kind, parser_stmt_trimmed, root
             );
 
             println!("[{}] Matched {}", test_name, parser_stmt_trimmed);

From bf90bf188ad2c93d6a0254f5f22b87299bc3a0af Mon Sep 17 00:00:00 2001
From: psteinroe <philipp@steinroetter.com>
Date: Wed, 21 Aug 2024 19:28:26 +0200
Subject: [PATCH 08/19] refactor: declaration semantic and tracker

---
 crates/pg_statement_splitter/src/data.rs      | 3681 +++++++++--------
 .../src/statement_splitter.rs                 |   64 +-
 crates/pg_statement_splitter/src/tracker.rs   |  222 +-
 3 files changed, 2079 insertions(+), 1888 deletions(-)

diff --git a/crates/pg_statement_splitter/src/data.rs b/crates/pg_statement_splitter/src/data.rs
index d7219a56..f3d01c39 100644
--- a/crates/pg_statement_splitter/src/data.rs
+++ b/crates/pg_statement_splitter/src/data.rs
@@ -3,69 +3,123 @@ use std::{collections::HashMap, sync::LazyLock};
 
 #[derive(Debug)]
 pub enum SyntaxDefinition {
-    RequiredToken(SyntaxKind),
-    OptionalToken(SyntaxKind),
-    AnyTokens,
-    AnyToken,
-    OneOf(Vec<SyntaxKind>),
+    RequiredToken(SyntaxKind),          // A single required token
+    OptionalToken(SyntaxKind),          // A single optional token
+    OptionalGroup(Vec<SyntaxKind>), // A group of tokens that are required if the group is present
+    AnyToken,                       // Any single token
+    AnyTokens(Option<Vec<SyntaxKind>>), // A sequence of 0 or more tokens, of which any can be present
+    OneOf(Vec<SyntaxKind>),             // One of the specified tokens
+}
+
+#[derive(Debug)]
+pub struct SyntaxBuilder {
+    parts: Vec<SyntaxDefinition>,
+}
+
+impl SyntaxBuilder {
+    // Start a new builder, which will automatically create a Group
+    pub fn new() -> Self {
+        Self { parts: Vec::new() }
+    }
+
+    pub fn any_token(mut self) -> Self {
+        self.parts.push(SyntaxDefinition::AnyToken);
+        self
+    }
+
+    pub fn any_tokens(mut self, tokens: Option<Vec<SyntaxKind>>) -> Self {
+        self.parts.push(SyntaxDefinition::AnyTokens(tokens));
+        self
+    }
+
+    pub fn required_token(mut self, token: SyntaxKind) -> Self {
+        self.parts.push(SyntaxDefinition::RequiredToken(token));
+        self
+    }
+
+    pub fn optional_token(mut self, token: SyntaxKind) -> Self {
+        self.parts.push(SyntaxDefinition::OptionalToken(token));
+        self
+    }
+
+    pub fn optional_schema_name_group(self) -> Self {
+        self.optional_group(vec![SyntaxKind::Ident, SyntaxKind::Ascii46])
+    }
+
+    pub fn one_of(mut self, tokens: Vec<SyntaxKind>) -> Self {
+        self.parts.push(SyntaxDefinition::OneOf(tokens));
+        self
+    }
+
+    pub fn optional_group(mut self, tokens: Vec<SyntaxKind>) -> Self {
+        self.parts.push(SyntaxDefinition::OptionalGroup(tokens));
+        self
+    }
+
+    pub fn build(self) -> Vec<SyntaxDefinition> {
+        self.parts
+    }
 }
 
 #[derive(Debug)]
 pub struct StatementDefinition {
     pub stmt: SyntaxKind,
     pub tokens: Vec<SyntaxDefinition>,
+    pub prohibited_following_statements: Vec<SyntaxKind>,
 }
 
-// in some edge cases such as create rule ... do also delete ... its close to
-// impossible to make sure the delete statement is part of the create rule
-// statement. this is why we only start new statements if the previous token
-// was not one of a fixed set of tokens that can only be part of a statement
-//
-// FIXME: this is a workaround for the current limitations of the parser
-// FIXME2: find a better name :D
-pub const SPECIAL_TOKENS: [SyntaxKind; 4] = [
-    SyntaxKind::Do,
-    SyntaxKind::Also,
-    SyntaxKind::Instead,
-    SyntaxKind::As,
-];
+impl StatementDefinition {
+    fn new(stmt: SyntaxKind, b: SyntaxBuilder) -> Self {
+        Self {
+            stmt,
+            tokens: b.build(),
+            prohibited_following_statements: Vec::new(),
+        }
+    }
+
+    fn with_prohibited_following_statements(mut self, prohibited: Vec<SyntaxKind>) -> Self {
+        self.prohibited_following_statements = prohibited;
+        self
+    }
+}
 
 pub static STATEMENT_BRIDGE_DEFINITIONS: LazyLock<HashMap<SyntaxKind, Vec<StatementDefinition>>> =
     LazyLock::new(|| {
         let mut m: Vec<StatementDefinition> = Vec::new();
 
-        m.push(StatementDefinition {
-            stmt: SyntaxKind::SelectStmt,
-            tokens: vec![
-                SyntaxDefinition::RequiredToken(SyntaxKind::Union),
-                SyntaxDefinition::OptionalToken(SyntaxKind::All),
-            ],
-        });
-
-        m.push(StatementDefinition {
-            stmt: SyntaxKind::SelectStmt,
-            tokens: vec![
-                SyntaxDefinition::RequiredToken(SyntaxKind::Intersect),
-                SyntaxDefinition::OptionalToken(SyntaxKind::All),
-            ],
-        });
-
-        m.push(StatementDefinition {
-            stmt: SyntaxKind::SelectStmt,
-            tokens: vec![
-                SyntaxDefinition::RequiredToken(SyntaxKind::Except),
-                SyntaxDefinition::OptionalToken(SyntaxKind::All),
-            ],
-        });
+        m.push(StatementDefinition::new(
+            SyntaxKind::SelectStmt,
+            SyntaxBuilder::new()
+                .required_token(SyntaxKind::Intersect)
+                .optional_token(SyntaxKind::All),
+        ));
+
+        m.push(StatementDefinition::new(
+            SyntaxKind::SelectStmt,
+            SyntaxBuilder::new()
+                .required_token(SyntaxKind::Union)
+                .optional_token(SyntaxKind::All),
+        ));
+
+        m.push(StatementDefinition::new(
+            SyntaxKind::SelectStmt,
+            SyntaxBuilder::new()
+                .required_token(SyntaxKind::Except)
+                .optional_token(SyntaxKind::All),
+        ));
 
         let mut stmt_starts: HashMap<SyntaxKind, Vec<StatementDefinition>> = HashMap::new();
 
         for stmt in m {
-            let first_token = stmt.tokens.get(0).unwrap();
-            if let SyntaxDefinition::RequiredToken(kind) = first_token {
-                stmt_starts.entry(*kind).or_insert(Vec::new()).push(stmt);
+            let first_token = stmt
+                .tokens
+                .first()
+                .expect("Expected first token to be present");
+
+            if let SyntaxDefinition::RequiredToken(token) = first_token {
+                stmt_starts.entry(*token).or_insert(Vec::new()).push(stmt);
             } else {
-                panic!("Expected RequiredToken as first token in bridge definition");
+                panic!("Expected first token to be a required token");
             }
         }
 
@@ -76,1779 +130,1780 @@ pub static STATEMENT_DEFINITIONS: LazyLock<HashMap<SyntaxKind, Vec<StatementDefi
     LazyLock::new(|| {
         let mut m: Vec<StatementDefinition> = Vec::new();
 
-        m.push(StatementDefinition {
-            stmt: SyntaxKind::CreateTrigStmt,
-            tokens: vec![
-                SyntaxDefinition::RequiredToken(SyntaxKind::Create),
-                SyntaxDefinition::OptionalToken(SyntaxKind::Or),
-                SyntaxDefinition::OptionalToken(SyntaxKind::Replace),
-                SyntaxDefinition::OptionalToken(SyntaxKind::Constraint),
-                SyntaxDefinition::RequiredToken(SyntaxKind::Trigger),
-                SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
-                SyntaxDefinition::AnyTokens,
-                SyntaxDefinition::RequiredToken(SyntaxKind::On),
-                SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
-                SyntaxDefinition::AnyTokens,
-                SyntaxDefinition::RequiredToken(SyntaxKind::Execute),
-                SyntaxDefinition::OneOf(vec![SyntaxKind::Function, SyntaxKind::Procedure]),
-                SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
-            ],
-        });
-
-        m.push(StatementDefinition {
-            stmt: SyntaxKind::SelectStmt,
-            tokens: vec![
-                SyntaxDefinition::RequiredToken(SyntaxKind::Select),
-                SyntaxDefinition::AnyToken,
-            ],
-        });
-
-        m.push(StatementDefinition {
-            stmt: SyntaxKind::InsertStmt,
-            tokens: vec![
-                SyntaxDefinition::RequiredToken(SyntaxKind::Insert),
-                SyntaxDefinition::RequiredToken(SyntaxKind::Into),
-                SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
-                // the minimum required tokens for an insert statement are DEFAULT VALUES
-                // this is important to not conflict with a SELECT statement
-                // when within an insert into table select ...
-                SyntaxDefinition::AnyToken,
-                SyntaxDefinition::AnyToken,
-            ],
-        });
-
-        m.push(StatementDefinition {
-            stmt: SyntaxKind::DeleteStmt,
-            tokens: vec![
-                SyntaxDefinition::RequiredToken(SyntaxKind::DeleteP),
-                SyntaxDefinition::RequiredToken(SyntaxKind::From),
-                SyntaxDefinition::OptionalToken(SyntaxKind::Only),
-                SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
-            ],
-        });
-
-        m.push(StatementDefinition {
-            stmt: SyntaxKind::UpdateStmt,
-            tokens: vec![
-                SyntaxDefinition::RequiredToken(SyntaxKind::Update),
-                SyntaxDefinition::OptionalToken(SyntaxKind::Only),
-                SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
-                SyntaxDefinition::AnyTokens,
-                SyntaxDefinition::RequiredToken(SyntaxKind::Set),
-                SyntaxDefinition::AnyToken,
-            ],
-        });
-
-        m.push(StatementDefinition {
-            stmt: SyntaxKind::MergeStmt,
-            tokens: vec![
-                SyntaxDefinition::RequiredToken(SyntaxKind::Merge),
-                SyntaxDefinition::RequiredToken(SyntaxKind::Into),
-                SyntaxDefinition::OptionalToken(SyntaxKind::Only),
-                SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
-            ],
-        });
-
-        m.push(StatementDefinition {
-            stmt: SyntaxKind::AlterTableStmt,
-            tokens: vec![
-                SyntaxDefinition::RequiredToken(SyntaxKind::Alter),
-                SyntaxDefinition::OptionalToken(SyntaxKind::Materialized),
-                SyntaxDefinition::OneOf(vec![
-                    SyntaxKind::Table,
-                    SyntaxKind::Index,
-                    SyntaxKind::View,
-                ]),
-                SyntaxDefinition::OptionalToken(SyntaxKind::IfP),
-                SyntaxDefinition::OptionalToken(SyntaxKind::Exists),
-                SyntaxDefinition::OptionalToken(SyntaxKind::Only),
-                SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
-                SyntaxDefinition::AnyToken,
-            ],
-        });
-
-        m.push(StatementDefinition {
-            stmt: SyntaxKind::RenameStmt,
-            tokens: vec![
-                SyntaxDefinition::RequiredToken(SyntaxKind::Alter),
-                SyntaxDefinition::AnyTokens,
-                SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
-                SyntaxDefinition::AnyTokens,
-                SyntaxDefinition::RequiredToken(SyntaxKind::Rename),
-                SyntaxDefinition::RequiredToken(SyntaxKind::To),
-                SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
-            ],
-        });
-
-        m.push(StatementDefinition {
-            stmt: SyntaxKind::RenameStmt,
-            tokens: vec![
-                SyntaxDefinition::RequiredToken(SyntaxKind::Alter),
-                SyntaxDefinition::RequiredToken(SyntaxKind::Table),
-                SyntaxDefinition::OptionalToken(SyntaxKind::IfP),
-                SyntaxDefinition::OptionalToken(SyntaxKind::Exists),
-                SyntaxDefinition::OptionalToken(SyntaxKind::Only),
-                SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
-                SyntaxDefinition::RequiredToken(SyntaxKind::Rename),
-            ],
-        });
-
-        m.push(StatementDefinition {
-            stmt: SyntaxKind::AlterDomainStmt,
-            tokens: vec![
-                SyntaxDefinition::RequiredToken(SyntaxKind::Alter),
-                SyntaxDefinition::RequiredToken(SyntaxKind::DomainP),
-                SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
-            ],
-        });
-
-        m.push(StatementDefinition {
-            stmt: SyntaxKind::CallStmt,
-            tokens: vec![
-                SyntaxDefinition::RequiredToken(SyntaxKind::Call),
-                SyntaxDefinition::OneOf(vec![SyntaxKind::Ident, SyntaxKind::VersionP]),
-                SyntaxDefinition::RequiredToken(SyntaxKind::Ascii40),
-                SyntaxDefinition::AnyTokens,
-                SyntaxDefinition::RequiredToken(SyntaxKind::Ascii41),
-            ],
-        });
-
-        m.push(StatementDefinition {
-            stmt: SyntaxKind::AlterDefaultPrivilegesStmt,
-            tokens: vec![
-                SyntaxDefinition::RequiredToken(SyntaxKind::Alter),
-                SyntaxDefinition::RequiredToken(SyntaxKind::Default),
-                SyntaxDefinition::RequiredToken(SyntaxKind::Privileges),
-            ],
-        });
-
-        m.push(StatementDefinition {
-            stmt: SyntaxKind::ClusterStmt,
-            tokens: vec![SyntaxDefinition::RequiredToken(SyntaxKind::Cluster)],
-        });
-
-        m.push(StatementDefinition {
-            stmt: SyntaxKind::CopyStmt,
-            tokens: vec![SyntaxDefinition::RequiredToken(SyntaxKind::Copy)],
-        });
-
-        m.push(StatementDefinition {
-            stmt: SyntaxKind::ExecuteStmt,
-            tokens: vec![
-                SyntaxDefinition::RequiredToken(SyntaxKind::Execute),
-                SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
-            ],
-        });
-
-        // TODO we might need to add new types to handle this properly
-        m.push(StatementDefinition {
-            stmt: SyntaxKind::CreateStmt,
-            tokens: vec![
-                SyntaxDefinition::RequiredToken(SyntaxKind::Create),
-                SyntaxDefinition::OptionalToken(SyntaxKind::Global),
-                SyntaxDefinition::OptionalToken(SyntaxKind::Local),
-                SyntaxDefinition::OptionalToken(SyntaxKind::Temporary),
-                SyntaxDefinition::OptionalToken(SyntaxKind::Temp),
-                SyntaxDefinition::OptionalToken(SyntaxKind::Unlogged),
-                SyntaxDefinition::RequiredToken(SyntaxKind::Table),
-                SyntaxDefinition::OptionalToken(SyntaxKind::IfP),
-                SyntaxDefinition::OptionalToken(SyntaxKind::Not),
-                SyntaxDefinition::OptionalToken(SyntaxKind::Exists),
-                SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
-            ],
-        });
-
-        m.push(StatementDefinition {
-            stmt: SyntaxKind::DefineStmt,
-            tokens: vec![
-                SyntaxDefinition::RequiredToken(SyntaxKind::Create),
-                SyntaxDefinition::OptionalToken(SyntaxKind::Or),
-                SyntaxDefinition::OptionalToken(SyntaxKind::Replace),
-                SyntaxDefinition::RequiredToken(SyntaxKind::Aggregate),
-            ],
-        });
-
-        m.push(StatementDefinition {
-            stmt: SyntaxKind::CreateOpClassStmt,
-            tokens: vec![
-                SyntaxDefinition::RequiredToken(SyntaxKind::Create),
-                SyntaxDefinition::RequiredToken(SyntaxKind::Operator),
-                SyntaxDefinition::RequiredToken(SyntaxKind::Class),
-                SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
-                SyntaxDefinition::OptionalToken(SyntaxKind::Default),
-                SyntaxDefinition::RequiredToken(SyntaxKind::For),
-                SyntaxDefinition::RequiredToken(SyntaxKind::TypeP),
-                SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
-                SyntaxDefinition::RequiredToken(SyntaxKind::Using),
-            ],
-        });
-
-        m.push(StatementDefinition {
-            stmt: SyntaxKind::DropStmt,
-            tokens: vec![
-                SyntaxDefinition::RequiredToken(SyntaxKind::Drop),
-                SyntaxDefinition::RequiredToken(SyntaxKind::Operator),
-                SyntaxDefinition::RequiredToken(SyntaxKind::Class),
-                SyntaxDefinition::OptionalToken(SyntaxKind::IfP),
-                SyntaxDefinition::OptionalToken(SyntaxKind::Exists),
-                SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
-                SyntaxDefinition::RequiredToken(SyntaxKind::Using),
-                SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
-            ],
-        });
-
-        m.push(StatementDefinition {
-            stmt: SyntaxKind::DropStmt,
-            tokens: vec![
-                SyntaxDefinition::RequiredToken(SyntaxKind::Drop),
-                SyntaxDefinition::RequiredToken(SyntaxKind::Access),
-                SyntaxDefinition::RequiredToken(SyntaxKind::Method),
-                SyntaxDefinition::OptionalToken(SyntaxKind::IfP),
-                SyntaxDefinition::OptionalToken(SyntaxKind::Exists),
-                SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
-            ],
-        });
-
-        m.push(StatementDefinition {
-            stmt: SyntaxKind::DropStmt,
-            tokens: vec![
-                SyntaxDefinition::RequiredToken(SyntaxKind::Drop),
-                SyntaxDefinition::RequiredToken(SyntaxKind::Server),
-                SyntaxDefinition::OptionalToken(SyntaxKind::IfP),
-                SyntaxDefinition::OptionalToken(SyntaxKind::Exists),
-                SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
-            ],
-        });
-
-        m.push(StatementDefinition {
-            stmt: SyntaxKind::DropStmt,
-            tokens: vec![
-                SyntaxDefinition::RequiredToken(SyntaxKind::Drop),
-                SyntaxDefinition::RequiredToken(SyntaxKind::Trigger),
-                SyntaxDefinition::OptionalToken(SyntaxKind::IfP),
-                SyntaxDefinition::OptionalToken(SyntaxKind::Exists),
-                SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
-                SyntaxDefinition::RequiredToken(SyntaxKind::On),
-                SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
-            ],
-        });
-
-        m.push(StatementDefinition {
-            stmt: SyntaxKind::DropStmt,
-            tokens: vec![
-                SyntaxDefinition::RequiredToken(SyntaxKind::Drop),
-                SyntaxDefinition::RequiredToken(SyntaxKind::Collation),
-                SyntaxDefinition::OptionalToken(SyntaxKind::IfP),
-                SyntaxDefinition::OptionalToken(SyntaxKind::Exists),
-                SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
-            ],
-        });
-
-        m.push(StatementDefinition {
-            stmt: SyntaxKind::DropStmt,
-            tokens: vec![
-                SyntaxDefinition::RequiredToken(SyntaxKind::Drop),
-                SyntaxDefinition::RequiredToken(SyntaxKind::ConversionP),
-                SyntaxDefinition::OptionalToken(SyntaxKind::IfP),
-                SyntaxDefinition::OptionalToken(SyntaxKind::Exists),
-                SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
-            ],
-        });
-
-        m.push(StatementDefinition {
-            stmt: SyntaxKind::DropStmt,
-            tokens: vec![
-                SyntaxDefinition::RequiredToken(SyntaxKind::Drop),
-                SyntaxDefinition::RequiredToken(SyntaxKind::TextP),
-                SyntaxDefinition::RequiredToken(SyntaxKind::Search),
-                SyntaxDefinition::RequiredToken(SyntaxKind::Parser),
-                SyntaxDefinition::OptionalToken(SyntaxKind::IfP),
-                SyntaxDefinition::OptionalToken(SyntaxKind::Exists),
-                SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
-            ],
-        });
-
-        m.push(StatementDefinition {
-            stmt: SyntaxKind::DropStmt,
-            tokens: vec![
-                SyntaxDefinition::RequiredToken(SyntaxKind::Drop),
-                SyntaxDefinition::RequiredToken(SyntaxKind::TextP),
-                SyntaxDefinition::RequiredToken(SyntaxKind::Search),
-                SyntaxDefinition::RequiredToken(SyntaxKind::Dictionary),
-                SyntaxDefinition::OptionalToken(SyntaxKind::IfP),
-                SyntaxDefinition::OptionalToken(SyntaxKind::Exists),
-                SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
-            ],
-        });
-
-        m.push(StatementDefinition {
-            stmt: SyntaxKind::DropStmt,
-            tokens: vec![
-                SyntaxDefinition::RequiredToken(SyntaxKind::Drop),
-                SyntaxDefinition::RequiredToken(SyntaxKind::TextP),
-                SyntaxDefinition::RequiredToken(SyntaxKind::Search),
-                SyntaxDefinition::RequiredToken(SyntaxKind::Template),
-                SyntaxDefinition::OptionalToken(SyntaxKind::IfP),
-                SyntaxDefinition::OptionalToken(SyntaxKind::Exists),
-                SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
-            ],
-        });
-
-        m.push(StatementDefinition {
-            stmt: SyntaxKind::DropStmt,
-            tokens: vec![
-                SyntaxDefinition::RequiredToken(SyntaxKind::Drop),
-                SyntaxDefinition::RequiredToken(SyntaxKind::TextP),
-                SyntaxDefinition::RequiredToken(SyntaxKind::Search),
-                SyntaxDefinition::RequiredToken(SyntaxKind::Configuration),
-                SyntaxDefinition::OptionalToken(SyntaxKind::IfP),
-                SyntaxDefinition::OptionalToken(SyntaxKind::Exists),
-                SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
-            ],
-        });
-
-        m.push(StatementDefinition {
-            stmt: SyntaxKind::DropStmt,
-            tokens: vec![
-                SyntaxDefinition::RequiredToken(SyntaxKind::Drop),
-                SyntaxDefinition::RequiredToken(SyntaxKind::Extension),
-                SyntaxDefinition::OptionalToken(SyntaxKind::IfP),
-                SyntaxDefinition::OptionalToken(SyntaxKind::Exists),
-                SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
-            ],
-        });
-
-        m.push(StatementDefinition {
-            stmt: SyntaxKind::DropStmt,
-            tokens: vec![
-                SyntaxDefinition::RequiredToken(SyntaxKind::Drop),
-                SyntaxDefinition::RequiredToken(SyntaxKind::Aggregate),
-                SyntaxDefinition::OptionalToken(SyntaxKind::IfP),
-                SyntaxDefinition::OptionalToken(SyntaxKind::Exists),
-                SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
-            ],
-        });
-
-        m.push(StatementDefinition {
-            stmt: SyntaxKind::DropStmt,
-            tokens: vec![
-                SyntaxDefinition::RequiredToken(SyntaxKind::Drop),
-                SyntaxDefinition::RequiredToken(SyntaxKind::DomainP),
-                SyntaxDefinition::OptionalToken(SyntaxKind::IfP),
-                SyntaxDefinition::OptionalToken(SyntaxKind::Exists),
-                SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
-            ],
-        });
-
-        m.push(StatementDefinition {
-            stmt: SyntaxKind::DropStmt,
-            tokens: vec![
-                SyntaxDefinition::RequiredToken(SyntaxKind::Drop),
-                SyntaxDefinition::RequiredToken(SyntaxKind::Sequence),
-                SyntaxDefinition::OptionalToken(SyntaxKind::IfP),
-                SyntaxDefinition::OptionalToken(SyntaxKind::Exists),
-                SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
-            ],
-        });
-
-        m.push(StatementDefinition {
-            stmt: SyntaxKind::DropStmt,
-            tokens: vec![
-                SyntaxDefinition::RequiredToken(SyntaxKind::Drop),
-                SyntaxDefinition::RequiredToken(SyntaxKind::Foreign),
-                SyntaxDefinition::RequiredToken(SyntaxKind::Table),
-                SyntaxDefinition::OptionalToken(SyntaxKind::IfP),
-                SyntaxDefinition::OptionalToken(SyntaxKind::Exists),
-                SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
-            ],
-        });
-
-        m.push(StatementDefinition {
-            stmt: SyntaxKind::DropStmt,
-            tokens: vec![
-                SyntaxDefinition::RequiredToken(SyntaxKind::Drop),
-                SyntaxDefinition::RequiredToken(SyntaxKind::Cast),
-                SyntaxDefinition::OptionalToken(SyntaxKind::IfP),
-                SyntaxDefinition::OptionalToken(SyntaxKind::Exists),
-                SyntaxDefinition::RequiredToken(SyntaxKind::Ascii40),
-                SyntaxDefinition::AnyTokens,
-                SyntaxDefinition::RequiredToken(SyntaxKind::As),
-                SyntaxDefinition::AnyTokens,
-                SyntaxDefinition::RequiredToken(SyntaxKind::Ascii41),
-            ],
-        });
-
-        m.push(StatementDefinition {
-            stmt: SyntaxKind::DropStmt,
-            tokens: vec![
-                SyntaxDefinition::RequiredToken(SyntaxKind::Drop),
-                SyntaxDefinition::RequiredToken(SyntaxKind::Foreign),
-                SyntaxDefinition::RequiredToken(SyntaxKind::DataP),
-                SyntaxDefinition::RequiredToken(SyntaxKind::Wrapper),
-                SyntaxDefinition::OptionalToken(SyntaxKind::IfP),
-                SyntaxDefinition::OptionalToken(SyntaxKind::Exists),
-                SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
-            ],
-        });
-
-        m.push(StatementDefinition {
-            stmt: SyntaxKind::DropStmt,
-            tokens: vec![
-                SyntaxDefinition::RequiredToken(SyntaxKind::Drop),
-                SyntaxDefinition::RequiredToken(SyntaxKind::Table),
-                SyntaxDefinition::OptionalToken(SyntaxKind::IfP),
-                SyntaxDefinition::OptionalToken(SyntaxKind::Exists),
-                SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
-            ],
-        });
-
-        m.push(StatementDefinition {
-            stmt: SyntaxKind::DropStmt,
-            tokens: vec![
-                SyntaxDefinition::RequiredToken(SyntaxKind::Drop),
-                SyntaxDefinition::RequiredToken(SyntaxKind::Index),
-                SyntaxDefinition::OptionalToken(SyntaxKind::Concurrently),
-                SyntaxDefinition::OptionalToken(SyntaxKind::IfP),
-                SyntaxDefinition::OptionalToken(SyntaxKind::Exists),
-                SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
-            ],
-        });
-
-        m.push(StatementDefinition {
-            stmt: SyntaxKind::DropStmt,
-            tokens: vec![
-                SyntaxDefinition::RequiredToken(SyntaxKind::Drop),
-                SyntaxDefinition::RequiredToken(SyntaxKind::Rule),
-                SyntaxDefinition::OptionalToken(SyntaxKind::IfP),
-                SyntaxDefinition::OptionalToken(SyntaxKind::Exists),
-                SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
-                SyntaxDefinition::RequiredToken(SyntaxKind::On),
-                SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
-            ],
-        });
-
-        m.push(StatementDefinition {
-            stmt: SyntaxKind::DropStmt,
-            tokens: vec![
-                SyntaxDefinition::RequiredToken(SyntaxKind::Drop),
-                SyntaxDefinition::RequiredToken(SyntaxKind::TypeP),
-                SyntaxDefinition::OptionalToken(SyntaxKind::IfP),
-                SyntaxDefinition::OptionalToken(SyntaxKind::Exists),
-                SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
-            ],
-        });
-
-        m.push(StatementDefinition {
-            stmt: SyntaxKind::DropStmt,
-            tokens: vec![
-                SyntaxDefinition::RequiredToken(SyntaxKind::Drop),
-                SyntaxDefinition::RequiredToken(SyntaxKind::Operator),
-                SyntaxDefinition::OptionalToken(SyntaxKind::IfP),
-                SyntaxDefinition::OptionalToken(SyntaxKind::Exists),
-                SyntaxDefinition::OneOf(vec![SyntaxKind::Op, SyntaxKind::Ident]),
-                SyntaxDefinition::RequiredToken(SyntaxKind::Ascii40),
-                SyntaxDefinition::AnyTokens,
-                SyntaxDefinition::RequiredToken(SyntaxKind::Ascii41),
-            ],
-        });
-
-        m.push(StatementDefinition {
-            stmt: SyntaxKind::DropStmt,
-            tokens: vec![
-                SyntaxDefinition::RequiredToken(SyntaxKind::Drop),
-                SyntaxDefinition::RequiredToken(SyntaxKind::Routine),
-                SyntaxDefinition::OptionalToken(SyntaxKind::IfP),
-                SyntaxDefinition::OptionalToken(SyntaxKind::Exists),
-                SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
-            ],
-        });
-
-        m.push(StatementDefinition {
-            stmt: SyntaxKind::DropStmt,
-            tokens: vec![
-                SyntaxDefinition::RequiredToken(SyntaxKind::Drop),
-                SyntaxDefinition::RequiredToken(SyntaxKind::Procedure),
-                SyntaxDefinition::OptionalToken(SyntaxKind::IfP),
-                SyntaxDefinition::OptionalToken(SyntaxKind::Exists),
-                SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
-            ],
-        });
-
-        m.push(StatementDefinition {
-            stmt: SyntaxKind::DropStmt,
-            tokens: vec![
-                SyntaxDefinition::RequiredToken(SyntaxKind::Drop),
-                SyntaxDefinition::RequiredToken(SyntaxKind::Function),
-                SyntaxDefinition::OptionalToken(SyntaxKind::IfP),
-                SyntaxDefinition::OptionalToken(SyntaxKind::Exists),
-                SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
-                SyntaxDefinition::RequiredToken(SyntaxKind::Ascii40),
-                SyntaxDefinition::AnyTokens,
-                SyntaxDefinition::RequiredToken(SyntaxKind::Ascii41),
-            ],
-        });
-
-        m.push(StatementDefinition {
-            stmt: SyntaxKind::DropStmt,
-            tokens: vec![
-                SyntaxDefinition::RequiredToken(SyntaxKind::Drop),
-                SyntaxDefinition::RequiredToken(SyntaxKind::Schema),
-                SyntaxDefinition::OptionalToken(SyntaxKind::IfP),
-                SyntaxDefinition::OptionalToken(SyntaxKind::Exists),
-                SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
-            ],
-        });
-
-        m.push(StatementDefinition {
-            stmt: SyntaxKind::DropStmt,
-            tokens: vec![
-                SyntaxDefinition::RequiredToken(SyntaxKind::Drop),
-                SyntaxDefinition::RequiredToken(SyntaxKind::View),
-                SyntaxDefinition::OptionalToken(SyntaxKind::IfP),
-                SyntaxDefinition::OptionalToken(SyntaxKind::Exists),
-                SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
-            ],
-        });
-
-        m.push(StatementDefinition {
-            stmt: SyntaxKind::DropStmt,
-            tokens: vec![
-                SyntaxDefinition::RequiredToken(SyntaxKind::Drop),
-                SyntaxDefinition::RequiredToken(SyntaxKind::Language),
-                SyntaxDefinition::OptionalToken(SyntaxKind::IfP),
-                SyntaxDefinition::OptionalToken(SyntaxKind::Exists),
-                SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
-            ],
-        });
-
-        m.push(StatementDefinition {
-            stmt: SyntaxKind::DropStmt,
-            tokens: vec![
-                SyntaxDefinition::RequiredToken(SyntaxKind::Drop),
-                SyntaxDefinition::OptionalToken(SyntaxKind::Procedural),
-                SyntaxDefinition::RequiredToken(SyntaxKind::Language),
-                SyntaxDefinition::OptionalToken(SyntaxKind::IfP),
-                SyntaxDefinition::OptionalToken(SyntaxKind::Exists),
-                SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
-                SyntaxDefinition::OneOf(vec![SyntaxKind::Cascade, SyntaxKind::Restrict]),
-            ],
-        });
-
-        m.push(StatementDefinition {
-            stmt: SyntaxKind::DropStmt,
-            tokens: vec![
-                SyntaxDefinition::RequiredToken(SyntaxKind::Drop),
-                SyntaxDefinition::RequiredToken(SyntaxKind::Operator),
-                SyntaxDefinition::RequiredToken(SyntaxKind::Family),
-                SyntaxDefinition::OptionalToken(SyntaxKind::IfP),
-                SyntaxDefinition::OptionalToken(SyntaxKind::Exists),
-                SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
-                SyntaxDefinition::RequiredToken(SyntaxKind::Using),
-                SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
-            ],
-        });
-
-        // CREATE TEXT SEARCH DICTIONARY alt_ts_dict1 (template=simple);
-        m.push(StatementDefinition {
-            stmt: SyntaxKind::DefineStmt,
-            tokens: vec![
-                SyntaxDefinition::RequiredToken(SyntaxKind::Create),
-                SyntaxDefinition::RequiredToken(SyntaxKind::TextP),
-                SyntaxDefinition::RequiredToken(SyntaxKind::Search),
-                SyntaxDefinition::RequiredToken(SyntaxKind::Dictionary),
-                SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
-                SyntaxDefinition::RequiredToken(SyntaxKind::Ascii40),
-                SyntaxDefinition::AnyTokens,
-                SyntaxDefinition::RequiredToken(SyntaxKind::Ascii41),
-            ],
-        });
-
-        m.push(StatementDefinition {
-            stmt: SyntaxKind::DefineStmt,
-            tokens: vec![
-                SyntaxDefinition::RequiredToken(SyntaxKind::Create),
-                SyntaxDefinition::RequiredToken(SyntaxKind::TextP),
-                SyntaxDefinition::RequiredToken(SyntaxKind::Search),
-                SyntaxDefinition::RequiredToken(SyntaxKind::Configuration),
-                SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
-                SyntaxDefinition::RequiredToken(SyntaxKind::Ascii40),
-                SyntaxDefinition::AnyTokens,
-                SyntaxDefinition::RequiredToken(SyntaxKind::Ascii41),
-            ],
-        });
-
-        m.push(StatementDefinition {
-            stmt: SyntaxKind::DefineStmt,
-            tokens: vec![
-                SyntaxDefinition::RequiredToken(SyntaxKind::Create),
-                SyntaxDefinition::RequiredToken(SyntaxKind::TextP),
-                SyntaxDefinition::RequiredToken(SyntaxKind::Search),
-                SyntaxDefinition::RequiredToken(SyntaxKind::Template),
-                SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
-                SyntaxDefinition::RequiredToken(SyntaxKind::Ascii40),
-                SyntaxDefinition::AnyTokens,
-                SyntaxDefinition::RequiredToken(SyntaxKind::Ascii41),
-            ],
-        });
-
-        m.push(StatementDefinition {
-            stmt: SyntaxKind::DefineStmt,
-            tokens: vec![
-                SyntaxDefinition::RequiredToken(SyntaxKind::Create),
-                SyntaxDefinition::RequiredToken(SyntaxKind::TextP),
-                SyntaxDefinition::RequiredToken(SyntaxKind::Search),
-                SyntaxDefinition::RequiredToken(SyntaxKind::Parser),
-                SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
-                SyntaxDefinition::RequiredToken(SyntaxKind::Ascii40),
-                SyntaxDefinition::AnyTokens,
-                SyntaxDefinition::RequiredToken(SyntaxKind::Ascii41),
-            ],
-        });
-
-        m.push(StatementDefinition {
-            stmt: SyntaxKind::DefineStmt,
-            tokens: vec![
-                SyntaxDefinition::RequiredToken(SyntaxKind::Create),
-                SyntaxDefinition::RequiredToken(SyntaxKind::Operator),
-            ],
-        });
-
-        m.push(StatementDefinition {
-            stmt: SyntaxKind::DefineStmt,
-            tokens: vec![
-                SyntaxDefinition::RequiredToken(SyntaxKind::Create),
-                SyntaxDefinition::OptionalToken(SyntaxKind::Or),
-                SyntaxDefinition::OptionalToken(SyntaxKind::Replace),
-                SyntaxDefinition::RequiredToken(SyntaxKind::Aggregate),
-                SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
-                SyntaxDefinition::RequiredToken(SyntaxKind::Ascii40),
-                SyntaxDefinition::AnyTokens,
-                SyntaxDefinition::RequiredToken(SyntaxKind::Ascii41),
-            ],
-        });
-
-        m.push(StatementDefinition {
-            stmt: SyntaxKind::DefineStmt,
-            tokens: vec![
-                SyntaxDefinition::RequiredToken(SyntaxKind::Create),
-                SyntaxDefinition::RequiredToken(SyntaxKind::TypeP),
-                SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
-            ],
-        });
-
-        m.push(StatementDefinition {
-            stmt: SyntaxKind::CompositeTypeStmt,
-            tokens: vec![
-                SyntaxDefinition::RequiredToken(SyntaxKind::Create),
-                SyntaxDefinition::RequiredToken(SyntaxKind::TypeP),
-                SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
-                SyntaxDefinition::RequiredToken(SyntaxKind::As),
-            ],
-        });
-
-        m.push(StatementDefinition {
-            stmt: SyntaxKind::CreateEnumStmt,
-            tokens: vec![
-                SyntaxDefinition::RequiredToken(SyntaxKind::Create),
-                SyntaxDefinition::RequiredToken(SyntaxKind::TypeP),
-                SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
-                SyntaxDefinition::RequiredToken(SyntaxKind::As),
-                SyntaxDefinition::RequiredToken(SyntaxKind::EnumP),
-            ],
-        });
-
-        m.push(StatementDefinition {
-            stmt: SyntaxKind::CreateRangeStmt,
-            tokens: vec![
-                SyntaxDefinition::RequiredToken(SyntaxKind::Create),
-                SyntaxDefinition::RequiredToken(SyntaxKind::TypeP),
-                SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
-                SyntaxDefinition::RequiredToken(SyntaxKind::As),
-                SyntaxDefinition::RequiredToken(SyntaxKind::Range),
-            ],
-        });
-
-        m.push(StatementDefinition {
-            stmt: SyntaxKind::TruncateStmt,
-            tokens: vec![
-                SyntaxDefinition::RequiredToken(SyntaxKind::Truncate),
-                SyntaxDefinition::OptionalToken(SyntaxKind::Table),
-                SyntaxDefinition::OptionalToken(SyntaxKind::Only),
-                SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
-            ],
-        });
-
-        m.push(StatementDefinition {
-            stmt: SyntaxKind::CommentStmt,
-            tokens: vec![
-                SyntaxDefinition::RequiredToken(SyntaxKind::Comment),
-                SyntaxDefinition::RequiredToken(SyntaxKind::On),
-            ],
-        });
-
-        m.push(StatementDefinition {
-            stmt: SyntaxKind::FetchStmt,
-            tokens: vec![
-                SyntaxDefinition::RequiredToken(SyntaxKind::Fetch),
-                SyntaxDefinition::AnyTokens,
-                SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
-            ],
-        });
-
-        m.push(StatementDefinition {
-            stmt: SyntaxKind::VacuumStmt,
-            tokens: vec![SyntaxDefinition::RequiredToken(SyntaxKind::Analyze)],
-        });
-
-        m.push(StatementDefinition {
-            stmt: SyntaxKind::IndexStmt,
-            tokens: vec![
-                SyntaxDefinition::RequiredToken(SyntaxKind::Create),
-                SyntaxDefinition::OptionalToken(SyntaxKind::Unique),
-                SyntaxDefinition::RequiredToken(SyntaxKind::Index),
-                SyntaxDefinition::AnyTokens,
-                SyntaxDefinition::RequiredToken(SyntaxKind::On),
-                SyntaxDefinition::OptionalToken(SyntaxKind::Only),
-                SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
-            ],
-        });
-
-        m.push(StatementDefinition {
-            stmt: SyntaxKind::CreateFunctionStmt,
-            tokens: vec![
-                SyntaxDefinition::RequiredToken(SyntaxKind::Create),
-                SyntaxDefinition::OptionalToken(SyntaxKind::Or),
-                SyntaxDefinition::OptionalToken(SyntaxKind::Replace),
-                SyntaxDefinition::OneOf(vec![SyntaxKind::Function, SyntaxKind::Procedure]),
-                SyntaxDefinition::AnyTokens,
-                SyntaxDefinition::RequiredToken(SyntaxKind::Ascii40),
-                SyntaxDefinition::AnyTokens,
-                SyntaxDefinition::RequiredToken(SyntaxKind::Ascii41),
-            ],
-        });
-
-        m.push(StatementDefinition {
-            stmt: SyntaxKind::AlterFunctionStmt,
-            tokens: vec![
-                SyntaxDefinition::RequiredToken(SyntaxKind::Alter),
-                SyntaxDefinition::OneOf(vec![SyntaxKind::Function, SyntaxKind::Procedure]),
-                SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
-            ],
-        });
-
-        m.push(StatementDefinition {
-            stmt: SyntaxKind::DoStmt,
-            tokens: vec![
-                SyntaxDefinition::RequiredToken(SyntaxKind::Do),
-                SyntaxDefinition::OptionalToken(SyntaxKind::Language),
-                SyntaxDefinition::OptionalToken(SyntaxKind::Ident),
-                SyntaxDefinition::RequiredToken(SyntaxKind::Sconst),
-            ],
-        });
-
-        m.push(StatementDefinition {
-            stmt: SyntaxKind::RuleStmt,
-            tokens: vec![
-                SyntaxDefinition::RequiredToken(SyntaxKind::Create),
-                SyntaxDefinition::OptionalToken(SyntaxKind::Or),
-                SyntaxDefinition::OptionalToken(SyntaxKind::Replace),
-                SyntaxDefinition::RequiredToken(SyntaxKind::Rule),
-                SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
-                SyntaxDefinition::RequiredToken(SyntaxKind::As),
-                SyntaxDefinition::RequiredToken(SyntaxKind::On),
-                SyntaxDefinition::OneOf(vec![
-                    SyntaxKind::Select,
-                    SyntaxKind::Insert,
-                    SyntaxKind::Update,
-                    SyntaxKind::DeleteP,
-                ]),
-                SyntaxDefinition::RequiredToken(SyntaxKind::To),
-                SyntaxDefinition::AnyTokens,
-                SyntaxDefinition::RequiredToken(SyntaxKind::Do),
-            ],
-        });
-
-        m.push(StatementDefinition {
-            stmt: SyntaxKind::NotifyStmt,
-            tokens: vec![
-                SyntaxDefinition::RequiredToken(SyntaxKind::Notify),
-                SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
-            ],
-        });
-
-        m.push(StatementDefinition {
-            stmt: SyntaxKind::ListenStmt,
-            tokens: vec![
-                SyntaxDefinition::RequiredToken(SyntaxKind::Listen),
-                SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
-            ],
-        });
-
-        m.push(StatementDefinition {
-            stmt: SyntaxKind::UnlistenStmt,
-            tokens: vec![
-                SyntaxDefinition::RequiredToken(SyntaxKind::Unlisten),
-                SyntaxDefinition::OneOf(vec![SyntaxKind::Ident, SyntaxKind::Ascii42]),
-            ],
-        });
-
-        // DECLARE c CURSOR FOR SELECT ctid,cmin,* FROM combocidtest
-        m.push(StatementDefinition {
-            stmt: SyntaxKind::DeclareCursorStmt,
-            tokens: vec![
-                SyntaxDefinition::RequiredToken(SyntaxKind::Declare),
-                SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
-                SyntaxDefinition::AnyTokens,
-                SyntaxDefinition::RequiredToken(SyntaxKind::Cursor),
-                SyntaxDefinition::AnyTokens,
-                SyntaxDefinition::RequiredToken(SyntaxKind::For),
-                SyntaxDefinition::OneOf(vec![SyntaxKind::Select, SyntaxKind::With]),
-                SyntaxDefinition::AnyToken,
-            ],
-        });
-
-        m.push(StatementDefinition {
-            stmt: SyntaxKind::TransactionStmt,
-            tokens: vec![
-                SyntaxDefinition::RequiredToken(SyntaxKind::Savepoint),
-                SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
-            ],
-        });
-
-        m.push(StatementDefinition {
-            stmt: SyntaxKind::TransactionStmt,
-            tokens: vec![
-                SyntaxDefinition::RequiredToken(SyntaxKind::BeginP),
-                // FIXME: without the ";", this would conflict with BEGIN ATOMIC
-                SyntaxDefinition::RequiredToken(SyntaxKind::Ascii59),
-            ],
-        });
-
-        m.push(StatementDefinition {
-            stmt: SyntaxKind::TransactionStmt,
-            tokens: vec![
-                SyntaxDefinition::RequiredToken(SyntaxKind::BeginP),
-                SyntaxDefinition::RequiredToken(SyntaxKind::Transaction),
-            ],
-        });
-
-        m.push(StatementDefinition {
-            stmt: SyntaxKind::TransactionStmt,
-            tokens: vec![SyntaxDefinition::RequiredToken(SyntaxKind::Commit)],
-        });
-
-        m.push(StatementDefinition {
-            stmt: SyntaxKind::TransactionStmt,
-            tokens: vec![
-                SyntaxDefinition::RequiredToken(SyntaxKind::Rollback),
-                SyntaxDefinition::AnyTokens,
-                SyntaxDefinition::RequiredToken(SyntaxKind::To),
-                SyntaxDefinition::OptionalToken(SyntaxKind::Savepoint),
-                SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
-            ],
-        });
-
-        m.push(StatementDefinition {
-            stmt: SyntaxKind::TransactionStmt,
-            tokens: vec![
-                SyntaxDefinition::RequiredToken(SyntaxKind::Rollback),
-                // FIXME: without the ";", this would conflict with ROLLBACK TO SAVEPOINT
-                SyntaxDefinition::RequiredToken(SyntaxKind::Ascii59),
-            ],
-        });
-
-        m.push(StatementDefinition {
-            stmt: SyntaxKind::ViewStmt,
-            tokens: vec![
-                SyntaxDefinition::RequiredToken(SyntaxKind::Create),
-                SyntaxDefinition::OptionalToken(SyntaxKind::Or),
-                SyntaxDefinition::OptionalToken(SyntaxKind::Replace),
-                SyntaxDefinition::OptionalToken(SyntaxKind::Temporary),
-                SyntaxDefinition::OptionalToken(SyntaxKind::Temp),
-                SyntaxDefinition::OptionalToken(SyntaxKind::Recursive),
-                SyntaxDefinition::RequiredToken(SyntaxKind::View),
-                SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
-                SyntaxDefinition::AnyTokens,
-                SyntaxDefinition::RequiredToken(SyntaxKind::As),
-                SyntaxDefinition::OneOf(vec![SyntaxKind::With, SyntaxKind::Select]),
-            ],
-        });
-
-        m.push(StatementDefinition {
-            stmt: SyntaxKind::LoadStmt,
-            tokens: vec![SyntaxDefinition::RequiredToken(SyntaxKind::Load)],
-        });
-
-        m.push(StatementDefinition {
-            stmt: SyntaxKind::CreateDomainStmt,
-            tokens: vec![
-                SyntaxDefinition::RequiredToken(SyntaxKind::Create),
-                SyntaxDefinition::RequiredToken(SyntaxKind::DomainP),
-                SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
-            ],
-        });
-
-        m.push(StatementDefinition {
-            stmt: SyntaxKind::CreatedbStmt,
-            tokens: vec![
-                SyntaxDefinition::RequiredToken(SyntaxKind::Create),
-                SyntaxDefinition::RequiredToken(SyntaxKind::Database),
-                SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
-            ],
-        });
-
-        m.push(StatementDefinition {
-            stmt: SyntaxKind::DropdbStmt,
-            tokens: vec![
-                SyntaxDefinition::RequiredToken(SyntaxKind::Drop),
-                SyntaxDefinition::RequiredToken(SyntaxKind::Database),
-                SyntaxDefinition::OptionalToken(SyntaxKind::IfP),
-                SyntaxDefinition::OptionalToken(SyntaxKind::Exists),
-                SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
-            ],
-        });
-
-        m.push(StatementDefinition {
-            stmt: SyntaxKind::VacuumStmt,
-            tokens: vec![SyntaxDefinition::RequiredToken(SyntaxKind::Vacuum)],
-        });
-
-        m.push(StatementDefinition {
-            stmt: SyntaxKind::CreateTableAsStmt,
-            tokens: vec![
-                SyntaxDefinition::RequiredToken(SyntaxKind::Create),
-                SyntaxDefinition::OptionalToken(SyntaxKind::Global),
-                SyntaxDefinition::OptionalToken(SyntaxKind::Local),
-                SyntaxDefinition::OptionalToken(SyntaxKind::Temporary),
-                SyntaxDefinition::OptionalToken(SyntaxKind::Temp),
-                SyntaxDefinition::RequiredToken(SyntaxKind::Materialized),
-                SyntaxDefinition::RequiredToken(SyntaxKind::View),
-                SyntaxDefinition::OptionalToken(SyntaxKind::IfP),
-                SyntaxDefinition::OptionalToken(SyntaxKind::Not),
-                SyntaxDefinition::OptionalToken(SyntaxKind::Exists),
-                SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
-                SyntaxDefinition::AnyTokens,
-                SyntaxDefinition::RequiredToken(SyntaxKind::As),
-                SyntaxDefinition::OneOf(vec![SyntaxKind::With, SyntaxKind::Select]),
-                SyntaxDefinition::AnyToken,
-            ],
-        });
-
-        m.push(StatementDefinition {
-            stmt: SyntaxKind::CreateTableAsStmt,
-            tokens: vec![
-                SyntaxDefinition::RequiredToken(SyntaxKind::Create),
-                SyntaxDefinition::OptionalToken(SyntaxKind::Global),
-                SyntaxDefinition::OptionalToken(SyntaxKind::Local),
-                SyntaxDefinition::OptionalToken(SyntaxKind::Temporary),
-                SyntaxDefinition::OptionalToken(SyntaxKind::Temp),
-                SyntaxDefinition::RequiredToken(SyntaxKind::Table),
-                SyntaxDefinition::OptionalToken(SyntaxKind::IfP),
-                SyntaxDefinition::OptionalToken(SyntaxKind::Not),
-                SyntaxDefinition::OptionalToken(SyntaxKind::Exists),
-                SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
-                SyntaxDefinition::AnyTokens,
-                SyntaxDefinition::RequiredToken(SyntaxKind::As),
-                SyntaxDefinition::OneOf(vec![SyntaxKind::With, SyntaxKind::Select]),
-                SyntaxDefinition::AnyToken,
-            ],
-        });
-
-        m.push(StatementDefinition {
-            stmt: SyntaxKind::ViewStmt,
-            tokens: vec![
-                SyntaxDefinition::RequiredToken(SyntaxKind::Create),
-                SyntaxDefinition::OptionalToken(SyntaxKind::Or),
-                SyntaxDefinition::OptionalToken(SyntaxKind::Replace),
-                SyntaxDefinition::OptionalToken(SyntaxKind::Temporary),
-                SyntaxDefinition::OptionalToken(SyntaxKind::Temp),
-                SyntaxDefinition::OptionalToken(SyntaxKind::Recursive),
-                SyntaxDefinition::RequiredToken(SyntaxKind::View),
-                SyntaxDefinition::OptionalToken(SyntaxKind::IfP),
-                SyntaxDefinition::OptionalToken(SyntaxKind::Not),
-                SyntaxDefinition::OptionalToken(SyntaxKind::Exists),
-                SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
-                SyntaxDefinition::AnyTokens,
-                SyntaxDefinition::RequiredToken(SyntaxKind::As),
-                SyntaxDefinition::OneOf(vec![SyntaxKind::With, SyntaxKind::Select]),
-                SyntaxDefinition::AnyToken,
-            ],
-        });
-
-        m.push(StatementDefinition {
-            stmt: SyntaxKind::ExplainStmt,
-            tokens: vec![
-                SyntaxDefinition::RequiredToken(SyntaxKind::Explain),
-                SyntaxDefinition::AnyTokens,
-                SyntaxDefinition::OneOf(vec![
-                    SyntaxKind::With,
-                    SyntaxKind::Select,
-                    SyntaxKind::Insert,
-                    SyntaxKind::DeleteP,
-                    SyntaxKind::Update,
-                    SyntaxKind::Merge,
-                    SyntaxKind::Execute,
-                ]),
-                SyntaxDefinition::AnyToken,
-            ],
-        });
-
-        m.push(StatementDefinition {
-            stmt: SyntaxKind::CreateSeqStmt,
-            tokens: vec![
-                SyntaxDefinition::RequiredToken(SyntaxKind::Create),
-                SyntaxDefinition::OptionalToken(SyntaxKind::Temporary),
-                SyntaxDefinition::OptionalToken(SyntaxKind::Temp),
-                SyntaxDefinition::OptionalToken(SyntaxKind::Unlogged),
-                SyntaxDefinition::RequiredToken(SyntaxKind::Sequence),
-                SyntaxDefinition::OptionalToken(SyntaxKind::IfP),
-                SyntaxDefinition::OptionalToken(SyntaxKind::Not),
-                SyntaxDefinition::OptionalToken(SyntaxKind::Exists),
-                SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
-            ],
-        });
-
-        m.push(StatementDefinition {
-            stmt: SyntaxKind::AlterSeqStmt,
-            tokens: vec![
-                SyntaxDefinition::RequiredToken(SyntaxKind::Alter),
-                SyntaxDefinition::RequiredToken(SyntaxKind::Sequence),
-                SyntaxDefinition::OptionalToken(SyntaxKind::IfP),
-                SyntaxDefinition::OptionalToken(SyntaxKind::Exists),
-                SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
-            ],
-        });
-
-        // RESET SESSION AUTHORIZATION
-        m.push(StatementDefinition {
-            stmt: SyntaxKind::VariableSetStmt,
-            tokens: vec![
-                SyntaxDefinition::RequiredToken(SyntaxKind::Reset),
-                SyntaxDefinition::RequiredToken(SyntaxKind::Session),
-                SyntaxDefinition::RequiredToken(SyntaxKind::Authorization),
-            ],
-        });
-
-        m.push(StatementDefinition {
-            stmt: SyntaxKind::VariableSetStmt,
-            tokens: vec![
-                SyntaxDefinition::RequiredToken(SyntaxKind::Set),
-                SyntaxDefinition::RequiredToken(SyntaxKind::Role),
-                SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
-            ],
-        });
-
-        m.push(StatementDefinition {
-            stmt: SyntaxKind::VariableSetStmt,
-            tokens: vec![
-                SyntaxDefinition::RequiredToken(SyntaxKind::Reset),
-                SyntaxDefinition::RequiredToken(SyntaxKind::Role),
-            ],
-        });
-
-        m.push(StatementDefinition {
-            stmt: SyntaxKind::VariableSetStmt,
-            tokens: vec![
-                SyntaxDefinition::RequiredToken(SyntaxKind::Reset),
-                SyntaxDefinition::OneOf(vec![SyntaxKind::All, SyntaxKind::Ident]),
-            ],
-        });
-
-        // ref: https://www.postgresql.org/docs/current/sql-set-session-authorization.html
-        m.push(StatementDefinition {
-            stmt: SyntaxKind::VariableSetStmt,
-            tokens: vec![
-                SyntaxDefinition::RequiredToken(SyntaxKind::Set),
-                SyntaxDefinition::RequiredToken(SyntaxKind::Session),
-                SyntaxDefinition::RequiredToken(SyntaxKind::Authorization),
-                SyntaxDefinition::OneOf(vec![SyntaxKind::Ident, SyntaxKind::Sconst]),
-            ],
-        });
-
-        m.push(StatementDefinition {
-            stmt: SyntaxKind::VariableSetStmt,
-            tokens: vec![
-                SyntaxDefinition::RequiredToken(SyntaxKind::Set),
-                SyntaxDefinition::OptionalToken(SyntaxKind::Session),
-                SyntaxDefinition::OptionalToken(SyntaxKind::Local),
-                SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
-                SyntaxDefinition::OneOf(vec![SyntaxKind::To, SyntaxKind::Ascii61]),
-                SyntaxDefinition::AnyToken,
-            ],
-        });
-
-        m.push(StatementDefinition {
-            stmt: SyntaxKind::VariableSetStmt,
-            tokens: vec![
-                SyntaxDefinition::RequiredToken(SyntaxKind::Set),
-                SyntaxDefinition::OptionalToken(SyntaxKind::Session),
-                SyntaxDefinition::OptionalToken(SyntaxKind::Local),
-                SyntaxDefinition::RequiredToken(SyntaxKind::Time),
-                SyntaxDefinition::RequiredToken(SyntaxKind::Zone),
-                SyntaxDefinition::AnyToken,
-            ],
-        });
-
-        m.push(StatementDefinition {
-            stmt: SyntaxKind::VariableShowStmt,
-            tokens: vec![
-                SyntaxDefinition::RequiredToken(SyntaxKind::Show),
-                SyntaxDefinition::OneOf(vec![SyntaxKind::Ident, SyntaxKind::All]),
-            ],
-        });
-
-        m.push(StatementDefinition {
-            stmt: SyntaxKind::DiscardStmt,
-            tokens: vec![
-                SyntaxDefinition::RequiredToken(SyntaxKind::Discard),
-                SyntaxDefinition::OneOf(vec![
-                    SyntaxKind::All,
-                    SyntaxKind::Plans,
-                    SyntaxKind::Sequences,
-                    SyntaxKind::Temp,
-                    SyntaxKind::Temporary,
-                ]),
-            ],
-        });
-
-        m.push(StatementDefinition {
-            stmt: SyntaxKind::CreateRoleStmt,
-            tokens: vec![
-                SyntaxDefinition::RequiredToken(SyntaxKind::Create),
-                SyntaxDefinition::OneOf(vec![
-                    SyntaxKind::Role,
-                    SyntaxKind::GroupP,
-                    SyntaxKind::User,
-                ]),
-                SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
-            ],
-        });
-
-        m.push(StatementDefinition {
-            stmt: SyntaxKind::AlterRoleStmt,
-            tokens: vec![
-                SyntaxDefinition::RequiredToken(SyntaxKind::Alter),
-                SyntaxDefinition::RequiredToken(SyntaxKind::Role),
-                SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
-            ],
-        });
-
-        m.push(StatementDefinition {
-            stmt: SyntaxKind::DropRoleStmt,
-            tokens: vec![
-                SyntaxDefinition::RequiredToken(SyntaxKind::Drop),
-                SyntaxDefinition::OneOf(vec![
-                    SyntaxKind::Role,
-                    SyntaxKind::User,
-                    SyntaxKind::GroupP,
-                ]),
-                SyntaxDefinition::OptionalToken(SyntaxKind::IfP),
-                SyntaxDefinition::OptionalToken(SyntaxKind::Exists),
-                SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
-            ],
-        });
-
-        m.push(StatementDefinition {
-            stmt: SyntaxKind::LockStmt,
-            tokens: vec![
-                SyntaxDefinition::RequiredToken(SyntaxKind::LockP),
-                SyntaxDefinition::OptionalToken(SyntaxKind::Table),
-                SyntaxDefinition::OptionalToken(SyntaxKind::Only),
-                SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
-            ],
-        });
-
-        m.push(StatementDefinition {
-            stmt: SyntaxKind::ConstraintsSetStmt,
-            tokens: vec![
-                SyntaxDefinition::RequiredToken(SyntaxKind::Set),
-                SyntaxDefinition::RequiredToken(SyntaxKind::Constraints),
-            ],
-        });
-
-        m.push(StatementDefinition {
-            stmt: SyntaxKind::ReindexStmt,
-            tokens: vec![
-                SyntaxDefinition::RequiredToken(SyntaxKind::Reindex),
-                SyntaxDefinition::OptionalToken(SyntaxKind::Concurrently),
-                SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
-            ],
-        });
-
-        m.push(StatementDefinition {
-            stmt: SyntaxKind::CheckPointStmt,
-            tokens: vec![SyntaxDefinition::RequiredToken(SyntaxKind::Checkpoint)],
-        });
-
-        m.push(StatementDefinition {
-            stmt: SyntaxKind::CreateSchemaStmt,
-            tokens: vec![
-                SyntaxDefinition::RequiredToken(SyntaxKind::Create),
-                SyntaxDefinition::RequiredToken(SyntaxKind::Schema),
-            ],
-        });
-
-        m.push(StatementDefinition {
-            stmt: SyntaxKind::AlterDatabaseStmt,
-            tokens: vec![
-                SyntaxDefinition::RequiredToken(SyntaxKind::Alter),
-                SyntaxDefinition::RequiredToken(SyntaxKind::Database),
-                SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
-            ],
-        });
-
-        m.push(StatementDefinition {
-            stmt: SyntaxKind::AlterDatabaseRefreshCollStmt,
-            tokens: vec![
-                SyntaxDefinition::RequiredToken(SyntaxKind::Alter),
-                SyntaxDefinition::RequiredToken(SyntaxKind::Database),
-                SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
-                SyntaxDefinition::RequiredToken(SyntaxKind::Refresh),
-                SyntaxDefinition::RequiredToken(SyntaxKind::Collation),
-                SyntaxDefinition::RequiredToken(SyntaxKind::VersionP),
-            ],
-        });
-
-        m.push(StatementDefinition {
-            stmt: SyntaxKind::AlterDatabaseSetStmt,
-            tokens: vec![
-                SyntaxDefinition::RequiredToken(SyntaxKind::Alter),
-                SyntaxDefinition::RequiredToken(SyntaxKind::Database),
-                SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
-                SyntaxDefinition::RequiredToken(SyntaxKind::Set),
-            ],
-        });
-
-        m.push(StatementDefinition {
-            stmt: SyntaxKind::AlterDatabaseSetStmt,
-            tokens: vec![
-                SyntaxDefinition::RequiredToken(SyntaxKind::Alter),
-                SyntaxDefinition::RequiredToken(SyntaxKind::Database),
-                SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
-                SyntaxDefinition::RequiredToken(SyntaxKind::Reset),
-            ],
-        });
-
-        m.push(StatementDefinition {
-            stmt: SyntaxKind::CreateConversionStmt,
-            tokens: vec![
-                SyntaxDefinition::RequiredToken(SyntaxKind::Create),
-                SyntaxDefinition::OptionalToken(SyntaxKind::Default),
-                SyntaxDefinition::RequiredToken(SyntaxKind::ConversionP),
-                SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
-                SyntaxDefinition::RequiredToken(SyntaxKind::For),
-                SyntaxDefinition::RequiredToken(SyntaxKind::Sconst),
-                SyntaxDefinition::RequiredToken(SyntaxKind::To),
-                SyntaxDefinition::RequiredToken(SyntaxKind::Sconst),
-                SyntaxDefinition::RequiredToken(SyntaxKind::From),
-                SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
-            ],
-        });
-
-        m.push(StatementDefinition {
-            stmt: SyntaxKind::CreateCastStmt,
-            tokens: vec![
-                SyntaxDefinition::RequiredToken(SyntaxKind::Create),
-                SyntaxDefinition::RequiredToken(SyntaxKind::Cast),
-                SyntaxDefinition::RequiredToken(SyntaxKind::Ascii40),
-                SyntaxDefinition::AnyTokens,
-                SyntaxDefinition::RequiredToken(SyntaxKind::As),
-                SyntaxDefinition::AnyTokens,
-                SyntaxDefinition::RequiredToken(SyntaxKind::Ascii41),
-            ],
-        });
-
-        m.push(StatementDefinition {
-            stmt: SyntaxKind::CreateOpFamilyStmt,
-            tokens: vec![
-                SyntaxDefinition::RequiredToken(SyntaxKind::Create),
-                SyntaxDefinition::RequiredToken(SyntaxKind::Operator),
-                SyntaxDefinition::RequiredToken(SyntaxKind::Family),
-                SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
-            ],
-        });
-
-        m.push(StatementDefinition {
-            stmt: SyntaxKind::AlterOpFamilyStmt,
-            tokens: vec![
-                SyntaxDefinition::RequiredToken(SyntaxKind::Alter),
-                SyntaxDefinition::RequiredToken(SyntaxKind::Operator),
-                SyntaxDefinition::RequiredToken(SyntaxKind::Family),
-                // for schemas, this should be put into all definitions...
-                // SyntaxDefinition::OptionalToken(SyntaxKind::Ident),
-                // SyntaxDefinition::OptionalToken(SyntaxKind::Ascii46),
-                SyntaxDefinition::AnyTokens,
-                // SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
-                SyntaxDefinition::RequiredToken(SyntaxKind::Using),
-                SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
-                // this is important to not conflict with RenameStmt
-                SyntaxDefinition::OneOf(vec![SyntaxKind::Drop, SyntaxKind::AddP]),
-            ],
-        });
-
-        m.push(StatementDefinition {
-            stmt: SyntaxKind::PrepareStmt,
-            tokens: vec![
-                SyntaxDefinition::RequiredToken(SyntaxKind::Prepare),
-                SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
-                SyntaxDefinition::AnyToken,
-                SyntaxDefinition::RequiredToken(SyntaxKind::As),
-                SyntaxDefinition::OneOf(vec![SyntaxKind::With, SyntaxKind::Select]),
-            ],
-        });
-
-        m.push(StatementDefinition {
-            stmt: SyntaxKind::DeallocateStmt,
-            tokens: vec![
-                SyntaxDefinition::RequiredToken(SyntaxKind::Deallocate),
-                SyntaxDefinition::OptionalToken(SyntaxKind::Prepare),
-                SyntaxDefinition::OneOf(vec![SyntaxKind::Ident, SyntaxKind::All]),
-            ],
-        });
-
-        m.push(StatementDefinition {
-            stmt: SyntaxKind::CreateTableSpaceStmt,
-            tokens: vec![
-                SyntaxDefinition::RequiredToken(SyntaxKind::Create),
-                SyntaxDefinition::RequiredToken(SyntaxKind::Tablespace),
-                SyntaxDefinition::AnyTokens,
-                SyntaxDefinition::RequiredToken(SyntaxKind::Location),
-            ],
-        });
-
-        m.push(StatementDefinition {
-            stmt: SyntaxKind::DropTableSpaceStmt,
-            tokens: vec![
-                SyntaxDefinition::RequiredToken(SyntaxKind::Drop),
-                SyntaxDefinition::RequiredToken(SyntaxKind::Tablespace),
-                SyntaxDefinition::OptionalToken(SyntaxKind::IfP),
-                SyntaxDefinition::OptionalToken(SyntaxKind::Exists),
-                SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
-            ],
-        });
-
-        m.push(StatementDefinition {
-            stmt: SyntaxKind::AlterOperatorStmt,
-            tokens: vec![
-                SyntaxDefinition::RequiredToken(SyntaxKind::Alter),
-                SyntaxDefinition::RequiredToken(SyntaxKind::Operator),
-            ],
-        });
-
-        m.push(StatementDefinition {
-            stmt: SyntaxKind::AlterTypeStmt,
-            tokens: vec![
-                SyntaxDefinition::RequiredToken(SyntaxKind::Alter),
-                SyntaxDefinition::RequiredToken(SyntaxKind::TypeP),
-                SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
-            ],
-        });
-
-        m.push(StatementDefinition {
-            stmt: SyntaxKind::DropOwnedStmt,
-            tokens: vec![
-                SyntaxDefinition::RequiredToken(SyntaxKind::Drop),
-                SyntaxDefinition::RequiredToken(SyntaxKind::Owned),
-                SyntaxDefinition::RequiredToken(SyntaxKind::By),
-            ],
-        });
-
-        m.push(StatementDefinition {
-            stmt: SyntaxKind::ReassignOwnedStmt,
-            tokens: vec![
-                SyntaxDefinition::RequiredToken(SyntaxKind::Reassign),
-                SyntaxDefinition::RequiredToken(SyntaxKind::Owned),
-                SyntaxDefinition::RequiredToken(SyntaxKind::By),
-                SyntaxDefinition::AnyTokens,
-                SyntaxDefinition::RequiredToken(SyntaxKind::To),
-            ],
-        });
-
-        m.push(StatementDefinition {
-            stmt: SyntaxKind::CreateFdwStmt,
-            tokens: vec![
-                SyntaxDefinition::RequiredToken(SyntaxKind::Create),
-                SyntaxDefinition::RequiredToken(SyntaxKind::Foreign),
-                SyntaxDefinition::RequiredToken(SyntaxKind::DataP),
-                SyntaxDefinition::RequiredToken(SyntaxKind::Wrapper),
-                SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
-            ],
-        });
-
-        m.push(StatementDefinition {
-            stmt: SyntaxKind::AlterFdwStmt,
-            tokens: vec![
-                SyntaxDefinition::RequiredToken(SyntaxKind::Alter),
-                SyntaxDefinition::RequiredToken(SyntaxKind::Foreign),
-                SyntaxDefinition::RequiredToken(SyntaxKind::DataP),
-                SyntaxDefinition::RequiredToken(SyntaxKind::Wrapper),
-                SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
-            ],
-        });
-
-        m.push(StatementDefinition {
-            stmt: SyntaxKind::CreateForeignServerStmt,
-            tokens: vec![
-                SyntaxDefinition::RequiredToken(SyntaxKind::Create),
-                SyntaxDefinition::RequiredToken(SyntaxKind::Server),
-                SyntaxDefinition::OptionalToken(SyntaxKind::IfP),
-                SyntaxDefinition::OptionalToken(SyntaxKind::Not),
-                SyntaxDefinition::OptionalToken(SyntaxKind::Exists),
-                SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
-                SyntaxDefinition::AnyTokens,
-                SyntaxDefinition::RequiredToken(SyntaxKind::Foreign),
-                SyntaxDefinition::RequiredToken(SyntaxKind::DataP),
-                SyntaxDefinition::RequiredToken(SyntaxKind::Wrapper),
-                SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
-            ],
-        });
-
-        m.push(StatementDefinition {
-            stmt: SyntaxKind::AlterForeignServerStmt,
-            tokens: vec![
-                SyntaxDefinition::RequiredToken(SyntaxKind::Alter),
-                SyntaxDefinition::RequiredToken(SyntaxKind::Server),
-                SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
-            ],
-        });
-
-        m.push(StatementDefinition {
-            stmt: SyntaxKind::CreateUserMappingStmt,
-            tokens: vec![
-                SyntaxDefinition::RequiredToken(SyntaxKind::Create),
-                SyntaxDefinition::RequiredToken(SyntaxKind::User),
-                SyntaxDefinition::RequiredToken(SyntaxKind::Mapping),
-                SyntaxDefinition::OptionalToken(SyntaxKind::IfP),
-                SyntaxDefinition::OptionalToken(SyntaxKind::Not),
-                SyntaxDefinition::OptionalToken(SyntaxKind::Exists),
-                SyntaxDefinition::RequiredToken(SyntaxKind::For),
-                SyntaxDefinition::AnyTokens,
-                SyntaxDefinition::RequiredToken(SyntaxKind::Server),
-                SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
-            ],
-        });
-
-        m.push(StatementDefinition {
-            stmt: SyntaxKind::AlterUserMappingStmt,
-            tokens: vec![
-                SyntaxDefinition::RequiredToken(SyntaxKind::Alter),
-                SyntaxDefinition::RequiredToken(SyntaxKind::User),
-                SyntaxDefinition::RequiredToken(SyntaxKind::Mapping),
-                SyntaxDefinition::OptionalToken(SyntaxKind::For),
-                SyntaxDefinition::AnyTokens,
-                SyntaxDefinition::RequiredToken(SyntaxKind::Server),
-                SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
-                SyntaxDefinition::RequiredToken(SyntaxKind::Options),
-            ],
-        });
-
-        m.push(StatementDefinition {
-            stmt: SyntaxKind::DropUserMappingStmt,
-            tokens: vec![
-                SyntaxDefinition::RequiredToken(SyntaxKind::Alter),
-                SyntaxDefinition::RequiredToken(SyntaxKind::User),
-                SyntaxDefinition::RequiredToken(SyntaxKind::Mapping),
-                SyntaxDefinition::OptionalToken(SyntaxKind::IfP),
-                SyntaxDefinition::OptionalToken(SyntaxKind::Exists),
-                SyntaxDefinition::OptionalToken(SyntaxKind::For),
-                SyntaxDefinition::AnyTokens,
-                SyntaxDefinition::RequiredToken(SyntaxKind::Server),
-                SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
-            ],
-        });
-
-        m.push(StatementDefinition {
-            stmt: SyntaxKind::SecLabelStmt,
-            tokens: vec![
-                SyntaxDefinition::RequiredToken(SyntaxKind::Security),
-                SyntaxDefinition::RequiredToken(SyntaxKind::Label),
-                SyntaxDefinition::OptionalToken(SyntaxKind::For),
-                SyntaxDefinition::OptionalToken(SyntaxKind::Ident),
-                SyntaxDefinition::RequiredToken(SyntaxKind::On),
-            ],
-        });
-
-        m.push(StatementDefinition {
-            stmt: SyntaxKind::CreateForeignTableStmt,
-            tokens: vec![
-                SyntaxDefinition::RequiredToken(SyntaxKind::Create),
-                SyntaxDefinition::RequiredToken(SyntaxKind::Foreign),
-                SyntaxDefinition::RequiredToken(SyntaxKind::Table),
-                SyntaxDefinition::OptionalToken(SyntaxKind::IfP),
-                SyntaxDefinition::OptionalToken(SyntaxKind::Not),
-                SyntaxDefinition::OptionalToken(SyntaxKind::Exists),
-                SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
-                SyntaxDefinition::AnyTokens,
-                SyntaxDefinition::RequiredToken(SyntaxKind::Server),
-                SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
-            ],
-        });
-
-        m.push(StatementDefinition {
-            stmt: SyntaxKind::ImportForeignSchemaStmt,
-            tokens: vec![
-                SyntaxDefinition::RequiredToken(SyntaxKind::ImportP),
-                SyntaxDefinition::RequiredToken(SyntaxKind::Foreign),
-                SyntaxDefinition::RequiredToken(SyntaxKind::Schema),
-                SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
-                SyntaxDefinition::AnyTokens,
-                SyntaxDefinition::RequiredToken(SyntaxKind::From),
-                SyntaxDefinition::RequiredToken(SyntaxKind::Server),
-                SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
-                SyntaxDefinition::RequiredToken(SyntaxKind::Into),
-                SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
-            ],
-        });
-
-        m.push(StatementDefinition {
-            stmt: SyntaxKind::CreateExtensionStmt,
-            tokens: vec![
-                SyntaxDefinition::RequiredToken(SyntaxKind::Create),
-                SyntaxDefinition::RequiredToken(SyntaxKind::Extension),
-                SyntaxDefinition::OptionalToken(SyntaxKind::IfP),
-                SyntaxDefinition::OptionalToken(SyntaxKind::Not),
-                SyntaxDefinition::OptionalToken(SyntaxKind::Exists),
-                SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
-            ],
-        });
-
-        m.push(StatementDefinition {
-            stmt: SyntaxKind::AlterExtensionStmt,
-            tokens: vec![
-                SyntaxDefinition::RequiredToken(SyntaxKind::Alter),
-                SyntaxDefinition::RequiredToken(SyntaxKind::Extension),
-                SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
-            ],
-        });
-
-        m.push(StatementDefinition {
-            stmt: SyntaxKind::CreateEventTrigStmt,
-            tokens: vec![
-                SyntaxDefinition::RequiredToken(SyntaxKind::Create),
-                SyntaxDefinition::RequiredToken(SyntaxKind::Event),
-                SyntaxDefinition::RequiredToken(SyntaxKind::Trigger),
-                SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
-                SyntaxDefinition::RequiredToken(SyntaxKind::On),
-                SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
-                SyntaxDefinition::AnyTokens,
-                SyntaxDefinition::RequiredToken(SyntaxKind::Execute),
-                SyntaxDefinition::OneOf(vec![SyntaxKind::Function, SyntaxKind::Procedure]),
-                SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
-                SyntaxDefinition::RequiredToken(SyntaxKind::Ascii40),
-                SyntaxDefinition::RequiredToken(SyntaxKind::Ascii41),
-            ],
-        });
-
-        m.push(StatementDefinition {
-            stmt: SyntaxKind::AlterEventTrigStmt,
-            tokens: vec![
-                SyntaxDefinition::RequiredToken(SyntaxKind::Alter),
-                SyntaxDefinition::RequiredToken(SyntaxKind::Event),
-                SyntaxDefinition::RequiredToken(SyntaxKind::Trigger),
-                SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
-            ],
-        });
-
-        m.push(StatementDefinition {
-            stmt: SyntaxKind::RefreshMatViewStmt,
-            tokens: vec![
-                SyntaxDefinition::RequiredToken(SyntaxKind::Refresh),
-                SyntaxDefinition::RequiredToken(SyntaxKind::Materialized),
-                SyntaxDefinition::RequiredToken(SyntaxKind::View),
-                SyntaxDefinition::OptionalToken(SyntaxKind::Concurrently),
-                SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
-            ],
-        });
-
-        m.push(StatementDefinition {
-            stmt: SyntaxKind::AlterSystemStmt,
-            tokens: vec![
-                SyntaxDefinition::RequiredToken(SyntaxKind::Alter),
-                SyntaxDefinition::RequiredToken(SyntaxKind::SystemP),
-                SyntaxDefinition::OneOf(vec![SyntaxKind::Set, SyntaxKind::Reset]),
-            ],
-        });
-
-        m.push(StatementDefinition {
-            stmt: SyntaxKind::CreatePolicyStmt,
-            tokens: vec![
-                SyntaxDefinition::RequiredToken(SyntaxKind::Create),
-                SyntaxDefinition::RequiredToken(SyntaxKind::Policy),
-                SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
-                SyntaxDefinition::RequiredToken(SyntaxKind::On),
-                SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
-            ],
-        });
-
-        m.push(StatementDefinition {
-            stmt: SyntaxKind::AlterPolicyStmt,
-            tokens: vec![
-                SyntaxDefinition::RequiredToken(SyntaxKind::Alter),
-                SyntaxDefinition::RequiredToken(SyntaxKind::Policy),
-                SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
-                SyntaxDefinition::RequiredToken(SyntaxKind::On),
-                SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
-            ],
-        });
-
-        m.push(StatementDefinition {
-            stmt: SyntaxKind::CreateTransformStmt,
-            tokens: vec![
-                SyntaxDefinition::RequiredToken(SyntaxKind::Create),
-                SyntaxDefinition::OptionalToken(SyntaxKind::Or),
-                SyntaxDefinition::OptionalToken(SyntaxKind::Replace),
-                SyntaxDefinition::RequiredToken(SyntaxKind::Transform),
-                SyntaxDefinition::RequiredToken(SyntaxKind::For),
-                SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
-                SyntaxDefinition::RequiredToken(SyntaxKind::Language),
-                SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
-                SyntaxDefinition::RequiredToken(SyntaxKind::Ascii40),
-                SyntaxDefinition::AnyTokens,
-                SyntaxDefinition::RequiredToken(SyntaxKind::Ascii41),
-            ],
-        });
-
-        m.push(StatementDefinition {
-            stmt: SyntaxKind::CreateAmStmt,
-            tokens: vec![
-                SyntaxDefinition::RequiredToken(SyntaxKind::Create),
-                SyntaxDefinition::RequiredToken(SyntaxKind::Access),
-                SyntaxDefinition::RequiredToken(SyntaxKind::Method),
-                SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
-                SyntaxDefinition::RequiredToken(SyntaxKind::TypeP),
-            ],
-        });
-
-        m.push(StatementDefinition {
-            stmt: SyntaxKind::CreatePublicationStmt,
-            tokens: vec![
-                SyntaxDefinition::RequiredToken(SyntaxKind::Create),
-                SyntaxDefinition::RequiredToken(SyntaxKind::Publication),
-                SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
-            ],
-        });
-
-        m.push(StatementDefinition {
-            stmt: SyntaxKind::AlterPublicationStmt,
-            tokens: vec![
-                SyntaxDefinition::RequiredToken(SyntaxKind::Alter),
-                SyntaxDefinition::RequiredToken(SyntaxKind::Publication),
-                SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
-            ],
-        });
-
-        m.push(StatementDefinition {
-            stmt: SyntaxKind::CreateSubscriptionStmt,
-            tokens: vec![
-                SyntaxDefinition::RequiredToken(SyntaxKind::Create),
-                SyntaxDefinition::RequiredToken(SyntaxKind::Subscription),
-                SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
-                SyntaxDefinition::RequiredToken(SyntaxKind::Connection),
-                SyntaxDefinition::RequiredToken(SyntaxKind::Sconst),
-                SyntaxDefinition::RequiredToken(SyntaxKind::Publication),
-                SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
-            ],
-        });
-
-        m.push(StatementDefinition {
-            stmt: SyntaxKind::AlterSubscriptionStmt,
-            tokens: vec![
-                SyntaxDefinition::RequiredToken(SyntaxKind::Alter),
-                SyntaxDefinition::RequiredToken(SyntaxKind::Subscription),
-                SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
-            ],
-        });
-
-        m.push(StatementDefinition {
-            stmt: SyntaxKind::DropSubscriptionStmt,
-            tokens: vec![
-                SyntaxDefinition::RequiredToken(SyntaxKind::Drop),
-                SyntaxDefinition::RequiredToken(SyntaxKind::Subscription),
-                SyntaxDefinition::OptionalToken(SyntaxKind::IfP),
-                SyntaxDefinition::OptionalToken(SyntaxKind::Exists),
-                SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
-            ],
-        });
-
-        // GRANT ALL ON SCHEMA alt_nsp1, alt_nsp2 TO public;
-        m.push(StatementDefinition {
-            stmt: SyntaxKind::GrantStmt,
-            tokens: vec![
-                SyntaxDefinition::RequiredToken(SyntaxKind::Grant),
-                SyntaxDefinition::AnyTokens,
-                SyntaxDefinition::RequiredToken(SyntaxKind::On),
-                SyntaxDefinition::AnyTokens,
-                SyntaxDefinition::RequiredToken(SyntaxKind::To),
-            ],
-        });
-
-        // REVOKE ALL ON SCHEMA alt_nsp6 FROM regress_alter_generic_user6;
-        m.push(StatementDefinition {
-            stmt: SyntaxKind::GrantStmt,
-            tokens: vec![
-                SyntaxDefinition::RequiredToken(SyntaxKind::Revoke),
-                SyntaxDefinition::AnyTokens,
-                SyntaxDefinition::RequiredToken(SyntaxKind::On),
-            ],
-        });
-
-        m.push(StatementDefinition {
-            stmt: SyntaxKind::AlterOwnerStmt,
-            tokens: vec![
-                SyntaxDefinition::RequiredToken(SyntaxKind::Alter),
-                SyntaxDefinition::AnyTokens,
-                SyntaxDefinition::RequiredToken(SyntaxKind::Owner),
-                SyntaxDefinition::RequiredToken(SyntaxKind::To),
-                SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
-            ],
-        });
-
-        // ALTER AGGREGATE alt_func1(int) SET SCHEMA alt_nsp2;
-        m.push(StatementDefinition {
-            stmt: SyntaxKind::AlterObjectSchemaStmt,
-            tokens: vec![
-                SyntaxDefinition::RequiredToken(SyntaxKind::Alter),
-                SyntaxDefinition::AnyTokens,
-                SyntaxDefinition::RequiredToken(SyntaxKind::Set),
-                SyntaxDefinition::RequiredToken(SyntaxKind::Schema),
-                SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
-            ],
-        });
-
-        m.push(StatementDefinition {
-            stmt: SyntaxKind::CreatePlangStmt,
-            tokens: vec![
-                SyntaxDefinition::RequiredToken(SyntaxKind::Create),
-                SyntaxDefinition::OptionalToken(SyntaxKind::Or),
-                SyntaxDefinition::OptionalToken(SyntaxKind::Replace),
-                SyntaxDefinition::OptionalToken(SyntaxKind::Trusted),
-                SyntaxDefinition::OptionalToken(SyntaxKind::Procedural),
-                SyntaxDefinition::RequiredToken(SyntaxKind::Language),
-                SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
-            ],
-        });
-
-        m.push(StatementDefinition {
-            stmt: SyntaxKind::CreateStatsStmt,
-            tokens: vec![
-                SyntaxDefinition::RequiredToken(SyntaxKind::Create),
-                SyntaxDefinition::RequiredToken(SyntaxKind::Statistics),
-                SyntaxDefinition::AnyTokens,
-                SyntaxDefinition::RequiredToken(SyntaxKind::On),
-                SyntaxDefinition::AnyTokens,
-                SyntaxDefinition::RequiredToken(SyntaxKind::From),
-                SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
-            ],
-        });
+        // m.push(StatementDefinition {
+        //     stmt: SyntaxKind::CreateTrigStmt,
+        //     tokens: vec![
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Create),
+        //         SyntaxDefinition::OptionalToken(SyntaxKind::Or),
+        //         SyntaxDefinition::OptionalToken(SyntaxKind::Replace),
+        //         SyntaxDefinition::OptionalToken(SyntaxKind::Constraint),
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Trigger),
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
+        //         SyntaxDefinition::AnyTokens,
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::On),
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
+        //         SyntaxDefinition::AnyTokens,
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Execute),
+        //         SyntaxDefinition::OneOf(vec![SyntaxKind::Function, SyntaxKind::Procedure]),
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
+        //     ],
+        // });
+
+        m.push(StatementDefinition::new(
+            SyntaxKind::SelectStmt,
+            SyntaxBuilder::new()
+                .required_token(SyntaxKind::Select)
+                .any_token(),
+        ));
+
+        m.push(
+            StatementDefinition::new(
+                SyntaxKind::InsertStmt,
+                SyntaxBuilder::new()
+                    .required_token(SyntaxKind::Insert)
+                    .required_token(SyntaxKind::Into)
+                    .optional_schema_name_group()
+                    .required_token(SyntaxKind::Ident),
+            )
+            .with_prohibited_following_statements(vec![SyntaxKind::SelectStmt]),
+        );
+
+        m.push(StatementDefinition::new(
+            SyntaxKind::DeleteStmt,
+            SyntaxBuilder::new()
+                .required_token(SyntaxKind::DeleteP)
+                .required_token(SyntaxKind::From)
+                .optional_token(SyntaxKind::Only)
+                .optional_schema_name_group()
+                .required_token(SyntaxKind::Ident),
+        ));
+
+        m.push(StatementDefinition::new(
+            SyntaxKind::UpdateStmt,
+            SyntaxBuilder::new()
+                .required_token(SyntaxKind::Update)
+                .optional_token(SyntaxKind::Only)
+                .optional_schema_name_group()
+                .required_token(SyntaxKind::Ident)
+                .any_tokens(None)
+                .required_token(SyntaxKind::Set)
+                .any_token(),
+        ));
+
+        // m.push(StatementDefinition {
+        //     stmt: SyntaxKind::MergeStmt,
+        //     tokens: vec![
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Merge),
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Into),
+        //         SyntaxDefinition::OptionalToken(SyntaxKind::Only),
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
+        //     ],
+        // });
+        //
+        // m.push(StatementDefinition {
+        //     stmt: SyntaxKind::AlterTableStmt,
+        //     tokens: vec![
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Alter),
+        //         SyntaxDefinition::OptionalToken(SyntaxKind::Materialized),
+        //         SyntaxDefinition::OneOf(vec![
+        //             SyntaxKind::Table,
+        //             SyntaxKind::Index,
+        //             SyntaxKind::View,
+        //         ]),
+        //         SyntaxDefinition::OptionalToken(SyntaxKind::IfP),
+        //         SyntaxDefinition::OptionalToken(SyntaxKind::Exists),
+        //         SyntaxDefinition::OptionalToken(SyntaxKind::Only),
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
+        //         SyntaxDefinition::AnyToken,
+        //     ],
+        // });
+        //
+        // m.push(StatementDefinition {
+        //     stmt: SyntaxKind::RenameStmt,
+        //     tokens: vec![
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Alter),
+        //         SyntaxDefinition::AnyTokens,
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
+        //         SyntaxDefinition::AnyTokens,
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Rename),
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::To),
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
+        //     ],
+        // });
+        //
+        // m.push(StatementDefinition {
+        //     stmt: SyntaxKind::RenameStmt,
+        //     tokens: vec![
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Alter),
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Table),
+        //         SyntaxDefinition::OptionalToken(SyntaxKind::IfP),
+        //         SyntaxDefinition::OptionalToken(SyntaxKind::Exists),
+        //         SyntaxDefinition::OptionalToken(SyntaxKind::Only),
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Rename),
+        //     ],
+        // });
+        //
+        // m.push(StatementDefinition {
+        //     stmt: SyntaxKind::AlterDomainStmt,
+        //     tokens: vec![
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Alter),
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::DomainP),
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
+        //     ],
+        // });
+        //
+        // m.push(StatementDefinition {
+        //     stmt: SyntaxKind::CallStmt,
+        //     tokens: vec![
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Call),
+        //         SyntaxDefinition::OneOf(vec![SyntaxKind::Ident, SyntaxKind::VersionP]),
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Ascii40),
+        //         SyntaxDefinition::AnyTokens,
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Ascii41),
+        //     ],
+        // });
+        //
+        // m.push(StatementDefinition {
+        //     stmt: SyntaxKind::AlterDefaultPrivilegesStmt,
+        //     tokens: vec![
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Alter),
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Default),
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Privileges),
+        //     ],
+        // });
+        //
+        // m.push(StatementDefinition {
+        //     stmt: SyntaxKind::ClusterStmt,
+        //     tokens: vec![SyntaxDefinition::RequiredToken(SyntaxKind::Cluster)],
+        // });
+        //
+        // m.push(StatementDefinition {
+        //     stmt: SyntaxKind::CopyStmt,
+        //     tokens: vec![SyntaxDefinition::RequiredToken(SyntaxKind::Copy)],
+        // });
+        //
+        // m.push(StatementDefinition {
+        //     stmt: SyntaxKind::ExecuteStmt,
+        //     tokens: vec![
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Execute),
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
+        //     ],
+        // });
+        //
+        // // TODO we might need to add new types to handle this properly
+        // m.push(StatementDefinition {
+        //     stmt: SyntaxKind::CreateStmt,
+        //     tokens: vec![
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Create),
+        //         SyntaxDefinition::OptionalToken(SyntaxKind::Global),
+        //         SyntaxDefinition::OptionalToken(SyntaxKind::Local),
+        //         SyntaxDefinition::OptionalToken(SyntaxKind::Temporary),
+        //         SyntaxDefinition::OptionalToken(SyntaxKind::Temp),
+        //         SyntaxDefinition::OptionalToken(SyntaxKind::Unlogged),
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Table),
+        //         SyntaxDefinition::OptionalToken(SyntaxKind::IfP),
+        //         SyntaxDefinition::OptionalToken(SyntaxKind::Not),
+        //         SyntaxDefinition::OptionalToken(SyntaxKind::Exists),
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
+        //     ],
+        // });
+        //
+        // m.push(StatementDefinition {
+        //     stmt: SyntaxKind::DefineStmt,
+        //     tokens: vec![
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Create),
+        //         SyntaxDefinition::OptionalToken(SyntaxKind::Or),
+        //         SyntaxDefinition::OptionalToken(SyntaxKind::Replace),
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Aggregate),
+        //     ],
+        // });
+        //
+        // m.push(StatementDefinition {
+        //     stmt: SyntaxKind::CreateOpClassStmt,
+        //     tokens: vec![
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Create),
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Operator),
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Class),
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
+        //         SyntaxDefinition::OptionalToken(SyntaxKind::Default),
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::For),
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::TypeP),
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Using),
+        //     ],
+        // });
+        //
+        // m.push(StatementDefinition {
+        //     stmt: SyntaxKind::DropStmt,
+        //     tokens: vec![
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Drop),
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Operator),
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Class),
+        //         SyntaxDefinition::OptionalToken(SyntaxKind::IfP),
+        //         SyntaxDefinition::OptionalToken(SyntaxKind::Exists),
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Using),
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
+        //     ],
+        // });
+        //
+        // m.push(StatementDefinition {
+        //     stmt: SyntaxKind::DropStmt,
+        //     tokens: vec![
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Drop),
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Access),
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Method),
+        //         SyntaxDefinition::OptionalToken(SyntaxKind::IfP),
+        //         SyntaxDefinition::OptionalToken(SyntaxKind::Exists),
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
+        //     ],
+        // });
+        //
+        // m.push(StatementDefinition {
+        //     stmt: SyntaxKind::DropStmt,
+        //     tokens: vec![
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Drop),
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Server),
+        //         SyntaxDefinition::OptionalToken(SyntaxKind::IfP),
+        //         SyntaxDefinition::OptionalToken(SyntaxKind::Exists),
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
+        //     ],
+        // });
+        //
+        // m.push(StatementDefinition {
+        //     stmt: SyntaxKind::DropStmt,
+        //     tokens: vec![
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Drop),
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Trigger),
+        //         SyntaxDefinition::OptionalToken(SyntaxKind::IfP),
+        //         SyntaxDefinition::OptionalToken(SyntaxKind::Exists),
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::On),
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
+        //     ],
+        // });
+        //
+        // m.push(StatementDefinition {
+        //     stmt: SyntaxKind::DropStmt,
+        //     tokens: vec![
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Drop),
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Collation),
+        //         SyntaxDefinition::OptionalToken(SyntaxKind::IfP),
+        //         SyntaxDefinition::OptionalToken(SyntaxKind::Exists),
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
+        //     ],
+        // });
+        //
+        // m.push(StatementDefinition {
+        //     stmt: SyntaxKind::DropStmt,
+        //     tokens: vec![
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Drop),
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::ConversionP),
+        //         SyntaxDefinition::OptionalToken(SyntaxKind::IfP),
+        //         SyntaxDefinition::OptionalToken(SyntaxKind::Exists),
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
+        //     ],
+        // });
+        //
+        // m.push(StatementDefinition {
+        //     stmt: SyntaxKind::DropStmt,
+        //     tokens: vec![
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Drop),
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::TextP),
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Search),
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Parser),
+        //         SyntaxDefinition::OptionalToken(SyntaxKind::IfP),
+        //         SyntaxDefinition::OptionalToken(SyntaxKind::Exists),
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
+        //     ],
+        // });
+        //
+        // m.push(StatementDefinition {
+        //     stmt: SyntaxKind::DropStmt,
+        //     tokens: vec![
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Drop),
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::TextP),
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Search),
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Dictionary),
+        //         SyntaxDefinition::OptionalToken(SyntaxKind::IfP),
+        //         SyntaxDefinition::OptionalToken(SyntaxKind::Exists),
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
+        //     ],
+        // });
+        //
+        // m.push(StatementDefinition {
+        //     stmt: SyntaxKind::DropStmt,
+        //     tokens: vec![
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Drop),
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::TextP),
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Search),
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Template),
+        //         SyntaxDefinition::OptionalToken(SyntaxKind::IfP),
+        //         SyntaxDefinition::OptionalToken(SyntaxKind::Exists),
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
+        //     ],
+        // });
+        //
+        // m.push(StatementDefinition {
+        //     stmt: SyntaxKind::DropStmt,
+        //     tokens: vec![
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Drop),
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::TextP),
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Search),
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Configuration),
+        //         SyntaxDefinition::OptionalToken(SyntaxKind::IfP),
+        //         SyntaxDefinition::OptionalToken(SyntaxKind::Exists),
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
+        //     ],
+        // });
+        //
+        // m.push(StatementDefinition {
+        //     stmt: SyntaxKind::DropStmt,
+        //     tokens: vec![
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Drop),
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Extension),
+        //         SyntaxDefinition::OptionalToken(SyntaxKind::IfP),
+        //         SyntaxDefinition::OptionalToken(SyntaxKind::Exists),
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
+        //     ],
+        // });
+        //
+        // m.push(StatementDefinition {
+        //     stmt: SyntaxKind::DropStmt,
+        //     tokens: vec![
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Drop),
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Aggregate),
+        //         SyntaxDefinition::OptionalToken(SyntaxKind::IfP),
+        //         SyntaxDefinition::OptionalToken(SyntaxKind::Exists),
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
+        //     ],
+        // });
+        //
+        // m.push(StatementDefinition {
+        //     stmt: SyntaxKind::DropStmt,
+        //     tokens: vec![
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Drop),
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::DomainP),
+        //         SyntaxDefinition::OptionalToken(SyntaxKind::IfP),
+        //         SyntaxDefinition::OptionalToken(SyntaxKind::Exists),
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
+        //     ],
+        // });
+        //
+        // m.push(StatementDefinition {
+        //     stmt: SyntaxKind::DropStmt,
+        //     tokens: vec![
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Drop),
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Sequence),
+        //         SyntaxDefinition::OptionalToken(SyntaxKind::IfP),
+        //         SyntaxDefinition::OptionalToken(SyntaxKind::Exists),
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
+        //     ],
+        // });
+        //
+        // m.push(StatementDefinition {
+        //     stmt: SyntaxKind::DropStmt,
+        //     tokens: vec![
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Drop),
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Foreign),
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Table),
+        //         SyntaxDefinition::OptionalToken(SyntaxKind::IfP),
+        //         SyntaxDefinition::OptionalToken(SyntaxKind::Exists),
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
+        //     ],
+        // });
+        //
+        // m.push(StatementDefinition {
+        //     stmt: SyntaxKind::DropStmt,
+        //     tokens: vec![
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Drop),
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Cast),
+        //         SyntaxDefinition::OptionalToken(SyntaxKind::IfP),
+        //         SyntaxDefinition::OptionalToken(SyntaxKind::Exists),
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Ascii40),
+        //         SyntaxDefinition::AnyTokens,
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::As),
+        //         SyntaxDefinition::AnyTokens,
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Ascii41),
+        //     ],
+        // });
+        //
+        // m.push(StatementDefinition {
+        //     stmt: SyntaxKind::DropStmt,
+        //     tokens: vec![
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Drop),
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Foreign),
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::DataP),
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Wrapper),
+        //         SyntaxDefinition::OptionalToken(SyntaxKind::IfP),
+        //         SyntaxDefinition::OptionalToken(SyntaxKind::Exists),
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
+        //     ],
+        // });
+        //
+        // m.push(StatementDefinition {
+        //     stmt: SyntaxKind::DropStmt,
+        //     tokens: vec![
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Drop),
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Table),
+        //         SyntaxDefinition::OptionalToken(SyntaxKind::IfP),
+        //         SyntaxDefinition::OptionalToken(SyntaxKind::Exists),
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
+        //     ],
+        // });
+        //
+        // m.push(StatementDefinition {
+        //     stmt: SyntaxKind::DropStmt,
+        //     tokens: vec![
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Drop),
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Index),
+        //         SyntaxDefinition::OptionalToken(SyntaxKind::Concurrently),
+        //         SyntaxDefinition::OptionalToken(SyntaxKind::IfP),
+        //         SyntaxDefinition::OptionalToken(SyntaxKind::Exists),
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
+        //     ],
+        // });
+        //
+        // m.push(StatementDefinition {
+        //     stmt: SyntaxKind::DropStmt,
+        //     tokens: vec![
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Drop),
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Rule),
+        //         SyntaxDefinition::OptionalToken(SyntaxKind::IfP),
+        //         SyntaxDefinition::OptionalToken(SyntaxKind::Exists),
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::On),
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
+        //     ],
+        // });
+        //
+        // m.push(StatementDefinition {
+        //     stmt: SyntaxKind::DropStmt,
+        //     tokens: vec![
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Drop),
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::TypeP),
+        //         SyntaxDefinition::OptionalToken(SyntaxKind::IfP),
+        //         SyntaxDefinition::OptionalToken(SyntaxKind::Exists),
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
+        //     ],
+        // });
+        //
+        // m.push(StatementDefinition {
+        //     stmt: SyntaxKind::DropStmt,
+        //     tokens: vec![
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Drop),
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Operator),
+        //         SyntaxDefinition::OptionalToken(SyntaxKind::IfP),
+        //         SyntaxDefinition::OptionalToken(SyntaxKind::Exists),
+        //         SyntaxDefinition::OneOf(vec![SyntaxKind::Op, SyntaxKind::Ident]),
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Ascii40),
+        //         SyntaxDefinition::AnyTokens,
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Ascii41),
+        //     ],
+        // });
+        //
+        // m.push(StatementDefinition {
+        //     stmt: SyntaxKind::DropStmt,
+        //     tokens: vec![
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Drop),
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Routine),
+        //         SyntaxDefinition::OptionalToken(SyntaxKind::IfP),
+        //         SyntaxDefinition::OptionalToken(SyntaxKind::Exists),
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
+        //     ],
+        // });
+        //
+        // m.push(StatementDefinition {
+        //     stmt: SyntaxKind::DropStmt,
+        //     tokens: vec![
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Drop),
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Procedure),
+        //         SyntaxDefinition::OptionalToken(SyntaxKind::IfP),
+        //         SyntaxDefinition::OptionalToken(SyntaxKind::Exists),
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
+        //     ],
+        // });
+        //
+        // m.push(StatementDefinition {
+        //     stmt: SyntaxKind::DropStmt,
+        //     tokens: vec![
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Drop),
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Function),
+        //         SyntaxDefinition::OptionalToken(SyntaxKind::IfP),
+        //         SyntaxDefinition::OptionalToken(SyntaxKind::Exists),
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Ascii40),
+        //         SyntaxDefinition::AnyTokens,
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Ascii41),
+        //     ],
+        // });
+        //
+        // m.push(StatementDefinition {
+        //     stmt: SyntaxKind::DropStmt,
+        //     tokens: vec![
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Drop),
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Schema),
+        //         SyntaxDefinition::OptionalToken(SyntaxKind::IfP),
+        //         SyntaxDefinition::OptionalToken(SyntaxKind::Exists),
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
+        //     ],
+        // });
+        //
+        // m.push(StatementDefinition {
+        //     stmt: SyntaxKind::DropStmt,
+        //     tokens: vec![
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Drop),
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::View),
+        //         SyntaxDefinition::OptionalToken(SyntaxKind::IfP),
+        //         SyntaxDefinition::OptionalToken(SyntaxKind::Exists),
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
+        //     ],
+        // });
+        //
+        // m.push(StatementDefinition {
+        //     stmt: SyntaxKind::DropStmt,
+        //     tokens: vec![
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Drop),
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Language),
+        //         SyntaxDefinition::OptionalToken(SyntaxKind::IfP),
+        //         SyntaxDefinition::OptionalToken(SyntaxKind::Exists),
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
+        //     ],
+        // });
+        //
+        // m.push(StatementDefinition {
+        //     stmt: SyntaxKind::DropStmt,
+        //     tokens: vec![
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Drop),
+        //         SyntaxDefinition::OptionalToken(SyntaxKind::Procedural),
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Language),
+        //         SyntaxDefinition::OptionalToken(SyntaxKind::IfP),
+        //         SyntaxDefinition::OptionalToken(SyntaxKind::Exists),
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
+        //         SyntaxDefinition::OneOf(vec![SyntaxKind::Cascade, SyntaxKind::Restrict]),
+        //     ],
+        // });
+        //
+        // m.push(StatementDefinition {
+        //     stmt: SyntaxKind::DropStmt,
+        //     tokens: vec![
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Drop),
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Operator),
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Family),
+        //         SyntaxDefinition::OptionalToken(SyntaxKind::IfP),
+        //         SyntaxDefinition::OptionalToken(SyntaxKind::Exists),
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Using),
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
+        //     ],
+        // });
+        //
+        // // CREATE TEXT SEARCH DICTIONARY alt_ts_dict1 (template=simple);
+        // m.push(StatementDefinition {
+        //     stmt: SyntaxKind::DefineStmt,
+        //     tokens: vec![
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Create),
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::TextP),
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Search),
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Dictionary),
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Ascii40),
+        //         SyntaxDefinition::AnyTokens,
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Ascii41),
+        //     ],
+        // });
+        //
+        // m.push(StatementDefinition {
+        //     stmt: SyntaxKind::DefineStmt,
+        //     tokens: vec![
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Create),
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::TextP),
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Search),
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Configuration),
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Ascii40),
+        //         SyntaxDefinition::AnyTokens,
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Ascii41),
+        //     ],
+        // });
+        //
+        // m.push(StatementDefinition {
+        //     stmt: SyntaxKind::DefineStmt,
+        //     tokens: vec![
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Create),
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::TextP),
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Search),
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Template),
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Ascii40),
+        //         SyntaxDefinition::AnyTokens,
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Ascii41),
+        //     ],
+        // });
+        //
+        // m.push(StatementDefinition {
+        //     stmt: SyntaxKind::DefineStmt,
+        //     tokens: vec![
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Create),
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::TextP),
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Search),
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Parser),
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Ascii40),
+        //         SyntaxDefinition::AnyTokens,
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Ascii41),
+        //     ],
+        // });
+        //
+        // m.push(StatementDefinition {
+        //     stmt: SyntaxKind::DefineStmt,
+        //     tokens: vec![
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Create),
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Operator),
+        //     ],
+        // });
+        //
+        // m.push(StatementDefinition {
+        //     stmt: SyntaxKind::DefineStmt,
+        //     tokens: vec![
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Create),
+        //         SyntaxDefinition::OptionalToken(SyntaxKind::Or),
+        //         SyntaxDefinition::OptionalToken(SyntaxKind::Replace),
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Aggregate),
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Ascii40),
+        //         SyntaxDefinition::AnyTokens,
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Ascii41),
+        //     ],
+        // });
+        //
+        // m.push(StatementDefinition {
+        //     stmt: SyntaxKind::DefineStmt,
+        //     tokens: vec![
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Create),
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::TypeP),
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
+        //     ],
+        // });
+        //
+        // m.push(StatementDefinition {
+        //     stmt: SyntaxKind::CompositeTypeStmt,
+        //     tokens: vec![
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Create),
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::TypeP),
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::As),
+        //     ],
+        // });
+        //
+        // m.push(StatementDefinition {
+        //     stmt: SyntaxKind::CreateEnumStmt,
+        //     tokens: vec![
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Create),
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::TypeP),
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::As),
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::EnumP),
+        //     ],
+        // });
+        //
+        // m.push(StatementDefinition {
+        //     stmt: SyntaxKind::CreateRangeStmt,
+        //     tokens: vec![
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Create),
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::TypeP),
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::As),
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Range),
+        //     ],
+        // });
+        //
+        // m.push(StatementDefinition {
+        //     stmt: SyntaxKind::TruncateStmt,
+        //     tokens: vec![
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Truncate),
+        //         SyntaxDefinition::OptionalToken(SyntaxKind::Table),
+        //         SyntaxDefinition::OptionalToken(SyntaxKind::Only),
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
+        //     ],
+        // });
+        //
+        // m.push(StatementDefinition {
+        //     stmt: SyntaxKind::CommentStmt,
+        //     tokens: vec![
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Comment),
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::On),
+        //     ],
+        // });
+        //
+        // m.push(StatementDefinition {
+        //     stmt: SyntaxKind::FetchStmt,
+        //     tokens: vec![
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Fetch),
+        //         SyntaxDefinition::AnyTokens,
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
+        //     ],
+        // });
+        //
+        // m.push(StatementDefinition {
+        //     stmt: SyntaxKind::VacuumStmt,
+        //     tokens: vec![SyntaxDefinition::RequiredToken(SyntaxKind::Analyze)],
+        // });
+        //
+        // m.push(StatementDefinition {
+        //     stmt: SyntaxKind::IndexStmt,
+        //     tokens: vec![
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Create),
+        //         SyntaxDefinition::OptionalToken(SyntaxKind::Unique),
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Index),
+        //         SyntaxDefinition::AnyTokens,
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::On),
+        //         SyntaxDefinition::OptionalToken(SyntaxKind::Only),
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
+        //     ],
+        // });
+        //
+        // m.push(StatementDefinition {
+        //     stmt: SyntaxKind::CreateFunctionStmt,
+        //     tokens: vec![
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Create),
+        //         SyntaxDefinition::OptionalToken(SyntaxKind::Or),
+        //         SyntaxDefinition::OptionalToken(SyntaxKind::Replace),
+        //         SyntaxDefinition::OneOf(vec![SyntaxKind::Function, SyntaxKind::Procedure]),
+        //         SyntaxDefinition::AnyTokens,
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Ascii40),
+        //         SyntaxDefinition::AnyTokens,
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Ascii41),
+        //     ],
+        // });
+        //
+        // m.push(StatementDefinition {
+        //     stmt: SyntaxKind::AlterFunctionStmt,
+        //     tokens: vec![
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Alter),
+        //         SyntaxDefinition::OneOf(vec![SyntaxKind::Function, SyntaxKind::Procedure]),
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
+        //     ],
+        // });
+        //
+        // m.push(StatementDefinition {
+        //     stmt: SyntaxKind::DoStmt,
+        //     tokens: vec![
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Do),
+        //         SyntaxDefinition::OptionalToken(SyntaxKind::Language),
+        //         SyntaxDefinition::OptionalToken(SyntaxKind::Ident),
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Sconst),
+        //     ],
+        // });
+        //
+        // m.push(StatementDefinition {
+        //     stmt: SyntaxKind::RuleStmt,
+        //     tokens: vec![
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Create),
+        //         SyntaxDefinition::OptionalToken(SyntaxKind::Or),
+        //         SyntaxDefinition::OptionalToken(SyntaxKind::Replace),
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Rule),
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::As),
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::On),
+        //         SyntaxDefinition::OneOf(vec![
+        //             SyntaxKind::Select,
+        //             SyntaxKind::Insert,
+        //             SyntaxKind::Update,
+        //             SyntaxKind::DeleteP,
+        //         ]),
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::To),
+        //         SyntaxDefinition::AnyTokens,
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Do),
+        //     ],
+        // });
+        //
+        // m.push(StatementDefinition {
+        //     stmt: SyntaxKind::NotifyStmt,
+        //     tokens: vec![
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Notify),
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
+        //     ],
+        // });
+        //
+        // m.push(StatementDefinition {
+        //     stmt: SyntaxKind::ListenStmt,
+        //     tokens: vec![
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Listen),
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
+        //     ],
+        // });
+        //
+        // m.push(StatementDefinition {
+        //     stmt: SyntaxKind::UnlistenStmt,
+        //     tokens: vec![
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Unlisten),
+        //         SyntaxDefinition::OneOf(vec![SyntaxKind::Ident, SyntaxKind::Ascii42]),
+        //     ],
+        // });
+        //
+        // // DECLARE c CURSOR FOR SELECT ctid,cmin,* FROM combocidtest
+        // m.push(StatementDefinition {
+        //     stmt: SyntaxKind::DeclareCursorStmt,
+        //     tokens: vec![
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Declare),
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
+        //         SyntaxDefinition::AnyTokens,
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Cursor),
+        //         SyntaxDefinition::AnyTokens,
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::For),
+        //         SyntaxDefinition::OneOf(vec![SyntaxKind::Select, SyntaxKind::With]),
+        //         SyntaxDefinition::AnyToken,
+        //     ],
+        // });
+        //
+        // m.push(StatementDefinition {
+        //     stmt: SyntaxKind::TransactionStmt,
+        //     tokens: vec![
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Savepoint),
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
+        //     ],
+        // });
+        //
+        // m.push(StatementDefinition {
+        //     stmt: SyntaxKind::TransactionStmt,
+        //     tokens: vec![
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::BeginP),
+        //         // FIXME: without the ";", this would conflict with BEGIN ATOMIC
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Ascii59),
+        //     ],
+        // });
+        //
+        // m.push(StatementDefinition {
+        //     stmt: SyntaxKind::TransactionStmt,
+        //     tokens: vec![
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::BeginP),
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Transaction),
+        //     ],
+        // });
+        //
+        // m.push(StatementDefinition {
+        //     stmt: SyntaxKind::TransactionStmt,
+        //     tokens: vec![SyntaxDefinition::RequiredToken(SyntaxKind::Commit)],
+        // });
+        //
+        // m.push(StatementDefinition {
+        //     stmt: SyntaxKind::TransactionStmt,
+        //     tokens: vec![
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Rollback),
+        //         SyntaxDefinition::AnyTokens,
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::To),
+        //         SyntaxDefinition::OptionalToken(SyntaxKind::Savepoint),
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
+        //     ],
+        // });
+        //
+        // m.push(StatementDefinition {
+        //     stmt: SyntaxKind::TransactionStmt,
+        //     tokens: vec![
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Rollback),
+        //         // FIXME: without the ";", this would conflict with ROLLBACK TO SAVEPOINT
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Ascii59),
+        //     ],
+        // });
+        //
+        // m.push(StatementDefinition {
+        //     stmt: SyntaxKind::ViewStmt,
+        //     tokens: vec![
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Create),
+        //         SyntaxDefinition::OptionalToken(SyntaxKind::Or),
+        //         SyntaxDefinition::OptionalToken(SyntaxKind::Replace),
+        //         SyntaxDefinition::OptionalToken(SyntaxKind::Temporary),
+        //         SyntaxDefinition::OptionalToken(SyntaxKind::Temp),
+        //         SyntaxDefinition::OptionalToken(SyntaxKind::Recursive),
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::View),
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
+        //         SyntaxDefinition::AnyTokens,
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::As),
+        //         SyntaxDefinition::OneOf(vec![SyntaxKind::With, SyntaxKind::Select]),
+        //     ],
+        // });
+        //
+        // m.push(StatementDefinition {
+        //     stmt: SyntaxKind::LoadStmt,
+        //     tokens: vec![SyntaxDefinition::RequiredToken(SyntaxKind::Load)],
+        // });
+        //
+        // m.push(StatementDefinition {
+        //     stmt: SyntaxKind::CreateDomainStmt,
+        //     tokens: vec![
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Create),
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::DomainP),
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
+        //     ],
+        // });
+        //
+        // m.push(StatementDefinition {
+        //     stmt: SyntaxKind::CreatedbStmt,
+        //     tokens: vec![
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Create),
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Database),
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
+        //     ],
+        // });
+        //
+        // m.push(StatementDefinition {
+        //     stmt: SyntaxKind::DropdbStmt,
+        //     tokens: vec![
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Drop),
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Database),
+        //         SyntaxDefinition::OptionalToken(SyntaxKind::IfP),
+        //         SyntaxDefinition::OptionalToken(SyntaxKind::Exists),
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
+        //     ],
+        // });
+        //
+        // m.push(StatementDefinition {
+        //     stmt: SyntaxKind::VacuumStmt,
+        //     tokens: vec![SyntaxDefinition::RequiredToken(SyntaxKind::Vacuum)],
+        // });
+        //
+        // m.push(StatementDefinition {
+        //     stmt: SyntaxKind::CreateTableAsStmt,
+        //     tokens: vec![
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Create),
+        //         SyntaxDefinition::OptionalToken(SyntaxKind::Global),
+        //         SyntaxDefinition::OptionalToken(SyntaxKind::Local),
+        //         SyntaxDefinition::OptionalToken(SyntaxKind::Temporary),
+        //         SyntaxDefinition::OptionalToken(SyntaxKind::Temp),
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Materialized),
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::View),
+        //         SyntaxDefinition::OptionalToken(SyntaxKind::IfP),
+        //         SyntaxDefinition::OptionalToken(SyntaxKind::Not),
+        //         SyntaxDefinition::OptionalToken(SyntaxKind::Exists),
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
+        //         SyntaxDefinition::AnyTokens,
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::As),
+        //         SyntaxDefinition::OneOf(vec![SyntaxKind::With, SyntaxKind::Select]),
+        //         SyntaxDefinition::AnyToken,
+        //     ],
+        // });
+
+        // m.push(StatementDefinition {
+        //     stmt: SyntaxKind::CreateTableAsStmt,
+        //     tokens: vec![
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Create),
+        //         SyntaxDefinition::OptionalToken(SyntaxKind::Global),
+        //         SyntaxDefinition::OptionalToken(SyntaxKind::Local),
+        //         SyntaxDefinition::OptionalToken(SyntaxKind::Temporary),
+        //         SyntaxDefinition::OptionalToken(SyntaxKind::Temp),
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Table),
+        //         SyntaxDefinition::OptionalToken(SyntaxKind::IfP),
+        //         SyntaxDefinition::OptionalToken(SyntaxKind::Not),
+        //         SyntaxDefinition::OptionalToken(SyntaxKind::Exists),
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
+        //         SyntaxDefinition::AnyTokens,
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::As),
+        //         SyntaxDefinition::OneOf(vec![SyntaxKind::With, SyntaxKind::Select]),
+        //         SyntaxDefinition::AnyToken,
+        //     ],
+        // });
+        //
+        // m.push(StatementDefinition {
+        //     stmt: SyntaxKind::ViewStmt,
+        //     tokens: vec![
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Create),
+        //         SyntaxDefinition::OptionalToken(SyntaxKind::Or),
+        //         SyntaxDefinition::OptionalToken(SyntaxKind::Replace),
+        //         SyntaxDefinition::OptionalToken(SyntaxKind::Temporary),
+        //         SyntaxDefinition::OptionalToken(SyntaxKind::Temp),
+        //         SyntaxDefinition::OptionalToken(SyntaxKind::Recursive),
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::View),
+        //         SyntaxDefinition::OptionalToken(SyntaxKind::IfP),
+        //         SyntaxDefinition::OptionalToken(SyntaxKind::Not),
+        //         SyntaxDefinition::OptionalToken(SyntaxKind::Exists),
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
+        //         SyntaxDefinition::AnyTokens,
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::As),
+        //         SyntaxDefinition::OneOf(vec![SyntaxKind::With, SyntaxKind::Select]),
+        //         SyntaxDefinition::AnyToken,
+        //     ],
+        // });
+        //
+        // m.push(StatementDefinition {
+        //     stmt: SyntaxKind::ExplainStmt,
+        //     tokens: vec![
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Explain),
+        //         SyntaxDefinition::AnyTokens,
+        //         SyntaxDefinition::OneOf(vec![
+        //             SyntaxKind::With,
+        //             SyntaxKind::Select,
+        //             SyntaxKind::Insert,
+        //             SyntaxKind::DeleteP,
+        //             SyntaxKind::Update,
+        //             SyntaxKind::Merge,
+        //             SyntaxKind::Execute,
+        //         ]),
+        //         SyntaxDefinition::AnyToken,
+        //     ],
+        // });
+        //
+        // m.push(StatementDefinition {
+        //     stmt: SyntaxKind::CreateSeqStmt,
+        //     tokens: vec![
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Create),
+        //         SyntaxDefinition::OptionalToken(SyntaxKind::Temporary),
+        //         SyntaxDefinition::OptionalToken(SyntaxKind::Temp),
+        //         SyntaxDefinition::OptionalToken(SyntaxKind::Unlogged),
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Sequence),
+        //         SyntaxDefinition::OptionalToken(SyntaxKind::IfP),
+        //         SyntaxDefinition::OptionalToken(SyntaxKind::Not),
+        //         SyntaxDefinition::OptionalToken(SyntaxKind::Exists),
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
+        //     ],
+        // });
+        //
+        // m.push(StatementDefinition {
+        //     stmt: SyntaxKind::AlterSeqStmt,
+        //     tokens: vec![
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Alter),
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Sequence),
+        //         SyntaxDefinition::OptionalToken(SyntaxKind::IfP),
+        //         SyntaxDefinition::OptionalToken(SyntaxKind::Exists),
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
+        //     ],
+        // });
+        //
+        // // RESET SESSION AUTHORIZATION
+        // m.push(StatementDefinition {
+        //     stmt: SyntaxKind::VariableSetStmt,
+        //     tokens: vec![
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Reset),
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Session),
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Authorization),
+        //     ],
+        // });
+        //
+        // m.push(StatementDefinition {
+        //     stmt: SyntaxKind::VariableSetStmt,
+        //     tokens: vec![
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Set),
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Role),
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
+        //     ],
+        // });
+        //
+        // m.push(StatementDefinition {
+        //     stmt: SyntaxKind::VariableSetStmt,
+        //     tokens: vec![
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Reset),
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Role),
+        //     ],
+        // });
+        //
+        // m.push(StatementDefinition {
+        //     stmt: SyntaxKind::VariableSetStmt,
+        //     tokens: vec![
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Reset),
+        //         SyntaxDefinition::OneOf(vec![SyntaxKind::All, SyntaxKind::Ident]),
+        //     ],
+        // });
+        //
+        // // ref: https://www.postgresql.org/docs/current/sql-set-session-authorization.html
+        // m.push(StatementDefinition {
+        //     stmt: SyntaxKind::VariableSetStmt,
+        //     tokens: vec![
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Set),
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Session),
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Authorization),
+        //         SyntaxDefinition::OneOf(vec![SyntaxKind::Ident, SyntaxKind::Sconst]),
+        //     ],
+        // });
+        //
+        // m.push(StatementDefinition {
+        //     stmt: SyntaxKind::VariableSetStmt,
+        //     tokens: vec![
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Set),
+        //         SyntaxDefinition::OptionalToken(SyntaxKind::Session),
+        //         SyntaxDefinition::OptionalToken(SyntaxKind::Local),
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
+        //         SyntaxDefinition::OneOf(vec![SyntaxKind::To, SyntaxKind::Ascii61]),
+        //         SyntaxDefinition::AnyToken,
+        //     ],
+        // });
+        //
+        // m.push(StatementDefinition {
+        //     stmt: SyntaxKind::VariableSetStmt,
+        //     tokens: vec![
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Set),
+        //         SyntaxDefinition::OptionalToken(SyntaxKind::Session),
+        //         SyntaxDefinition::OptionalToken(SyntaxKind::Local),
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Time),
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Zone),
+        //         SyntaxDefinition::AnyToken,
+        //     ],
+        // });
+        //
+        // m.push(StatementDefinition {
+        //     stmt: SyntaxKind::VariableShowStmt,
+        //     tokens: vec![
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Show),
+        //         SyntaxDefinition::OneOf(vec![SyntaxKind::Ident, SyntaxKind::All]),
+        //     ],
+        // });
+        //
+        // m.push(StatementDefinition {
+        //     stmt: SyntaxKind::DiscardStmt,
+        //     tokens: vec![
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Discard),
+        //         SyntaxDefinition::OneOf(vec![
+        //             SyntaxKind::All,
+        //             SyntaxKind::Plans,
+        //             SyntaxKind::Sequences,
+        //             SyntaxKind::Temp,
+        //             SyntaxKind::Temporary,
+        //         ]),
+        //     ],
+        // });
+        //
+        // m.push(StatementDefinition {
+        //     stmt: SyntaxKind::CreateRoleStmt,
+        //     tokens: vec![
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Create),
+        //         SyntaxDefinition::OneOf(vec![
+        //             SyntaxKind::Role,
+        //             SyntaxKind::GroupP,
+        //             SyntaxKind::User,
+        //         ]),
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
+        //     ],
+        // });
+        //
+        // m.push(StatementDefinition {
+        //     stmt: SyntaxKind::AlterRoleStmt,
+        //     tokens: vec![
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Alter),
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Role),
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
+        //     ],
+        // });
+        //
+        // m.push(StatementDefinition {
+        //     stmt: SyntaxKind::DropRoleStmt,
+        //     tokens: vec![
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Drop),
+        //         SyntaxDefinition::OneOf(vec![
+        //             SyntaxKind::Role,
+        //             SyntaxKind::User,
+        //             SyntaxKind::GroupP,
+        //         ]),
+        //         SyntaxDefinition::OptionalToken(SyntaxKind::IfP),
+        //         SyntaxDefinition::OptionalToken(SyntaxKind::Exists),
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
+        //     ],
+        // });
+        //
+        // m.push(StatementDefinition {
+        //     stmt: SyntaxKind::LockStmt,
+        //     tokens: vec![
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::LockP),
+        //         SyntaxDefinition::OptionalToken(SyntaxKind::Table),
+        //         SyntaxDefinition::OptionalToken(SyntaxKind::Only),
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
+        //     ],
+        // });
+        //
+        // m.push(StatementDefinition {
+        //     stmt: SyntaxKind::ConstraintsSetStmt,
+        //     tokens: vec![
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Set),
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Constraints),
+        //     ],
+        // });
+        //
+        // m.push(StatementDefinition {
+        //     stmt: SyntaxKind::ReindexStmt,
+        //     tokens: vec![
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Reindex),
+        //         SyntaxDefinition::OptionalToken(SyntaxKind::Concurrently),
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
+        //     ],
+        // });
+        //
+        // m.push(StatementDefinition {
+        //     stmt: SyntaxKind::CheckPointStmt,
+        //     tokens: vec![SyntaxDefinition::RequiredToken(SyntaxKind::Checkpoint)],
+        // });
+        //
+        // m.push(StatementDefinition {
+        //     stmt: SyntaxKind::CreateSchemaStmt,
+        //     tokens: vec![
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Create),
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Schema),
+        //     ],
+        // });
+        //
+        // m.push(StatementDefinition {
+        //     stmt: SyntaxKind::AlterDatabaseStmt,
+        //     tokens: vec![
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Alter),
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Database),
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
+        //     ],
+        // });
+        //
+        // m.push(StatementDefinition {
+        //     stmt: SyntaxKind::AlterDatabaseRefreshCollStmt,
+        //     tokens: vec![
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Alter),
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Database),
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Refresh),
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Collation),
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::VersionP),
+        //     ],
+        // });
+        //
+        // m.push(StatementDefinition {
+        //     stmt: SyntaxKind::AlterDatabaseSetStmt,
+        //     tokens: vec![
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Alter),
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Database),
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Set),
+        //     ],
+        // });
+        //
+        // m.push(StatementDefinition {
+        //     stmt: SyntaxKind::AlterDatabaseSetStmt,
+        //     tokens: vec![
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Alter),
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Database),
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Reset),
+        //     ],
+        // });
+        //
+        // m.push(StatementDefinition {
+        //     stmt: SyntaxKind::CreateConversionStmt,
+        //     tokens: vec![
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Create),
+        //         SyntaxDefinition::OptionalToken(SyntaxKind::Default),
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::ConversionP),
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::For),
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Sconst),
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::To),
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Sconst),
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::From),
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
+        //     ],
+        // });
+        //
+        // m.push(StatementDefinition {
+        //     stmt: SyntaxKind::CreateCastStmt,
+        //     tokens: vec![
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Create),
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Cast),
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Ascii40),
+        //         SyntaxDefinition::AnyTokens,
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::As),
+        //         SyntaxDefinition::AnyTokens,
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Ascii41),
+        //     ],
+        // });
+        //
+        // m.push(StatementDefinition {
+        //     stmt: SyntaxKind::CreateOpFamilyStmt,
+        //     tokens: vec![
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Create),
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Operator),
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Family),
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
+        //     ],
+        // });
+        //
+        // m.push(StatementDefinition {
+        //     stmt: SyntaxKind::AlterOpFamilyStmt,
+        //     tokens: vec![
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Alter),
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Operator),
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Family),
+        //         // for schemas, this should be put into all definitions...
+        //         // SyntaxDefinition::OptionalToken(SyntaxKind::Ident),
+        //         // SyntaxDefinition::OptionalToken(SyntaxKind::Ascii46),
+        //         SyntaxDefinition::AnyTokens,
+        //         // SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Using),
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
+        //         // this is important to not conflict with RenameStmt
+        //         SyntaxDefinition::OneOf(vec![SyntaxKind::Drop, SyntaxKind::AddP]),
+        //     ],
+        // });
+        //
+        // m.push(StatementDefinition {
+        //     stmt: SyntaxKind::PrepareStmt,
+        //     tokens: vec![
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Prepare),
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
+        //         SyntaxDefinition::AnyToken,
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::As),
+        //         SyntaxDefinition::OneOf(vec![SyntaxKind::With, SyntaxKind::Select]),
+        //     ],
+        // });
+        //
+        // m.push(StatementDefinition {
+        //     stmt: SyntaxKind::DeallocateStmt,
+        //     tokens: vec![
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Deallocate),
+        //         SyntaxDefinition::OptionalToken(SyntaxKind::Prepare),
+        //         SyntaxDefinition::OneOf(vec![SyntaxKind::Ident, SyntaxKind::All]),
+        //     ],
+        // });
+        //
+        // m.push(StatementDefinition {
+        //     stmt: SyntaxKind::CreateTableSpaceStmt,
+        //     tokens: vec![
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Create),
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Tablespace),
+        //         SyntaxDefinition::AnyTokens,
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Location),
+        //     ],
+        // });
+        //
+        // m.push(StatementDefinition {
+        //     stmt: SyntaxKind::DropTableSpaceStmt,
+        //     tokens: vec![
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Drop),
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Tablespace),
+        //         SyntaxDefinition::OptionalToken(SyntaxKind::IfP),
+        //         SyntaxDefinition::OptionalToken(SyntaxKind::Exists),
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
+        //     ],
+        // });
+        //
+        // m.push(StatementDefinition {
+        //     stmt: SyntaxKind::AlterOperatorStmt,
+        //     tokens: vec![
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Alter),
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Operator),
+        //     ],
+        // });
+        //
+        // m.push(StatementDefinition {
+        //     stmt: SyntaxKind::AlterTypeStmt,
+        //     tokens: vec![
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Alter),
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::TypeP),
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
+        //     ],
+        // });
+        //
+        // m.push(StatementDefinition {
+        //     stmt: SyntaxKind::DropOwnedStmt,
+        //     tokens: vec![
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Drop),
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Owned),
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::By),
+        //     ],
+        // });
+        //
+        // m.push(StatementDefinition {
+        //     stmt: SyntaxKind::ReassignOwnedStmt,
+        //     tokens: vec![
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Reassign),
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Owned),
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::By),
+        //         SyntaxDefinition::AnyTokens,
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::To),
+        //     ],
+        // });
+        //
+        // m.push(StatementDefinition {
+        //     stmt: SyntaxKind::CreateFdwStmt,
+        //     tokens: vec![
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Create),
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Foreign),
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::DataP),
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Wrapper),
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
+        //     ],
+        // });
+        //
+        // m.push(StatementDefinition {
+        //     stmt: SyntaxKind::AlterFdwStmt,
+        //     tokens: vec![
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Alter),
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Foreign),
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::DataP),
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Wrapper),
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
+        //     ],
+        // });
+        //
+        // m.push(StatementDefinition {
+        //     stmt: SyntaxKind::CreateForeignServerStmt,
+        //     tokens: vec![
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Create),
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Server),
+        //         SyntaxDefinition::OptionalToken(SyntaxKind::IfP),
+        //         SyntaxDefinition::OptionalToken(SyntaxKind::Not),
+        //         SyntaxDefinition::OptionalToken(SyntaxKind::Exists),
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
+        //         SyntaxDefinition::AnyTokens,
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Foreign),
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::DataP),
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Wrapper),
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
+        //     ],
+        // });
+        //
+        // m.push(StatementDefinition {
+        //     stmt: SyntaxKind::AlterForeignServerStmt,
+        //     tokens: vec![
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Alter),
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Server),
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
+        //     ],
+        // });
+        //
+        // m.push(StatementDefinition {
+        //     stmt: SyntaxKind::CreateUserMappingStmt,
+        //     tokens: vec![
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Create),
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::User),
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Mapping),
+        //         SyntaxDefinition::OptionalToken(SyntaxKind::IfP),
+        //         SyntaxDefinition::OptionalToken(SyntaxKind::Not),
+        //         SyntaxDefinition::OptionalToken(SyntaxKind::Exists),
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::For),
+        //         SyntaxDefinition::AnyTokens,
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Server),
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
+        //     ],
+        // });
+        //
+        // m.push(StatementDefinition {
+        //     stmt: SyntaxKind::AlterUserMappingStmt,
+        //     tokens: vec![
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Alter),
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::User),
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Mapping),
+        //         SyntaxDefinition::OptionalToken(SyntaxKind::For),
+        //         SyntaxDefinition::AnyTokens,
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Server),
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Options),
+        //     ],
+        // });
+        //
+        // m.push(StatementDefinition {
+        //     stmt: SyntaxKind::DropUserMappingStmt,
+        //     tokens: vec![
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Alter),
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::User),
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Mapping),
+        //         SyntaxDefinition::OptionalToken(SyntaxKind::IfP),
+        //         SyntaxDefinition::OptionalToken(SyntaxKind::Exists),
+        //         SyntaxDefinition::OptionalToken(SyntaxKind::For),
+        //         SyntaxDefinition::AnyTokens,
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Server),
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
+        //     ],
+        // });
+        //
+        // m.push(StatementDefinition {
+        //     stmt: SyntaxKind::SecLabelStmt,
+        //     tokens: vec![
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Security),
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Label),
+        //         SyntaxDefinition::OptionalToken(SyntaxKind::For),
+        //         SyntaxDefinition::OptionalToken(SyntaxKind::Ident),
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::On),
+        //     ],
+        // });
+        //
+        // m.push(StatementDefinition {
+        //     stmt: SyntaxKind::CreateForeignTableStmt,
+        //     tokens: vec![
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Create),
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Foreign),
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Table),
+        //         SyntaxDefinition::OptionalToken(SyntaxKind::IfP),
+        //         SyntaxDefinition::OptionalToken(SyntaxKind::Not),
+        //         SyntaxDefinition::OptionalToken(SyntaxKind::Exists),
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
+        //         SyntaxDefinition::AnyTokens,
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Server),
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
+        //     ],
+        // });
+        //
+        // m.push(StatementDefinition {
+        //     stmt: SyntaxKind::ImportForeignSchemaStmt,
+        //     tokens: vec![
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::ImportP),
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Foreign),
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Schema),
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
+        //         SyntaxDefinition::AnyTokens,
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::From),
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Server),
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Into),
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
+        //     ],
+        // });
+        //
+        // m.push(StatementDefinition {
+        //     stmt: SyntaxKind::CreateExtensionStmt,
+        //     tokens: vec![
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Create),
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Extension),
+        //         SyntaxDefinition::OptionalToken(SyntaxKind::IfP),
+        //         SyntaxDefinition::OptionalToken(SyntaxKind::Not),
+        //         SyntaxDefinition::OptionalToken(SyntaxKind::Exists),
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
+        //     ],
+        // });
+        //
+        // m.push(StatementDefinition {
+        //     stmt: SyntaxKind::AlterExtensionStmt,
+        //     tokens: vec![
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Alter),
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Extension),
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
+        //     ],
+        // });
+        //
+        // m.push(StatementDefinition {
+        //     stmt: SyntaxKind::CreateEventTrigStmt,
+        //     tokens: vec![
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Create),
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Event),
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Trigger),
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::On),
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
+        //         SyntaxDefinition::AnyTokens,
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Execute),
+        //         SyntaxDefinition::OneOf(vec![SyntaxKind::Function, SyntaxKind::Procedure]),
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Ascii40),
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Ascii41),
+        //     ],
+        // });
+        //
+        // m.push(StatementDefinition {
+        //     stmt: SyntaxKind::AlterEventTrigStmt,
+        //     tokens: vec![
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Alter),
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Event),
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Trigger),
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
+        //     ],
+        // });
+        //
+        // m.push(StatementDefinition {
+        //     stmt: SyntaxKind::RefreshMatViewStmt,
+        //     tokens: vec![
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Refresh),
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Materialized),
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::View),
+        //         SyntaxDefinition::OptionalToken(SyntaxKind::Concurrently),
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
+        //     ],
+        // });
+        //
+        // m.push(StatementDefinition {
+        //     stmt: SyntaxKind::AlterSystemStmt,
+        //     tokens: vec![
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Alter),
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::SystemP),
+        //         SyntaxDefinition::OneOf(vec![SyntaxKind::Set, SyntaxKind::Reset]),
+        //     ],
+        // });
+        //
+        // m.push(StatementDefinition {
+        //     stmt: SyntaxKind::CreatePolicyStmt,
+        //     tokens: vec![
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Create),
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Policy),
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::On),
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
+        //     ],
+        // });
+        //
+        // m.push(StatementDefinition {
+        //     stmt: SyntaxKind::AlterPolicyStmt,
+        //     tokens: vec![
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Alter),
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Policy),
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::On),
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
+        //     ],
+        // });
+        //
+        // m.push(StatementDefinition {
+        //     stmt: SyntaxKind::CreateTransformStmt,
+        //     tokens: vec![
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Create),
+        //         SyntaxDefinition::OptionalToken(SyntaxKind::Or),
+        //         SyntaxDefinition::OptionalToken(SyntaxKind::Replace),
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Transform),
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::For),
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Language),
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Ascii40),
+        //         SyntaxDefinition::AnyTokens,
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Ascii41),
+        //     ],
+        // });
+        //
+        // m.push(StatementDefinition {
+        //     stmt: SyntaxKind::CreateAmStmt,
+        //     tokens: vec![
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Create),
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Access),
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Method),
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::TypeP),
+        //     ],
+        // });
+        //
+        // m.push(StatementDefinition {
+        //     stmt: SyntaxKind::CreatePublicationStmt,
+        //     tokens: vec![
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Create),
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Publication),
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
+        //     ],
+        // });
+        //
+        // m.push(StatementDefinition {
+        //     stmt: SyntaxKind::AlterPublicationStmt,
+        //     tokens: vec![
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Alter),
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Publication),
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
+        //     ],
+        // });
+        //
+        // m.push(StatementDefinition {
+        //     stmt: SyntaxKind::CreateSubscriptionStmt,
+        //     tokens: vec![
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Create),
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Subscription),
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Connection),
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Sconst),
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Publication),
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
+        //     ],
+        // });
+        //
+        // m.push(StatementDefinition {
+        //     stmt: SyntaxKind::AlterSubscriptionStmt,
+        //     tokens: vec![
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Alter),
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Subscription),
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
+        //     ],
+        // });
+        //
+        // m.push(StatementDefinition {
+        //     stmt: SyntaxKind::DropSubscriptionStmt,
+        //     tokens: vec![
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Drop),
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Subscription),
+        //         SyntaxDefinition::OptionalToken(SyntaxKind::IfP),
+        //         SyntaxDefinition::OptionalToken(SyntaxKind::Exists),
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
+        //     ],
+        // });
+        //
+        // // GRANT ALL ON SCHEMA alt_nsp1, alt_nsp2 TO public;
+        // m.push(StatementDefinition {
+        //     stmt: SyntaxKind::GrantStmt,
+        //     tokens: vec![
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Grant),
+        //         SyntaxDefinition::AnyTokens,
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::On),
+        //         SyntaxDefinition::AnyTokens,
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::To),
+        //     ],
+        // });
+        //
+        // // REVOKE ALL ON SCHEMA alt_nsp6 FROM regress_alter_generic_user6;
+        // m.push(StatementDefinition {
+        //     stmt: SyntaxKind::GrantStmt,
+        //     tokens: vec![
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Revoke),
+        //         SyntaxDefinition::AnyTokens,
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::On),
+        //     ],
+        // });
+        //
+        // m.push(StatementDefinition {
+        //     stmt: SyntaxKind::AlterOwnerStmt,
+        //     tokens: vec![
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Alter),
+        //         SyntaxDefinition::AnyTokens,
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Owner),
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::To),
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
+        //     ],
+        // });
+        //
+        // // ALTER AGGREGATE alt_func1(int) SET SCHEMA alt_nsp2;
+        // m.push(StatementDefinition {
+        //     stmt: SyntaxKind::AlterObjectSchemaStmt,
+        //     tokens: vec![
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Alter),
+        //         SyntaxDefinition::AnyTokens,
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Set),
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Schema),
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
+        //     ],
+        // });
+        //
+        // m.push(StatementDefinition {
+        //     stmt: SyntaxKind::CreatePlangStmt,
+        //     tokens: vec![
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Create),
+        //         SyntaxDefinition::OptionalToken(SyntaxKind::Or),
+        //         SyntaxDefinition::OptionalToken(SyntaxKind::Replace),
+        //         SyntaxDefinition::OptionalToken(SyntaxKind::Trusted),
+        //         SyntaxDefinition::OptionalToken(SyntaxKind::Procedural),
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Language),
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
+        //     ],
+        // });
+        //
+        // m.push(StatementDefinition {
+        //     stmt: SyntaxKind::CreateStatsStmt,
+        //     tokens: vec![
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Create),
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Statistics),
+        //         SyntaxDefinition::AnyTokens,
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::On),
+        //         SyntaxDefinition::AnyTokens,
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::From),
+        //         SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
+        //     ],
+        // });
 
         let mut stmt_starts: HashMap<SyntaxKind, Vec<StatementDefinition>> = HashMap::new();
 
         for stmt in m {
-            let first_token = stmt.tokens.get(0).unwrap();
-            if let SyntaxDefinition::RequiredToken(kind) = first_token {
-                stmt_starts.entry(*kind).or_insert(Vec::new()).push(stmt);
+            let first_token = stmt
+                .tokens
+                .first()
+                .expect("Expected first token to be present");
+
+            if let SyntaxDefinition::RequiredToken(token) = first_token {
+                stmt_starts.entry(*token).or_insert(Vec::new()).push(stmt);
             } else {
-                panic!("Expected RequiredToken as first token in statement definition");
+                panic!("Expected first token to be a required token");
             }
         }
 
diff --git a/crates/pg_statement_splitter/src/statement_splitter.rs b/crates/pg_statement_splitter/src/statement_splitter.rs
index 1893a8a2..4f34cea9 100644
--- a/crates/pg_statement_splitter/src/statement_splitter.rs
+++ b/crates/pg_statement_splitter/src/statement_splitter.rs
@@ -2,7 +2,7 @@ use pg_lexer::{SyntaxKind, WHITESPACE_TOKENS};
 use text_size::{TextRange, TextSize};
 
 use crate::{
-    data::{SPECIAL_TOKENS, STATEMENT_BRIDGE_DEFINITIONS, STATEMENT_DEFINITIONS},
+    data::{STATEMENT_BRIDGE_DEFINITIONS, STATEMENT_DEFINITIONS},
     parser::Parser,
     tracker::Tracker,
 };
@@ -99,12 +99,8 @@ impl<'a> StatementSplitter<'a> {
                 });
             }
 
-            // we already moved, so we need to lookbehind 2
-            let lookbehind = self.parser.lookbehind(2, true);
-
             if self.sub_trx_depth == 0
                 && self.sub_stmt_depth == 0 && self.is_within_atomic_block == false
-                    && (lookbehind.is_none() || !SPECIAL_TOKENS.contains(&lookbehind.unwrap().kind))
                     // it onyl makes sense to start tracking new statements if at least one of the
                     // currently tracked statements could be complete. or if none are tracked yet.
                     // this is important for statements such as `explain select 1;` where `select 1`
@@ -133,6 +129,13 @@ impl<'a> StatementSplitter<'a> {
                             .filter_map(|stmt| {
                                 if self.active_bridges.iter().any(|b| b.def.stmt == stmt.stmt) {
                                     None
+                                } else if self.tracked_statements.iter().any(|s| {
+                                    s.could_be_complete()
+                                        && s.def
+                                            .prohibited_following_statements
+                                            .contains(&stmt.stmt)
+                                }) {
+                                    None
                                 } else {
                                     Some(Tracker::new_at(stmt, self.parser.pos))
                                 }
@@ -186,7 +189,7 @@ impl<'a> StatementSplitter<'a> {
                             s.started_at == earliest_complete_stmt_started_at
                                 && s.could_be_complete()
                         })
-                        .max_by_key(|stmt| stmt.current_pos)
+                        .max_by_key(|stmt| stmt.max_pos())
                         .unwrap();
 
                     assert_eq!(
@@ -196,7 +199,9 @@ impl<'a> StatementSplitter<'a> {
                             .filter(|s| {
                                 s.started_at == earliest_complete_stmt_started_at
                                     && s.could_be_complete()
-                                    && s.current_pos == earliest_complete_stmt.current_pos
+                                    && s.current_positions().iter().any(|i| {
+                                        earliest_complete_stmt.current_positions().contains(i)
+                                    })
                             })
                             .count(),
                         "multiple complete statements at the same position"
@@ -256,7 +261,7 @@ impl<'a> StatementSplitter<'a> {
                             s.started_at == latest_complete_before_started_at
                                 && s.could_be_complete()
                         })
-                        .max_by_key(|stmt| stmt.current_pos)
+                        .max_by_key(|stmt| stmt.max_pos())
                         .cloned()
                         .unwrap();
 
@@ -267,7 +272,9 @@ impl<'a> StatementSplitter<'a> {
                             .filter(|s| {
                                 s.started_at == latest_complete_before_started_at
                                     && s.could_be_complete()
-                                    && s.current_pos == latest_complete_before.current_pos
+                                    && s.current_positions().iter().any(|i| {
+                                        latest_complete_before.current_positions().contains(i)
+                                    })
                             })
                             .count(),
                         "multiple complete statements at the same position"
@@ -344,7 +351,7 @@ impl<'a> StatementSplitter<'a> {
                 .filter(|s| {
                     s.started_at == earliest_complete_stmt_started_at && s.could_be_complete()
                 })
-                .max_by_key(|stmt| stmt.current_pos)
+                .max_by_key(|stmt| stmt.max_pos())
                 .unwrap();
 
             assert_eq!(
@@ -354,7 +361,9 @@ impl<'a> StatementSplitter<'a> {
                     .filter(|s| {
                         s.started_at == earliest_complete_stmt_started_at
                             && s.could_be_complete()
-                            && s.current_pos == earliest_complete_stmt.current_pos
+                            && s.current_positions()
+                                .iter()
+                                .any(|i| earliest_complete_stmt.current_positions().contains(i))
                     })
                     .count(),
                 "multiple complete statements at the same position"
@@ -453,6 +462,39 @@ mod tests {
         assert_eq!(SyntaxKind::ExecuteStmt, result[1].kind);
     }
 
+    #[test]
+    fn test_prohibited_follow_up() {
+        let input =
+            "insert into public.test (id) select 1 from other.test where id = 2;\nselect 4;";
+
+        let result = StatementSplitter::new(input).run();
+
+        assert_eq!(result.len(), 2);
+        assert_eq!(
+            "insert into public.test (id) select 1 from other.test where id = 2;",
+            input[result[0].range].to_string()
+        );
+        assert_eq!(SyntaxKind::InsertStmt, result[0].kind);
+        assert_eq!("select 4;", input[result[1].range].to_string());
+        assert_eq!(SyntaxKind::SelectStmt, result[1].kind);
+    }
+
+    #[test]
+    fn test_schema() {
+        let input = "delete from public.table where id = 2;\nselect 4;";
+
+        let result = StatementSplitter::new(input).run();
+
+        assert_eq!(result.len(), 2);
+        assert_eq!(
+            "delete from public.table where id = 2;",
+            input[result[0].range].to_string()
+        );
+        assert_eq!(SyntaxKind::DeleteStmt, result[0].kind);
+        assert_eq!("select 4;", input[result[1].range].to_string());
+        assert_eq!(SyntaxKind::SelectStmt, result[1].kind);
+    }
+
     #[test]
     fn test_sub_statement() {
         let input = "select 1 from (select 2 from contact) c;\nselect 4;";
diff --git a/crates/pg_statement_splitter/src/tracker.rs b/crates/pg_statement_splitter/src/tracker.rs
index c445f810..079f5a4a 100644
--- a/crates/pg_statement_splitter/src/tracker.rs
+++ b/crates/pg_statement_splitter/src/tracker.rs
@@ -2,12 +2,48 @@ use pg_lexer::{SyntaxKind, WHITESPACE_TOKENS};
 
 use crate::data::{StatementDefinition, SyntaxDefinition};
 
+#[derive(Debug, Clone)]
+pub struct Position {
+    idx: usize,
+    group_idx: Option<usize>,
+}
+
+impl Position {
+    fn new(idx: usize) -> Self {
+        Self {
+            idx,
+            group_idx: None,
+        }
+    }
+
+    fn new_with_group(idx: usize) -> Self {
+        Self {
+            idx,
+            group_idx: Some(1),
+        }
+    }
+
+    fn start_group(&mut self) {
+        self.group_idx = Some(0);
+    }
+
+    fn advance(&mut self) {
+        self.idx += 1;
+    }
+
+    fn advance_group(&mut self) {
+        assert!(self.group_idx.is_some());
+        self.group_idx = Some(self.group_idx.unwrap() + 1);
+    }
+}
+
 #[derive(Debug, Clone)]
 pub struct Tracker<'a> {
     pub def: &'a StatementDefinition,
 
-    /// position in the definition
-    pub current_pos: usize,
+    /// position in the definition, and for each position we track the current token for that
+    /// position. required for groups.
+    pub positions: Vec<Position>,
 
     /// position in the global token stream
     pub started_at: usize,
@@ -17,37 +53,64 @@ impl<'a> Tracker<'a> {
     pub fn new_at(def: &'a StatementDefinition, at: usize) -> Self {
         Self {
             def,
-            current_pos: 1,
+            positions: vec![Position {
+                idx: 1,
+                group_idx: None,
+            }],
             started_at: at,
         }
     }
 
-    fn next_possible_tokens(&self) -> Vec<(usize, SyntaxKind)> {
-        let mut tokens = Vec::new();
+    pub fn max_pos(&self) -> usize {
+        self.positions.iter().max_by_key(|p| p.idx).unwrap().idx
+    }
+
+    pub fn current_positions(&self) -> Vec<usize> {
+        self.positions.iter().map(|x| x.idx).collect()
+    }
+
+    fn next_possible_positions_from_with(
+        def: &StatementDefinition,
+        pos: &Position,
+        kind: &SyntaxKind,
+    ) -> Vec<Position> {
+        let mut positions = Vec::new();
 
-        for (pos, token) in self.def.tokens.iter().enumerate().skip(self.current_pos) {
+        for (pos, token) in def.tokens.iter().enumerate().skip(pos.idx.to_owned()) {
             match token {
                 SyntaxDefinition::RequiredToken(k) => {
-                    tokens.push((pos, *k));
+                    if k == kind {
+                        positions.push(Position::new(pos + 1));
+                    }
                     break;
                 }
                 SyntaxDefinition::OptionalToken(k) => {
-                    tokens.push((pos, *k));
+                    if k == kind {
+                        positions.push(Position::new(pos + 1));
+                    }
                 }
-                SyntaxDefinition::AnyTokens => {
+                SyntaxDefinition::AnyTokens(_) => {
                     //
                 }
                 SyntaxDefinition::AnyToken => {
                     //
                 }
                 SyntaxDefinition::OneOf(kinds) => {
-                    tokens.extend(kinds.iter().map(|x| (pos, *x)));
+                    if kinds.iter().any(|x| x == kind) {
+                        positions.push(Position::new(pos + 1));
+                    }
                     break;
                 }
+                SyntaxDefinition::OptionalGroup(t) => {
+                    let first_token = t.first().unwrap();
+                    if first_token == kind {
+                        positions.push(Position::new_with_group(pos + 1));
+                    }
+                }
             }
         }
 
-        tokens
+        positions
     }
 
     pub fn advance_with(&mut self, kind: &SyntaxKind) -> bool {
@@ -55,69 +118,100 @@ impl<'a> Tracker<'a> {
             return true;
         }
 
-        let is_valid = match self.def.tokens.get(self.current_pos) {
-            Some(SyntaxDefinition::RequiredToken(k)) => {
-                self.current_pos += 1;
-                k == kind
-            }
-            Some(SyntaxDefinition::OptionalToken(k)) => {
-                if k == kind {
-                    self.current_pos += 1;
-                } else if let Some(next_token) =
-                    self.next_possible_tokens().iter().find(|x| x.1 == *kind)
-                {
-                    self.current_pos = next_token.0 + 1;
-                } else {
-                    return false;
-                }
-
-                true
-            }
-            Some(SyntaxDefinition::AnyTokens) => {
-                assert!(self.next_possible_tokens().len() > 0);
+        let mut new_positions = Vec::with_capacity(self.positions.len());
 
-                if let Some(next_token) = self.next_possible_tokens().iter().find(|x| x.1 == *kind)
-                {
-                    self.current_pos = next_token.0 + 1;
+        for mut pos in self.positions.drain(..) {
+            match self.def.tokens.get(pos.idx) {
+                Some(SyntaxDefinition::RequiredToken(k)) => {
+                    pos.advance();
+                    if k == kind {
+                        new_positions.push(pos);
+                    }
                 }
-
-                true
-            }
-            Some(SyntaxDefinition::AnyToken) => {
-                self.current_pos += 1;
-                true
-            }
-            Some(SyntaxDefinition::OneOf(kinds)) => {
-                if kinds.iter().any(|x| x == kind) {
-                    self.current_pos += 1;
-                    true
-                } else {
-                    false
+                Some(SyntaxDefinition::AnyToken) => {
+                    pos.advance();
+                    new_positions.push(pos);
                 }
-            }
-            None => true,
-        };
+                Some(SyntaxDefinition::OneOf(kinds)) => {
+                    if kinds.iter().any(|x| x == kind) {
+                        pos.advance();
+                        new_positions.push(pos);
+                    }
+                }
+                Some(SyntaxDefinition::OptionalToken(k)) => {
+                    if k == kind {
+                        pos.advance();
+                        new_positions.push(pos);
+                    } else {
+                        new_positions.extend(Tracker::next_possible_positions_from_with(
+                            self.def, &pos, kind,
+                        ));
+                    }
+                }
+                Some(SyntaxDefinition::AnyTokens(maybe_tokens)) => {
+                    let next_positions =
+                        Tracker::next_possible_positions_from_with(self.def, &pos, kind);
+
+                    if next_positions.is_empty() {
+                        // we only keep the current position if we either dont care about the
+                        // tokens or the token is in the list of possible tokens
+                        if let Some(tokens) = maybe_tokens {
+                            if tokens.iter().any(|x| x == kind) {
+                                new_positions.push(pos);
+                            }
+                        } else {
+                            new_positions.push(pos);
+                        }
+                    } else {
+                        new_positions.extend(next_positions);
+                    }
+                }
+                Some(SyntaxDefinition::OptionalGroup(tokens)) => {
+                    // the token in the group is stored in the group_idx
+                    if pos.group_idx.is_none() {
+                        pos.start_group();
+                    }
+                    let token = tokens.get(pos.group_idx.unwrap()).unwrap();
+                    if token == kind {
+                        pos.advance_group();
+
+                        // if we reached the end of the group, we advance the position
+                        if pos.group_idx.unwrap() == tokens.len() {
+                            pos.advance();
+                        }
+
+                        new_positions.push(pos);
+                    }
+                }
+                None => {
+                    // if we reached the end of the definition, we do nothing but keep the position
+                    new_positions.push(pos);
+                }
+            };
+        }
 
-        is_valid
-    }
+        self.positions = new_positions;
 
-    pub fn could_be_complete(&self) -> bool {
-        self.next_required_token().is_none()
+        self.positions.len() != 0
     }
 
-    /// returns the next "required" token we are expecting
-    ///
-    /// None if we are no required tokens left
-    fn next_required_token(&self) -> Option<&SyntaxDefinition> {
+    pub fn could_be_complete(&self) -> bool {
         self.def
             .tokens
             .iter()
-            .skip(self.current_pos)
-            .find(|x| match x {
-                SyntaxDefinition::RequiredToken(_) => true,
-                SyntaxDefinition::OneOf(_) => true,
-                SyntaxDefinition::AnyToken => true,
-                _ => false,
+            .skip(
+                self.positions
+                    .iter()
+                    .max_by_key(|p| p.idx)
+                    .unwrap()
+                    .to_owned()
+                    .idx,
+            )
+            .all(|x| match x {
+                SyntaxDefinition::RequiredToken(_) => false,
+                SyntaxDefinition::OneOf(_) => false,
+                SyntaxDefinition::AnyToken => false,
+                _ => true,
             })
     }
 }

From 92273e3e350f7063d629306c4d5dfccf46882c6c Mon Sep 17 00:00:00 2001
From: psteinroe <philipp@steinroetter.com>
Date: Thu, 22 Aug 2024 12:30:38 +0200
Subject: [PATCH 09/19] fix: rewrite and clenaup splitter

---
 .../src/statement_splitter.rs                 | 602 ++++++++----------
 1 file changed, 283 insertions(+), 319 deletions(-)

diff --git a/crates/pg_statement_splitter/src/statement_splitter.rs b/crates/pg_statement_splitter/src/statement_splitter.rs
index 4f34cea9..36b01599 100644
--- a/crates/pg_statement_splitter/src/statement_splitter.rs
+++ b/crates/pg_statement_splitter/src/statement_splitter.rs
@@ -11,12 +11,13 @@ pub(crate) struct StatementSplitter<'a> {
     parser: Parser,
     tracked_statements: Vec<Tracker<'a>>,
     active_bridges: Vec<Tracker<'a>>,
+    ranges: Vec<StatementPosition>,
     sub_trx_depth: usize,
     sub_stmt_depth: usize,
     is_within_atomic_block: bool,
 }
 
-#[derive(Debug)]
+#[derive(Debug, Clone)]
 pub struct StatementPosition {
     pub kind: SyntaxKind,
     pub range: TextRange,
@@ -28,316 +29,141 @@ impl<'a> StatementSplitter<'a> {
             parser: Parser::new(pg_lexer::lex(sql)),
             tracked_statements: Vec::new(),
             active_bridges: Vec::new(),
+            ranges: Vec::new(),
+
             sub_trx_depth: 0,
             sub_stmt_depth: 0,
             is_within_atomic_block: false,
         }
     }
 
-    pub fn run(&mut self) -> Vec<StatementPosition> {
-        let mut ranges = Vec::new();
-
-        while !self.parser.eof() {
-            let at_token = self.parser.nth(0, false);
-            println!("{:?}", at_token.kind);
-            println!(
-                "tracked stmts before {:?}",
-                self.tracked_statements
-                    .iter()
-                    .map(|s| s.def.stmt)
-                    .collect::<Vec<_>>()
-            );
-            // TODO rename vars and add helpers to make distinciton between pos and text pos clear
-
-            // TODO handle BEGIN ATOMIC ... END here
-            if at_token.kind == SyntaxKind::BeginP {
-                // self.sub_trx_depth += 1;
-            } else if at_token.kind == SyntaxKind::EndP {
-                // self.sub_trx_depth -= 1;
-
-                self.is_within_atomic_block = false;
-            } else if at_token.kind == SyntaxKind::Ascii40 {
+    fn track_nesting(&mut self) {
+        match self.parser.nth(0, false).kind {
+            SyntaxKind::Ascii40 => {
                 // "("
-                self.sub_stmt_depth += 1;
-            } else if at_token.kind == SyntaxKind::Ascii41 {
+                self.sub_trx_depth += 1;
+            }
+            SyntaxKind::Ascii41 => {
                 // ")"
-                self.sub_stmt_depth -= 1;
-            } else if at_token.kind == SyntaxKind::Atomic
-                && self.parser.lookbehind(2, true).map(|t| t.kind) == Some(SyntaxKind::BeginP)
-            {
-                self.is_within_atomic_block = true;
+                self.sub_trx_depth -= 1;
             }
-
-            let mut removed_items = Vec::new();
-
-            self.tracked_statements.retain_mut(|stmt| {
-                let keep = stmt.advance_with(&at_token.kind);
-                if !keep {
-                    removed_items.push(stmt.started_at);
+            SyntaxKind::Atomic => {
+                if self.parser.lookbehind(2, true).map(|t| t.kind) == Some(SyntaxKind::BeginP) {
+                    self.is_within_atomic_block = true;
                 }
-                keep
-            });
-
-            if self.tracked_statements.len() == 0 && removed_items.len() > 0 {
-                let any_stmt_after = removed_items.iter().min().unwrap();
-                println!("adding any statement: {:?}", any_stmt_after,);
-                ranges.push(StatementPosition {
-                    kind: SyntaxKind::Any,
-                    range: TextRange::new(
-                        TextSize::try_from(
-                            self.parser
-                                .tokens
-                                .get(*any_stmt_after)
-                                .unwrap()
-                                .span
-                                .start(),
-                        )
-                        .unwrap(),
-                        TextSize::try_from(self.parser.lookbehind(2, true).unwrap().span.end())
-                            .unwrap(),
-                    ),
-                });
             }
-
-            if self.sub_trx_depth == 0
-                && self.sub_stmt_depth == 0 && self.is_within_atomic_block == false
-                    // it onyl makes sense to start tracking new statements if at least one of the
-                    // currently tracked statements could be complete. or if none are tracked yet.
-                    // this is important for statements such as `explain select 1;` where `select 1`
-                    // would mark a completed statement that would move `explain` into completed,
-                    // even though the latter is part of the former.
-                && (self.tracked_statements.len() == 0
-                    || self
-                        .tracked_statements
-                        .iter()
-                        .any(|s| s.could_be_complete()))
-            {
-                if let Some(stmts) = STATEMENT_DEFINITIONS.get(&at_token.kind) {
-                    println!(
-                        "adding stmts: {:?}, completed are {:?}",
-                        stmts.iter().map(|s| s.stmt).collect::<Vec<_>>(),
-                        self.tracked_statements
-                            .iter()
-                            .filter(|s| s.could_be_complete())
-                            .map(|s| s.def.stmt)
-                            .collect::<Vec<_>>()
-                    );
-
-                    self.tracked_statements.append(
-                        &mut stmts
-                            .iter()
-                            .filter_map(|stmt| {
-                                if self.active_bridges.iter().any(|b| b.def.stmt == stmt.stmt) {
-                                    None
-                                } else if self.tracked_statements.iter().any(|s| {
-                                    s.could_be_complete()
-                                        && s.def
-                                            .prohibited_following_statements
-                                            .contains(&stmt.stmt)
-                                }) {
-                                    None
-                                } else {
-                                    Some(Tracker::new_at(stmt, self.parser.pos))
-                                }
-                            })
-                            .collect(),
-                    );
-                };
+            SyntaxKind::EndP => {
+                self.is_within_atomic_block = false;
             }
+            _ => {}
+        };
+    }
 
-            self.active_bridges
-                .retain_mut(|stmt| stmt.advance_with(&at_token.kind));
+    /// advance all tracked statements and return the earliest started_at value of the removed
+    /// statements
+    fn advance_tracker(&mut self) -> Option<usize> {
+        let mut removed_items = Vec::new();
 
-            if let Some(bridges) = STATEMENT_BRIDGE_DEFINITIONS.get(&at_token.kind) {
-                self.active_bridges.append(
-                    &mut bridges
-                        .iter()
-                        .map(|stmt| Tracker::new_at(stmt, self.parser.pos))
-                        .collect(),
-                );
+        self.tracked_statements.retain_mut(|stmt| {
+            let keep = stmt.advance_with(&self.parser.nth(0, false).kind);
+            if !keep {
+                removed_items.push(stmt.started_at);
             }
+            keep
+        });
 
-            println!(
-                "tracked stmts after {:?}",
-                self.tracked_statements
-                    .iter()
-                    .map(|s| s.def.stmt)
-                    .collect::<Vec<_>>()
-            );
+        removed_items.iter().min().map(|i| *i)
+    }
 
-            // i didnt believe it myself at first, but there are statements where a ";" is valid
-            // within a sub statement, e.g.:
-            // "create rule qqq as on insert to copydml_test do instead (delete from copydml_test; delete from copydml_test);"
-            // so we need to check for sub statement depth here
-            if at_token.kind == SyntaxKind::Ascii59
-                && self.sub_stmt_depth == 0
-                && self.is_within_atomic_block == false
-            {
-                // ;
-                // get earliest statement
-                if let Some(earliest_complete_stmt_started_at) = self
-                    .tracked_statements
-                    .iter()
-                    .filter(|s| s.could_be_complete())
-                    .min_by_key(|stmt| stmt.started_at)
-                    .map(|stmt| stmt.started_at)
-                {
-                    let earliest_complete_stmt = self
-                        .tracked_statements
-                        .iter()
-                        .filter(|s| {
-                            s.started_at == earliest_complete_stmt_started_at
-                                && s.could_be_complete()
-                        })
-                        .max_by_key(|stmt| stmt.max_pos())
-                        .unwrap();
-
-                    assert_eq!(
-                        1,
-                        self.tracked_statements
-                            .iter()
-                            .filter(|s| {
-                                s.started_at == earliest_complete_stmt_started_at
-                                    && s.could_be_complete()
-                                    && s.current_positions().iter().any(|i| {
-                                        earliest_complete_stmt.current_positions().contains(i)
-                                    })
-                            })
-                            .count(),
-                        "multiple complete statements at the same position"
-                    );
+    fn token_range(&self, token_pos: usize) -> TextRange {
+        self.parser.tokens.get(token_pos).unwrap().span
+    }
 
-                    let end_pos = at_token.span.end();
-                    let start_pos = TextSize::try_from(
-                        self.parser
-                            .tokens
-                            .get(earliest_complete_stmt.started_at)
-                            .unwrap()
-                            .span
-                            .start(),
-                    )
-                    .unwrap();
-                    println!(
-                        "adding stmt from ';': {:?}",
-                        earliest_complete_stmt.def.stmt
-                    );
-                    ranges.push(StatementPosition {
-                        kind: earliest_complete_stmt.def.stmt,
-                        range: TextRange::new(start_pos, end_pos),
-                    });
-                }
+    fn add_incomplete_statement(&mut self, started_at: Option<usize>) {
+        if self.tracked_statements.len() > 0 || started_at.is_none() {
+            return;
+        }
 
-                self.tracked_statements.clear();
-                self.active_bridges.clear();
-            }
+        self.ranges.push(StatementPosition {
+            kind: SyntaxKind::Any,
+            range: TextRange::new(
+                self.token_range(started_at.unwrap()).start(),
+                self.parser.lookbehind(2, true).unwrap().span.end(),
+            ),
+        });
+    }
 
-            // if a statement is complete, check if there are any complete statements that start
-            // before the just completed one
+    fn start_new_statements(&mut self) {
+        if self.sub_trx_depth != 0 || self.sub_stmt_depth != 0 || self.is_within_atomic_block {
+            return;
+        }
 
-            // Step 1: Find the latest completed statement
-            let latest_completed_stmt_started_at = self
+        // it onyl makes sense to start tracking new statements if at least one of the
+        // currently tracked statements could be complete. or if none are tracked yet.
+        // this is important for statements such as `explain select 1;` where `select 1`
+        // would mark a completed statement that would move `explain` into completed,
+        // even though the latter is part of the former.
+        if self.tracked_statements.len() != 0
+            && self
                 .tracked_statements
                 .iter()
-                .filter(|s| s.could_be_complete())
-                .max_by_key(|stmt| stmt.started_at)
-                .map(|stmt| stmt.started_at);
+                .all(|s| !s.could_be_complete())
+        {
+            return;
+        }
 
-            if let Some(latest_completed_stmt_started_at) = latest_completed_stmt_started_at {
-                // Step 2: Find the latest complete statement before the latest completed statement
-                let latest_complete_before_started_at = self
-                    .tracked_statements
+        let new_stmts = STATEMENT_DEFINITIONS.get(&self.parser.nth(0, false).kind);
+
+        if let Some(new_stmts) = new_stmts {
+            self.tracked_statements.append(
+                &mut new_stmts
                     .iter()
-                    .filter(|s| {
-                        s.could_be_complete() && s.started_at < latest_completed_stmt_started_at
+                    .filter_map(|stmt| {
+                        if self.active_bridges.iter().any(|b| b.def.stmt == stmt.stmt) {
+                            None
+                        } else if self.tracked_statements.iter().any(|s| {
+                            s.could_be_complete()
+                                && s.def.prohibited_following_statements.contains(&stmt.stmt)
+                        }) {
+                            None
+                        } else {
+                            Some(Tracker::new_at(stmt, self.parser.pos))
+                        }
                     })
-                    .max_by_key(|stmt| stmt.started_at)
-                    .map(|stmt| stmt.started_at);
-
-                if let Some(latest_complete_before_started_at) = latest_complete_before_started_at {
-                    let latest_complete_before = self
-                        .tracked_statements
-                        .iter()
-                        .filter(|s| {
-                            s.started_at == latest_complete_before_started_at
-                                && s.could_be_complete()
-                        })
-                        .max_by_key(|stmt| stmt.max_pos())
-                        .cloned()
-                        .unwrap();
-
-                    assert_eq!(
-                        1,
-                        self.tracked_statements
-                            .iter()
-                            .filter(|s| {
-                                s.started_at == latest_complete_before_started_at
-                                    && s.could_be_complete()
-                                    && s.current_positions().iter().any(|i| {
-                                        latest_complete_before.current_positions().contains(i)
-                                    })
-                            })
-                            .count(),
-                        "multiple complete statements at the same position"
-                    );
-
-                    // Step 3: save range for the statement
+                    .collect(),
+            );
+        }
+    }
 
-                    // end is the last non-whitespace token before the start of the latest complete
-                    // statement
+    fn advance_bridges(&mut self) {
+        self.active_bridges
+            .retain_mut(|stmt| stmt.advance_with(&self.parser.nth(0, false).kind));
+    }
 
-                    // TODO optimize
-                    let latest_text_pos = self
-                        .parser
-                        .tokens
-                        .get(latest_completed_stmt_started_at)
-                        .unwrap()
-                        .span
-                        .start();
-                    let end_pos = self
-                        .parser
-                        .tokens
-                        .iter()
-                        // .skip(latest_completed_stmt_started_at)
-                        .filter_map(|t| {
-                            if t.span.start() < latest_text_pos
-                                && !WHITESPACE_TOKENS.contains(&t.kind)
-                            {
-                                Some(t.span.end())
-                            } else {
-                                None
-                            }
-                        })
-                        .max()
-                        .unwrap();
-
-                    println!("adding stmt: {:?}", latest_complete_before.def.stmt);
-
-                    ranges.push(StatementPosition {
-                        kind: latest_complete_before.def.stmt,
-                        range: TextRange::new(
-                            TextSize::try_from(
-                                self.parser
-                                    .tokens
-                                    .get(latest_complete_before.started_at)
-                                    .unwrap()
-                                    .span
-                                    .start(),
-                            )
-                            .unwrap(),
-                            end_pos,
-                        ),
-                    });
+    fn start_new_bridges(&mut self) {
+        if let Some(bridges) = STATEMENT_BRIDGE_DEFINITIONS.get(&self.parser.nth(0, false).kind) {
+            self.active_bridges.append(
+                &mut bridges
+                    .iter()
+                    .map(|stmt| Tracker::new_at(stmt, self.parser.pos))
+                    .collect(),
+            );
+        }
+    }
 
-                    // Step 4: remove all statements that started before or at the position
-                    self.tracked_statements
-                        .retain(|s| s.started_at > latest_complete_before.started_at);
-                }
-            }
+    fn close_stmt_with_semicolon(&mut self) {
+        let at_token = self.parser.nth(0, false);
+        assert_eq!(at_token.kind, SyntaxKind::Ascii59);
 
-            self.parser.advance();
+        // i didnt believe it myself at first, but there are statements where a ";" is valid
+        // within a sub statement, e.g.:
+        // "create rule qqq as on insert to copydml_test do instead (delete from copydml_test; delete from copydml_test);"
+        // so we need to check for sub statement depth here
+        if self.sub_stmt_depth != 0 || self.is_within_atomic_block {
+            return;
         }
 
-        // get the earliest statement that is complete
+        // get earliest statement
         if let Some(earliest_complete_stmt_started_at) = self
             .tracked_statements
             .iter()
@@ -369,27 +195,7 @@ impl<'a> StatementSplitter<'a> {
                 "multiple complete statements at the same position"
             );
 
-            let earliest_text_pos = self
-                .parser
-                .tokens
-                .get(earliest_complete_stmt.started_at)
-                .unwrap()
-                .span
-                .start();
-            let end_pos = self
-                .parser
-                .tokens
-                .iter()
-                .skip(earliest_complete_stmt.started_at)
-                .filter_map(|t| {
-                    if t.span.start() > earliest_text_pos && !WHITESPACE_TOKENS.contains(&t.kind) {
-                        Some(t.span.end())
-                    } else {
-                        None
-                    }
-                })
-                .max()
-                .unwrap();
+            let end_pos = at_token.span.end();
             let start_pos = TextSize::try_from(
                 self.parser
                     .tokens
@@ -399,9 +205,177 @@ impl<'a> StatementSplitter<'a> {
                     .start(),
             )
             .unwrap();
+            println!(
+                "adding stmt from ';': {:?}",
+                earliest_complete_stmt.def.stmt
+            );
+            self.ranges.push(StatementPosition {
+                kind: earliest_complete_stmt.def.stmt,
+                range: TextRange::new(start_pos, end_pos),
+            });
+        }
+
+        self.tracked_statements.clear();
+        self.active_bridges.clear();
+    }
+
+    fn find_earliest_statement_start_pos(&self) -> Option<usize> {
+        self.tracked_statements
+            .iter()
+            .min_by_key(|stmt| stmt.started_at)
+            .map(|stmt| stmt.started_at)
+    }
+
+    fn find_earliest_complete_statement_start_pos(&self) -> Option<usize> {
+        self.tracked_statements
+            .iter()
+            .filter(|s| s.could_be_complete())
+            .min_by_key(|stmt| stmt.started_at)
+            .map(|stmt| stmt.started_at)
+    }
+
+    fn find_latest_complete_statement_start_pos(&self) -> Option<usize> {
+        self.tracked_statements
+            .iter()
+            .filter(|s| s.could_be_complete())
+            .max_by_key(|stmt| stmt.started_at)
+            .map(|stmt| stmt.started_at)
+    }
+
+    fn find_latest_complete_statement_before_start_pos(&self, before: usize) -> Option<usize> {
+        self.tracked_statements
+            .iter()
+            .filter(|s| s.could_be_complete() && s.started_at < before)
+            .max_by_key(|stmt| stmt.started_at)
+            .map(|stmt| stmt.started_at)
+    }
+
+    fn find_highest_positioned_complete_statement(&self, started_at: usize) -> &Tracker<'a> {
+        self.tracked_statements
+            .iter()
+            .filter(|s| s.started_at == started_at && s.could_be_complete())
+            .max_by_key(|stmt| stmt.max_pos())
+            .unwrap()
+    }
+
+    fn assert_single_complete_statement_at_position(&self, tracker: &Tracker<'a>) {
+        assert_eq!(
+            1,
+            self.tracked_statements
+                .iter()
+                .filter(|s| {
+                    s.started_at == tracker.started_at
+                        && s.could_be_complete()
+                        && s.current_positions()
+                            .iter()
+                            .any(|i| tracker.current_positions().contains(i))
+                })
+                .count(),
+            "multiple complete statements at the same position"
+        );
+    }
+
+    pub fn run(mut self) -> Vec<StatementPosition> {
+        while !self.parser.eof() {
+            println!("{:?}", self.parser.nth(0, false).kind);
+            println!(
+                "tracked stmts before {:?}",
+                self.tracked_statements
+                    .iter()
+                    .map(|s| s.def.stmt)
+                    .collect::<Vec<_>>()
+            );
+
+            self.track_nesting();
+
+            let removed_items_min_started_at = self.advance_tracker();
+
+            self.add_incomplete_statement(removed_items_min_started_at);
+
+            self.start_new_statements();
+
+            self.advance_bridges();
+
+            self.start_new_bridges();
+
+            println!(
+                "tracked stmts after {:?}",
+                self.tracked_statements
+                    .iter()
+                    .map(|s| s.def.stmt)
+                    .collect::<Vec<_>>()
+            );
+
+            if self.parser.nth(0, false).kind == SyntaxKind::Ascii59 {
+                self.close_stmt_with_semicolon();
+            }
+
+            // # This is where the actual parsing happens
+
+            // 1. Find the latest complete statement
+            if let Some(latest_completed_stmt_started_at) =
+                self.find_latest_complete_statement_start_pos()
+            {
+                // Step 2: Find the latest complete statement before the latest completed statement
+                if let Some(latest_complete_before_started_at) = self
+                    .find_latest_complete_statement_before_start_pos(
+                        latest_completed_stmt_started_at,
+                    )
+                {
+                    let latest_complete_before = self.find_highest_positioned_complete_statement(
+                        latest_complete_before_started_at,
+                    );
+
+                    self.assert_single_complete_statement_at_position(&latest_complete_before);
+
+                    let stmt_kind = latest_complete_before.def.stmt;
+                    let latest_complete_before_started_at = latest_complete_before.started_at;
+
+                    // Step 3: save range for the statement
+                    let start_pos = self.token_range(latest_complete_before_started_at).start();
+
+                    // the end position is the end() of the last non-whitespace token before the start
+                    // of the latest complete statement
+                    let latest_non_whitespace_token = self
+                        .parser
+                        .lookbehind(self.parser.pos - latest_completed_stmt_started_at + 1, true);
+                    let end_pos = latest_non_whitespace_token.unwrap().span.end();
+
+                    println!("adding stmt: {:?}", stmt_kind);
+
+                    self.ranges.push(StatementPosition {
+                        kind: stmt_kind,
+                        range: TextRange::new(start_pos, end_pos),
+                    });
+
+                    // Step 4: remove all statements that started before or at the position
+                    self.tracked_statements
+                        .retain(|s| s.started_at > latest_complete_before_started_at);
+                }
+            }
+
+            self.parser.advance();
+        }
+
+        // we reached eof; add any remaining statements
+
+        // get the earliest statement that is complete
+        if let Some(earliest_complete_stmt_started_at) =
+            self.find_earliest_complete_statement_start_pos()
+        {
+            let earliest_complete_stmt =
+                self.find_highest_positioned_complete_statement(earliest_complete_stmt_started_at);
+
+            self.assert_single_complete_statement_at_position(earliest_complete_stmt);
+
+            let start_pos = self.token_range(earliest_complete_stmt_started_at).start();
+
+            let end_token = self.parser.lookbehind(1, true).unwrap();
+            let end_pos = end_token.span.end();
+
             println!("adding stmt at end: {:?}", earliest_complete_stmt.def.stmt);
             println!("start: {:?}, end: {:?}", start_pos, end_pos);
-            ranges.push(StatementPosition {
+            self.ranges.push(StatementPosition {
                 kind: earliest_complete_stmt.def.stmt,
                 range: TextRange::new(start_pos, end_pos),
             });
@@ -410,30 +384,20 @@ impl<'a> StatementSplitter<'a> {
                 .retain(|s| s.started_at > earliest_complete_stmt_started_at);
         }
 
-        if let Some(earliest_stmt_started_at) = self
-            .tracked_statements
-            .iter()
-            .min_by_key(|stmt| stmt.started_at)
-            .map(|stmt| stmt.started_at)
-        {
-            let start_pos = TextSize::try_from(
-                self.parser
-                    .tokens
-                    .get(earliest_stmt_started_at)
-                    .unwrap()
-                    .span
-                    .start(),
-            );
+        if let Some(earliest_stmt_started_at) = self.find_earliest_statement_start_pos() {
+            let start_pos = self.token_range(earliest_stmt_started_at).start();
+
             // end position is last non-whitespace token before or at the current position
-            let end_pos = TextSize::try_from(self.parser.lookbehind(1, true).unwrap().span.end());
+            let end_pos = self.parser.lookbehind(1, true).unwrap().span.end();
+
             println!("adding any stmt at end");
-            ranges.push(StatementPosition {
+            self.ranges.push(StatementPosition {
                 kind: SyntaxKind::Any,
-                range: TextRange::new(start_pos.unwrap(), end_pos.unwrap()),
+                range: TextRange::new(start_pos, end_pos),
             });
         }
 
-        ranges
+        self.ranges
     }
 }
 

From 28b8431a9d7901bdfaf164c277dd48ac3d6cebe0 Mon Sep 17 00:00:00 2001
From: psteinroe <philipp@steinroetter.com>
Date: Thu, 22 Aug 2024 15:39:55 +0200
Subject: [PATCH 10/19] feat: finish refactor

---
 crates/pg_statement_splitter/src/data.rs      | 3213 ++++++++---------
 .../src/statement_splitter.rs                 |    2 +-
 2 files changed, 1458 insertions(+), 1757 deletions(-)

diff --git a/crates/pg_statement_splitter/src/data.rs b/crates/pg_statement_splitter/src/data.rs
index f3d01c39..fc2c558a 100644
--- a/crates/pg_statement_splitter/src/data.rs
+++ b/crates/pg_statement_splitter/src/data.rs
@@ -46,6 +46,18 @@ impl SyntaxBuilder {
         self.optional_group(vec![SyntaxKind::Ident, SyntaxKind::Ascii46])
     }
 
+    pub fn optional_if_exists_group(self) -> Self {
+        self.optional_group(vec![SyntaxKind::IfP, SyntaxKind::Exists])
+    }
+
+    pub fn optional_if_not_exists_group(self) -> Self {
+        self.optional_group(vec![SyntaxKind::IfP, SyntaxKind::Not, SyntaxKind::Exists])
+    }
+
+    pub fn optional_or_replace_group(self) -> Self {
+        self.optional_group(vec![SyntaxKind::Or, SyntaxKind::Replace])
+    }
+
     pub fn one_of(mut self, tokens: Vec<SyntaxKind>) -> Self {
         self.parts.push(SyntaxDefinition::OneOf(tokens));
         self
@@ -130,24 +142,25 @@ pub static STATEMENT_DEFINITIONS: LazyLock<HashMap<SyntaxKind, Vec<StatementDefi
     LazyLock::new(|| {
         let mut m: Vec<StatementDefinition> = Vec::new();
 
-        // m.push(StatementDefinition {
-        //     stmt: SyntaxKind::CreateTrigStmt,
-        //     tokens: vec![
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Create),
-        //         SyntaxDefinition::OptionalToken(SyntaxKind::Or),
-        //         SyntaxDefinition::OptionalToken(SyntaxKind::Replace),
-        //         SyntaxDefinition::OptionalToken(SyntaxKind::Constraint),
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Trigger),
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
-        //         SyntaxDefinition::AnyTokens,
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::On),
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
-        //         SyntaxDefinition::AnyTokens,
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Execute),
-        //         SyntaxDefinition::OneOf(vec![SyntaxKind::Function, SyntaxKind::Procedure]),
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
-        //     ],
-        // });
+        m.push(StatementDefinition::new(
+            SyntaxKind::CreateTrigStmt,
+            SyntaxBuilder::new()
+                .required_token(SyntaxKind::Create)
+                .optional_token(SyntaxKind::Or)
+                .optional_token(SyntaxKind::Replace)
+                .optional_token(SyntaxKind::Constraint)
+                .required_token(SyntaxKind::Trigger)
+                .optional_schema_name_group()
+                .required_token(SyntaxKind::Ident)
+                .any_tokens(None)
+                .required_token(SyntaxKind::On)
+                .required_token(SyntaxKind::Ident)
+                .any_tokens(None)
+                .required_token(SyntaxKind::Execute)
+                .one_of(vec![SyntaxKind::Function, SyntaxKind::Procedure])
+                .optional_schema_name_group()
+                .required_token(SyntaxKind::Ident),
+        ));
 
         m.push(StatementDefinition::new(
             SyntaxKind::SelectStmt,
@@ -190,1746 +203,1434 @@ pub static STATEMENT_DEFINITIONS: LazyLock<HashMap<SyntaxKind, Vec<StatementDefi
                 .any_token(),
         ));
 
-        // m.push(StatementDefinition {
-        //     stmt: SyntaxKind::MergeStmt,
-        //     tokens: vec![
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Merge),
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Into),
-        //         SyntaxDefinition::OptionalToken(SyntaxKind::Only),
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
-        //     ],
-        // });
-        //
-        // m.push(StatementDefinition {
-        //     stmt: SyntaxKind::AlterTableStmt,
-        //     tokens: vec![
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Alter),
-        //         SyntaxDefinition::OptionalToken(SyntaxKind::Materialized),
-        //         SyntaxDefinition::OneOf(vec![
-        //             SyntaxKind::Table,
-        //             SyntaxKind::Index,
-        //             SyntaxKind::View,
-        //         ]),
-        //         SyntaxDefinition::OptionalToken(SyntaxKind::IfP),
-        //         SyntaxDefinition::OptionalToken(SyntaxKind::Exists),
-        //         SyntaxDefinition::OptionalToken(SyntaxKind::Only),
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
-        //         SyntaxDefinition::AnyToken,
-        //     ],
-        // });
-        //
-        // m.push(StatementDefinition {
-        //     stmt: SyntaxKind::RenameStmt,
-        //     tokens: vec![
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Alter),
-        //         SyntaxDefinition::AnyTokens,
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
-        //         SyntaxDefinition::AnyTokens,
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Rename),
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::To),
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
-        //     ],
-        // });
-        //
-        // m.push(StatementDefinition {
-        //     stmt: SyntaxKind::RenameStmt,
-        //     tokens: vec![
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Alter),
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Table),
-        //         SyntaxDefinition::OptionalToken(SyntaxKind::IfP),
-        //         SyntaxDefinition::OptionalToken(SyntaxKind::Exists),
-        //         SyntaxDefinition::OptionalToken(SyntaxKind::Only),
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Rename),
-        //     ],
-        // });
-        //
-        // m.push(StatementDefinition {
-        //     stmt: SyntaxKind::AlterDomainStmt,
-        //     tokens: vec![
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Alter),
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::DomainP),
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
-        //     ],
-        // });
-        //
-        // m.push(StatementDefinition {
-        //     stmt: SyntaxKind::CallStmt,
-        //     tokens: vec![
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Call),
-        //         SyntaxDefinition::OneOf(vec![SyntaxKind::Ident, SyntaxKind::VersionP]),
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Ascii40),
-        //         SyntaxDefinition::AnyTokens,
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Ascii41),
-        //     ],
-        // });
-        //
-        // m.push(StatementDefinition {
-        //     stmt: SyntaxKind::AlterDefaultPrivilegesStmt,
-        //     tokens: vec![
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Alter),
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Default),
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Privileges),
-        //     ],
-        // });
-        //
-        // m.push(StatementDefinition {
-        //     stmt: SyntaxKind::ClusterStmt,
-        //     tokens: vec![SyntaxDefinition::RequiredToken(SyntaxKind::Cluster)],
-        // });
-        //
-        // m.push(StatementDefinition {
-        //     stmt: SyntaxKind::CopyStmt,
-        //     tokens: vec![SyntaxDefinition::RequiredToken(SyntaxKind::Copy)],
-        // });
-        //
-        // m.push(StatementDefinition {
-        //     stmt: SyntaxKind::ExecuteStmt,
-        //     tokens: vec![
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Execute),
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
-        //     ],
-        // });
-        //
-        // // TODO we might need to add new types to handle this properly
-        // m.push(StatementDefinition {
-        //     stmt: SyntaxKind::CreateStmt,
-        //     tokens: vec![
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Create),
-        //         SyntaxDefinition::OptionalToken(SyntaxKind::Global),
-        //         SyntaxDefinition::OptionalToken(SyntaxKind::Local),
-        //         SyntaxDefinition::OptionalToken(SyntaxKind::Temporary),
-        //         SyntaxDefinition::OptionalToken(SyntaxKind::Temp),
-        //         SyntaxDefinition::OptionalToken(SyntaxKind::Unlogged),
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Table),
-        //         SyntaxDefinition::OptionalToken(SyntaxKind::IfP),
-        //         SyntaxDefinition::OptionalToken(SyntaxKind::Not),
-        //         SyntaxDefinition::OptionalToken(SyntaxKind::Exists),
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
-        //     ],
-        // });
-        //
-        // m.push(StatementDefinition {
-        //     stmt: SyntaxKind::DefineStmt,
-        //     tokens: vec![
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Create),
-        //         SyntaxDefinition::OptionalToken(SyntaxKind::Or),
-        //         SyntaxDefinition::OptionalToken(SyntaxKind::Replace),
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Aggregate),
-        //     ],
-        // });
-        //
-        // m.push(StatementDefinition {
-        //     stmt: SyntaxKind::CreateOpClassStmt,
-        //     tokens: vec![
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Create),
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Operator),
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Class),
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
-        //         SyntaxDefinition::OptionalToken(SyntaxKind::Default),
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::For),
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::TypeP),
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Using),
-        //     ],
-        // });
-        //
-        // m.push(StatementDefinition {
-        //     stmt: SyntaxKind::DropStmt,
-        //     tokens: vec![
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Drop),
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Operator),
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Class),
-        //         SyntaxDefinition::OptionalToken(SyntaxKind::IfP),
-        //         SyntaxDefinition::OptionalToken(SyntaxKind::Exists),
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Using),
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
-        //     ],
-        // });
-        //
-        // m.push(StatementDefinition {
-        //     stmt: SyntaxKind::DropStmt,
-        //     tokens: vec![
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Drop),
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Access),
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Method),
-        //         SyntaxDefinition::OptionalToken(SyntaxKind::IfP),
-        //         SyntaxDefinition::OptionalToken(SyntaxKind::Exists),
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
-        //     ],
-        // });
-        //
-        // m.push(StatementDefinition {
-        //     stmt: SyntaxKind::DropStmt,
-        //     tokens: vec![
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Drop),
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Server),
-        //         SyntaxDefinition::OptionalToken(SyntaxKind::IfP),
-        //         SyntaxDefinition::OptionalToken(SyntaxKind::Exists),
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
-        //     ],
-        // });
-        //
-        // m.push(StatementDefinition {
-        //     stmt: SyntaxKind::DropStmt,
-        //     tokens: vec![
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Drop),
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Trigger),
-        //         SyntaxDefinition::OptionalToken(SyntaxKind::IfP),
-        //         SyntaxDefinition::OptionalToken(SyntaxKind::Exists),
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::On),
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
-        //     ],
-        // });
-        //
-        // m.push(StatementDefinition {
-        //     stmt: SyntaxKind::DropStmt,
-        //     tokens: vec![
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Drop),
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Collation),
-        //         SyntaxDefinition::OptionalToken(SyntaxKind::IfP),
-        //         SyntaxDefinition::OptionalToken(SyntaxKind::Exists),
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
-        //     ],
-        // });
-        //
-        // m.push(StatementDefinition {
-        //     stmt: SyntaxKind::DropStmt,
-        //     tokens: vec![
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Drop),
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::ConversionP),
-        //         SyntaxDefinition::OptionalToken(SyntaxKind::IfP),
-        //         SyntaxDefinition::OptionalToken(SyntaxKind::Exists),
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
-        //     ],
-        // });
-        //
-        // m.push(StatementDefinition {
-        //     stmt: SyntaxKind::DropStmt,
-        //     tokens: vec![
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Drop),
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::TextP),
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Search),
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Parser),
-        //         SyntaxDefinition::OptionalToken(SyntaxKind::IfP),
-        //         SyntaxDefinition::OptionalToken(SyntaxKind::Exists),
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
-        //     ],
-        // });
-        //
-        // m.push(StatementDefinition {
-        //     stmt: SyntaxKind::DropStmt,
-        //     tokens: vec![
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Drop),
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::TextP),
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Search),
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Dictionary),
-        //         SyntaxDefinition::OptionalToken(SyntaxKind::IfP),
-        //         SyntaxDefinition::OptionalToken(SyntaxKind::Exists),
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
-        //     ],
-        // });
-        //
-        // m.push(StatementDefinition {
-        //     stmt: SyntaxKind::DropStmt,
-        //     tokens: vec![
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Drop),
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::TextP),
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Search),
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Template),
-        //         SyntaxDefinition::OptionalToken(SyntaxKind::IfP),
-        //         SyntaxDefinition::OptionalToken(SyntaxKind::Exists),
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
-        //     ],
-        // });
-        //
-        // m.push(StatementDefinition {
-        //     stmt: SyntaxKind::DropStmt,
-        //     tokens: vec![
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Drop),
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::TextP),
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Search),
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Configuration),
-        //         SyntaxDefinition::OptionalToken(SyntaxKind::IfP),
-        //         SyntaxDefinition::OptionalToken(SyntaxKind::Exists),
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
-        //     ],
-        // });
-        //
-        // m.push(StatementDefinition {
-        //     stmt: SyntaxKind::DropStmt,
-        //     tokens: vec![
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Drop),
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Extension),
-        //         SyntaxDefinition::OptionalToken(SyntaxKind::IfP),
-        //         SyntaxDefinition::OptionalToken(SyntaxKind::Exists),
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
-        //     ],
-        // });
-        //
-        // m.push(StatementDefinition {
-        //     stmt: SyntaxKind::DropStmt,
-        //     tokens: vec![
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Drop),
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Aggregate),
-        //         SyntaxDefinition::OptionalToken(SyntaxKind::IfP),
-        //         SyntaxDefinition::OptionalToken(SyntaxKind::Exists),
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
-        //     ],
-        // });
-        //
-        // m.push(StatementDefinition {
-        //     stmt: SyntaxKind::DropStmt,
-        //     tokens: vec![
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Drop),
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::DomainP),
-        //         SyntaxDefinition::OptionalToken(SyntaxKind::IfP),
-        //         SyntaxDefinition::OptionalToken(SyntaxKind::Exists),
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
-        //     ],
-        // });
-        //
-        // m.push(StatementDefinition {
-        //     stmt: SyntaxKind::DropStmt,
-        //     tokens: vec![
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Drop),
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Sequence),
-        //         SyntaxDefinition::OptionalToken(SyntaxKind::IfP),
-        //         SyntaxDefinition::OptionalToken(SyntaxKind::Exists),
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
-        //     ],
-        // });
-        //
-        // m.push(StatementDefinition {
-        //     stmt: SyntaxKind::DropStmt,
-        //     tokens: vec![
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Drop),
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Foreign),
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Table),
-        //         SyntaxDefinition::OptionalToken(SyntaxKind::IfP),
-        //         SyntaxDefinition::OptionalToken(SyntaxKind::Exists),
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
-        //     ],
-        // });
-        //
-        // m.push(StatementDefinition {
-        //     stmt: SyntaxKind::DropStmt,
-        //     tokens: vec![
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Drop),
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Cast),
-        //         SyntaxDefinition::OptionalToken(SyntaxKind::IfP),
-        //         SyntaxDefinition::OptionalToken(SyntaxKind::Exists),
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Ascii40),
-        //         SyntaxDefinition::AnyTokens,
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::As),
-        //         SyntaxDefinition::AnyTokens,
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Ascii41),
-        //     ],
-        // });
-        //
-        // m.push(StatementDefinition {
-        //     stmt: SyntaxKind::DropStmt,
-        //     tokens: vec![
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Drop),
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Foreign),
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::DataP),
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Wrapper),
-        //         SyntaxDefinition::OptionalToken(SyntaxKind::IfP),
-        //         SyntaxDefinition::OptionalToken(SyntaxKind::Exists),
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
-        //     ],
-        // });
-        //
-        // m.push(StatementDefinition {
-        //     stmt: SyntaxKind::DropStmt,
-        //     tokens: vec![
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Drop),
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Table),
-        //         SyntaxDefinition::OptionalToken(SyntaxKind::IfP),
-        //         SyntaxDefinition::OptionalToken(SyntaxKind::Exists),
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
-        //     ],
-        // });
-        //
-        // m.push(StatementDefinition {
-        //     stmt: SyntaxKind::DropStmt,
-        //     tokens: vec![
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Drop),
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Index),
-        //         SyntaxDefinition::OptionalToken(SyntaxKind::Concurrently),
-        //         SyntaxDefinition::OptionalToken(SyntaxKind::IfP),
-        //         SyntaxDefinition::OptionalToken(SyntaxKind::Exists),
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
-        //     ],
-        // });
-        //
-        // m.push(StatementDefinition {
-        //     stmt: SyntaxKind::DropStmt,
-        //     tokens: vec![
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Drop),
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Rule),
-        //         SyntaxDefinition::OptionalToken(SyntaxKind::IfP),
-        //         SyntaxDefinition::OptionalToken(SyntaxKind::Exists),
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::On),
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
-        //     ],
-        // });
-        //
-        // m.push(StatementDefinition {
-        //     stmt: SyntaxKind::DropStmt,
-        //     tokens: vec![
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Drop),
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::TypeP),
-        //         SyntaxDefinition::OptionalToken(SyntaxKind::IfP),
-        //         SyntaxDefinition::OptionalToken(SyntaxKind::Exists),
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
-        //     ],
-        // });
-        //
-        // m.push(StatementDefinition {
-        //     stmt: SyntaxKind::DropStmt,
-        //     tokens: vec![
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Drop),
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Operator),
-        //         SyntaxDefinition::OptionalToken(SyntaxKind::IfP),
-        //         SyntaxDefinition::OptionalToken(SyntaxKind::Exists),
-        //         SyntaxDefinition::OneOf(vec![SyntaxKind::Op, SyntaxKind::Ident]),
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Ascii40),
-        //         SyntaxDefinition::AnyTokens,
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Ascii41),
-        //     ],
-        // });
-        //
-        // m.push(StatementDefinition {
-        //     stmt: SyntaxKind::DropStmt,
-        //     tokens: vec![
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Drop),
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Routine),
-        //         SyntaxDefinition::OptionalToken(SyntaxKind::IfP),
-        //         SyntaxDefinition::OptionalToken(SyntaxKind::Exists),
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
-        //     ],
-        // });
-        //
-        // m.push(StatementDefinition {
-        //     stmt: SyntaxKind::DropStmt,
-        //     tokens: vec![
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Drop),
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Procedure),
-        //         SyntaxDefinition::OptionalToken(SyntaxKind::IfP),
-        //         SyntaxDefinition::OptionalToken(SyntaxKind::Exists),
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
-        //     ],
-        // });
-        //
-        // m.push(StatementDefinition {
-        //     stmt: SyntaxKind::DropStmt,
-        //     tokens: vec![
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Drop),
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Function),
-        //         SyntaxDefinition::OptionalToken(SyntaxKind::IfP),
-        //         SyntaxDefinition::OptionalToken(SyntaxKind::Exists),
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Ascii40),
-        //         SyntaxDefinition::AnyTokens,
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Ascii41),
-        //     ],
-        // });
-        //
-        // m.push(StatementDefinition {
-        //     stmt: SyntaxKind::DropStmt,
-        //     tokens: vec![
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Drop),
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Schema),
-        //         SyntaxDefinition::OptionalToken(SyntaxKind::IfP),
-        //         SyntaxDefinition::OptionalToken(SyntaxKind::Exists),
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
-        //     ],
-        // });
-        //
-        // m.push(StatementDefinition {
-        //     stmt: SyntaxKind::DropStmt,
-        //     tokens: vec![
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Drop),
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::View),
-        //         SyntaxDefinition::OptionalToken(SyntaxKind::IfP),
-        //         SyntaxDefinition::OptionalToken(SyntaxKind::Exists),
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
-        //     ],
-        // });
-        //
-        // m.push(StatementDefinition {
-        //     stmt: SyntaxKind::DropStmt,
-        //     tokens: vec![
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Drop),
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Language),
-        //         SyntaxDefinition::OptionalToken(SyntaxKind::IfP),
-        //         SyntaxDefinition::OptionalToken(SyntaxKind::Exists),
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
-        //     ],
-        // });
-        //
-        // m.push(StatementDefinition {
-        //     stmt: SyntaxKind::DropStmt,
-        //     tokens: vec![
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Drop),
-        //         SyntaxDefinition::OptionalToken(SyntaxKind::Procedural),
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Language),
-        //         SyntaxDefinition::OptionalToken(SyntaxKind::IfP),
-        //         SyntaxDefinition::OptionalToken(SyntaxKind::Exists),
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
-        //         SyntaxDefinition::OneOf(vec![SyntaxKind::Cascade, SyntaxKind::Restrict]),
-        //     ],
-        // });
-        //
-        // m.push(StatementDefinition {
-        //     stmt: SyntaxKind::DropStmt,
-        //     tokens: vec![
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Drop),
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Operator),
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Family),
-        //         SyntaxDefinition::OptionalToken(SyntaxKind::IfP),
-        //         SyntaxDefinition::OptionalToken(SyntaxKind::Exists),
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Using),
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
-        //     ],
-        // });
-        //
-        // // CREATE TEXT SEARCH DICTIONARY alt_ts_dict1 (template=simple);
-        // m.push(StatementDefinition {
-        //     stmt: SyntaxKind::DefineStmt,
-        //     tokens: vec![
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Create),
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::TextP),
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Search),
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Dictionary),
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Ascii40),
-        //         SyntaxDefinition::AnyTokens,
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Ascii41),
-        //     ],
-        // });
-        //
-        // m.push(StatementDefinition {
-        //     stmt: SyntaxKind::DefineStmt,
-        //     tokens: vec![
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Create),
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::TextP),
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Search),
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Configuration),
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Ascii40),
-        //         SyntaxDefinition::AnyTokens,
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Ascii41),
-        //     ],
-        // });
-        //
-        // m.push(StatementDefinition {
-        //     stmt: SyntaxKind::DefineStmt,
-        //     tokens: vec![
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Create),
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::TextP),
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Search),
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Template),
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Ascii40),
-        //         SyntaxDefinition::AnyTokens,
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Ascii41),
-        //     ],
-        // });
-        //
-        // m.push(StatementDefinition {
-        //     stmt: SyntaxKind::DefineStmt,
-        //     tokens: vec![
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Create),
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::TextP),
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Search),
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Parser),
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Ascii40),
-        //         SyntaxDefinition::AnyTokens,
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Ascii41),
-        //     ],
-        // });
-        //
-        // m.push(StatementDefinition {
-        //     stmt: SyntaxKind::DefineStmt,
-        //     tokens: vec![
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Create),
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Operator),
-        //     ],
-        // });
-        //
-        // m.push(StatementDefinition {
-        //     stmt: SyntaxKind::DefineStmt,
-        //     tokens: vec![
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Create),
-        //         SyntaxDefinition::OptionalToken(SyntaxKind::Or),
-        //         SyntaxDefinition::OptionalToken(SyntaxKind::Replace),
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Aggregate),
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Ascii40),
-        //         SyntaxDefinition::AnyTokens,
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Ascii41),
-        //     ],
-        // });
-        //
-        // m.push(StatementDefinition {
-        //     stmt: SyntaxKind::DefineStmt,
-        //     tokens: vec![
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Create),
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::TypeP),
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
-        //     ],
-        // });
-        //
-        // m.push(StatementDefinition {
-        //     stmt: SyntaxKind::CompositeTypeStmt,
-        //     tokens: vec![
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Create),
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::TypeP),
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::As),
-        //     ],
-        // });
-        //
-        // m.push(StatementDefinition {
-        //     stmt: SyntaxKind::CreateEnumStmt,
-        //     tokens: vec![
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Create),
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::TypeP),
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::As),
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::EnumP),
-        //     ],
-        // });
-        //
-        // m.push(StatementDefinition {
-        //     stmt: SyntaxKind::CreateRangeStmt,
-        //     tokens: vec![
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Create),
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::TypeP),
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::As),
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Range),
-        //     ],
-        // });
-        //
-        // m.push(StatementDefinition {
-        //     stmt: SyntaxKind::TruncateStmt,
-        //     tokens: vec![
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Truncate),
-        //         SyntaxDefinition::OptionalToken(SyntaxKind::Table),
-        //         SyntaxDefinition::OptionalToken(SyntaxKind::Only),
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
-        //     ],
-        // });
-        //
-        // m.push(StatementDefinition {
-        //     stmt: SyntaxKind::CommentStmt,
-        //     tokens: vec![
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Comment),
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::On),
-        //     ],
-        // });
-        //
-        // m.push(StatementDefinition {
-        //     stmt: SyntaxKind::FetchStmt,
-        //     tokens: vec![
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Fetch),
-        //         SyntaxDefinition::AnyTokens,
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
-        //     ],
-        // });
-        //
-        // m.push(StatementDefinition {
-        //     stmt: SyntaxKind::VacuumStmt,
-        //     tokens: vec![SyntaxDefinition::RequiredToken(SyntaxKind::Analyze)],
-        // });
-        //
-        // m.push(StatementDefinition {
-        //     stmt: SyntaxKind::IndexStmt,
-        //     tokens: vec![
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Create),
-        //         SyntaxDefinition::OptionalToken(SyntaxKind::Unique),
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Index),
-        //         SyntaxDefinition::AnyTokens,
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::On),
-        //         SyntaxDefinition::OptionalToken(SyntaxKind::Only),
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
-        //     ],
-        // });
-        //
-        // m.push(StatementDefinition {
-        //     stmt: SyntaxKind::CreateFunctionStmt,
-        //     tokens: vec![
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Create),
-        //         SyntaxDefinition::OptionalToken(SyntaxKind::Or),
-        //         SyntaxDefinition::OptionalToken(SyntaxKind::Replace),
-        //         SyntaxDefinition::OneOf(vec![SyntaxKind::Function, SyntaxKind::Procedure]),
-        //         SyntaxDefinition::AnyTokens,
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Ascii40),
-        //         SyntaxDefinition::AnyTokens,
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Ascii41),
-        //     ],
-        // });
-        //
-        // m.push(StatementDefinition {
-        //     stmt: SyntaxKind::AlterFunctionStmt,
-        //     tokens: vec![
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Alter),
-        //         SyntaxDefinition::OneOf(vec![SyntaxKind::Function, SyntaxKind::Procedure]),
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
-        //     ],
-        // });
-        //
-        // m.push(StatementDefinition {
-        //     stmt: SyntaxKind::DoStmt,
-        //     tokens: vec![
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Do),
-        //         SyntaxDefinition::OptionalToken(SyntaxKind::Language),
-        //         SyntaxDefinition::OptionalToken(SyntaxKind::Ident),
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Sconst),
-        //     ],
-        // });
-        //
-        // m.push(StatementDefinition {
-        //     stmt: SyntaxKind::RuleStmt,
-        //     tokens: vec![
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Create),
-        //         SyntaxDefinition::OptionalToken(SyntaxKind::Or),
-        //         SyntaxDefinition::OptionalToken(SyntaxKind::Replace),
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Rule),
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::As),
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::On),
-        //         SyntaxDefinition::OneOf(vec![
-        //             SyntaxKind::Select,
-        //             SyntaxKind::Insert,
-        //             SyntaxKind::Update,
-        //             SyntaxKind::DeleteP,
-        //         ]),
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::To),
-        //         SyntaxDefinition::AnyTokens,
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Do),
-        //     ],
-        // });
-        //
-        // m.push(StatementDefinition {
-        //     stmt: SyntaxKind::NotifyStmt,
-        //     tokens: vec![
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Notify),
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
-        //     ],
-        // });
-        //
-        // m.push(StatementDefinition {
-        //     stmt: SyntaxKind::ListenStmt,
-        //     tokens: vec![
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Listen),
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
-        //     ],
-        // });
-        //
-        // m.push(StatementDefinition {
-        //     stmt: SyntaxKind::UnlistenStmt,
-        //     tokens: vec![
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Unlisten),
-        //         SyntaxDefinition::OneOf(vec![SyntaxKind::Ident, SyntaxKind::Ascii42]),
-        //     ],
-        // });
-        //
-        // // DECLARE c CURSOR FOR SELECT ctid,cmin,* FROM combocidtest
-        // m.push(StatementDefinition {
-        //     stmt: SyntaxKind::DeclareCursorStmt,
-        //     tokens: vec![
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Declare),
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
-        //         SyntaxDefinition::AnyTokens,
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Cursor),
-        //         SyntaxDefinition::AnyTokens,
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::For),
-        //         SyntaxDefinition::OneOf(vec![SyntaxKind::Select, SyntaxKind::With]),
-        //         SyntaxDefinition::AnyToken,
-        //     ],
-        // });
-        //
-        // m.push(StatementDefinition {
-        //     stmt: SyntaxKind::TransactionStmt,
-        //     tokens: vec![
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Savepoint),
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
-        //     ],
-        // });
-        //
-        // m.push(StatementDefinition {
-        //     stmt: SyntaxKind::TransactionStmt,
-        //     tokens: vec![
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::BeginP),
-        //         // FIXME: without the ";", this would conflict with BEGIN ATOMIC
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Ascii59),
-        //     ],
-        // });
-        //
-        // m.push(StatementDefinition {
-        //     stmt: SyntaxKind::TransactionStmt,
-        //     tokens: vec![
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::BeginP),
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Transaction),
-        //     ],
-        // });
-        //
-        // m.push(StatementDefinition {
-        //     stmt: SyntaxKind::TransactionStmt,
-        //     tokens: vec![SyntaxDefinition::RequiredToken(SyntaxKind::Commit)],
-        // });
-        //
-        // m.push(StatementDefinition {
-        //     stmt: SyntaxKind::TransactionStmt,
-        //     tokens: vec![
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Rollback),
-        //         SyntaxDefinition::AnyTokens,
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::To),
-        //         SyntaxDefinition::OptionalToken(SyntaxKind::Savepoint),
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
-        //     ],
-        // });
-        //
-        // m.push(StatementDefinition {
-        //     stmt: SyntaxKind::TransactionStmt,
-        //     tokens: vec![
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Rollback),
-        //         // FIXME: without the ";", this would conflict with ROLLBACK TO SAVEPOINT
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Ascii59),
-        //     ],
-        // });
-        //
-        // m.push(StatementDefinition {
-        //     stmt: SyntaxKind::ViewStmt,
-        //     tokens: vec![
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Create),
-        //         SyntaxDefinition::OptionalToken(SyntaxKind::Or),
-        //         SyntaxDefinition::OptionalToken(SyntaxKind::Replace),
-        //         SyntaxDefinition::OptionalToken(SyntaxKind::Temporary),
-        //         SyntaxDefinition::OptionalToken(SyntaxKind::Temp),
-        //         SyntaxDefinition::OptionalToken(SyntaxKind::Recursive),
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::View),
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
-        //         SyntaxDefinition::AnyTokens,
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::As),
-        //         SyntaxDefinition::OneOf(vec![SyntaxKind::With, SyntaxKind::Select]),
-        //     ],
-        // });
-        //
-        // m.push(StatementDefinition {
-        //     stmt: SyntaxKind::LoadStmt,
-        //     tokens: vec![SyntaxDefinition::RequiredToken(SyntaxKind::Load)],
-        // });
-        //
-        // m.push(StatementDefinition {
-        //     stmt: SyntaxKind::CreateDomainStmt,
-        //     tokens: vec![
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Create),
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::DomainP),
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
-        //     ],
-        // });
-        //
-        // m.push(StatementDefinition {
-        //     stmt: SyntaxKind::CreatedbStmt,
-        //     tokens: vec![
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Create),
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Database),
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
-        //     ],
-        // });
-        //
-        // m.push(StatementDefinition {
-        //     stmt: SyntaxKind::DropdbStmt,
-        //     tokens: vec![
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Drop),
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Database),
-        //         SyntaxDefinition::OptionalToken(SyntaxKind::IfP),
-        //         SyntaxDefinition::OptionalToken(SyntaxKind::Exists),
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
-        //     ],
-        // });
-        //
-        // m.push(StatementDefinition {
-        //     stmt: SyntaxKind::VacuumStmt,
-        //     tokens: vec![SyntaxDefinition::RequiredToken(SyntaxKind::Vacuum)],
-        // });
-        //
-        // m.push(StatementDefinition {
-        //     stmt: SyntaxKind::CreateTableAsStmt,
-        //     tokens: vec![
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Create),
-        //         SyntaxDefinition::OptionalToken(SyntaxKind::Global),
-        //         SyntaxDefinition::OptionalToken(SyntaxKind::Local),
-        //         SyntaxDefinition::OptionalToken(SyntaxKind::Temporary),
-        //         SyntaxDefinition::OptionalToken(SyntaxKind::Temp),
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Materialized),
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::View),
-        //         SyntaxDefinition::OptionalToken(SyntaxKind::IfP),
-        //         SyntaxDefinition::OptionalToken(SyntaxKind::Not),
-        //         SyntaxDefinition::OptionalToken(SyntaxKind::Exists),
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
-        //         SyntaxDefinition::AnyTokens,
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::As),
-        //         SyntaxDefinition::OneOf(vec![SyntaxKind::With, SyntaxKind::Select]),
-        //         SyntaxDefinition::AnyToken,
-        //     ],
-        // });
-
-        // m.push(StatementDefinition {
-        //     stmt: SyntaxKind::CreateTableAsStmt,
-        //     tokens: vec![
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Create),
-        //         SyntaxDefinition::OptionalToken(SyntaxKind::Global),
-        //         SyntaxDefinition::OptionalToken(SyntaxKind::Local),
-        //         SyntaxDefinition::OptionalToken(SyntaxKind::Temporary),
-        //         SyntaxDefinition::OptionalToken(SyntaxKind::Temp),
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Table),
-        //         SyntaxDefinition::OptionalToken(SyntaxKind::IfP),
-        //         SyntaxDefinition::OptionalToken(SyntaxKind::Not),
-        //         SyntaxDefinition::OptionalToken(SyntaxKind::Exists),
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
-        //         SyntaxDefinition::AnyTokens,
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::As),
-        //         SyntaxDefinition::OneOf(vec![SyntaxKind::With, SyntaxKind::Select]),
-        //         SyntaxDefinition::AnyToken,
-        //     ],
-        // });
-        //
-        // m.push(StatementDefinition {
-        //     stmt: SyntaxKind::ViewStmt,
-        //     tokens: vec![
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Create),
-        //         SyntaxDefinition::OptionalToken(SyntaxKind::Or),
-        //         SyntaxDefinition::OptionalToken(SyntaxKind::Replace),
-        //         SyntaxDefinition::OptionalToken(SyntaxKind::Temporary),
-        //         SyntaxDefinition::OptionalToken(SyntaxKind::Temp),
-        //         SyntaxDefinition::OptionalToken(SyntaxKind::Recursive),
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::View),
-        //         SyntaxDefinition::OptionalToken(SyntaxKind::IfP),
-        //         SyntaxDefinition::OptionalToken(SyntaxKind::Not),
-        //         SyntaxDefinition::OptionalToken(SyntaxKind::Exists),
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
-        //         SyntaxDefinition::AnyTokens,
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::As),
-        //         SyntaxDefinition::OneOf(vec![SyntaxKind::With, SyntaxKind::Select]),
-        //         SyntaxDefinition::AnyToken,
-        //     ],
-        // });
-        //
-        // m.push(StatementDefinition {
-        //     stmt: SyntaxKind::ExplainStmt,
-        //     tokens: vec![
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Explain),
-        //         SyntaxDefinition::AnyTokens,
-        //         SyntaxDefinition::OneOf(vec![
-        //             SyntaxKind::With,
-        //             SyntaxKind::Select,
-        //             SyntaxKind::Insert,
-        //             SyntaxKind::DeleteP,
-        //             SyntaxKind::Update,
-        //             SyntaxKind::Merge,
-        //             SyntaxKind::Execute,
-        //         ]),
-        //         SyntaxDefinition::AnyToken,
-        //     ],
-        // });
-        //
-        // m.push(StatementDefinition {
-        //     stmt: SyntaxKind::CreateSeqStmt,
-        //     tokens: vec![
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Create),
-        //         SyntaxDefinition::OptionalToken(SyntaxKind::Temporary),
-        //         SyntaxDefinition::OptionalToken(SyntaxKind::Temp),
-        //         SyntaxDefinition::OptionalToken(SyntaxKind::Unlogged),
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Sequence),
-        //         SyntaxDefinition::OptionalToken(SyntaxKind::IfP),
-        //         SyntaxDefinition::OptionalToken(SyntaxKind::Not),
-        //         SyntaxDefinition::OptionalToken(SyntaxKind::Exists),
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
-        //     ],
-        // });
-        //
-        // m.push(StatementDefinition {
-        //     stmt: SyntaxKind::AlterSeqStmt,
-        //     tokens: vec![
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Alter),
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Sequence),
-        //         SyntaxDefinition::OptionalToken(SyntaxKind::IfP),
-        //         SyntaxDefinition::OptionalToken(SyntaxKind::Exists),
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
-        //     ],
-        // });
-        //
-        // // RESET SESSION AUTHORIZATION
-        // m.push(StatementDefinition {
-        //     stmt: SyntaxKind::VariableSetStmt,
-        //     tokens: vec![
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Reset),
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Session),
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Authorization),
-        //     ],
-        // });
-        //
-        // m.push(StatementDefinition {
-        //     stmt: SyntaxKind::VariableSetStmt,
-        //     tokens: vec![
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Set),
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Role),
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
-        //     ],
-        // });
-        //
-        // m.push(StatementDefinition {
-        //     stmt: SyntaxKind::VariableSetStmt,
-        //     tokens: vec![
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Reset),
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Role),
-        //     ],
-        // });
-        //
-        // m.push(StatementDefinition {
-        //     stmt: SyntaxKind::VariableSetStmt,
-        //     tokens: vec![
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Reset),
-        //         SyntaxDefinition::OneOf(vec![SyntaxKind::All, SyntaxKind::Ident]),
-        //     ],
-        // });
-        //
-        // // ref: https://www.postgresql.org/docs/current/sql-set-session-authorization.html
-        // m.push(StatementDefinition {
-        //     stmt: SyntaxKind::VariableSetStmt,
-        //     tokens: vec![
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Set),
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Session),
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Authorization),
-        //         SyntaxDefinition::OneOf(vec![SyntaxKind::Ident, SyntaxKind::Sconst]),
-        //     ],
-        // });
-        //
-        // m.push(StatementDefinition {
-        //     stmt: SyntaxKind::VariableSetStmt,
-        //     tokens: vec![
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Set),
-        //         SyntaxDefinition::OptionalToken(SyntaxKind::Session),
-        //         SyntaxDefinition::OptionalToken(SyntaxKind::Local),
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
-        //         SyntaxDefinition::OneOf(vec![SyntaxKind::To, SyntaxKind::Ascii61]),
-        //         SyntaxDefinition::AnyToken,
-        //     ],
-        // });
-        //
-        // m.push(StatementDefinition {
-        //     stmt: SyntaxKind::VariableSetStmt,
-        //     tokens: vec![
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Set),
-        //         SyntaxDefinition::OptionalToken(SyntaxKind::Session),
-        //         SyntaxDefinition::OptionalToken(SyntaxKind::Local),
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Time),
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Zone),
-        //         SyntaxDefinition::AnyToken,
-        //     ],
-        // });
-        //
-        // m.push(StatementDefinition {
-        //     stmt: SyntaxKind::VariableShowStmt,
-        //     tokens: vec![
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Show),
-        //         SyntaxDefinition::OneOf(vec![SyntaxKind::Ident, SyntaxKind::All]),
-        //     ],
-        // });
-        //
-        // m.push(StatementDefinition {
-        //     stmt: SyntaxKind::DiscardStmt,
-        //     tokens: vec![
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Discard),
-        //         SyntaxDefinition::OneOf(vec![
-        //             SyntaxKind::All,
-        //             SyntaxKind::Plans,
-        //             SyntaxKind::Sequences,
-        //             SyntaxKind::Temp,
-        //             SyntaxKind::Temporary,
-        //         ]),
-        //     ],
-        // });
-        //
-        // m.push(StatementDefinition {
-        //     stmt: SyntaxKind::CreateRoleStmt,
-        //     tokens: vec![
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Create),
-        //         SyntaxDefinition::OneOf(vec![
-        //             SyntaxKind::Role,
-        //             SyntaxKind::GroupP,
-        //             SyntaxKind::User,
-        //         ]),
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
-        //     ],
-        // });
-        //
-        // m.push(StatementDefinition {
-        //     stmt: SyntaxKind::AlterRoleStmt,
-        //     tokens: vec![
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Alter),
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Role),
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
-        //     ],
-        // });
-        //
-        // m.push(StatementDefinition {
-        //     stmt: SyntaxKind::DropRoleStmt,
-        //     tokens: vec![
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Drop),
-        //         SyntaxDefinition::OneOf(vec![
-        //             SyntaxKind::Role,
-        //             SyntaxKind::User,
-        //             SyntaxKind::GroupP,
-        //         ]),
-        //         SyntaxDefinition::OptionalToken(SyntaxKind::IfP),
-        //         SyntaxDefinition::OptionalToken(SyntaxKind::Exists),
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
-        //     ],
-        // });
-        //
-        // m.push(StatementDefinition {
-        //     stmt: SyntaxKind::LockStmt,
-        //     tokens: vec![
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::LockP),
-        //         SyntaxDefinition::OptionalToken(SyntaxKind::Table),
-        //         SyntaxDefinition::OptionalToken(SyntaxKind::Only),
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
-        //     ],
-        // });
-        //
-        // m.push(StatementDefinition {
-        //     stmt: SyntaxKind::ConstraintsSetStmt,
-        //     tokens: vec![
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Set),
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Constraints),
-        //     ],
-        // });
-        //
-        // m.push(StatementDefinition {
-        //     stmt: SyntaxKind::ReindexStmt,
-        //     tokens: vec![
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Reindex),
-        //         SyntaxDefinition::OptionalToken(SyntaxKind::Concurrently),
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
-        //     ],
-        // });
-        //
-        // m.push(StatementDefinition {
-        //     stmt: SyntaxKind::CheckPointStmt,
-        //     tokens: vec![SyntaxDefinition::RequiredToken(SyntaxKind::Checkpoint)],
-        // });
-        //
-        // m.push(StatementDefinition {
-        //     stmt: SyntaxKind::CreateSchemaStmt,
-        //     tokens: vec![
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Create),
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Schema),
-        //     ],
-        // });
-        //
-        // m.push(StatementDefinition {
-        //     stmt: SyntaxKind::AlterDatabaseStmt,
-        //     tokens: vec![
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Alter),
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Database),
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
-        //     ],
-        // });
-        //
-        // m.push(StatementDefinition {
-        //     stmt: SyntaxKind::AlterDatabaseRefreshCollStmt,
-        //     tokens: vec![
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Alter),
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Database),
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Refresh),
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Collation),
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::VersionP),
-        //     ],
-        // });
-        //
-        // m.push(StatementDefinition {
-        //     stmt: SyntaxKind::AlterDatabaseSetStmt,
-        //     tokens: vec![
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Alter),
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Database),
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Set),
-        //     ],
-        // });
-        //
-        // m.push(StatementDefinition {
-        //     stmt: SyntaxKind::AlterDatabaseSetStmt,
-        //     tokens: vec![
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Alter),
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Database),
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Reset),
-        //     ],
-        // });
-        //
-        // m.push(StatementDefinition {
-        //     stmt: SyntaxKind::CreateConversionStmt,
-        //     tokens: vec![
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Create),
-        //         SyntaxDefinition::OptionalToken(SyntaxKind::Default),
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::ConversionP),
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::For),
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Sconst),
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::To),
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Sconst),
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::From),
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
-        //     ],
-        // });
-        //
-        // m.push(StatementDefinition {
-        //     stmt: SyntaxKind::CreateCastStmt,
-        //     tokens: vec![
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Create),
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Cast),
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Ascii40),
-        //         SyntaxDefinition::AnyTokens,
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::As),
-        //         SyntaxDefinition::AnyTokens,
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Ascii41),
-        //     ],
-        // });
-        //
-        // m.push(StatementDefinition {
-        //     stmt: SyntaxKind::CreateOpFamilyStmt,
-        //     tokens: vec![
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Create),
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Operator),
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Family),
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
-        //     ],
-        // });
-        //
-        // m.push(StatementDefinition {
-        //     stmt: SyntaxKind::AlterOpFamilyStmt,
-        //     tokens: vec![
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Alter),
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Operator),
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Family),
-        //         // for schemas, this should be put into all definitions...
-        //         // SyntaxDefinition::OptionalToken(SyntaxKind::Ident),
-        //         // SyntaxDefinition::OptionalToken(SyntaxKind::Ascii46),
-        //         SyntaxDefinition::AnyTokens,
-        //         // SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Using),
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
-        //         // this is important to not conflict with RenameStmt
-        //         SyntaxDefinition::OneOf(vec![SyntaxKind::Drop, SyntaxKind::AddP]),
-        //     ],
-        // });
-        //
-        // m.push(StatementDefinition {
-        //     stmt: SyntaxKind::PrepareStmt,
-        //     tokens: vec![
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Prepare),
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
-        //         SyntaxDefinition::AnyToken,
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::As),
-        //         SyntaxDefinition::OneOf(vec![SyntaxKind::With, SyntaxKind::Select]),
-        //     ],
-        // });
-        //
-        // m.push(StatementDefinition {
-        //     stmt: SyntaxKind::DeallocateStmt,
-        //     tokens: vec![
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Deallocate),
-        //         SyntaxDefinition::OptionalToken(SyntaxKind::Prepare),
-        //         SyntaxDefinition::OneOf(vec![SyntaxKind::Ident, SyntaxKind::All]),
-        //     ],
-        // });
-        //
-        // m.push(StatementDefinition {
-        //     stmt: SyntaxKind::CreateTableSpaceStmt,
-        //     tokens: vec![
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Create),
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Tablespace),
-        //         SyntaxDefinition::AnyTokens,
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Location),
-        //     ],
-        // });
-        //
-        // m.push(StatementDefinition {
-        //     stmt: SyntaxKind::DropTableSpaceStmt,
-        //     tokens: vec![
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Drop),
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Tablespace),
-        //         SyntaxDefinition::OptionalToken(SyntaxKind::IfP),
-        //         SyntaxDefinition::OptionalToken(SyntaxKind::Exists),
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
-        //     ],
-        // });
-        //
-        // m.push(StatementDefinition {
-        //     stmt: SyntaxKind::AlterOperatorStmt,
-        //     tokens: vec![
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Alter),
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Operator),
-        //     ],
-        // });
-        //
-        // m.push(StatementDefinition {
-        //     stmt: SyntaxKind::AlterTypeStmt,
-        //     tokens: vec![
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Alter),
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::TypeP),
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
-        //     ],
-        // });
-        //
-        // m.push(StatementDefinition {
-        //     stmt: SyntaxKind::DropOwnedStmt,
-        //     tokens: vec![
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Drop),
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Owned),
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::By),
-        //     ],
-        // });
-        //
-        // m.push(StatementDefinition {
-        //     stmt: SyntaxKind::ReassignOwnedStmt,
-        //     tokens: vec![
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Reassign),
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Owned),
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::By),
-        //         SyntaxDefinition::AnyTokens,
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::To),
-        //     ],
-        // });
-        //
-        // m.push(StatementDefinition {
-        //     stmt: SyntaxKind::CreateFdwStmt,
-        //     tokens: vec![
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Create),
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Foreign),
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::DataP),
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Wrapper),
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
-        //     ],
-        // });
-        //
-        // m.push(StatementDefinition {
-        //     stmt: SyntaxKind::AlterFdwStmt,
-        //     tokens: vec![
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Alter),
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Foreign),
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::DataP),
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Wrapper),
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
-        //     ],
-        // });
-        //
-        // m.push(StatementDefinition {
-        //     stmt: SyntaxKind::CreateForeignServerStmt,
-        //     tokens: vec![
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Create),
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Server),
-        //         SyntaxDefinition::OptionalToken(SyntaxKind::IfP),
-        //         SyntaxDefinition::OptionalToken(SyntaxKind::Not),
-        //         SyntaxDefinition::OptionalToken(SyntaxKind::Exists),
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
-        //         SyntaxDefinition::AnyTokens,
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Foreign),
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::DataP),
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Wrapper),
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
-        //     ],
-        // });
-        //
-        // m.push(StatementDefinition {
-        //     stmt: SyntaxKind::AlterForeignServerStmt,
-        //     tokens: vec![
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Alter),
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Server),
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
-        //     ],
-        // });
-        //
-        // m.push(StatementDefinition {
-        //     stmt: SyntaxKind::CreateUserMappingStmt,
-        //     tokens: vec![
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Create),
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::User),
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Mapping),
-        //         SyntaxDefinition::OptionalToken(SyntaxKind::IfP),
-        //         SyntaxDefinition::OptionalToken(SyntaxKind::Not),
-        //         SyntaxDefinition::OptionalToken(SyntaxKind::Exists),
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::For),
-        //         SyntaxDefinition::AnyTokens,
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Server),
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
-        //     ],
-        // });
-        //
-        // m.push(StatementDefinition {
-        //     stmt: SyntaxKind::AlterUserMappingStmt,
-        //     tokens: vec![
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Alter),
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::User),
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Mapping),
-        //         SyntaxDefinition::OptionalToken(SyntaxKind::For),
-        //         SyntaxDefinition::AnyTokens,
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Server),
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Options),
-        //     ],
-        // });
-        //
-        // m.push(StatementDefinition {
-        //     stmt: SyntaxKind::DropUserMappingStmt,
-        //     tokens: vec![
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Alter),
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::User),
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Mapping),
-        //         SyntaxDefinition::OptionalToken(SyntaxKind::IfP),
-        //         SyntaxDefinition::OptionalToken(SyntaxKind::Exists),
-        //         SyntaxDefinition::OptionalToken(SyntaxKind::For),
-        //         SyntaxDefinition::AnyTokens,
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Server),
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
-        //     ],
-        // });
-        //
-        // m.push(StatementDefinition {
-        //     stmt: SyntaxKind::SecLabelStmt,
-        //     tokens: vec![
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Security),
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Label),
-        //         SyntaxDefinition::OptionalToken(SyntaxKind::For),
-        //         SyntaxDefinition::OptionalToken(SyntaxKind::Ident),
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::On),
-        //     ],
-        // });
-        //
-        // m.push(StatementDefinition {
-        //     stmt: SyntaxKind::CreateForeignTableStmt,
-        //     tokens: vec![
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Create),
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Foreign),
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Table),
-        //         SyntaxDefinition::OptionalToken(SyntaxKind::IfP),
-        //         SyntaxDefinition::OptionalToken(SyntaxKind::Not),
-        //         SyntaxDefinition::OptionalToken(SyntaxKind::Exists),
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
-        //         SyntaxDefinition::AnyTokens,
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Server),
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
-        //     ],
-        // });
-        //
-        // m.push(StatementDefinition {
-        //     stmt: SyntaxKind::ImportForeignSchemaStmt,
-        //     tokens: vec![
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::ImportP),
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Foreign),
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Schema),
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
-        //         SyntaxDefinition::AnyTokens,
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::From),
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Server),
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Into),
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
-        //     ],
-        // });
-        //
-        // m.push(StatementDefinition {
-        //     stmt: SyntaxKind::CreateExtensionStmt,
-        //     tokens: vec![
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Create),
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Extension),
-        //         SyntaxDefinition::OptionalToken(SyntaxKind::IfP),
-        //         SyntaxDefinition::OptionalToken(SyntaxKind::Not),
-        //         SyntaxDefinition::OptionalToken(SyntaxKind::Exists),
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
-        //     ],
-        // });
-        //
-        // m.push(StatementDefinition {
-        //     stmt: SyntaxKind::AlterExtensionStmt,
-        //     tokens: vec![
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Alter),
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Extension),
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
-        //     ],
-        // });
-        //
-        // m.push(StatementDefinition {
-        //     stmt: SyntaxKind::CreateEventTrigStmt,
-        //     tokens: vec![
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Create),
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Event),
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Trigger),
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::On),
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
-        //         SyntaxDefinition::AnyTokens,
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Execute),
-        //         SyntaxDefinition::OneOf(vec![SyntaxKind::Function, SyntaxKind::Procedure]),
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Ascii40),
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Ascii41),
-        //     ],
-        // });
-        //
-        // m.push(StatementDefinition {
-        //     stmt: SyntaxKind::AlterEventTrigStmt,
-        //     tokens: vec![
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Alter),
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Event),
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Trigger),
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
-        //     ],
-        // });
-        //
-        // m.push(StatementDefinition {
-        //     stmt: SyntaxKind::RefreshMatViewStmt,
-        //     tokens: vec![
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Refresh),
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Materialized),
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::View),
-        //         SyntaxDefinition::OptionalToken(SyntaxKind::Concurrently),
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
-        //     ],
-        // });
-        //
-        // m.push(StatementDefinition {
-        //     stmt: SyntaxKind::AlterSystemStmt,
-        //     tokens: vec![
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Alter),
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::SystemP),
-        //         SyntaxDefinition::OneOf(vec![SyntaxKind::Set, SyntaxKind::Reset]),
-        //     ],
-        // });
-        //
-        // m.push(StatementDefinition {
-        //     stmt: SyntaxKind::CreatePolicyStmt,
-        //     tokens: vec![
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Create),
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Policy),
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::On),
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
-        //     ],
-        // });
-        //
-        // m.push(StatementDefinition {
-        //     stmt: SyntaxKind::AlterPolicyStmt,
-        //     tokens: vec![
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Alter),
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Policy),
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::On),
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
-        //     ],
-        // });
-        //
-        // m.push(StatementDefinition {
-        //     stmt: SyntaxKind::CreateTransformStmt,
-        //     tokens: vec![
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Create),
-        //         SyntaxDefinition::OptionalToken(SyntaxKind::Or),
-        //         SyntaxDefinition::OptionalToken(SyntaxKind::Replace),
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Transform),
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::For),
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Language),
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Ascii40),
-        //         SyntaxDefinition::AnyTokens,
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Ascii41),
-        //     ],
-        // });
-        //
-        // m.push(StatementDefinition {
-        //     stmt: SyntaxKind::CreateAmStmt,
-        //     tokens: vec![
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Create),
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Access),
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Method),
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::TypeP),
-        //     ],
-        // });
-        //
-        // m.push(StatementDefinition {
-        //     stmt: SyntaxKind::CreatePublicationStmt,
-        //     tokens: vec![
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Create),
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Publication),
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
-        //     ],
-        // });
-        //
-        // m.push(StatementDefinition {
-        //     stmt: SyntaxKind::AlterPublicationStmt,
-        //     tokens: vec![
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Alter),
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Publication),
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
-        //     ],
-        // });
-        //
-        // m.push(StatementDefinition {
-        //     stmt: SyntaxKind::CreateSubscriptionStmt,
-        //     tokens: vec![
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Create),
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Subscription),
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Connection),
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Sconst),
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Publication),
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
-        //     ],
-        // });
-        //
-        // m.push(StatementDefinition {
-        //     stmt: SyntaxKind::AlterSubscriptionStmt,
-        //     tokens: vec![
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Alter),
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Subscription),
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
-        //     ],
-        // });
-        //
-        // m.push(StatementDefinition {
-        //     stmt: SyntaxKind::DropSubscriptionStmt,
-        //     tokens: vec![
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Drop),
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Subscription),
-        //         SyntaxDefinition::OptionalToken(SyntaxKind::IfP),
-        //         SyntaxDefinition::OptionalToken(SyntaxKind::Exists),
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
-        //     ],
-        // });
-        //
-        // // GRANT ALL ON SCHEMA alt_nsp1, alt_nsp2 TO public;
-        // m.push(StatementDefinition {
-        //     stmt: SyntaxKind::GrantStmt,
-        //     tokens: vec![
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Grant),
-        //         SyntaxDefinition::AnyTokens,
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::On),
-        //         SyntaxDefinition::AnyTokens,
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::To),
-        //     ],
-        // });
-        //
-        // // REVOKE ALL ON SCHEMA alt_nsp6 FROM regress_alter_generic_user6;
-        // m.push(StatementDefinition {
-        //     stmt: SyntaxKind::GrantStmt,
-        //     tokens: vec![
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Revoke),
-        //         SyntaxDefinition::AnyTokens,
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::On),
-        //     ],
-        // });
-        //
-        // m.push(StatementDefinition {
-        //     stmt: SyntaxKind::AlterOwnerStmt,
-        //     tokens: vec![
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Alter),
-        //         SyntaxDefinition::AnyTokens,
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Owner),
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::To),
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
-        //     ],
-        // });
-        //
-        // // ALTER AGGREGATE alt_func1(int) SET SCHEMA alt_nsp2;
-        // m.push(StatementDefinition {
-        //     stmt: SyntaxKind::AlterObjectSchemaStmt,
-        //     tokens: vec![
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Alter),
-        //         SyntaxDefinition::AnyTokens,
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Set),
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Schema),
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
-        //     ],
-        // });
-        //
-        // m.push(StatementDefinition {
-        //     stmt: SyntaxKind::CreatePlangStmt,
-        //     tokens: vec![
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Create),
-        //         SyntaxDefinition::OptionalToken(SyntaxKind::Or),
-        //         SyntaxDefinition::OptionalToken(SyntaxKind::Replace),
-        //         SyntaxDefinition::OptionalToken(SyntaxKind::Trusted),
-        //         SyntaxDefinition::OptionalToken(SyntaxKind::Procedural),
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Language),
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
-        //     ],
-        // });
-        //
-        // m.push(StatementDefinition {
-        //     stmt: SyntaxKind::CreateStatsStmt,
-        //     tokens: vec![
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Create),
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Statistics),
-        //         SyntaxDefinition::AnyTokens,
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::On),
-        //         SyntaxDefinition::AnyTokens,
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::From),
-        //         SyntaxDefinition::RequiredToken(SyntaxKind::Ident),
-        //     ],
-        // });
+        m.push(StatementDefinition::new(
+            SyntaxKind::MergeStmt,
+            SyntaxBuilder::new()
+                .required_token(SyntaxKind::Merge)
+                .required_token(SyntaxKind::Into)
+                .optional_token(SyntaxKind::Only)
+                .optional_schema_name_group()
+                .required_token(SyntaxKind::Ident),
+        ));
 
-        let mut stmt_starts: HashMap<SyntaxKind, Vec<StatementDefinition>> = HashMap::new();
+        m.push(StatementDefinition::new(
+            SyntaxKind::AlterTableStmt,
+            SyntaxBuilder::new()
+                .required_token(SyntaxKind::Alter)
+                .optional_token(SyntaxKind::Materialized)
+                .one_of(vec![SyntaxKind::Table, SyntaxKind::Index, SyntaxKind::View])
+                .optional_if_exists_group()
+                .optional_token(SyntaxKind::Only)
+                .optional_schema_name_group()
+                .required_token(SyntaxKind::Ident)
+                .any_token(),
+        ));
 
-        for stmt in m {
-            let first_token = stmt
-                .tokens
-                .first()
-                .expect("Expected first token to be present");
+        m.push(StatementDefinition::new(
+            SyntaxKind::RenameStmt,
+            SyntaxBuilder::new()
+                .required_token(SyntaxKind::Alter)
+                .any_tokens(None)
+                .optional_schema_name_group()
+                .required_token(SyntaxKind::Ident)
+                .any_tokens(None)
+                .required_token(SyntaxKind::Rename)
+                .required_token(SyntaxKind::To)
+                .optional_schema_name_group()
+                .required_token(SyntaxKind::Ident),
+        ));
 
-            if let SyntaxDefinition::RequiredToken(token) = first_token {
-                stmt_starts.entry(*token).or_insert(Vec::new()).push(stmt);
-            } else {
-                panic!("Expected first token to be a required token");
-            }
-        }
+        m.push(StatementDefinition::new(
+            SyntaxKind::RenameStmt,
+            SyntaxBuilder::new()
+                .required_token(SyntaxKind::Alter)
+                .required_token(SyntaxKind::Table)
+                .optional_if_exists_group()
+                .optional_token(SyntaxKind::Only)
+                .optional_schema_name_group()
+                .required_token(SyntaxKind::Ident)
+                .required_token(SyntaxKind::Rename),
+        ));
 
-        stmt_starts
-    });
+        m.push(StatementDefinition::new(
+            SyntaxKind::AlterDomainStmt,
+            SyntaxBuilder::new()
+                .required_token(SyntaxKind::Alter)
+                .required_token(SyntaxKind::DomainP)
+                .optional_schema_name_group()
+                .required_token(SyntaxKind::Ident),
+        ));
+
+        m.push(StatementDefinition::new(
+            SyntaxKind::CallStmt,
+            SyntaxBuilder::new()
+                .required_token(SyntaxKind::Call)
+                .optional_schema_name_group()
+                .one_of(vec![SyntaxKind::Ident, SyntaxKind::VersionP])
+                .required_token(SyntaxKind::Ascii40)
+                .any_tokens(None)
+                .required_token(SyntaxKind::Ascii41),
+        ));
+
+        m.push(StatementDefinition::new(
+            SyntaxKind::AlterDefaultPrivilegesStmt,
+            SyntaxBuilder::new()
+                .required_token(SyntaxKind::Alter)
+                .required_token(SyntaxKind::Default)
+                .required_token(SyntaxKind::Privileges),
+        ));
+
+        m.push(StatementDefinition::new(
+            SyntaxKind::ClusterStmt,
+            SyntaxBuilder::new().required_token(SyntaxKind::Cluster),
+        ));
+
+        m.push(StatementDefinition::new(
+            SyntaxKind::CopyStmt,
+            SyntaxBuilder::new().required_token(SyntaxKind::Copy),
+        ));
+
+        m.push(StatementDefinition::new(
+            SyntaxKind::ExecuteStmt,
+            SyntaxBuilder::new()
+                .required_token(SyntaxKind::Execute)
+                .optional_schema_name_group()
+                .required_token(SyntaxKind::Ident),
+        ));
+
+        m.push(StatementDefinition::new(
+            SyntaxKind::CreateStmt,
+            SyntaxBuilder::new()
+                .required_token(SyntaxKind::Create)
+                .any_tokens(Some(vec![
+                    SyntaxKind::Global,
+                    SyntaxKind::Local,
+                    SyntaxKind::Temporary,
+                    SyntaxKind::Temp,
+                    SyntaxKind::Unlogged,
+                ]))
+                .required_token(SyntaxKind::Table)
+                .optional_if_not_exists_group()
+                .optional_schema_name_group()
+                .required_token(SyntaxKind::Ident),
+        ));
+
+        m.push(StatementDefinition::new(
+            SyntaxKind::DefineStmt,
+            SyntaxBuilder::new()
+                .required_token(SyntaxKind::Create)
+                .optional_token(SyntaxKind::Or)
+                .optional_token(SyntaxKind::Replace)
+                .required_token(SyntaxKind::Aggregate),
+        ));
+
+        m.push(StatementDefinition::new(
+            SyntaxKind::CreateOpClassStmt,
+            SyntaxBuilder::new()
+                .required_token(SyntaxKind::Create)
+                .required_token(SyntaxKind::Operator)
+                .required_token(SyntaxKind::Class)
+                .optional_schema_name_group()
+                .required_token(SyntaxKind::Ident)
+                .optional_token(SyntaxKind::Default)
+                .required_token(SyntaxKind::For)
+                .required_token(SyntaxKind::TypeP)
+                .optional_schema_name_group()
+                .required_token(SyntaxKind::Ident)
+                .required_token(SyntaxKind::Using),
+        ));
+
+        m.push(StatementDefinition::new(
+            SyntaxKind::DropStmt,
+            SyntaxBuilder::new()
+                .required_token(SyntaxKind::Drop)
+                .one_of(vec![
+                    SyntaxKind::Server,
+                    SyntaxKind::Collation,
+                    SyntaxKind::ConversionP,
+                    SyntaxKind::Extension,
+                    SyntaxKind::Aggregate,
+                    SyntaxKind::DomainP,
+                    SyntaxKind::Sequence,
+                    SyntaxKind::Table,
+                    SyntaxKind::TypeP,
+                    SyntaxKind::Routine,
+                    SyntaxKind::Procedure,
+                    SyntaxKind::Schema,
+                    SyntaxKind::View,
+                    SyntaxKind::Language,
+                ])
+                .optional_if_exists_group()
+                .optional_schema_name_group()
+                .required_token(SyntaxKind::Ident),
+        ));
+
+        m.push(StatementDefinition::new(
+            SyntaxKind::DropStmt,
+            SyntaxBuilder::new()
+                .required_token(SyntaxKind::Drop)
+                .required_token(SyntaxKind::TextP)
+                .required_token(SyntaxKind::Search)
+                .one_of(vec![
+                    SyntaxKind::Parser,
+                    SyntaxKind::Dictionary,
+                    SyntaxKind::Template,
+                    SyntaxKind::Configuration,
+                ])
+                .optional_if_exists_group()
+                .optional_schema_name_group()
+                .required_token(SyntaxKind::Ident),
+        ));
+
+        m.push(StatementDefinition::new(
+            SyntaxKind::DropStmt,
+            SyntaxBuilder::new()
+                .required_token(SyntaxKind::Drop)
+                .optional_token(SyntaxKind::Procedural)
+                .required_token(SyntaxKind::Language)
+                .optional_if_exists_group()
+                .optional_schema_name_group()
+                .required_token(SyntaxKind::Ident),
+        ));
+
+        m.push(StatementDefinition::new(
+            SyntaxKind::DropStmt,
+            SyntaxBuilder::new()
+                .required_token(SyntaxKind::Drop)
+                .required_token(SyntaxKind::Operator)
+                .required_token(SyntaxKind::Class)
+                .optional_if_exists_group()
+                .optional_schema_name_group()
+                .required_token(SyntaxKind::Ident)
+                .required_token(SyntaxKind::Using)
+                .required_token(SyntaxKind::Ident),
+        ));
 
-// TODO: complete the hashmap above with all statements:
-// RETURN statement (inside SQL function body)
-// ReturnStmt,
-// SetOperationStmt,
-//
-// TODO: parsing ambiguity, check docs for solution
-// GrantStmt(super::GrantStmt),
-// GrantRoleStmt(super::GrantRoleStmt),
-// ClosePortalStmt,
-// CreatePlangStmt,
-// AlterRoleSetStmt,
-// DeclareCursorStmt,
-// AlterObjectDependsStmt,
-// AlterObjectSchemaStmt,
-// AlterOwnerStmt,
-// AlterEnumStmt,
-// AlterTsdictionaryStmt,
-// AlterTsconfigurationStmt,
-// AlterTableSpaceOptionsStmt,
-// AlterTableMoveAllStmt,
-// AlterExtensionContentsStmt,
-// ReplicaIdentityStmt,
-//
+        m.push(StatementDefinition::new(
+            SyntaxKind::DropStmt,
+            SyntaxBuilder::new()
+                .required_token(SyntaxKind::Drop)
+                .required_token(SyntaxKind::Access)
+                .required_token(SyntaxKind::Method)
+                .optional_if_exists_group()
+                .optional_schema_name_group()
+                .required_token(SyntaxKind::Ident),
+        ));
+
+        m.push(StatementDefinition::new(
+            SyntaxKind::DropStmt,
+            SyntaxBuilder::new()
+                .required_token(SyntaxKind::Drop)
+                .one_of(vec![SyntaxKind::Rule, SyntaxKind::Trigger])
+                .required_token(SyntaxKind::Trigger)
+                .optional_if_exists_group()
+                .required_token(SyntaxKind::Ident)
+                .required_token(SyntaxKind::On)
+                .optional_schema_name_group()
+                .required_token(SyntaxKind::Ident),
+        ));
+
+        m.push(StatementDefinition::new(
+            SyntaxKind::DropStmt,
+            SyntaxBuilder::new()
+                .required_token(SyntaxKind::Drop)
+                .required_token(SyntaxKind::TextP)
+                .required_token(SyntaxKind::Search)
+                .one_of(vec![
+                    SyntaxKind::Template,
+                    SyntaxKind::Configuration,
+                    SyntaxKind::Parser,
+                    SyntaxKind::Dictionary,
+                ])
+                .optional_if_exists_group()
+                .optional_schema_name_group()
+                .required_token(SyntaxKind::Ident),
+        ));
+
+        m.push(StatementDefinition::new(
+            SyntaxKind::DropStmt,
+            SyntaxBuilder::new()
+                .required_token(SyntaxKind::Drop)
+                .required_token(SyntaxKind::Foreign)
+                .required_token(SyntaxKind::Table)
+                .optional_if_exists_group()
+                .optional_schema_name_group()
+                .required_token(SyntaxKind::Ident),
+        ));
+
+        m.push(StatementDefinition::new(
+            SyntaxKind::DropStmt,
+            SyntaxBuilder::new()
+                .required_token(SyntaxKind::Drop)
+                .required_token(SyntaxKind::Cast)
+                .optional_if_exists_group()
+                .required_token(SyntaxKind::Ascii40)
+                .any_tokens(None)
+                .required_token(SyntaxKind::As)
+                .any_tokens(None)
+                .required_token(SyntaxKind::Ascii41),
+        ));
+
+        m.push(StatementDefinition::new(
+            SyntaxKind::DropStmt,
+            SyntaxBuilder::new()
+                .required_token(SyntaxKind::Drop)
+                .required_token(SyntaxKind::Foreign)
+                .required_token(SyntaxKind::DataP)
+                .required_token(SyntaxKind::Wrapper)
+                .optional_if_exists_group()
+                .optional_schema_name_group()
+                .required_token(SyntaxKind::Ident),
+        ));
+
+        m.push(StatementDefinition::new(
+            SyntaxKind::DropStmt,
+            SyntaxBuilder::new()
+                .required_token(SyntaxKind::Drop)
+                .required_token(SyntaxKind::Index)
+                .optional_token(SyntaxKind::Concurrently)
+                .optional_if_exists_group()
+                .optional_schema_name_group()
+                .required_token(SyntaxKind::Ident),
+        ));
+
+        m.push(StatementDefinition::new(
+            SyntaxKind::DropStmt,
+            SyntaxBuilder::new()
+                .required_token(SyntaxKind::Drop)
+                .required_token(SyntaxKind::Operator)
+                .optional_if_exists_group()
+                .optional_schema_name_group()
+                .one_of(vec![SyntaxKind::Ident, SyntaxKind::Operator])
+                .required_token(SyntaxKind::Ascii40)
+                .any_tokens(None)
+                .required_token(SyntaxKind::Ascii41),
+        ));
+
+        m.push(StatementDefinition::new(
+            SyntaxKind::DropStmt,
+            SyntaxBuilder::new()
+                .required_token(SyntaxKind::Drop)
+                .required_token(SyntaxKind::Function)
+                .optional_if_exists_group()
+                .optional_schema_name_group()
+                .required_token(SyntaxKind::Ident)
+                .required_token(SyntaxKind::Ascii40)
+                .any_tokens(None)
+                .required_token(SyntaxKind::Ascii41),
+        ));
+
+        m.push(StatementDefinition::new(
+            SyntaxKind::DropStmt,
+            SyntaxBuilder::new()
+                .required_token(SyntaxKind::Drop)
+                .required_token(SyntaxKind::Operator)
+                .required_token(SyntaxKind::Family)
+                .optional_if_exists_group()
+                .optional_schema_name_group()
+                .required_token(SyntaxKind::Ident)
+                .required_token(SyntaxKind::Using)
+                .required_token(SyntaxKind::Ident),
+        ));
+
+        m.push(StatementDefinition::new(
+            SyntaxKind::DefineStmt,
+            SyntaxBuilder::new()
+                .required_token(SyntaxKind::Create)
+                .required_token(SyntaxKind::TextP)
+                .required_token(SyntaxKind::Search)
+                .one_of(vec![
+                    SyntaxKind::Dictionary,
+                    SyntaxKind::Configuration,
+                    SyntaxKind::Template,
+                    SyntaxKind::Parser,
+                ])
+                .optional_schema_name_group()
+                .required_token(SyntaxKind::Ident)
+                .required_token(SyntaxKind::Ascii40)
+                .any_tokens(None)
+                .required_token(SyntaxKind::Ascii41),
+        ));
+
+        m.push(StatementDefinition::new(
+            SyntaxKind::DefineStmt,
+            SyntaxBuilder::new()
+                .required_token(SyntaxKind::Create)
+                .required_token(SyntaxKind::Operator),
+        ));
+
+        m.push(StatementDefinition::new(
+            SyntaxKind::DefineStmt,
+            SyntaxBuilder::new()
+                .required_token(SyntaxKind::Create)
+                .optional_or_replace_group()
+                .required_token(SyntaxKind::Aggregate)
+                .optional_schema_name_group()
+                .required_token(SyntaxKind::Ident)
+                .required_token(SyntaxKind::Ascii40)
+                .any_tokens(None)
+                .required_token(SyntaxKind::Ascii41),
+        ));
+
+        m.push(StatementDefinition::new(
+            SyntaxKind::DefineStmt,
+            SyntaxBuilder::new()
+                .required_token(SyntaxKind::Create)
+                .required_token(SyntaxKind::TypeP)
+                .optional_schema_name_group()
+                .required_token(SyntaxKind::Ident),
+        ));
+
+        m.push(StatementDefinition::new(
+            SyntaxKind::CompositeTypeStmt,
+            SyntaxBuilder::new()
+                .required_token(SyntaxKind::Create)
+                .required_token(SyntaxKind::TypeP)
+                .optional_schema_name_group()
+                .required_token(SyntaxKind::Ident)
+                .required_token(SyntaxKind::As),
+        ));
+
+        m.push(StatementDefinition::new(
+            SyntaxKind::CreateEnumStmt,
+            SyntaxBuilder::new()
+                .required_token(SyntaxKind::Create)
+                .required_token(SyntaxKind::TypeP)
+                .optional_schema_name_group()
+                .required_token(SyntaxKind::Ident)
+                .required_token(SyntaxKind::As)
+                .required_token(SyntaxKind::EnumP),
+        ));
+
+        m.push(StatementDefinition::new(
+            SyntaxKind::CreateRangeStmt,
+            SyntaxBuilder::new()
+                .required_token(SyntaxKind::Create)
+                .required_token(SyntaxKind::TypeP)
+                .optional_schema_name_group()
+                .required_token(SyntaxKind::Ident)
+                .required_token(SyntaxKind::As)
+                .required_token(SyntaxKind::Range),
+        ));
+
+        m.push(StatementDefinition::new(
+            SyntaxKind::TruncateStmt,
+            SyntaxBuilder::new()
+                .required_token(SyntaxKind::Truncate)
+                .optional_token(SyntaxKind::Table)
+                .optional_token(SyntaxKind::Only)
+                .required_token(SyntaxKind::Ident),
+        ));
+
+        m.push(StatementDefinition::new(
+            SyntaxKind::CommentStmt,
+            SyntaxBuilder::new()
+                .required_token(SyntaxKind::Comment)
+                .required_token(SyntaxKind::On)
+                .any_tokens(None)
+                .required_token(SyntaxKind::Is)
+                .one_of(vec![SyntaxKind::Ident, SyntaxKind::Sconst]),
+        ));
+
+        m.push(StatementDefinition::new(
+            SyntaxKind::FetchStmt,
+            SyntaxBuilder::new()
+                .required_token(SyntaxKind::Fetch)
+                .any_tokens(None)
+                .required_token(SyntaxKind::Ident),
+        ));
+
+        m.push(StatementDefinition::new(
+            SyntaxKind::VacuumStmt,
+            SyntaxBuilder::new().required_token(SyntaxKind::Analyze),
+        ));
+
+        m.push(StatementDefinition::new(
+            SyntaxKind::IndexStmt,
+            SyntaxBuilder::new()
+                .required_token(SyntaxKind::Create)
+                .optional_token(SyntaxKind::Unique)
+                .required_token(SyntaxKind::Index)
+                .any_tokens(None)
+                .required_token(SyntaxKind::On)
+                .optional_token(SyntaxKind::Only)
+                .optional_schema_name_group()
+                .required_token(SyntaxKind::Ident),
+        ));
+
+        m.push(StatementDefinition::new(
+            SyntaxKind::CreateFunctionStmt,
+            SyntaxBuilder::new()
+                .required_token(SyntaxKind::Create)
+                .optional_token(SyntaxKind::Or)
+                .optional_token(SyntaxKind::Replace)
+                .one_of(vec![SyntaxKind::Function, SyntaxKind::Procedure])
+                .any_tokens(None)
+                .required_token(SyntaxKind::Ascii40)
+                .any_tokens(None)
+                .required_token(SyntaxKind::Ascii41),
+        ));
+
+        m.push(StatementDefinition::new(
+            SyntaxKind::AlterFunctionStmt,
+            SyntaxBuilder::new()
+                .required_token(SyntaxKind::Alter)
+                .one_of(vec![SyntaxKind::Function, SyntaxKind::Procedure])
+                .optional_schema_name_group()
+                .required_token(SyntaxKind::Ident),
+        ));
+
+        m.push(StatementDefinition::new(
+            SyntaxKind::DoStmt,
+            SyntaxBuilder::new()
+                .required_token(SyntaxKind::Do)
+                .optional_token(SyntaxKind::Language)
+                .optional_token(SyntaxKind::Ident)
+                .required_token(SyntaxKind::Sconst),
+        ));
+
+        m.push(
+            StatementDefinition::new(
+                SyntaxKind::RuleStmt,
+                SyntaxBuilder::new()
+                    .required_token(SyntaxKind::Create)
+                    .optional_token(SyntaxKind::Or)
+                    .optional_token(SyntaxKind::Replace)
+                    .required_token(SyntaxKind::Rule)
+                    .optional_schema_name_group()
+                    .required_token(SyntaxKind::Ident)
+                    .required_token(SyntaxKind::As)
+                    .required_token(SyntaxKind::On)
+                    .one_of(vec![
+                        SyntaxKind::Select,
+                        SyntaxKind::Insert,
+                        SyntaxKind::Update,
+                        SyntaxKind::DeleteP,
+                    ])
+                    .required_token(SyntaxKind::To)
+                    .any_tokens(None)
+                    .required_token(SyntaxKind::Do),
+            )
+            .with_prohibited_following_statements(vec![
+                SyntaxKind::SelectStmt,
+                SyntaxKind::InsertStmt,
+                SyntaxKind::UpdateStmt,
+                SyntaxKind::DeleteStmt,
+            ]),
+        );
+
+        m.push(StatementDefinition::new(
+            SyntaxKind::NotifyStmt,
+            SyntaxBuilder::new()
+                .required_token(SyntaxKind::Notify)
+                .required_token(SyntaxKind::Ident),
+        ));
+
+        m.push(StatementDefinition::new(
+            SyntaxKind::ListenStmt,
+            SyntaxBuilder::new()
+                .required_token(SyntaxKind::Listen)
+                .required_token(SyntaxKind::Ident),
+        ));
+
+        m.push(StatementDefinition::new(
+            SyntaxKind::UnlistenStmt,
+            SyntaxBuilder::new()
+                .required_token(SyntaxKind::Unlisten)
+                .one_of(vec![SyntaxKind::Ident, SyntaxKind::Ascii42]),
+        ));
+
+        // DECLARE c CURSOR FOR SELECT ctid,cmin,* FROM combocidtest
+        m.push(
+            StatementDefinition::new(
+                SyntaxKind::DeclareCursorStmt,
+                SyntaxBuilder::new()
+                    .required_token(SyntaxKind::Declare)
+                    .required_token(SyntaxKind::Ident)
+                    .any_tokens(None)
+                    .required_token(SyntaxKind::Cursor)
+                    .any_tokens(None)
+                    .required_token(SyntaxKind::For),
+            )
+            .with_prohibited_following_statements(vec![SyntaxKind::SelectStmt]),
+        );
+
+        m.push(StatementDefinition::new(
+            SyntaxKind::DeclareCursorStmt,
+            SyntaxBuilder::new()
+                .required_token(SyntaxKind::Declare)
+                .required_token(SyntaxKind::Ident)
+                .any_tokens(None)
+                .required_token(SyntaxKind::Cursor)
+                .any_tokens(None)
+                .required_token(SyntaxKind::For)
+                .one_of(vec![SyntaxKind::Select, SyntaxKind::With])
+                .any_token(),
+        ));
+
+        m.push(StatementDefinition::new(
+            SyntaxKind::TransactionStmt,
+            SyntaxBuilder::new()
+                .required_token(SyntaxKind::Savepoint)
+                .required_token(SyntaxKind::Ident),
+        ));
+
+        m.push(StatementDefinition::new(
+            SyntaxKind::TransactionStmt,
+            SyntaxBuilder::new().required_token(SyntaxKind::BeginP),
+        ));
+
+        m.push(StatementDefinition::new(
+            SyntaxKind::TransactionStmt,
+            SyntaxBuilder::new()
+                .required_token(SyntaxKind::BeginP)
+                .required_token(SyntaxKind::Transaction),
+        ));
+
+        m.push(StatementDefinition::new(
+            SyntaxKind::TransactionStmt,
+            SyntaxBuilder::new().required_token(SyntaxKind::Commit),
+        ));
+
+        m.push(StatementDefinition::new(
+            SyntaxKind::TransactionStmt,
+            SyntaxBuilder::new()
+                .required_token(SyntaxKind::Rollback)
+                .any_tokens(None)
+                .required_token(SyntaxKind::To)
+                .optional_token(SyntaxKind::Savepoint)
+                .required_token(SyntaxKind::Ident),
+        ));
+
+        m.push(StatementDefinition::new(
+            SyntaxKind::TransactionStmt,
+            // FIXME: conflicts with ROLLBACK TO SAVEPOINT?
+            SyntaxBuilder::new().required_token(SyntaxKind::Rollback),
+        ));
+
+        m.push(
+            StatementDefinition::new(
+                SyntaxKind::ViewStmt,
+                SyntaxBuilder::new()
+                    .required_token(SyntaxKind::Create)
+                    .optional_or_replace_group()
+                    .optional_token(SyntaxKind::Temporary)
+                    .optional_token(SyntaxKind::Temp)
+                    .optional_token(SyntaxKind::Recursive)
+                    .required_token(SyntaxKind::View)
+                    .optional_schema_name_group()
+                    .required_token(SyntaxKind::Ident)
+                    .any_tokens(None)
+                    .required_token(SyntaxKind::As),
+            )
+            .with_prohibited_following_statements(vec![SyntaxKind::SelectStmt]),
+        );
+
+        m.push(StatementDefinition::new(
+            SyntaxKind::LoadStmt,
+            SyntaxBuilder::new().required_token(SyntaxKind::Load),
+        ));
+
+        m.push(StatementDefinition::new(
+            SyntaxKind::CreateDomainStmt,
+            SyntaxBuilder::new()
+                .required_token(SyntaxKind::Create)
+                .required_token(SyntaxKind::DomainP)
+                .optional_schema_name_group()
+                .required_token(SyntaxKind::Ident),
+        ));
+
+        m.push(StatementDefinition::new(
+            SyntaxKind::CreatedbStmt,
+            SyntaxBuilder::new()
+                .required_token(SyntaxKind::Create)
+                .required_token(SyntaxKind::Database)
+                .required_token(SyntaxKind::Ident),
+        ));
+
+        m.push(StatementDefinition::new(
+            SyntaxKind::DropdbStmt,
+            SyntaxBuilder::new()
+                .required_token(SyntaxKind::Drop)
+                .required_token(SyntaxKind::Database)
+                .optional_if_exists_group()
+                .required_token(SyntaxKind::Ident),
+        ));
+
+        m.push(StatementDefinition::new(
+            SyntaxKind::VacuumStmt,
+            SyntaxBuilder::new().required_token(SyntaxKind::Vacuum),
+        ));
+
+        m.push(
+            StatementDefinition::new(
+                SyntaxKind::CreateTableAsStmt,
+                SyntaxBuilder::new()
+                    .required_token(SyntaxKind::Create)
+                    .required_token(SyntaxKind::Materialized)
+                    .required_token(SyntaxKind::View)
+                    .optional_if_not_exists_group()
+                    .optional_schema_name_group()
+                    .required_token(SyntaxKind::Ident)
+                    .any_tokens(None)
+                    .required_token(SyntaxKind::As),
+            )
+            .with_prohibited_following_statements(vec![SyntaxKind::SelectStmt]),
+        );
+
+        m.push(
+            StatementDefinition::new(
+                SyntaxKind::CreateTableAsStmt,
+                SyntaxBuilder::new()
+                    .required_token(SyntaxKind::Create)
+                    .any_tokens(Some(vec![
+                        SyntaxKind::Global,
+                        SyntaxKind::Local,
+                        SyntaxKind::Temporary,
+                        SyntaxKind::Temp,
+                    ]))
+                    .required_token(SyntaxKind::Table)
+                    .optional_if_not_exists_group()
+                    .optional_schema_name_group()
+                    .required_token(SyntaxKind::Ident)
+                    .any_tokens(None)
+                    .required_token(SyntaxKind::As)
+                    .any_token(),
+            )
+            .with_prohibited_following_statements(vec![SyntaxKind::SelectStmt]),
+        );
+
+        m.push(
+            StatementDefinition::new(
+                SyntaxKind::ViewStmt,
+                SyntaxBuilder::new()
+                    .required_token(SyntaxKind::Create)
+                    .optional_token(SyntaxKind::Or)
+                    .optional_token(SyntaxKind::Replace)
+                    .optional_token(SyntaxKind::Temporary)
+                    .optional_token(SyntaxKind::Temp)
+                    .optional_token(SyntaxKind::Recursive)
+                    .required_token(SyntaxKind::View)
+                    .optional_if_not_exists_group()
+                    .optional_schema_name_group()
+                    .required_token(SyntaxKind::Ident)
+                    .any_tokens(None)
+                    .required_token(SyntaxKind::As),
+            )
+            .with_prohibited_following_statements(vec![SyntaxKind::SelectStmt]),
+        );
+
+        m.push(
+            StatementDefinition::new(
+                SyntaxKind::ExplainStmt,
+                SyntaxBuilder::new().required_token(SyntaxKind::Explain),
+            )
+            .with_prohibited_following_statements(vec![
+                SyntaxKind::SelectStmt,
+                SyntaxKind::InsertStmt,
+                SyntaxKind::DeleteStmt,
+                SyntaxKind::UpdateStmt,
+                SyntaxKind::MergeStmt,
+                SyntaxKind::ExecuteStmt,
+            ]),
+        );
+
+        m.push(StatementDefinition::new(
+            SyntaxKind::CreateSeqStmt,
+            SyntaxBuilder::new()
+                .required_token(SyntaxKind::Create)
+                .any_tokens(Some(vec![
+                    SyntaxKind::Temporary,
+                    SyntaxKind::Temp,
+                    SyntaxKind::Unlogged,
+                ]))
+                .required_token(SyntaxKind::Sequence)
+                .optional_if_not_exists_group()
+                .optional_schema_name_group()
+                .required_token(SyntaxKind::Ident),
+        ));
+
+        m.push(StatementDefinition::new(
+            SyntaxKind::AlterSeqStmt,
+            SyntaxBuilder::new()
+                .required_token(SyntaxKind::Alter)
+                .required_token(SyntaxKind::Sequence)
+                .optional_if_exists_group()
+                .optional_schema_name_group()
+                .required_token(SyntaxKind::Ident),
+        ));
+
+        m.push(StatementDefinition::new(
+            SyntaxKind::VariableSetStmt,
+            SyntaxBuilder::new()
+                .required_token(SyntaxKind::Reset)
+                .one_of(vec![SyntaxKind::All, SyntaxKind::Ident, SyntaxKind::Role]),
+        ));
+
+        m.push(StatementDefinition::new(
+            SyntaxKind::VariableSetStmt,
+            SyntaxBuilder::new()
+                .required_token(SyntaxKind::Reset)
+                .required_token(SyntaxKind::Session)
+                .required_token(SyntaxKind::Authorization),
+        ));
+
+        m.push(StatementDefinition::new(
+            SyntaxKind::VariableSetStmt,
+            SyntaxBuilder::new()
+                .required_token(SyntaxKind::Set)
+                .required_token(SyntaxKind::Role)
+                .required_token(SyntaxKind::Ident),
+        ));
+
+        // ref: https://www.postgresql.org/docs/current/sql-set-session-authorization.html
+        m.push(StatementDefinition::new(
+            SyntaxKind::VariableSetStmt,
+            SyntaxBuilder::new()
+                .required_token(SyntaxKind::Set)
+                .required_token(SyntaxKind::Session)
+                .required_token(SyntaxKind::Authorization)
+                .one_of(vec![SyntaxKind::Ident, SyntaxKind::Sconst]),
+        ));
+
+        m.push(StatementDefinition::new(
+            SyntaxKind::VariableSetStmt,
+            SyntaxBuilder::new()
+                .required_token(SyntaxKind::Set)
+                .optional_token(SyntaxKind::Session)
+                .optional_token(SyntaxKind::Local)
+                .required_token(SyntaxKind::Ident)
+                .one_of(vec![SyntaxKind::To, SyntaxKind::Ascii61])
+                .any_token(),
+        ));
+
+        m.push(StatementDefinition::new(
+            SyntaxKind::VariableSetStmt,
+            SyntaxBuilder::new()
+                .required_token(SyntaxKind::Set)
+                .optional_token(SyntaxKind::Session)
+                .optional_token(SyntaxKind::Local)
+                .required_token(SyntaxKind::Time)
+                .required_token(SyntaxKind::Zone)
+                .any_token(),
+        ));
+
+        m.push(StatementDefinition::new(
+            SyntaxKind::VariableShowStmt,
+            SyntaxBuilder::new()
+                .required_token(SyntaxKind::Show)
+                .one_of(vec![SyntaxKind::Ident, SyntaxKind::All]),
+        ));
+
+        m.push(StatementDefinition::new(
+            SyntaxKind::DiscardStmt,
+            SyntaxBuilder::new()
+                .required_token(SyntaxKind::Discard)
+                .one_of(vec![
+                    SyntaxKind::All,
+                    SyntaxKind::Plans,
+                    SyntaxKind::Sequences,
+                    SyntaxKind::Temp,
+                    SyntaxKind::Temporary,
+                ]),
+        ));
+
+        m.push(StatementDefinition::new(
+            SyntaxKind::CreateRoleStmt,
+            SyntaxBuilder::new()
+                .required_token(SyntaxKind::Create)
+                .one_of(vec![SyntaxKind::Role, SyntaxKind::GroupP, SyntaxKind::User])
+                .required_token(SyntaxKind::Ident),
+        ));
+
+        m.push(StatementDefinition::new(
+            SyntaxKind::AlterRoleStmt,
+            SyntaxBuilder::new()
+                .required_token(SyntaxKind::Alter)
+                .required_token(SyntaxKind::Role)
+                .required_token(SyntaxKind::Ident),
+        ));
+
+        m.push(StatementDefinition::new(
+            SyntaxKind::DropRoleStmt,
+            SyntaxBuilder::new()
+                .required_token(SyntaxKind::Drop)
+                .one_of(vec![SyntaxKind::Role, SyntaxKind::User, SyntaxKind::GroupP])
+                .optional_token(SyntaxKind::IfP)
+                .optional_token(SyntaxKind::Exists)
+                .required_token(SyntaxKind::Ident),
+        ));
+
+        m.push(StatementDefinition::new(
+            SyntaxKind::LockStmt,
+            SyntaxBuilder::new()
+                .required_token(SyntaxKind::LockP)
+                .optional_token(SyntaxKind::Table)
+                .optional_token(SyntaxKind::Only)
+                .optional_schema_name_group()
+                .required_token(SyntaxKind::Ident),
+        ));
+
+        m.push(StatementDefinition::new(
+            SyntaxKind::ConstraintsSetStmt,
+            SyntaxBuilder::new()
+                .required_token(SyntaxKind::Set)
+                .required_token(SyntaxKind::Constraints),
+        ));
+
+        m.push(StatementDefinition::new(
+            SyntaxKind::ReindexStmt,
+            SyntaxBuilder::new()
+                .required_token(SyntaxKind::Reindex)
+                .optional_token(SyntaxKind::Concurrently)
+                .optional_schema_name_group()
+                .required_token(SyntaxKind::Ident),
+        ));
+
+        m.push(StatementDefinition::new(
+            SyntaxKind::CheckPointStmt,
+            SyntaxBuilder::new().required_token(SyntaxKind::Checkpoint),
+        ));
+
+        m.push(StatementDefinition::new(
+            SyntaxKind::CreateSchemaStmt,
+            SyntaxBuilder::new()
+                .required_token(SyntaxKind::Create)
+                .required_token(SyntaxKind::Schema),
+        ));
+
+        m.push(StatementDefinition::new(
+            SyntaxKind::AlterDatabaseStmt,
+            SyntaxBuilder::new()
+                .required_token(SyntaxKind::Alter)
+                .required_token(SyntaxKind::Database)
+                .required_token(SyntaxKind::Ident),
+        ));
+
+        m.push(StatementDefinition::new(
+            SyntaxKind::AlterDatabaseRefreshCollStmt,
+            SyntaxBuilder::new()
+                .required_token(SyntaxKind::Alter)
+                .required_token(SyntaxKind::Database)
+                .required_token(SyntaxKind::Ident)
+                .required_token(SyntaxKind::Refresh)
+                .required_token(SyntaxKind::Collation)
+                .required_token(SyntaxKind::VersionP),
+        ));
+
+        m.push(StatementDefinition::new(
+            SyntaxKind::AlterDatabaseSetStmt,
+            SyntaxBuilder::new()
+                .required_token(SyntaxKind::Alter)
+                .required_token(SyntaxKind::Database)
+                .required_token(SyntaxKind::Ident)
+                .one_of(vec![SyntaxKind::Set, SyntaxKind::Reset]),
+        ));
+
+        m.push(StatementDefinition::new(
+            SyntaxKind::CreateConversionStmt,
+            SyntaxBuilder::new()
+                .required_token(SyntaxKind::Create)
+                .optional_token(SyntaxKind::Default)
+                .required_token(SyntaxKind::ConversionP)
+                .optional_schema_name_group()
+                .required_token(SyntaxKind::Ident)
+                .required_token(SyntaxKind::For)
+                .required_token(SyntaxKind::Sconst)
+                .required_token(SyntaxKind::To)
+                .required_token(SyntaxKind::Sconst)
+                .required_token(SyntaxKind::From)
+                .required_token(SyntaxKind::Ident),
+        ));
+
+        m.push(StatementDefinition::new(
+            SyntaxKind::CreateCastStmt,
+            SyntaxBuilder::new()
+                .required_token(SyntaxKind::Create)
+                .required_token(SyntaxKind::Cast)
+                .required_token(SyntaxKind::Ascii40)
+                .any_tokens(None)
+                .required_token(SyntaxKind::As)
+                .any_tokens(None)
+                .required_token(SyntaxKind::Ascii41),
+        ));
+
+        m.push(StatementDefinition::new(
+            SyntaxKind::CreateOpFamilyStmt,
+            SyntaxBuilder::new()
+                .required_token(SyntaxKind::Create)
+                .required_token(SyntaxKind::Operator)
+                .required_token(SyntaxKind::Family)
+                .optional_schema_name_group()
+                .required_token(SyntaxKind::Ident),
+        ));
+
+        m.push(StatementDefinition::new(
+            SyntaxKind::AlterOpFamilyStmt,
+            SyntaxBuilder::new()
+                .required_token(SyntaxKind::Alter)
+                .required_token(SyntaxKind::Operator)
+                .required_token(SyntaxKind::Family)
+                .optional_schema_name_group()
+                .required_token(SyntaxKind::Ident)
+                .required_token(SyntaxKind::Using)
+                .required_token(SyntaxKind::Ident)
+                .one_of(vec![
+                    SyntaxKind::Drop,
+                    SyntaxKind::AddP,
+                    SyntaxKind::Rename,
+                    SyntaxKind::Owner,
+                    SyntaxKind::Set,
+                ]),
+        ));
+
+        m.push(
+            StatementDefinition::new(
+                SyntaxKind::PrepareStmt,
+                SyntaxBuilder::new()
+                    .required_token(SyntaxKind::Prepare)
+                    .required_token(SyntaxKind::Ident)
+                    .any_token()
+                    .required_token(SyntaxKind::As),
+            )
+            .with_prohibited_following_statements(vec![SyntaxKind::SelectStmt]),
+        );
+
+        m.push(StatementDefinition::new(
+            SyntaxKind::DeallocateStmt,
+            SyntaxBuilder::new()
+                .required_token(SyntaxKind::Deallocate)
+                .optional_token(SyntaxKind::Prepare)
+                .one_of(vec![SyntaxKind::Ident, SyntaxKind::All]),
+        ));
+
+        m.push(StatementDefinition::new(
+            SyntaxKind::CreateTableSpaceStmt,
+            SyntaxBuilder::new()
+                .required_token(SyntaxKind::Create)
+                .required_token(SyntaxKind::Tablespace)
+                .any_tokens(None)
+                .required_token(SyntaxKind::Location),
+        ));
+
+        m.push(StatementDefinition::new(
+            SyntaxKind::DropTableSpaceStmt,
+            SyntaxBuilder::new()
+                .required_token(SyntaxKind::Drop)
+                .required_token(SyntaxKind::Tablespace)
+                .optional_if_exists_group()
+                .optional_token(SyntaxKind::IfP)
+                .optional_token(SyntaxKind::Exists)
+                .required_token(SyntaxKind::Ident),
+        ));
+
+        m.push(StatementDefinition::new(
+            SyntaxKind::AlterOperatorStmt,
+            SyntaxBuilder::new()
+                .required_token(SyntaxKind::Alter)
+                .required_token(SyntaxKind::Operator),
+        ));
+
+        m.push(StatementDefinition::new(
+            SyntaxKind::AlterTypeStmt,
+            SyntaxBuilder::new()
+                .required_token(SyntaxKind::Alter)
+                .required_token(SyntaxKind::TypeP)
+                .optional_schema_name_group()
+                .required_token(SyntaxKind::Ident),
+        ));
+
+        m.push(StatementDefinition::new(
+            SyntaxKind::DropOwnedStmt,
+            SyntaxBuilder::new()
+                .required_token(SyntaxKind::Drop)
+                .required_token(SyntaxKind::Owned)
+                .required_token(SyntaxKind::By),
+        ));
+
+        m.push(StatementDefinition::new(
+            SyntaxKind::ReassignOwnedStmt,
+            SyntaxBuilder::new()
+                .required_token(SyntaxKind::Reassign)
+                .required_token(SyntaxKind::Owned)
+                .required_token(SyntaxKind::By)
+                .any_tokens(None)
+                .required_token(SyntaxKind::To),
+        ));
+
+        m.push(StatementDefinition::new(
+            SyntaxKind::CreateFdwStmt,
+            SyntaxBuilder::new()
+                .required_token(SyntaxKind::Create)
+                .required_token(SyntaxKind::Foreign)
+                .required_token(SyntaxKind::DataP)
+                .required_token(SyntaxKind::Wrapper)
+                .required_token(SyntaxKind::Ident),
+        ));
+
+        m.push(StatementDefinition::new(
+            SyntaxKind::AlterFdwStmt,
+            SyntaxBuilder::new()
+                .required_token(SyntaxKind::Alter)
+                .required_token(SyntaxKind::Foreign)
+                .required_token(SyntaxKind::DataP)
+                .required_token(SyntaxKind::Wrapper)
+                .required_token(SyntaxKind::Ident),
+        ));
+
+        m.push(StatementDefinition::new(
+            SyntaxKind::CreateForeignServerStmt,
+            SyntaxBuilder::new()
+                .required_token(SyntaxKind::Create)
+                .required_token(SyntaxKind::Server)
+                .optional_if_not_exists_group()
+                .optional_schema_name_group()
+                .required_token(SyntaxKind::Ident)
+                .any_tokens(None)
+                .required_token(SyntaxKind::Foreign)
+                .required_token(SyntaxKind::DataP)
+                .required_token(SyntaxKind::Wrapper)
+                .required_token(SyntaxKind::Ident),
+        ));
+
+        m.push(StatementDefinition::new(
+            SyntaxKind::AlterForeignServerStmt,
+            SyntaxBuilder::new()
+                .required_token(SyntaxKind::Alter)
+                .required_token(SyntaxKind::Server)
+                .optional_schema_name_group()
+                .required_token(SyntaxKind::Ident),
+        ));
+
+        m.push(StatementDefinition::new(
+            SyntaxKind::CreateUserMappingStmt,
+            SyntaxBuilder::new()
+                .required_token(SyntaxKind::Create)
+                .required_token(SyntaxKind::User)
+                .required_token(SyntaxKind::Mapping)
+                .optional_if_not_exists_group()
+                .required_token(SyntaxKind::For)
+                .any_tokens(None)
+                .required_token(SyntaxKind::Server)
+                .required_token(SyntaxKind::Ident),
+        ));
+
+        m.push(StatementDefinition::new(
+            SyntaxKind::AlterUserMappingStmt,
+            SyntaxBuilder::new()
+                .required_token(SyntaxKind::Alter)
+                .required_token(SyntaxKind::User)
+                .required_token(SyntaxKind::Mapping)
+                .optional_token(SyntaxKind::For)
+                .any_tokens(None)
+                .required_token(SyntaxKind::Server)
+                .required_token(SyntaxKind::Ident)
+                .required_token(SyntaxKind::Options),
+        ));
+
+        m.push(StatementDefinition::new(
+            SyntaxKind::DropUserMappingStmt,
+            SyntaxBuilder::new()
+                .required_token(SyntaxKind::Drop)
+                .required_token(SyntaxKind::User)
+                .required_token(SyntaxKind::Mapping)
+                .optional_if_exists_group()
+                .optional_token(SyntaxKind::For)
+                .any_tokens(None)
+                .required_token(SyntaxKind::Server)
+                .required_token(SyntaxKind::Ident),
+        ));
+
+        m.push(StatementDefinition::new(
+            SyntaxKind::SecLabelStmt,
+            SyntaxBuilder::new()
+                .required_token(SyntaxKind::Security)
+                .required_token(SyntaxKind::Label)
+                .optional_token(SyntaxKind::For)
+                .optional_schema_name_group()
+                .required_token(SyntaxKind::Ident)
+                .required_token(SyntaxKind::On),
+        ));
+
+        m.push(StatementDefinition::new(
+            SyntaxKind::CreateForeignTableStmt,
+            SyntaxBuilder::new()
+                .required_token(SyntaxKind::Create)
+                .required_token(SyntaxKind::Foreign)
+                .required_token(SyntaxKind::Table)
+                .optional_if_not_exists_group()
+                .optional_schema_name_group()
+                .required_token(SyntaxKind::Ident)
+                .any_tokens(None)
+                .required_token(SyntaxKind::Server)
+                .required_token(SyntaxKind::Ident),
+        ));
+
+        m.push(StatementDefinition::new(
+            SyntaxKind::ImportForeignSchemaStmt,
+            SyntaxBuilder::new()
+                .required_token(SyntaxKind::ImportP)
+                .required_token(SyntaxKind::Foreign)
+                .required_token(SyntaxKind::Schema)
+                .optional_schema_name_group()
+                .required_token(SyntaxKind::Ident)
+                .any_tokens(None)
+                .required_token(SyntaxKind::From)
+                .required_token(SyntaxKind::Server)
+                .required_token(SyntaxKind::Ident)
+                .required_token(SyntaxKind::Into)
+                .optional_schema_name_group()
+                .required_token(SyntaxKind::Ident),
+        ));
+
+        m.push(StatementDefinition::new(
+            SyntaxKind::CreateExtensionStmt,
+            SyntaxBuilder::new()
+                .required_token(SyntaxKind::Create)
+                .required_token(SyntaxKind::Extension)
+                .optional_if_not_exists_group()
+                .optional_schema_name_group()
+                .required_token(SyntaxKind::Ident),
+        ));
+
+        m.push(StatementDefinition::new(
+            SyntaxKind::AlterExtensionStmt,
+            SyntaxBuilder::new()
+                .required_token(SyntaxKind::Alter)
+                .required_token(SyntaxKind::Extension)
+                .optional_schema_name_group()
+                .required_token(SyntaxKind::Ident),
+        ));
+
+        m.push(StatementDefinition::new(
+            SyntaxKind::CreateEventTrigStmt,
+            SyntaxBuilder::new()
+                .required_token(SyntaxKind::Create)
+                .required_token(SyntaxKind::Event)
+                .required_token(SyntaxKind::Trigger)
+                .optional_schema_name_group()
+                .required_token(SyntaxKind::Ident)
+                .required_token(SyntaxKind::On)
+                .required_token(SyntaxKind::Ident)
+                .any_tokens(None)
+                .required_token(SyntaxKind::Execute)
+                .one_of(vec![SyntaxKind::Function, SyntaxKind::Procedure])
+                .optional_schema_name_group()
+                .required_token(SyntaxKind::Ident)
+                .required_token(SyntaxKind::Ascii40)
+                .required_token(SyntaxKind::Ascii41),
+        ));
+
+        m.push(StatementDefinition::new(
+            SyntaxKind::AlterEventTrigStmt,
+            SyntaxBuilder::new()
+                .required_token(SyntaxKind::Alter)
+                .required_token(SyntaxKind::Event)
+                .required_token(SyntaxKind::Trigger)
+                .optional_schema_name_group()
+                .required_token(SyntaxKind::Ident),
+        ));
+
+        m.push(StatementDefinition::new(
+            SyntaxKind::RefreshMatViewStmt,
+            SyntaxBuilder::new()
+                .required_token(SyntaxKind::Refresh)
+                .required_token(SyntaxKind::Materialized)
+                .required_token(SyntaxKind::View)
+                .optional_token(SyntaxKind::Concurrently)
+                .optional_schema_name_group()
+                .required_token(SyntaxKind::Ident),
+        ));
+
+        m.push(StatementDefinition::new(
+            SyntaxKind::AlterSystemStmt,
+            SyntaxBuilder::new()
+                .required_token(SyntaxKind::Alter)
+                .required_token(SyntaxKind::SystemP)
+                .one_of(vec![SyntaxKind::Set, SyntaxKind::Reset]),
+        ));
+
+        m.push(StatementDefinition::new(
+            SyntaxKind::CreatePolicyStmt,
+            SyntaxBuilder::new()
+                .required_token(SyntaxKind::Create)
+                .required_token(SyntaxKind::Policy)
+                .optional_schema_name_group()
+                .required_token(SyntaxKind::Ident)
+                .required_token(SyntaxKind::On)
+                .optional_schema_name_group()
+                .required_token(SyntaxKind::Ident),
+        ));
+
+        m.push(StatementDefinition::new(
+            SyntaxKind::AlterPolicyStmt,
+            SyntaxBuilder::new()
+                .required_token(SyntaxKind::Alter)
+                .required_token(SyntaxKind::Policy)
+                .optional_schema_name_group()
+                .required_token(SyntaxKind::Ident)
+                .required_token(SyntaxKind::On)
+                .optional_schema_name_group()
+                .required_token(SyntaxKind::Ident),
+        ));
+
+        m.push(StatementDefinition::new(
+            SyntaxKind::CreateTransformStmt,
+            SyntaxBuilder::new()
+                .required_token(SyntaxKind::Create)
+                .optional_or_replace_group()
+                .required_token(SyntaxKind::Transform)
+                .required_token(SyntaxKind::For)
+                .optional_schema_name_group()
+                .required_token(SyntaxKind::Ident)
+                .required_token(SyntaxKind::Language)
+                .optional_schema_name_group()
+                .required_token(SyntaxKind::Ident)
+                .required_token(SyntaxKind::Ascii40)
+                .any_tokens(None)
+                .required_token(SyntaxKind::Ascii41),
+        ));
+
+        m.push(StatementDefinition::new(
+            SyntaxKind::CreateAmStmt,
+            SyntaxBuilder::new()
+                .required_token(SyntaxKind::Create)
+                .required_token(SyntaxKind::Access)
+                .required_token(SyntaxKind::Method)
+                .optional_schema_name_group()
+                .required_token(SyntaxKind::Ident)
+                .required_token(SyntaxKind::TypeP),
+        ));
+
+        m.push(StatementDefinition::new(
+            SyntaxKind::CreatePublicationStmt,
+            SyntaxBuilder::new()
+                .required_token(SyntaxKind::Create)
+                .required_token(SyntaxKind::Publication)
+                .optional_schema_name_group()
+                .required_token(SyntaxKind::Ident),
+        ));
+
+        m.push(StatementDefinition::new(
+            SyntaxKind::AlterPublicationStmt,
+            SyntaxBuilder::new()
+                .required_token(SyntaxKind::Alter)
+                .required_token(SyntaxKind::Publication)
+                .optional_schema_name_group()
+                .required_token(SyntaxKind::Ident),
+        ));
+
+        m.push(StatementDefinition::new(
+            SyntaxKind::CreateSubscriptionStmt,
+            SyntaxBuilder::new()
+                .required_token(SyntaxKind::Create)
+                .required_token(SyntaxKind::Subscription)
+                .optional_schema_name_group()
+                .required_token(SyntaxKind::Ident)
+                .required_token(SyntaxKind::Connection)
+                .required_token(SyntaxKind::Sconst)
+                .required_token(SyntaxKind::Publication)
+                .optional_schema_name_group()
+                .required_token(SyntaxKind::Ident),
+        ));
+
+        m.push(StatementDefinition::new(
+            SyntaxKind::AlterSubscriptionStmt,
+            SyntaxBuilder::new()
+                .required_token(SyntaxKind::Alter)
+                .required_token(SyntaxKind::Subscription)
+                .optional_schema_name_group()
+                .required_token(SyntaxKind::Ident),
+        ));
+
+        m.push(StatementDefinition::new(
+            SyntaxKind::DropSubscriptionStmt,
+            SyntaxBuilder::new()
+                .required_token(SyntaxKind::Drop)
+                .required_token(SyntaxKind::Subscription)
+                .optional_if_exists_group()
+                .optional_schema_name_group()
+                .required_token(SyntaxKind::Ident),
+        ));
+
+        m.push(StatementDefinition::new(
+            SyntaxKind::GrantStmt,
+            SyntaxBuilder::new()
+                .required_token(SyntaxKind::Grant)
+                .any_tokens(None)
+                .required_token(SyntaxKind::On)
+                .any_tokens(None)
+                .required_token(SyntaxKind::To),
+        ));
+
+        m.push(StatementDefinition::new(
+            SyntaxKind::GrantStmt,
+            SyntaxBuilder::new()
+                .required_token(SyntaxKind::Revoke)
+                .any_tokens(None)
+                .required_token(SyntaxKind::On),
+        ));
+
+        m.push(StatementDefinition::new(
+            SyntaxKind::AlterOwnerStmt,
+            SyntaxBuilder::new()
+                .required_token(SyntaxKind::Alter)
+                .any_tokens(None)
+                .required_token(SyntaxKind::Owner)
+                .required_token(SyntaxKind::To)
+                .required_token(SyntaxKind::Ident),
+        ));
+
+        m.push(StatementDefinition::new(
+            SyntaxKind::AlterObjectSchemaStmt,
+            SyntaxBuilder::new()
+                .required_token(SyntaxKind::Alter)
+                .any_tokens(None)
+                .required_token(SyntaxKind::Set)
+                .required_token(SyntaxKind::Schema)
+                .optional_schema_name_group()
+                .required_token(SyntaxKind::Ident),
+        ));
+
+        m.push(StatementDefinition::new(
+            SyntaxKind::CreatePlangStmt,
+            SyntaxBuilder::new()
+                .required_token(SyntaxKind::Create)
+                .optional_or_replace_group()
+                .optional_token(SyntaxKind::Trusted)
+                .optional_token(SyntaxKind::Procedural)
+                .required_token(SyntaxKind::Language)
+                .optional_schema_name_group()
+                .required_token(SyntaxKind::Ident),
+        ));
+
+        m.push(StatementDefinition::new(
+            SyntaxKind::CreateStatsStmt,
+            SyntaxBuilder::new()
+                .required_token(SyntaxKind::Create)
+                .required_token(SyntaxKind::Statistics)
+                .any_tokens(None)
+                .required_token(SyntaxKind::On)
+                .any_tokens(None)
+                .required_token(SyntaxKind::From)
+                .optional_schema_name_group()
+                .required_token(SyntaxKind::Ident),
+        ));
+
+        let mut stmt_starts: HashMap<SyntaxKind, Vec<StatementDefinition>> = HashMap::new();
+
+        for stmt in m {
+            let first_token = stmt
+                .tokens
+                .first()
+                .expect("Expected first token to be present");
+
+            if let SyntaxDefinition::RequiredToken(token) = first_token {
+                stmt_starts.entry(*token).or_insert(Vec::new()).push(stmt);
+            } else {
+                panic!("Expected first token to be a required token");
+            }
+        }
+
+        stmt_starts
+    });
diff --git a/crates/pg_statement_splitter/src/statement_splitter.rs b/crates/pg_statement_splitter/src/statement_splitter.rs
index 36b01599..4bb03c9f 100644
--- a/crates/pg_statement_splitter/src/statement_splitter.rs
+++ b/crates/pg_statement_splitter/src/statement_splitter.rs
@@ -1,4 +1,4 @@
-use pg_lexer::{SyntaxKind, WHITESPACE_TOKENS};
+use pg_lexer::SyntaxKind;
 use text_size::{TextRange, TextSize};
 
 use crate::{

From 399c0d24a940c3befd1f71bc4d17b44d73eb13b0 Mon Sep 17 00:00:00 2001
From: psteinroe <philipp@steinroetter.com>
Date: Thu, 22 Aug 2024 15:55:46 +0200
Subject: [PATCH 11/19] fix: optional group handling

---
 .../src/statement_splitter.rs                  | 18 ++++++++++++++++++
 crates/pg_statement_splitter/src/tracker.rs    |  7 +++++++
 2 files changed, 25 insertions(+)

diff --git a/crates/pg_statement_splitter/src/statement_splitter.rs b/crates/pg_statement_splitter/src/statement_splitter.rs
index 4bb03c9f..2818cb16 100644
--- a/crates/pg_statement_splitter/src/statement_splitter.rs
+++ b/crates/pg_statement_splitter/src/statement_splitter.rs
@@ -152,6 +152,7 @@ impl<'a> StatementSplitter<'a> {
     }
 
     fn close_stmt_with_semicolon(&mut self) {
+        println!("closing stmt with semicolon");
         let at_token = self.parser.nth(0, false);
         assert_eq!(at_token.kind, SyntaxKind::Ascii59);
 
@@ -160,6 +161,7 @@ impl<'a> StatementSplitter<'a> {
         // "create rule qqq as on insert to copydml_test do instead (delete from copydml_test; delete from copydml_test);"
         // so we need to check for sub statement depth here
         if self.sub_stmt_depth != 0 || self.is_within_atomic_block {
+            println!("sub stmt depth != 0 or within atomic block");
             return;
         }
 
@@ -171,6 +173,10 @@ impl<'a> StatementSplitter<'a> {
             .min_by_key(|stmt| stmt.started_at)
             .map(|stmt| stmt.started_at)
         {
+            println!(
+                "earliest complete stmt started at: {:?}",
+                earliest_complete_stmt_started_at
+            );
             let earliest_complete_stmt = self
                 .tracked_statements
                 .iter()
@@ -359,10 +365,21 @@ impl<'a> StatementSplitter<'a> {
 
         // we reached eof; add any remaining statements
 
+        println!(
+            "tracked stmts after eof {:?}",
+            self.tracked_statements
+                .iter()
+                .map(|s| s.def.stmt)
+                .collect::<Vec<_>>()
+        );
         // get the earliest statement that is complete
         if let Some(earliest_complete_stmt_started_at) =
             self.find_earliest_complete_statement_start_pos()
         {
+            println!(
+                "earliest complete stmt started at: {:?}",
+                earliest_complete_stmt_started_at
+            );
             let earliest_complete_stmt =
                 self.find_highest_positioned_complete_statement(earliest_complete_stmt_started_at);
 
@@ -385,6 +402,7 @@ impl<'a> StatementSplitter<'a> {
         }
 
         if let Some(earliest_stmt_started_at) = self.find_earliest_statement_start_pos() {
+            println!("earliest stmt started at: {:?}", earliest_stmt_started_at);
             let start_pos = self.token_range(earliest_stmt_started_at).start();
 
             // end position is last non-whitespace token before or at the current position
diff --git a/crates/pg_statement_splitter/src/tracker.rs b/crates/pg_statement_splitter/src/tracker.rs
index 079f5a4a..ae01e207 100644
--- a/crates/pg_statement_splitter/src/tracker.rs
+++ b/crates/pg_statement_splitter/src/tracker.rs
@@ -29,6 +29,7 @@ impl Position {
 
     fn advance(&mut self) {
         self.idx += 1;
+        self.group_idx = None;
     }
 
     fn advance_group(&mut self) {
@@ -181,6 +182,12 @@ impl<'a> Tracker<'a> {
                         }
 
                         new_positions.push(pos);
+                    } else if pos.group_idx.unwrap() == 0 {
+                        // if the first token in the group does not match, we move to the next
+                        // possible tokens
+                        new_positions.extend(Tracker::next_possible_positions_from_with(
+                            self.def, &pos, kind,
+                        ));
                     }
                 }
                 None => {

From 9c2ba7c047978302aa61ee73111bba869d775b32 Mon Sep 17 00:00:00 2001
From: psteinroe <philipp@steinroetter.com>
Date: Thu, 22 Aug 2024 18:20:27 +0200
Subject: [PATCH 12/19] fix: minor fixes

---
 crates/pg_statement_splitter/src/data.rs      |  87 ++++++-------
 crates/pg_statement_splitter/src/parser.rs    |  14 ++-
 .../src/statement_splitter.rs                 | 115 +++++++++++-------
 crates/pg_statement_splitter/src/tracker.rs   |  67 +++++-----
 4 files changed, 162 insertions(+), 121 deletions(-)

diff --git a/crates/pg_statement_splitter/src/data.rs b/crates/pg_statement_splitter/src/data.rs
index fc2c558a..2d73fe20 100644
--- a/crates/pg_statement_splitter/src/data.rs
+++ b/crates/pg_statement_splitter/src/data.rs
@@ -422,7 +422,6 @@ pub static STATEMENT_DEFINITIONS: LazyLock<HashMap<SyntaxKind, Vec<StatementDefi
             SyntaxBuilder::new()
                 .required_token(SyntaxKind::Drop)
                 .one_of(vec![SyntaxKind::Rule, SyntaxKind::Trigger])
-                .required_token(SyntaxKind::Trigger)
                 .optional_if_exists_group()
                 .required_token(SyntaxKind::Ident)
                 .required_token(SyntaxKind::On)
@@ -501,7 +500,7 @@ pub static STATEMENT_DEFINITIONS: LazyLock<HashMap<SyntaxKind, Vec<StatementDefi
                 .required_token(SyntaxKind::Operator)
                 .optional_if_exists_group()
                 .optional_schema_name_group()
-                .one_of(vec![SyntaxKind::Ident, SyntaxKind::Operator])
+                .one_of(vec![SyntaxKind::Ident, SyntaxKind::Op])
                 .required_token(SyntaxKind::Ascii40)
                 .any_tokens(None)
                 .required_token(SyntaxKind::Ascii41),
@@ -658,18 +657,21 @@ pub static STATEMENT_DEFINITIONS: LazyLock<HashMap<SyntaxKind, Vec<StatementDefi
                 .required_token(SyntaxKind::Ident),
         ));
 
-        m.push(StatementDefinition::new(
-            SyntaxKind::CreateFunctionStmt,
-            SyntaxBuilder::new()
-                .required_token(SyntaxKind::Create)
-                .optional_token(SyntaxKind::Or)
-                .optional_token(SyntaxKind::Replace)
-                .one_of(vec![SyntaxKind::Function, SyntaxKind::Procedure])
-                .any_tokens(None)
-                .required_token(SyntaxKind::Ascii40)
-                .any_tokens(None)
-                .required_token(SyntaxKind::Ascii41),
-        ));
+        m.push(
+            StatementDefinition::new(
+                SyntaxKind::CreateFunctionStmt,
+                SyntaxBuilder::new()
+                    .required_token(SyntaxKind::Create)
+                    .optional_token(SyntaxKind::Or)
+                    .optional_token(SyntaxKind::Replace)
+                    .one_of(vec![SyntaxKind::Function, SyntaxKind::Procedure])
+                    .any_tokens(None)
+                    .required_token(SyntaxKind::Ascii40)
+                    .any_tokens(None)
+                    .required_token(SyntaxKind::Ascii41),
+            )
+            .with_prohibited_following_statements(vec![SyntaxKind::TransactionStmt]),
+        );
 
         m.push(StatementDefinition::new(
             SyntaxKind::AlterFunctionStmt,
@@ -768,12 +770,15 @@ pub static STATEMENT_DEFINITIONS: LazyLock<HashMap<SyntaxKind, Vec<StatementDefi
                 .any_token(),
         ));
 
-        m.push(StatementDefinition::new(
-            SyntaxKind::TransactionStmt,
-            SyntaxBuilder::new()
-                .required_token(SyntaxKind::Savepoint)
-                .required_token(SyntaxKind::Ident),
-        ));
+        m.push(
+            StatementDefinition::new(
+                SyntaxKind::TransactionStmt,
+                SyntaxBuilder::new()
+                    .required_token(SyntaxKind::Savepoint)
+                    .required_token(SyntaxKind::Ident),
+            )
+            .with_prohibited_following_statements(vec![SyntaxKind::TransactionStmt]),
+        );
 
         m.push(StatementDefinition::new(
             SyntaxKind::TransactionStmt,
@@ -792,21 +797,26 @@ pub static STATEMENT_DEFINITIONS: LazyLock<HashMap<SyntaxKind, Vec<StatementDefi
             SyntaxBuilder::new().required_token(SyntaxKind::Commit),
         ));
 
-        m.push(StatementDefinition::new(
-            SyntaxKind::TransactionStmt,
-            SyntaxBuilder::new()
-                .required_token(SyntaxKind::Rollback)
-                .any_tokens(None)
-                .required_token(SyntaxKind::To)
-                .optional_token(SyntaxKind::Savepoint)
-                .required_token(SyntaxKind::Ident),
-        ));
+        m.push(
+            StatementDefinition::new(
+                SyntaxKind::TransactionStmt,
+                SyntaxBuilder::new()
+                    .required_token(SyntaxKind::Rollback)
+                    .any_tokens(None)
+                    .required_token(SyntaxKind::To)
+                    .optional_token(SyntaxKind::Savepoint)
+                    .required_token(SyntaxKind::Ident),
+            )
+            .with_prohibited_following_statements(vec![SyntaxKind::TransactionStmt]),
+        );
 
-        m.push(StatementDefinition::new(
-            SyntaxKind::TransactionStmt,
-            // FIXME: conflicts with ROLLBACK TO SAVEPOINT?
-            SyntaxBuilder::new().required_token(SyntaxKind::Rollback),
-        ));
+        m.push(
+            StatementDefinition::new(
+                SyntaxKind::TransactionStmt,
+                SyntaxBuilder::new().required_token(SyntaxKind::Rollback),
+            )
+            .with_prohibited_following_statements(vec![SyntaxKind::TransactionStmt]),
+        );
 
         m.push(
             StatementDefinition::new(
@@ -926,6 +936,7 @@ pub static STATEMENT_DEFINITIONS: LazyLock<HashMap<SyntaxKind, Vec<StatementDefi
                 SyntaxBuilder::new().required_token(SyntaxKind::Explain),
             )
             .with_prohibited_following_statements(vec![
+                SyntaxKind::VacuumStmt,
                 SyntaxKind::SelectStmt,
                 SyntaxKind::InsertStmt,
                 SyntaxKind::DeleteStmt,
@@ -1175,13 +1186,7 @@ pub static STATEMENT_DEFINITIONS: LazyLock<HashMap<SyntaxKind, Vec<StatementDefi
                 .required_token(SyntaxKind::Ident)
                 .required_token(SyntaxKind::Using)
                 .required_token(SyntaxKind::Ident)
-                .one_of(vec![
-                    SyntaxKind::Drop,
-                    SyntaxKind::AddP,
-                    SyntaxKind::Rename,
-                    SyntaxKind::Owner,
-                    SyntaxKind::Set,
-                ]),
+                .one_of(vec![SyntaxKind::Drop, SyntaxKind::AddP, SyntaxKind::Rename]),
         ));
 
         m.push(
diff --git a/crates/pg_statement_splitter/src/parser.rs b/crates/pg_statement_splitter/src/parser.rs
index f8de749b..1ef24447 100644
--- a/crates/pg_statement_splitter/src/parser.rs
+++ b/crates/pg_statement_splitter/src/parser.rs
@@ -130,7 +130,12 @@ impl Parser {
     /// lookbehind method.
     ///
     /// if `ignore_whitespace` is true, it will skip all whitespace tokens
-    pub fn lookbehind(&self, lookbehind: usize, ignore_whitespace: bool) -> Option<&Token> {
+    pub fn lookbehind(
+        &self,
+        lookbehind: usize,
+        ignore_whitespace: bool,
+        start_before: Option<usize>,
+    ) -> Option<&Token> {
         if ignore_whitespace {
             let mut idx = 0;
             let mut non_whitespace_token_ctr = 0;
@@ -138,7 +143,7 @@ impl Parser {
                 if idx > self.pos {
                     return None;
                 }
-                match self.tokens.get(self.pos - idx) {
+                match self.tokens.get(self.pos - start_before.unwrap_or(0) - idx) {
                     Some(token) => {
                         if !WHITESPACE_TOKENS.contains(&token.kind) {
                             non_whitespace_token_ctr += 1;
@@ -149,7 +154,7 @@ impl Parser {
                         idx += 1;
                     }
                     None => {
-                        if (self.pos - idx) > 0 {
+                        if (self.pos - idx - start_before.unwrap_or(0)) > 0 {
                             idx += 1;
                         } else {
                             return None;
@@ -158,7 +163,8 @@ impl Parser {
                 }
             }
         } else {
-            self.tokens.get(self.pos - lookbehind)
+            self.tokens
+                .get(self.pos - lookbehind - start_before.unwrap_or(0))
         }
     }
 
diff --git a/crates/pg_statement_splitter/src/statement_splitter.rs b/crates/pg_statement_splitter/src/statement_splitter.rs
index 2818cb16..7a274f9e 100644
--- a/crates/pg_statement_splitter/src/statement_splitter.rs
+++ b/crates/pg_statement_splitter/src/statement_splitter.rs
@@ -41,14 +41,15 @@ impl<'a> StatementSplitter<'a> {
         match self.parser.nth(0, false).kind {
             SyntaxKind::Ascii40 => {
                 // "("
-                self.sub_trx_depth += 1;
+                self.sub_stmt_depth += 1;
             }
             SyntaxKind::Ascii41 => {
                 // ")"
-                self.sub_trx_depth -= 1;
+                self.sub_stmt_depth -= 1;
             }
             SyntaxKind::Atomic => {
-                if self.parser.lookbehind(2, true).map(|t| t.kind) == Some(SyntaxKind::BeginP) {
+                if self.parser.lookbehind(2, true, None).map(|t| t.kind) == Some(SyntaxKind::BeginP)
+                {
                     self.is_within_atomic_block = true;
                 }
             }
@@ -88,7 +89,7 @@ impl<'a> StatementSplitter<'a> {
             kind: SyntaxKind::Any,
             range: TextRange::new(
                 self.token_range(started_at.unwrap()).start(),
-                self.parser.lookbehind(2, true).unwrap().span.end(),
+                self.parser.lookbehind(2, true, None).unwrap().span.end(),
             ),
         });
     }
@@ -115,23 +116,23 @@ impl<'a> StatementSplitter<'a> {
         let new_stmts = STATEMENT_DEFINITIONS.get(&self.parser.nth(0, false).kind);
 
         if let Some(new_stmts) = new_stmts {
-            self.tracked_statements.append(
-                &mut new_stmts
-                    .iter()
-                    .filter_map(|stmt| {
-                        if self.active_bridges.iter().any(|b| b.def.stmt == stmt.stmt) {
-                            None
-                        } else if self.tracked_statements.iter().any(|s| {
-                            s.could_be_complete()
-                                && s.def.prohibited_following_statements.contains(&stmt.stmt)
-                        }) {
-                            None
-                        } else {
-                            Some(Tracker::new_at(stmt, self.parser.pos))
-                        }
-                    })
-                    .collect(),
-            );
+            let to_add = &mut new_stmts
+                .iter()
+                .filter_map(|stmt| {
+                    if self.active_bridges.iter().any(|b| b.def.stmt == stmt.stmt) {
+                        None
+                    } else if self
+                        .tracked_statements
+                        .iter_mut()
+                        .any(|s| !s.can_start_stmt_after(&stmt.stmt))
+                    {
+                        None
+                    } else {
+                        Some(Tracker::new_at(stmt, self.parser.pos))
+                    }
+                })
+                .collect();
+            self.tracked_statements.append(to_add);
         }
     }
 
@@ -283,7 +284,11 @@ impl<'a> StatementSplitter<'a> {
 
     pub fn run(mut self) -> Vec<StatementPosition> {
         while !self.parser.eof() {
-            println!("{:?}", self.parser.nth(0, false).kind);
+            println!(
+                "#{:?}: {:?}",
+                self.parser.pos,
+                self.parser.nth(0, false).kind
+            );
             println!(
                 "tracked stmts before {:?}",
                 self.tracked_statements
@@ -342,13 +347,13 @@ impl<'a> StatementSplitter<'a> {
 
                     // the end position is the end() of the last non-whitespace token before the start
                     // of the latest complete statement
-                    let latest_non_whitespace_token = self
-                        .parser
-                        .lookbehind(self.parser.pos - latest_completed_stmt_started_at + 1, true);
+                    let latest_non_whitespace_token = self.parser.lookbehind(
+                        2,
+                        true,
+                        Some(self.parser.pos - latest_completed_stmt_started_at),
+                    );
                     let end_pos = latest_non_whitespace_token.unwrap().span.end();
 
-                    println!("adding stmt: {:?}", stmt_kind);
-
                     self.ranges.push(StatementPosition {
                         kind: stmt_kind,
                         range: TextRange::new(start_pos, end_pos),
@@ -365,13 +370,6 @@ impl<'a> StatementSplitter<'a> {
 
         // we reached eof; add any remaining statements
 
-        println!(
-            "tracked stmts after eof {:?}",
-            self.tracked_statements
-                .iter()
-                .map(|s| s.def.stmt)
-                .collect::<Vec<_>>()
-        );
         // get the earliest statement that is complete
         if let Some(earliest_complete_stmt_started_at) =
             self.find_earliest_complete_statement_start_pos()
@@ -387,7 +385,7 @@ impl<'a> StatementSplitter<'a> {
 
             let start_pos = self.token_range(earliest_complete_stmt_started_at).start();
 
-            let end_token = self.parser.lookbehind(1, true).unwrap();
+            let end_token = self.parser.lookbehind(1, true, None).unwrap();
             let end_pos = end_token.span.end();
 
             println!("adding stmt at end: {:?}", earliest_complete_stmt.def.stmt);
@@ -406,7 +404,7 @@ impl<'a> StatementSplitter<'a> {
             let start_pos = self.token_range(earliest_stmt_started_at).start();
 
             // end position is last non-whitespace token before or at the current position
-            let end_pos = self.parser.lookbehind(1, true).unwrap().span.end();
+            let end_pos = self.parser.lookbehind(1, true, None).unwrap().span.end();
 
             println!("adding any stmt at end");
             self.ranges.push(StatementPosition {
@@ -425,6 +423,37 @@ mod tests {
 
     use crate::statement_splitter::StatementSplitter;
 
+    #[test]
+    fn test_simple_select() {
+        let input = "
+select id, name, test1231234123, unknown from co;
+
+select 14433313331333
+
+alter table test drop column id;
+
+select lower('test');
+";
+
+        let result = StatementSplitter::new(input).run();
+
+        assert_eq!(result.len(), 4);
+        assert_eq!(
+            "select id, name, test1231234123, unknown from co;",
+            input[result[0].range].to_string()
+        );
+        assert_eq!(SyntaxKind::SelectStmt, result[0].kind);
+        assert_eq!("select 14433313331333", input[result[1].range].to_string());
+        assert_eq!(SyntaxKind::SelectStmt, result[1].kind);
+        assert_eq!(SyntaxKind::AlterTableStmt, result[2].kind);
+        assert_eq!(
+            "alter table test drop column id;",
+            input[result[2].range].to_string()
+        );
+        assert_eq!(SyntaxKind::SelectStmt, result[3].kind);
+        assert_eq!("select lower('test');", input[result[3].range].to_string());
+    }
+
     #[test]
     fn test_create_or_replace() {
         let input = "CREATE OR REPLACE TRIGGER check_update
@@ -586,19 +615,19 @@ mod tests {
 
     #[test]
     fn test_explain_analyze() {
-        let input = "explain analyze select 1 from contact\nselect 1\nselect 4";
+        let input = "explain analyze select 1 from contact;\nselect 1;\nselect 4;";
 
         let result = StatementSplitter::new(input).run();
 
         assert_eq!(result.len(), 3);
         assert_eq!(
-            "explain analyze select 1 from contact",
+            "explain analyze select 1 from contact;",
             input[result[0].range].to_string()
         );
         assert_eq!(SyntaxKind::ExplainStmt, result[0].kind);
-        assert_eq!("select 1", input[result[1].range].to_string());
+        assert_eq!("select 1;", input[result[1].range].to_string());
         assert_eq!(SyntaxKind::SelectStmt, result[1].kind);
-        assert_eq!("select 4", input[result[2].range].to_string());
+        assert_eq!("select 4;", input[result[2].range].to_string());
         assert_eq!(SyntaxKind::SelectStmt, result[2].kind);
     }
 
@@ -694,10 +723,6 @@ DROP ROLE IF EXISTS regress_alter_generic_user1;";
 
         let result = StatementSplitter::new(input).run();
 
-        for r in &result {
-            println!("{:?} {:?}", r.kind, input[r.range].to_string());
-        }
-
         assert_eq!(result.len(), 2);
         assert_eq!("create", input[result[0].range].to_string());
         assert_eq!(SyntaxKind::Any, result[0].kind);
@@ -1008,7 +1033,7 @@ ALTER OPERATOR FAMILY alt_nsp6.alt_opf6 USING btree ADD OPERATOR 1 < (int4, int2
     fn test_alter_op_family_2() {
         let input = "
 CREATE OPERATOR FAMILY alt_opf4 USING btree;
-ALTER OPERATOR FAMILY schema.alt_opf4 USING btree ADD
+ALTER OPERATOR FAMILY test.alt_opf4 USING btree ADD
   -- int4 vs int2
   OPERATOR 1 < (int4, int2) ,
   OPERATOR 2 <= (int4, int2) ,
diff --git a/crates/pg_statement_splitter/src/tracker.rs b/crates/pg_statement_splitter/src/tracker.rs
index ae01e207..62f1472a 100644
--- a/crates/pg_statement_splitter/src/tracker.rs
+++ b/crates/pg_statement_splitter/src/tracker.rs
@@ -5,36 +5,25 @@ use crate::data::{StatementDefinition, SyntaxDefinition};
 #[derive(Debug, Clone)]
 pub struct Position {
     idx: usize,
-    group_idx: Option<usize>,
+    group_idx: usize,
 }
 
 impl Position {
     fn new(idx: usize) -> Self {
-        Self {
-            idx,
-            group_idx: None,
-        }
+        Self { idx, group_idx: 0 }
     }
 
     fn new_with_group(idx: usize) -> Self {
-        Self {
-            idx,
-            group_idx: Some(1),
-        }
-    }
-
-    fn start_group(&mut self) {
-        self.group_idx = Some(0);
+        Self { idx, group_idx: 1 }
     }
 
     fn advance(&mut self) {
         self.idx += 1;
-        self.group_idx = None;
+        self.group_idx = 0;
     }
 
     fn advance_group(&mut self) {
-        assert!(self.group_idx.is_some());
-        self.group_idx = Some(self.group_idx.unwrap() + 1);
+        self.group_idx += 1;
     }
 }
 
@@ -48,18 +37,35 @@ pub struct Tracker<'a> {
 
     /// position in the global token stream
     pub started_at: usize,
+
+    used_prohibited_statements: Vec<SyntaxKind>,
 }
 
 impl<'a> Tracker<'a> {
     pub fn new_at(def: &'a StatementDefinition, at: usize) -> Self {
         Self {
             def,
-            positions: vec![Position {
-                idx: 1,
-                group_idx: None,
-            }],
+            positions: vec![Position::new(1)],
             started_at: at,
+            used_prohibited_statements: Vec::new(),
+        }
+    }
+
+    pub fn can_start_stmt_after(&mut self, kind: &SyntaxKind) -> bool {
+        if self.used_prohibited_statements.contains(&kind) {
+            // we already used this prohibited statement, we we can start a new statement
+            return true;
         }
+
+        let res =
+            self.could_be_complete() && self.def.prohibited_following_statements.contains(kind);
+
+        if res {
+            self.used_prohibited_statements.push(kind.clone());
+            return false;
+        }
+
+        true
     }
 
     pub fn max_pos(&self) -> usize {
@@ -168,26 +174,25 @@ impl<'a> Tracker<'a> {
                     }
                 }
                 Some(SyntaxDefinition::OptionalGroup(tokens)) => {
-                    // the token in the group is stored in the group_idx
-                    if pos.group_idx.is_none() {
-                        pos.start_group();
+                    if pos.group_idx == 0 {
+                        // if we are at the beginning of the group, we also need to spawn new
+                        // trackers for every possible next token
+                        new_positions.extend(Tracker::next_possible_positions_from_with(
+                            self.def, &pos, kind,
+                        ));
                     }
-                    let token = tokens.get(pos.group_idx.unwrap()).unwrap();
+
+                    // advance group
+                    let token = tokens.get(pos.group_idx).unwrap();
                     if token == kind {
                         pos.advance_group();
 
                         // if we reached the end of the group, we advance the position
-                        if pos.group_idx.unwrap() == tokens.len() {
+                        if pos.group_idx == tokens.len() {
                             pos.advance();
                         }
 
                         new_positions.push(pos);
-                    } else if pos.group_idx.unwrap() == 0 {
-                        // if the first token in the group does not match, we move to the next
-                        // possible tokens
-                        new_positions.extend(Tracker::next_possible_positions_from_with(
-                            self.def, &pos, kind,
-                        ));
                     }
                 }
                 None => {

From 0b4a9fd95a8a502cecd1a09ddce10f343eec0706 Mon Sep 17 00:00:00 2001
From: psteinroe <philipp@steinroetter.com>
Date: Fri, 23 Aug 2024 10:34:06 +0200
Subject: [PATCH 13/19] fix: minor stuff

---
 crates/pg_statement_splitter/src/data.rs      | 128 +++++++++++++-----
 .../src/statement_splitter.rs                 |  67 ++++++++-
 crates/pg_statement_splitter/src/tracker.rs   |  43 +++++-
 .../pg_statement_splitter/tests/skipped.txt   |   2 +-
 4 files changed, 197 insertions(+), 43 deletions(-)

diff --git a/crates/pg_statement_splitter/src/data.rs b/crates/pg_statement_splitter/src/data.rs
index 2d73fe20..6204c3ed 100644
--- a/crates/pg_statement_splitter/src/data.rs
+++ b/crates/pg_statement_splitter/src/data.rs
@@ -218,6 +218,7 @@ pub static STATEMENT_DEFINITIONS: LazyLock<HashMap<SyntaxKind, Vec<StatementDefi
             SyntaxBuilder::new()
                 .required_token(SyntaxKind::Alter)
                 .optional_token(SyntaxKind::Materialized)
+                .optional_token(SyntaxKind::Foreign)
                 .one_of(vec![SyntaxKind::Table, SyntaxKind::Index, SyntaxKind::View])
                 .optional_if_exists_group()
                 .optional_token(SyntaxKind::Only)
@@ -298,22 +299,25 @@ pub static STATEMENT_DEFINITIONS: LazyLock<HashMap<SyntaxKind, Vec<StatementDefi
                 .required_token(SyntaxKind::Ident),
         ));
 
-        m.push(StatementDefinition::new(
-            SyntaxKind::CreateStmt,
-            SyntaxBuilder::new()
-                .required_token(SyntaxKind::Create)
-                .any_tokens(Some(vec![
-                    SyntaxKind::Global,
-                    SyntaxKind::Local,
-                    SyntaxKind::Temporary,
-                    SyntaxKind::Temp,
-                    SyntaxKind::Unlogged,
-                ]))
-                .required_token(SyntaxKind::Table)
-                .optional_if_not_exists_group()
-                .optional_schema_name_group()
-                .required_token(SyntaxKind::Ident),
-        ));
+        m.push(
+            StatementDefinition::new(
+                SyntaxKind::CreateStmt,
+                SyntaxBuilder::new()
+                    .required_token(SyntaxKind::Create)
+                    .any_tokens(Some(vec![
+                        SyntaxKind::Global,
+                        SyntaxKind::Local,
+                        SyntaxKind::Temporary,
+                        SyntaxKind::Temp,
+                        SyntaxKind::Unlogged,
+                    ]))
+                    .required_token(SyntaxKind::Table)
+                    .optional_if_not_exists_group()
+                    .optional_schema_name_group()
+                    .required_token(SyntaxKind::Ident),
+            )
+            .with_prohibited_following_statements(vec![SyntaxKind::TransactionStmt]),
+        );
 
         m.push(StatementDefinition::new(
             SyntaxKind::DefineStmt,
@@ -359,6 +363,7 @@ pub static STATEMENT_DEFINITIONS: LazyLock<HashMap<SyntaxKind, Vec<StatementDefi
                     SyntaxKind::Schema,
                     SyntaxKind::View,
                     SyntaxKind::Language,
+                    SyntaxKind::Function,
                 ])
                 .optional_if_exists_group()
                 .optional_schema_name_group()
@@ -382,6 +387,17 @@ pub static STATEMENT_DEFINITIONS: LazyLock<HashMap<SyntaxKind, Vec<StatementDefi
                 .required_token(SyntaxKind::Ident),
         ));
 
+        m.push(StatementDefinition::new(
+            SyntaxKind::DropStmt,
+            SyntaxBuilder::new()
+                .required_token(SyntaxKind::Drop)
+                .required_token(SyntaxKind::Event)
+                .required_token(SyntaxKind::Trigger)
+                .optional_if_exists_group()
+                .optional_schema_name_group()
+                .required_token(SyntaxKind::Ident),
+        ));
+
         m.push(StatementDefinition::new(
             SyntaxKind::DropStmt,
             SyntaxBuilder::new()
@@ -513,7 +529,11 @@ pub static STATEMENT_DEFINITIONS: LazyLock<HashMap<SyntaxKind, Vec<StatementDefi
                 .required_token(SyntaxKind::Function)
                 .optional_if_exists_group()
                 .optional_schema_name_group()
-                .required_token(SyntaxKind::Ident)
+                .one_of(vec![
+                    SyntaxKind::Ident,
+                    SyntaxKind::VersionP,
+                    SyntaxKind::Set,
+                ])
                 .required_token(SyntaxKind::Ascii40)
                 .any_tokens(None)
                 .required_token(SyntaxKind::Ascii41),
@@ -670,17 +690,23 @@ pub static STATEMENT_DEFINITIONS: LazyLock<HashMap<SyntaxKind, Vec<StatementDefi
                     .any_tokens(None)
                     .required_token(SyntaxKind::Ascii41),
             )
-            .with_prohibited_following_statements(vec![SyntaxKind::TransactionStmt]),
+            .with_prohibited_following_statements(vec![
+                SyntaxKind::TransactionStmt,
+                SyntaxKind::VariableSetStmt,
+            ]),
         );
 
-        m.push(StatementDefinition::new(
-            SyntaxKind::AlterFunctionStmt,
-            SyntaxBuilder::new()
-                .required_token(SyntaxKind::Alter)
-                .one_of(vec![SyntaxKind::Function, SyntaxKind::Procedure])
-                .optional_schema_name_group()
-                .required_token(SyntaxKind::Ident),
-        ));
+        m.push(
+            StatementDefinition::new(
+                SyntaxKind::AlterFunctionStmt,
+                SyntaxBuilder::new()
+                    .required_token(SyntaxKind::Alter)
+                    .one_of(vec![SyntaxKind::Function, SyntaxKind::Procedure])
+                    .optional_schema_name_group()
+                    .required_token(SyntaxKind::Ident),
+            )
+            .with_prohibited_following_statements(vec![SyntaxKind::VariableSetStmt]),
+        );
 
         m.push(StatementDefinition::new(
             SyntaxKind::DoStmt,
@@ -770,6 +796,17 @@ pub static STATEMENT_DEFINITIONS: LazyLock<HashMap<SyntaxKind, Vec<StatementDefi
                 .any_token(),
         ));
 
+        m.push(
+            StatementDefinition::new(
+                SyntaxKind::TransactionStmt,
+                SyntaxBuilder::new()
+                    .required_token(SyntaxKind::Release)
+                    .optional_token(SyntaxKind::Savepoint)
+                    .required_token(SyntaxKind::Ident),
+            )
+            .with_prohibited_following_statements(vec![SyntaxKind::TransactionStmt]),
+        );
+
         m.push(
             StatementDefinition::new(
                 SyntaxKind::TransactionStmt,
@@ -867,10 +904,13 @@ pub static STATEMENT_DEFINITIONS: LazyLock<HashMap<SyntaxKind, Vec<StatementDefi
                 .required_token(SyntaxKind::Ident),
         ));
 
-        m.push(StatementDefinition::new(
-            SyntaxKind::VacuumStmt,
-            SyntaxBuilder::new().required_token(SyntaxKind::Vacuum),
-        ));
+        m.push(
+            StatementDefinition::new(
+                SyntaxKind::VacuumStmt,
+                SyntaxBuilder::new().required_token(SyntaxKind::Vacuum),
+            )
+            .with_prohibited_following_statements(vec![SyntaxKind::VacuumStmt]),
+        );
 
         m.push(
             StatementDefinition::new(
@@ -1008,9 +1048,12 @@ pub static STATEMENT_DEFINITIONS: LazyLock<HashMap<SyntaxKind, Vec<StatementDefi
             SyntaxKind::VariableSetStmt,
             SyntaxBuilder::new()
                 .required_token(SyntaxKind::Set)
-                .optional_token(SyntaxKind::Session)
-                .optional_token(SyntaxKind::Local)
-                .required_token(SyntaxKind::Ident)
+                .any_tokens(Some(vec![
+                    SyntaxKind::Local,
+                    SyntaxKind::Session,
+                    SyntaxKind::Ident,
+                    SyntaxKind::Ascii46,
+                ]))
                 .one_of(vec![SyntaxKind::To, SyntaxKind::Ascii61])
                 .any_token(),
         ));
@@ -1093,11 +1136,25 @@ pub static STATEMENT_DEFINITIONS: LazyLock<HashMap<SyntaxKind, Vec<StatementDefi
             SyntaxKind::ReindexStmt,
             SyntaxBuilder::new()
                 .required_token(SyntaxKind::Reindex)
+                .any_tokens(None)
+                .one_of(vec![
+                    SyntaxKind::Table,
+                    SyntaxKind::Index,
+                    SyntaxKind::Schema,
+                ])
                 .optional_token(SyntaxKind::Concurrently)
                 .optional_schema_name_group()
                 .required_token(SyntaxKind::Ident),
         ));
 
+        m.push(StatementDefinition::new(
+            SyntaxKind::ReindexStmt,
+            SyntaxBuilder::new()
+                .required_token(SyntaxKind::Reindex)
+                .any_tokens(None)
+                .one_of(vec![SyntaxKind::Database, SyntaxKind::SystemP]),
+        ));
+
         m.push(StatementDefinition::new(
             SyntaxKind::CheckPointStmt,
             SyntaxBuilder::new().required_token(SyntaxKind::Checkpoint),
@@ -1195,8 +1252,9 @@ pub static STATEMENT_DEFINITIONS: LazyLock<HashMap<SyntaxKind, Vec<StatementDefi
                 SyntaxBuilder::new()
                     .required_token(SyntaxKind::Prepare)
                     .required_token(SyntaxKind::Ident)
-                    .any_token()
-                    .required_token(SyntaxKind::As),
+                    .any_tokens(None)
+                    .required_token(SyntaxKind::As)
+                    .any_token(),
             )
             .with_prohibited_following_statements(vec![SyntaxKind::SelectStmt]),
         );
diff --git a/crates/pg_statement_splitter/src/statement_splitter.rs b/crates/pg_statement_splitter/src/statement_splitter.rs
index 7a274f9e..ef68387b 100644
--- a/crates/pg_statement_splitter/src/statement_splitter.rs
+++ b/crates/pg_statement_splitter/src/statement_splitter.rs
@@ -1,4 +1,4 @@
-use pg_lexer::SyntaxKind;
+use pg_lexer::{SyntaxKind, WHITESPACE_TOKENS};
 use text_size::{TextRange, TextSize};
 
 use crate::{
@@ -73,6 +73,8 @@ impl<'a> StatementSplitter<'a> {
             keep
         });
 
+        println!("removed items: {:?}", removed_items);
+
         removed_items.iter().min().map(|i| *i)
     }
 
@@ -124,7 +126,7 @@ impl<'a> StatementSplitter<'a> {
                     } else if self
                         .tracked_statements
                         .iter_mut()
-                        .any(|s| !s.can_start_stmt_after(&stmt.stmt))
+                        .any(|s| !s.can_start_stmt_after(&stmt.stmt, self.parser.pos))
                     {
                         None
                     } else {
@@ -132,6 +134,7 @@ impl<'a> StatementSplitter<'a> {
                     }
                 })
                 .collect();
+            println!("adding stmt: {:?}", to_add);
             self.tracked_statements.append(to_add);
         }
     }
@@ -284,6 +287,10 @@ impl<'a> StatementSplitter<'a> {
 
     pub fn run(mut self) -> Vec<StatementPosition> {
         while !self.parser.eof() {
+            if WHITESPACE_TOKENS.contains(&self.parser.nth(0, false).kind) {
+                self.parser.advance();
+                continue;
+            }
             println!(
                 "#{:?}: {:?}",
                 self.parser.pos,
@@ -756,6 +763,20 @@ DROP ROLE IF EXISTS regress_alter_generic_user1;";
         assert_eq!(SyntaxKind::SelectStmt, result[1].kind);
     }
 
+    #[test]
+    fn test_set_with_schema() {
+        let input = "SET custom.my_guc = 42;";
+
+        let result = StatementSplitter::new(input).run();
+
+        assert_eq!(result.len(), 1);
+        assert_eq!(
+            "SET custom.my_guc = 42;",
+            input[result[0].range].to_string()
+        );
+        assert_eq!(SyntaxKind::VariableSetStmt, result[0].kind);
+    }
+
     #[test]
     fn test_only_incomplete_statement() {
         let input = "   create    ";
@@ -1269,6 +1290,48 @@ $$;
         assert_eq!(SyntaxKind::CreateFunctionStmt, result[2].kind);
     }
 
+    #[test]
+    fn test_prepare_as() {
+        let input = "
+DROP VIEW fdv4;
+
+PREPARE foo AS
+  SELECT id, keywords, title, body, created
+  FROM articles
+  GROUP BY id;
+
+EXECUTE foo;
+";
+        let result = StatementSplitter::new(input).run();
+
+        assert_eq!(result.len(), 3);
+        assert_eq!(SyntaxKind::DropStmt, result[0].kind);
+        assert_eq!(SyntaxKind::PrepareStmt, result[1].kind);
+        assert_eq!(SyntaxKind::ExecuteStmt, result[2].kind);
+    }
+
+    #[test]
+    fn create_function_set() {
+        let input = "
+create function report_guc(text) returns text as\n$$ select current_setting($1) $$ language sql\nset work_mem = '1MB';
+";
+        let result = StatementSplitter::new(input).run();
+
+        assert_eq!(result.len(), 1);
+        assert_eq!(SyntaxKind::CreateFunctionStmt, result[0].kind);
+    }
+
+    #[test]
+    fn test_drop_function() {
+        let input = "
+DROP FUNCTION set(name);
+";
+        let result = StatementSplitter::new(input).run();
+
+        assert_eq!(result.len(), 1);
+        assert_eq!(SyntaxKind::DropStmt, result[0].kind);
+    }
+
     #[test]
     fn test_call_version() {
         let input = "
diff --git a/crates/pg_statement_splitter/src/tracker.rs b/crates/pg_statement_splitter/src/tracker.rs
index 62f1472a..af7f432e 100644
--- a/crates/pg_statement_splitter/src/tracker.rs
+++ b/crates/pg_statement_splitter/src/tracker.rs
@@ -38,7 +38,7 @@ pub struct Tracker<'a> {
     /// position in the global token stream
     pub started_at: usize,
 
-    used_prohibited_statements: Vec<SyntaxKind>,
+    used_prohibited_statements: Vec<(usize, SyntaxKind)>,
 }
 
 impl<'a> Tracker<'a> {
@@ -51,17 +51,24 @@ impl<'a> Tracker<'a> {
         }
     }
 
-    pub fn can_start_stmt_after(&mut self, kind: &SyntaxKind) -> bool {
-        if self.used_prohibited_statements.contains(&kind) {
+    pub fn can_start_stmt_after(&mut self, kind: &SyntaxKind, at: usize) -> bool {
+        if let Some(x) = self
+            .used_prohibited_statements
+            .iter()
+            .find(|x| x.1 == *kind)
+        {
             // we already used this prohibited statement, we we can start a new statement
-            return true;
+            // but only if we are not at the same position as the prohibited statement
+            // this is to prevent adding the second "VariableSetStmt" if the first was added to the
+            // used list if both start at the same position
+            return x.0 != at;
         }
 
         let res =
             self.could_be_complete() && self.def.prohibited_following_statements.contains(kind);
 
         if res {
-            self.used_prohibited_statements.push(kind.clone());
+            self.used_prohibited_statements.push((at, kind.clone()));
             return false;
         }
 
@@ -127,25 +134,39 @@ impl<'a> Tracker<'a> {
 
         let mut new_positions = Vec::with_capacity(self.positions.len());
 
+        println!(
+            "advancing with {:?} and positions {:?}",
+            kind,
+            self.positions
+                .iter()
+                .map(|x| self.def.tokens.get(x.idx))
+                .collect::<Vec<_>>()
+        );
+
         for mut pos in self.positions.drain(..) {
+            println!("advancing pos {:?}", pos);
             match self.def.tokens.get(pos.idx) {
                 Some(SyntaxDefinition::RequiredToken(k)) => {
+                    println!("required token {:?}", k);
                     pos.advance();
                     if k == kind {
                         new_positions.push(pos);
                     }
                 }
                 Some(SyntaxDefinition::AnyToken) => {
+                    println!("any token");
                     pos.advance();
                     new_positions.push(pos);
                 }
                 Some(SyntaxDefinition::OneOf(kinds)) => {
+                    println!("one of {:?}", kinds);
                     if kinds.iter().any(|x| x == kind) {
                         pos.advance();
                         new_positions.push(pos);
                     }
                 }
                 Some(SyntaxDefinition::OptionalToken(k)) => {
+                    println!("optional token {:?}", k);
                     if k == kind {
                         pos.advance();
                         new_positions.push(pos);
@@ -156,6 +177,7 @@ impl<'a> Tracker<'a> {
                     }
                 }
                 Some(SyntaxDefinition::AnyTokens(maybe_tokens)) => {
+                    println!("any tokens {:?}", maybe_tokens);
                     let next_positions =
                         Tracker::next_possible_positions_from_with(self.def, &pos, kind);
 
@@ -174,6 +196,7 @@ impl<'a> Tracker<'a> {
                     }
                 }
                 Some(SyntaxDefinition::OptionalGroup(tokens)) => {
+                    println!("optional group {:?}", tokens);
                     if pos.group_idx == 0 {
                         // if we are at the beginning of the group, we also need to spawn new
                         // trackers for every possible next token
@@ -185,10 +208,12 @@ impl<'a> Tracker<'a> {
                     // advance group
                     let token = tokens.get(pos.group_idx).unwrap();
                     if token == kind {
+                        println!("advancing group");
                         pos.advance_group();
 
                         // if we reached the end of the group, we advance the position
                         if pos.group_idx == tokens.len() {
+                            println!("advancing pos after group");
                             pos.advance();
                         }
 
@@ -204,6 +229,14 @@ impl<'a> Tracker<'a> {
 
         self.positions = new_positions;
 
+        println!(
+            "new positions {:?}",
+            self.positions
+                .iter()
+                .map(|x| self.def.tokens.get(x.idx))
+                .collect::<Vec<_>>()
+        );
+
         self.positions.len() != 0
     }
 
diff --git a/crates/pg_statement_splitter/tests/skipped.txt b/crates/pg_statement_splitter/tests/skipped.txt
index f62d2256..47487a45 100644
--- a/crates/pg_statement_splitter/tests/skipped.txt
+++ b/crates/pg_statement_splitter/tests/skipped.txt
@@ -14,4 +14,4 @@ aggregates
 comments
 dependency
 drop_if_exists
-
+groupingsets

From 69bf227368e3a55dd860abe13f45541b882dbf26 Mon Sep 17 00:00:00 2001
From: psteinroe <philipp@steinroetter.com>
Date: Fri, 23 Aug 2024 12:00:10 +0200
Subject: [PATCH 14/19] fix: minor stuff

---
 crates/pg_statement_splitter/src/data.rs      | 164 ++++++++++++++----
 .../src/statement_splitter.rs                 |  77 ++++++--
 crates/pg_statement_splitter/src/tracker.rs   |  22 ++-
 .../pg_statement_splitter/tests/skipped.txt   |   7 +
 4 files changed, 217 insertions(+), 53 deletions(-)

diff --git a/crates/pg_statement_splitter/src/data.rs b/crates/pg_statement_splitter/src/data.rs
index 6204c3ed..8fe8feb3 100644
--- a/crates/pg_statement_splitter/src/data.rs
+++ b/crates/pg_statement_splitter/src/data.rs
@@ -78,6 +78,7 @@ pub struct StatementDefinition {
     pub stmt: SyntaxKind,
     pub tokens: Vec<SyntaxDefinition>,
     pub prohibited_following_statements: Vec<SyntaxKind>,
+    pub prohibited_tokens: Vec<SyntaxKind>,
 }
 
 impl StatementDefinition {
@@ -86,9 +87,15 @@ impl StatementDefinition {
             stmt,
             tokens: b.build(),
             prohibited_following_statements: Vec::new(),
+            prohibited_tokens: Vec::new(),
         }
     }
 
+    fn with_prohibited_tokens(mut self, prohibited: Vec<SyntaxKind>) -> Self {
+        self.prohibited_tokens = prohibited;
+        self
+    }
+
     fn with_prohibited_following_statements(mut self, prohibited: Vec<SyntaxKind>) -> Self {
         self.prohibited_following_statements = prohibited;
         self
@@ -223,7 +230,11 @@ pub static STATEMENT_DEFINITIONS: LazyLock<HashMap<SyntaxKind, Vec<StatementDefi
                 .optional_if_exists_group()
                 .optional_token(SyntaxKind::Only)
                 .optional_schema_name_group()
-                .required_token(SyntaxKind::Ident)
+                .one_of(vec![
+                    SyntaxKind::Ident,
+                    SyntaxKind::VersionP,
+                    SyntaxKind::Simple,
+                ])
                 .any_token(),
         ));
 
@@ -273,13 +284,16 @@ pub static STATEMENT_DEFINITIONS: LazyLock<HashMap<SyntaxKind, Vec<StatementDefi
                 .required_token(SyntaxKind::Ascii41),
         ));
 
-        m.push(StatementDefinition::new(
-            SyntaxKind::AlterDefaultPrivilegesStmt,
-            SyntaxBuilder::new()
-                .required_token(SyntaxKind::Alter)
-                .required_token(SyntaxKind::Default)
-                .required_token(SyntaxKind::Privileges),
-        ));
+        m.push(
+            StatementDefinition::new(
+                SyntaxKind::AlterDefaultPrivilegesStmt,
+                SyntaxBuilder::new()
+                    .required_token(SyntaxKind::Alter)
+                    .required_token(SyntaxKind::Default)
+                    .required_token(SyntaxKind::Privileges),
+            )
+            .with_prohibited_following_statements(vec![SyntaxKind::GrantStmt]),
+        );
 
         m.push(StatementDefinition::new(
             SyntaxKind::ClusterStmt,
@@ -387,6 +401,17 @@ pub static STATEMENT_DEFINITIONS: LazyLock<HashMap<SyntaxKind, Vec<StatementDefi
                 .required_token(SyntaxKind::Ident),
         ));
 
+        m.push(StatementDefinition::new(
+            SyntaxKind::DropStmt,
+            SyntaxBuilder::new()
+                .required_token(SyntaxKind::Drop)
+                .required_token(SyntaxKind::Materialized)
+                .required_token(SyntaxKind::View)
+                .optional_if_exists_group()
+                .optional_schema_name_group()
+                .required_token(SyntaxKind::Ident),
+        ));
+
         m.push(StatementDefinition::new(
             SyntaxKind::DropStmt,
             SyntaxBuilder::new()
@@ -822,6 +847,11 @@ pub static STATEMENT_DEFINITIONS: LazyLock<HashMap<SyntaxKind, Vec<StatementDefi
             SyntaxBuilder::new().required_token(SyntaxKind::BeginP),
         ));
 
+        m.push(StatementDefinition::new(
+            SyntaxKind::TransactionStmt,
+            SyntaxBuilder::new().required_token(SyntaxKind::EndP),
+        ));
+
         m.push(StatementDefinition::new(
             SyntaxKind::TransactionStmt,
             SyntaxBuilder::new()
@@ -942,7 +972,11 @@ pub static STATEMENT_DEFINITIONS: LazyLock<HashMap<SyntaxKind, Vec<StatementDefi
                     .required_token(SyntaxKind::Table)
                     .optional_if_not_exists_group()
                     .optional_schema_name_group()
-                    .required_token(SyntaxKind::Ident)
+                    .one_of(vec![
+                        SyntaxKind::Ident,
+                        SyntaxKind::VersionP,
+                        SyntaxKind::Simple,
+                    ])
                     .any_tokens(None)
                     .required_token(SyntaxKind::As)
                     .any_token(),
@@ -973,7 +1007,19 @@ pub static STATEMENT_DEFINITIONS: LazyLock<HashMap<SyntaxKind, Vec<StatementDefi
         m.push(
             StatementDefinition::new(
                 SyntaxKind::ExplainStmt,
-                SyntaxBuilder::new().required_token(SyntaxKind::Explain),
+                SyntaxBuilder::new()
+                    .required_token(SyntaxKind::Explain)
+                    .one_of(vec![
+                        SyntaxKind::Analyze,
+                        SyntaxKind::Ascii40,
+                        SyntaxKind::Select,
+                        SyntaxKind::Insert,
+                        SyntaxKind::Update,
+                        SyntaxKind::DeleteP,
+                        SyntaxKind::Merge,
+                        SyntaxKind::Execute,
+                        SyntaxKind::Create,
+                    ]),
             )
             .with_prohibited_following_statements(vec![
                 SyntaxKind::VacuumStmt,
@@ -983,6 +1029,7 @@ pub static STATEMENT_DEFINITIONS: LazyLock<HashMap<SyntaxKind, Vec<StatementDefi
                 SyntaxKind::UpdateStmt,
                 SyntaxKind::MergeStmt,
                 SyntaxKind::ExecuteStmt,
+                SyntaxKind::CreateTableAsStmt,
             ]),
         );
 
@@ -1105,6 +1152,18 @@ pub static STATEMENT_DEFINITIONS: LazyLock<HashMap<SyntaxKind, Vec<StatementDefi
                 .required_token(SyntaxKind::Ident),
         ));
 
+        m.push(
+            StatementDefinition::new(
+                SyntaxKind::AlterRoleSetStmt,
+                SyntaxBuilder::new()
+                    .required_token(SyntaxKind::Alter)
+                    .required_token(SyntaxKind::Role)
+                    .required_token(SyntaxKind::Ident)
+                    .required_token(SyntaxKind::Set),
+            )
+            .with_prohibited_following_statements(vec![SyntaxKind::VariableSetStmt]),
+        );
+
         m.push(StatementDefinition::new(
             SyntaxKind::DropRoleStmt,
             SyntaxBuilder::new()
@@ -1160,12 +1219,23 @@ pub static STATEMENT_DEFINITIONS: LazyLock<HashMap<SyntaxKind, Vec<StatementDefi
             SyntaxBuilder::new().required_token(SyntaxKind::Checkpoint),
         ));
 
-        m.push(StatementDefinition::new(
-            SyntaxKind::CreateSchemaStmt,
-            SyntaxBuilder::new()
-                .required_token(SyntaxKind::Create)
-                .required_token(SyntaxKind::Schema),
-        ));
+        // CREATE TABLE, CREATE VIEW, CREATE INDEX, CREATE SEQUENCE, CREATE TRIGGER and GRANT
+        m.push(
+            StatementDefinition::new(
+                SyntaxKind::CreateSchemaStmt,
+                SyntaxBuilder::new()
+                    .required_token(SyntaxKind::Create)
+                    .required_token(SyntaxKind::Schema),
+            )
+            .with_prohibited_following_statements(vec![
+                SyntaxKind::CreateTableAsStmt,
+                SyntaxKind::CreateStmt,
+                SyntaxKind::IndexStmt,
+                SyntaxKind::CreateSeqStmt,
+                SyntaxKind::CreateTrigStmt,
+                SyntaxKind::GrantStmt,
+            ]),
+        );
 
         m.push(StatementDefinition::new(
             SyntaxKind::AlterDatabaseStmt,
@@ -1233,18 +1303,21 @@ pub static STATEMENT_DEFINITIONS: LazyLock<HashMap<SyntaxKind, Vec<StatementDefi
                 .required_token(SyntaxKind::Ident),
         ));
 
-        m.push(StatementDefinition::new(
-            SyntaxKind::AlterOpFamilyStmt,
-            SyntaxBuilder::new()
-                .required_token(SyntaxKind::Alter)
-                .required_token(SyntaxKind::Operator)
-                .required_token(SyntaxKind::Family)
-                .optional_schema_name_group()
-                .required_token(SyntaxKind::Ident)
-                .required_token(SyntaxKind::Using)
-                .required_token(SyntaxKind::Ident)
-                .one_of(vec![SyntaxKind::Drop, SyntaxKind::AddP, SyntaxKind::Rename]),
-        ));
+        m.push(
+            StatementDefinition::new(
+                SyntaxKind::AlterOpFamilyStmt,
+                SyntaxBuilder::new()
+                    .required_token(SyntaxKind::Alter)
+                    .required_token(SyntaxKind::Operator)
+                    .required_token(SyntaxKind::Family)
+                    .optional_schema_name_group()
+                    .required_token(SyntaxKind::Ident)
+                    .required_token(SyntaxKind::Using)
+                    .required_token(SyntaxKind::Ident)
+                    .one_of(vec![SyntaxKind::Drop, SyntaxKind::AddP, SyntaxKind::Rename]),
+            )
+            .with_prohibited_tokens(vec![SyntaxKind::Rename]),
+        );
 
         m.push(
             StatementDefinition::new(
@@ -1256,9 +1329,21 @@ pub static STATEMENT_DEFINITIONS: LazyLock<HashMap<SyntaxKind, Vec<StatementDefi
                     .required_token(SyntaxKind::As)
                     .any_token(),
             )
-            .with_prohibited_following_statements(vec![SyntaxKind::SelectStmt]),
+            .with_prohibited_following_statements(vec![
+                SyntaxKind::SelectStmt,
+                SyntaxKind::InsertStmt,
+                SyntaxKind::UpdateStmt,
+                SyntaxKind::DeleteStmt,
+            ]),
         );
 
+        m.push(StatementDefinition::new(
+            SyntaxKind::ClosePortalStmt,
+            SyntaxBuilder::new()
+                .required_token(SyntaxKind::Close)
+                .one_of(vec![SyntaxKind::Ident, SyntaxKind::All]),
+        ));
+
         m.push(StatementDefinition::new(
             SyntaxKind::DeallocateStmt,
             SyntaxBuilder::new()
@@ -1331,15 +1416,18 @@ pub static STATEMENT_DEFINITIONS: LazyLock<HashMap<SyntaxKind, Vec<StatementDefi
                 .required_token(SyntaxKind::Ident),
         ));
 
-        m.push(StatementDefinition::new(
-            SyntaxKind::AlterFdwStmt,
-            SyntaxBuilder::new()
-                .required_token(SyntaxKind::Alter)
-                .required_token(SyntaxKind::Foreign)
-                .required_token(SyntaxKind::DataP)
-                .required_token(SyntaxKind::Wrapper)
-                .required_token(SyntaxKind::Ident),
-        ));
+        m.push(
+            StatementDefinition::new(
+                SyntaxKind::AlterFdwStmt,
+                SyntaxBuilder::new()
+                    .required_token(SyntaxKind::Alter)
+                    .required_token(SyntaxKind::Foreign)
+                    .required_token(SyntaxKind::DataP)
+                    .required_token(SyntaxKind::Wrapper)
+                    .required_token(SyntaxKind::Ident),
+            )
+            .with_prohibited_tokens(vec![SyntaxKind::Rename]),
+        );
 
         m.push(StatementDefinition::new(
             SyntaxKind::CreateForeignServerStmt,
diff --git a/crates/pg_statement_splitter/src/statement_splitter.rs b/crates/pg_statement_splitter/src/statement_splitter.rs
index ef68387b..a0c5aa53 100644
--- a/crates/pg_statement_splitter/src/statement_splitter.rs
+++ b/crates/pg_statement_splitter/src/statement_splitter.rs
@@ -37,25 +37,31 @@ impl<'a> StatementSplitter<'a> {
         }
     }
 
-    fn track_nesting(&mut self) {
+    fn end_nesting(&mut self) {
         match self.parser.nth(0, false).kind {
-            SyntaxKind::Ascii40 => {
-                // "("
-                self.sub_stmt_depth += 1;
-            }
             SyntaxKind::Ascii41 => {
                 // ")"
                 self.sub_stmt_depth -= 1;
             }
+            SyntaxKind::EndP => {
+                self.is_within_atomic_block = false;
+            }
+            _ => {}
+        };
+    }
+
+    fn start_nesting(&mut self) {
+        match self.parser.nth(0, false).kind {
+            SyntaxKind::Ascii40 => {
+                // "("
+                self.sub_stmt_depth += 1;
+            }
             SyntaxKind::Atomic => {
                 if self.parser.lookbehind(2, true, None).map(|t| t.kind) == Some(SyntaxKind::BeginP)
                 {
                     self.is_within_atomic_block = true;
                 }
             }
-            SyntaxKind::EndP => {
-                self.is_within_atomic_block = false;
-            }
             _ => {}
         };
     }
@@ -177,19 +183,19 @@ impl<'a> StatementSplitter<'a> {
             .min_by_key(|stmt| stmt.started_at)
             .map(|stmt| stmt.started_at)
         {
-            println!(
-                "earliest complete stmt started at: {:?}",
-                earliest_complete_stmt_started_at
-            );
             let earliest_complete_stmt = self
                 .tracked_statements
                 .iter()
                 .filter(|s| {
                     s.started_at == earliest_complete_stmt_started_at && s.could_be_complete()
                 })
-                .max_by_key(|stmt| stmt.max_pos())
+                .max_by_key(|stmt| {
+                    println!("stmt: {:?} max pos: {:?}", stmt.def.stmt, stmt.max_pos());
+                    stmt.max_pos()
+                })
                 .unwrap();
 
+            println!("earliest complete stmt: {:?}", earliest_complete_stmt);
             assert_eq!(
                 1,
                 self.tracked_statements
@@ -304,7 +310,7 @@ impl<'a> StatementSplitter<'a> {
                     .collect::<Vec<_>>()
             );
 
-            self.track_nesting();
+            self.start_nesting();
 
             let removed_items_min_started_at = self.advance_tracker();
 
@@ -328,6 +334,8 @@ impl<'a> StatementSplitter<'a> {
                 self.close_stmt_with_semicolon();
             }
 
+            self.end_nesting();
+
             // # This is where the actual parsing happens
 
             // 1. Find the latest complete statement
@@ -1360,6 +1368,47 @@ DROP LANGUAGE IF EXISTS test_language_exists;
         assert_eq!(SyntaxKind::DropStmt, result[2].kind);
     }
 
+    #[test]
+    fn alter_mat_view() {
+        let input = "
+ALTER MATERIALIZED VIEW mvtest_tvm SET SCHEMA mvtest_mvschema;
+";
+        let result = StatementSplitter::new(input).run();
+
+        assert_eq!(result.len(), 1);
+        assert_eq!(SyntaxKind::AlterObjectSchemaStmt, result[0].kind);
+    }
+
+    #[test]
+    fn create_tbl_as_2() {
+        let input = "
+create table simple as
+  select generate_series(1, 20000) AS id, 'aaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaa';
+";
+        let result = StatementSplitter::new(input).run();
+
+        assert_eq!(result.len(), 1);
+        assert_eq!(SyntaxKind::CreateTableAsStmt, result[0].kind);
+    }
+
+    #[test]
+    fn create_tbl_as() {
+        let input = "
+CREATE TABLE tab_settings_flags AS SELECT name, category,
+    'EXPLAIN'          = ANY(flags) AS explain,
+    'NO_RESET_ALL'     = ANY(flags) AS no_reset_all,
+    'NO_SHOW_ALL'      = ANY(flags) AS no_show_all,
+    'NOT_IN_SAMPLE'    = ANY(flags) AS not_in_sample,
+    'RUNTIME_COMPUTED' = ANY(flags) AS runtime_computed
+  FROM pg_show_all_settings() AS psas,
+    pg_settings_get_flags(psas.name) AS flags;
+";
+        let result = StatementSplitter::new(input).run();
+
+        assert_eq!(result.len(), 1);
+        assert_eq!(SyntaxKind::CreateTableAsStmt, result[0].kind);
+    }
+
     #[allow(clippy::must_use)]
     fn debug(input: &str) {
         for s in input.split(';').filter_map(|s| {
diff --git a/crates/pg_statement_splitter/src/tracker.rs b/crates/pg_statement_splitter/src/tracker.rs
index af7f432e..771085dc 100644
--- a/crates/pg_statement_splitter/src/tracker.rs
+++ b/crates/pg_statement_splitter/src/tracker.rs
@@ -75,8 +75,24 @@ impl<'a> Tracker<'a> {
         true
     }
 
+    /// Returns the max idx of all tracked positions while ignoring non-required tokens
     pub fn max_pos(&self) -> usize {
-        self.positions.iter().max_by_key(|p| p.idx).unwrap().idx
+        self.positions
+            .iter()
+            .map(|p| {
+                // substract non-required tokens from the position count
+                (0..p.idx).fold(0, |acc, idx| {
+                    let token = self.def.tokens.get(idx);
+                    match token {
+                        Some(SyntaxDefinition::RequiredToken(_)) => acc + 1,
+                        Some(SyntaxDefinition::OneOf(_)) => acc + 1,
+                        Some(SyntaxDefinition::AnyToken) => acc + 1,
+                        _ => acc,
+                    }
+                })
+            })
+            .max()
+            .unwrap()
     }
 
     pub fn current_positions(&self) -> Vec<usize> {
@@ -132,6 +148,10 @@ impl<'a> Tracker<'a> {
             return true;
         }
 
+        if self.def.prohibited_tokens.contains(kind) {
+            return false;
+        }
+
         let mut new_positions = Vec::with_capacity(self.positions.len());
 
         println!(
diff --git a/crates/pg_statement_splitter/tests/skipped.txt b/crates/pg_statement_splitter/tests/skipped.txt
index 47487a45..f301b568 100644
--- a/crates/pg_statement_splitter/tests/skipped.txt
+++ b/crates/pg_statement_splitter/tests/skipped.txt
@@ -15,3 +15,10 @@ comments
 dependency
 drop_if_exists
 groupingsets
+index_including_gist
+inherit
+insert
+insert_conflict
+numeric_big
+opr_sanity
+case

From 2d0ef3e47b1a7d01852c5577a4e2f761699fba10 Mon Sep 17 00:00:00 2001
From: psteinroe <philipp@steinroetter.com>
Date: Mon, 26 Aug 2024 17:31:48 +0200
Subject: [PATCH 15/19] fix: progress

---
 crates/pg_statement_splitter/src/data.rs      | 68 +++++++++++++------
 .../src/statement_splitter.rs                 | 11 +++
 .../pg_statement_splitter/tests/skipped.txt   |  3 +
 3 files changed, 62 insertions(+), 20 deletions(-)

diff --git a/crates/pg_statement_splitter/src/data.rs b/crates/pg_statement_splitter/src/data.rs
index 8fe8feb3..0505af8c 100644
--- a/crates/pg_statement_splitter/src/data.rs
+++ b/crates/pg_statement_splitter/src/data.rs
@@ -27,6 +27,20 @@ impl SyntaxBuilder {
         self
     }
 
+    /// The name of an object is almost always an `Ident` token, but due to naming conflicts it can
+    /// also be a set of other tokens. This function adds those tokens to the list of possible
+    /// tokens.
+    pub fn ident_like(mut self) -> Self {
+        self.parts.push(SyntaxDefinition::OneOf(vec![
+            SyntaxKind::Ident,
+            SyntaxKind::VersionP,
+            SyntaxKind::Cursor,
+            SyntaxKind::Simple,
+            SyntaxKind::Set,
+        ]));
+        self
+    }
+
     pub fn any_tokens(mut self, tokens: Option<Vec<SyntaxKind>>) -> Self {
         self.parts.push(SyntaxDefinition::AnyTokens(tokens));
         self
@@ -183,7 +197,7 @@ pub static STATEMENT_DEFINITIONS: LazyLock<HashMap<SyntaxKind, Vec<StatementDefi
                     .required_token(SyntaxKind::Insert)
                     .required_token(SyntaxKind::Into)
                     .optional_schema_name_group()
-                    .required_token(SyntaxKind::Ident),
+                    .ident_like(),
             )
             .with_prohibited_following_statements(vec![SyntaxKind::SelectStmt]),
         );
@@ -204,7 +218,7 @@ pub static STATEMENT_DEFINITIONS: LazyLock<HashMap<SyntaxKind, Vec<StatementDefi
                 .required_token(SyntaxKind::Update)
                 .optional_token(SyntaxKind::Only)
                 .optional_schema_name_group()
-                .required_token(SyntaxKind::Ident)
+                .ident_like()
                 .any_tokens(None)
                 .required_token(SyntaxKind::Set)
                 .any_token(),
@@ -230,11 +244,7 @@ pub static STATEMENT_DEFINITIONS: LazyLock<HashMap<SyntaxKind, Vec<StatementDefi
                 .optional_if_exists_group()
                 .optional_token(SyntaxKind::Only)
                 .optional_schema_name_group()
-                .one_of(vec![
-                    SyntaxKind::Ident,
-                    SyntaxKind::VersionP,
-                    SyntaxKind::Simple,
-                ])
+                .ident_like()
                 .any_token(),
         ));
 
@@ -278,7 +288,7 @@ pub static STATEMENT_DEFINITIONS: LazyLock<HashMap<SyntaxKind, Vec<StatementDefi
             SyntaxBuilder::new()
                 .required_token(SyntaxKind::Call)
                 .optional_schema_name_group()
-                .one_of(vec![SyntaxKind::Ident, SyntaxKind::VersionP])
+                .ident_like()
                 .required_token(SyntaxKind::Ascii40)
                 .any_tokens(None)
                 .required_token(SyntaxKind::Ascii41),
@@ -328,7 +338,7 @@ pub static STATEMENT_DEFINITIONS: LazyLock<HashMap<SyntaxKind, Vec<StatementDefi
                     .required_token(SyntaxKind::Table)
                     .optional_if_not_exists_group()
                     .optional_schema_name_group()
-                    .required_token(SyntaxKind::Ident),
+                    .ident_like(),
             )
             .with_prohibited_following_statements(vec![SyntaxKind::TransactionStmt]),
         );
@@ -381,7 +391,7 @@ pub static STATEMENT_DEFINITIONS: LazyLock<HashMap<SyntaxKind, Vec<StatementDefi
                 ])
                 .optional_if_exists_group()
                 .optional_schema_name_group()
-                .required_token(SyntaxKind::Ident),
+                .ident_like(),
         ));
 
         m.push(StatementDefinition::new(
@@ -554,11 +564,7 @@ pub static STATEMENT_DEFINITIONS: LazyLock<HashMap<SyntaxKind, Vec<StatementDefi
                 .required_token(SyntaxKind::Function)
                 .optional_if_exists_group()
                 .optional_schema_name_group()
-                .one_of(vec![
-                    SyntaxKind::Ident,
-                    SyntaxKind::VersionP,
-                    SyntaxKind::Set,
-                ])
+                .ident_like()
                 .required_token(SyntaxKind::Ascii40)
                 .any_tokens(None)
                 .required_token(SyntaxKind::Ascii41),
@@ -684,6 +690,14 @@ pub static STATEMENT_DEFINITIONS: LazyLock<HashMap<SyntaxKind, Vec<StatementDefi
                 .required_token(SyntaxKind::Ident),
         ));
 
+        m.push(StatementDefinition::new(
+            SyntaxKind::FetchStmt,
+            SyntaxBuilder::new()
+                .required_token(SyntaxKind::Move)
+                .any_tokens(None)
+                .required_token(SyntaxKind::Ident),
+        ));
+
         m.push(StatementDefinition::new(
             SyntaxKind::VacuumStmt,
             SyntaxBuilder::new().required_token(SyntaxKind::Analyze),
@@ -769,6 +783,7 @@ pub static STATEMENT_DEFINITIONS: LazyLock<HashMap<SyntaxKind, Vec<StatementDefi
                 SyntaxKind::InsertStmt,
                 SyntaxKind::UpdateStmt,
                 SyntaxKind::DeleteStmt,
+                SyntaxKind::VariableSetStmt,
             ]),
         );
 
@@ -852,6 +867,14 @@ pub static STATEMENT_DEFINITIONS: LazyLock<HashMap<SyntaxKind, Vec<StatementDefi
             SyntaxBuilder::new().required_token(SyntaxKind::EndP),
         ));
 
+        m.push(StatementDefinition::new(
+            SyntaxKind::TransactionStmt,
+            SyntaxBuilder::new()
+                .required_token(SyntaxKind::Prepare)
+                .required_token(SyntaxKind::Transaction)
+                .required_token(SyntaxKind::Sconst),
+        ));
+
         m.push(StatementDefinition::new(
             SyntaxKind::TransactionStmt,
             SyntaxBuilder::new()
@@ -972,11 +995,7 @@ pub static STATEMENT_DEFINITIONS: LazyLock<HashMap<SyntaxKind, Vec<StatementDefi
                     .required_token(SyntaxKind::Table)
                     .optional_if_not_exists_group()
                     .optional_schema_name_group()
-                    .one_of(vec![
-                        SyntaxKind::Ident,
-                        SyntaxKind::VersionP,
-                        SyntaxKind::Simple,
-                    ])
+                    .ident_like()
                     .any_tokens(None)
                     .required_token(SyntaxKind::As)
                     .any_token(),
@@ -1019,6 +1038,7 @@ pub static STATEMENT_DEFINITIONS: LazyLock<HashMap<SyntaxKind, Vec<StatementDefi
                         SyntaxKind::Merge,
                         SyntaxKind::Execute,
                         SyntaxKind::Create,
+                        SyntaxKind::Declare,
                     ]),
             )
             .with_prohibited_following_statements(vec![
@@ -1030,6 +1050,7 @@ pub static STATEMENT_DEFINITIONS: LazyLock<HashMap<SyntaxKind, Vec<StatementDefi
                 SyntaxKind::MergeStmt,
                 SyntaxKind::ExecuteStmt,
                 SyntaxKind::CreateTableAsStmt,
+                SyntaxKind::DeclareCursorStmt,
             ]),
         );
 
@@ -1073,6 +1094,13 @@ pub static STATEMENT_DEFINITIONS: LazyLock<HashMap<SyntaxKind, Vec<StatementDefi
                 .required_token(SyntaxKind::Authorization),
         ));
 
+        m.push(StatementDefinition::new(
+            SyntaxKind::VariableSetStmt,
+            SyntaxBuilder::new()
+                .required_token(SyntaxKind::Set)
+                .required_token(SyntaxKind::Transaction),
+        ));
+
         m.push(StatementDefinition::new(
             SyntaxKind::VariableSetStmt,
             SyntaxBuilder::new()
diff --git a/crates/pg_statement_splitter/src/statement_splitter.rs b/crates/pg_statement_splitter/src/statement_splitter.rs
index a0c5aa53..08cc4940 100644
--- a/crates/pg_statement_splitter/src/statement_splitter.rs
+++ b/crates/pg_statement_splitter/src/statement_splitter.rs
@@ -1379,6 +1379,17 @@ ALTER MATERIALIZED VIEW mvtest_tvm SET SCHEMA mvtest_mvschema;
         assert_eq!(SyntaxKind::AlterObjectSchemaStmt, result[0].kind);
     }
 
+    #[test]
+    fn move_backward() {
+        let input = "
+MOVE BACKWARD ALL IN c1;
+";
+        let result = StatementSplitter::new(input).run();
+
+        assert_eq!(result.len(), 1);
+        assert_eq!(SyntaxKind::FetchStmt, result[0].kind);
+    }
+
     #[test]
     fn create_tbl_as_2() {
         let input = "
diff --git a/crates/pg_statement_splitter/tests/skipped.txt b/crates/pg_statement_splitter/tests/skipped.txt
index f301b568..1538545e 100644
--- a/crates/pg_statement_splitter/tests/skipped.txt
+++ b/crates/pg_statement_splitter/tests/skipped.txt
@@ -22,3 +22,6 @@ insert_conflict
 numeric_big
 opr_sanity
 case
+random
+rangetypes
+regproc

From 47529016835aa66ce11cc16c3c0ef17bc6c8a1fc Mon Sep 17 00:00:00 2001
From: psteinroe <philipp@steinroetter.com>
Date: Wed, 28 Aug 2024 09:47:30 +0200
Subject: [PATCH 16/19] fix: finished most regression tests

---
 crates/pg_statement_splitter/src/data.rs      | 147 ++++++++++---
 .../src/statement_splitter.rs                 | 206 ++++++++++++------
 crates/pg_statement_splitter/src/tracker.rs   |  37 +---
 .../pg_statement_splitter/tests/skipped.txt   |   5 +
 .../tests/statement_splitter_tests.rs         |  17 +-
 5 files changed, 282 insertions(+), 130 deletions(-)

diff --git a/crates/pg_statement_splitter/src/data.rs b/crates/pg_statement_splitter/src/data.rs
index 0505af8c..f3ef0de7 100644
--- a/crates/pg_statement_splitter/src/data.rs
+++ b/crates/pg_statement_splitter/src/data.rs
@@ -37,6 +37,7 @@ impl SyntaxBuilder {
             SyntaxKind::Cursor,
             SyntaxKind::Simple,
             SyntaxKind::Set,
+            SyntaxKind::Leakproof,
         ]));
         self
     }
@@ -93,6 +94,7 @@ pub struct StatementDefinition {
     pub tokens: Vec<SyntaxDefinition>,
     pub prohibited_following_statements: Vec<SyntaxKind>,
     pub prohibited_tokens: Vec<SyntaxKind>,
+    pub ignore_if_prohibited: bool,
 }
 
 impl StatementDefinition {
@@ -102,6 +104,7 @@ impl StatementDefinition {
             tokens: b.build(),
             prohibited_following_statements: Vec::new(),
             prohibited_tokens: Vec::new(),
+            ignore_if_prohibited: false,
         }
     }
 
@@ -114,6 +117,11 @@ impl StatementDefinition {
         self.prohibited_following_statements = prohibited;
         self
     }
+
+    fn with_ignore_if_prohibited(mut self) -> Self {
+        self.ignore_if_prohibited = true;
+        self
+    }
 }
 
 pub static STATEMENT_BRIDGE_DEFINITIONS: LazyLock<HashMap<SyntaxKind, Vec<StatementDefinition>>> =
@@ -190,6 +198,35 @@ pub static STATEMENT_DEFINITIONS: LazyLock<HashMap<SyntaxKind, Vec<StatementDefi
                 .any_token(),
         ));
 
+        // "TABLE t1;"
+        // is syntactic sugar for "SELECT * FROM t1"
+        m.push(
+            StatementDefinition::new(
+                SyntaxKind::SelectStmt,
+                SyntaxBuilder::new()
+                    .required_token(SyntaxKind::Table)
+                    .optional_schema_name_group()
+                    .ident_like()
+                    // this is polluting too much so we require a ";" for now...
+                    .required_token(SyntaxKind::Ascii59),
+            )
+            // this pollutes the "prohibited following statements" logic too much
+            // so we need to ignore it as a prohibited statement
+            .with_ignore_if_prohibited(),
+        );
+
+        // VALUES is also legal as a standalone query
+        // e.g. VALUES (1,2), (3,4+4), (7,77.7);
+        // todo use repeated group
+        m.push(StatementDefinition::new(
+            SyntaxKind::SelectStmt,
+            SyntaxBuilder::new()
+                .required_token(SyntaxKind::Values)
+                .required_token(SyntaxKind::Ascii40)
+                .any_tokens(None)
+                .required_token(SyntaxKind::Ascii41),
+        ));
+
         m.push(
             StatementDefinition::new(
                 SyntaxKind::InsertStmt,
@@ -199,7 +236,10 @@ pub static STATEMENT_DEFINITIONS: LazyLock<HashMap<SyntaxKind, Vec<StatementDefi
                     .optional_schema_name_group()
                     .ident_like(),
             )
-            .with_prohibited_following_statements(vec![SyntaxKind::SelectStmt]),
+            .with_prohibited_following_statements(vec![
+                SyntaxKind::SelectStmt,
+                SyntaxKind::VariableSetStmt,
+            ]),
         );
 
         m.push(StatementDefinition::new(
@@ -234,18 +274,34 @@ pub static STATEMENT_DEFINITIONS: LazyLock<HashMap<SyntaxKind, Vec<StatementDefi
                 .required_token(SyntaxKind::Ident),
         ));
 
+        m.push(
+            StatementDefinition::new(
+                SyntaxKind::AlterTableStmt,
+                SyntaxBuilder::new()
+                    .required_token(SyntaxKind::Alter)
+                    .optional_token(SyntaxKind::Materialized)
+                    .optional_token(SyntaxKind::Foreign)
+                    .one_of(vec![SyntaxKind::Table, SyntaxKind::Index, SyntaxKind::View])
+                    .optional_if_exists_group()
+                    .optional_token(SyntaxKind::Only)
+                    .optional_schema_name_group()
+                    .ident_like()
+                    .any_token(),
+            )
+            .with_prohibited_tokens(vec![SyntaxKind::Rename]),
+        );
+
+        // no idea why this is an AlterTableStmt
         m.push(StatementDefinition::new(
             SyntaxKind::AlterTableStmt,
             SyntaxBuilder::new()
                 .required_token(SyntaxKind::Alter)
-                .optional_token(SyntaxKind::Materialized)
-                .optional_token(SyntaxKind::Foreign)
-                .one_of(vec![SyntaxKind::Table, SyntaxKind::Index, SyntaxKind::View])
+                .required_token(SyntaxKind::Sequence)
                 .optional_if_exists_group()
-                .optional_token(SyntaxKind::Only)
                 .optional_schema_name_group()
                 .ident_like()
-                .any_token(),
+                .required_token(SyntaxKind::Set)
+                .one_of(vec![SyntaxKind::Logged, SyntaxKind::Unlogged]),
         ));
 
         m.push(StatementDefinition::new(
@@ -364,7 +420,7 @@ pub static STATEMENT_DEFINITIONS: LazyLock<HashMap<SyntaxKind, Vec<StatementDefi
                 .required_token(SyntaxKind::For)
                 .required_token(SyntaxKind::TypeP)
                 .optional_schema_name_group()
-                .required_token(SyntaxKind::Ident)
+                .one_of(vec![SyntaxKind::Ident, SyntaxKind::TextP])
                 .required_token(SyntaxKind::Using),
         ));
 
@@ -679,7 +735,11 @@ pub static STATEMENT_DEFINITIONS: LazyLock<HashMap<SyntaxKind, Vec<StatementDefi
                 .required_token(SyntaxKind::On)
                 .any_tokens(None)
                 .required_token(SyntaxKind::Is)
-                .one_of(vec![SyntaxKind::Ident, SyntaxKind::Sconst]),
+                .one_of(vec![
+                    SyntaxKind::Ident,
+                    SyntaxKind::Sconst,
+                    SyntaxKind::NullP,
+                ]),
         ));
 
         m.push(StatementDefinition::new(
@@ -875,6 +935,14 @@ pub static STATEMENT_DEFINITIONS: LazyLock<HashMap<SyntaxKind, Vec<StatementDefi
                 .required_token(SyntaxKind::Sconst),
         ));
 
+        m.push(StatementDefinition::new(
+            SyntaxKind::TransactionStmt,
+            SyntaxBuilder::new()
+                .required_token(SyntaxKind::Start)
+                .required_token(SyntaxKind::Transaction)
+                .any_token(),
+        ));
+
         m.push(StatementDefinition::new(
             SyntaxKind::TransactionStmt,
             SyntaxBuilder::new()
@@ -998,9 +1066,18 @@ pub static STATEMENT_DEFINITIONS: LazyLock<HashMap<SyntaxKind, Vec<StatementDefi
                     .ident_like()
                     .any_tokens(None)
                     .required_token(SyntaxKind::As)
-                    .any_token(),
+                    .one_of(vec![
+                        SyntaxKind::With,
+                        SyntaxKind::Select,
+                        SyntaxKind::Values,
+                        SyntaxKind::Table,
+                        SyntaxKind::Execute,
+                    ]),
             )
-            .with_prohibited_following_statements(vec![SyntaxKind::SelectStmt]),
+            .with_prohibited_following_statements(vec![
+                SyntaxKind::SelectStmt,
+                SyntaxKind::ExecuteStmt,
+            ]),
         );
 
         m.push(
@@ -1039,18 +1116,22 @@ pub static STATEMENT_DEFINITIONS: LazyLock<HashMap<SyntaxKind, Vec<StatementDefi
                         SyntaxKind::Execute,
                         SyntaxKind::Create,
                         SyntaxKind::Declare,
+                        SyntaxKind::Create,
                     ]),
             )
             .with_prohibited_following_statements(vec![
                 SyntaxKind::VacuumStmt,
                 SyntaxKind::SelectStmt,
+                SyntaxKind::CreateTableAsStmt,
                 SyntaxKind::InsertStmt,
                 SyntaxKind::DeleteStmt,
                 SyntaxKind::UpdateStmt,
                 SyntaxKind::MergeStmt,
                 SyntaxKind::ExecuteStmt,
-                SyntaxKind::CreateTableAsStmt,
+                SyntaxKind::CreateStmt,
                 SyntaxKind::DeclareCursorStmt,
+                // todo remove this again when we include all deps
+                SyntaxKind::VariableSetStmt,
             ]),
         );
 
@@ -1114,6 +1195,7 @@ pub static STATEMENT_DEFINITIONS: LazyLock<HashMap<SyntaxKind, Vec<StatementDefi
             SyntaxKind::VariableSetStmt,
             SyntaxBuilder::new()
                 .required_token(SyntaxKind::Set)
+                .optional_token(SyntaxKind::Local)
                 .required_token(SyntaxKind::Session)
                 .required_token(SyntaxKind::Authorization)
                 .one_of(vec![SyntaxKind::Ident, SyntaxKind::Sconst]),
@@ -1176,7 +1258,7 @@ pub static STATEMENT_DEFINITIONS: LazyLock<HashMap<SyntaxKind, Vec<StatementDefi
             SyntaxKind::AlterRoleStmt,
             SyntaxBuilder::new()
                 .required_token(SyntaxKind::Alter)
-                .required_token(SyntaxKind::Role)
+                .one_of(vec![SyntaxKind::Role, SyntaxKind::User])
                 .required_token(SyntaxKind::Ident),
         ));
 
@@ -1258,6 +1340,7 @@ pub static STATEMENT_DEFINITIONS: LazyLock<HashMap<SyntaxKind, Vec<StatementDefi
             .with_prohibited_following_statements(vec![
                 SyntaxKind::CreateTableAsStmt,
                 SyntaxKind::CreateStmt,
+                SyntaxKind::SelectStmt,
                 SyntaxKind::IndexStmt,
                 SyntaxKind::CreateSeqStmt,
                 SyntaxKind::CreateTrigStmt,
@@ -1742,23 +1825,31 @@ pub static STATEMENT_DEFINITIONS: LazyLock<HashMap<SyntaxKind, Vec<StatementDefi
                 .required_token(SyntaxKind::To),
         ));
 
-        m.push(StatementDefinition::new(
-            SyntaxKind::GrantStmt,
-            SyntaxBuilder::new()
-                .required_token(SyntaxKind::Revoke)
-                .any_tokens(None)
-                .required_token(SyntaxKind::On),
-        ));
+        m.push(
+            StatementDefinition::new(
+                SyntaxKind::GrantStmt,
+                SyntaxBuilder::new()
+                    .required_token(SyntaxKind::Revoke)
+                    .any_tokens(None)
+                    .required_token(SyntaxKind::On),
+            )
+            .with_prohibited_following_statements(vec![SyntaxKind::SelectStmt]),
+        );
 
-        m.push(StatementDefinition::new(
-            SyntaxKind::AlterOwnerStmt,
-            SyntaxBuilder::new()
-                .required_token(SyntaxKind::Alter)
-                .any_tokens(None)
-                .required_token(SyntaxKind::Owner)
-                .required_token(SyntaxKind::To)
-                .required_token(SyntaxKind::Ident),
-        ));
+        m.push(
+            StatementDefinition::new(
+                SyntaxKind::AlterOwnerStmt,
+                SyntaxBuilder::new()
+                    .required_token(SyntaxKind::Alter)
+                    .any_tokens(None)
+                    .required_token(SyntaxKind::Owner)
+                    .required_token(SyntaxKind::To)
+                    .required_token(SyntaxKind::Ident),
+            )
+            // dont ask why, but it seems like tables are special
+            // and altering their owner is an AlterTableStmt
+            .with_prohibited_tokens(vec![SyntaxKind::Table]),
+        );
 
         m.push(StatementDefinition::new(
             SyntaxKind::AlterObjectSchemaStmt,
diff --git a/crates/pg_statement_splitter/src/statement_splitter.rs b/crates/pg_statement_splitter/src/statement_splitter.rs
index 08cc4940..12011ff3 100644
--- a/crates/pg_statement_splitter/src/statement_splitter.rs
+++ b/crates/pg_statement_splitter/src/statement_splitter.rs
@@ -15,6 +15,7 @@ pub(crate) struct StatementSplitter<'a> {
     sub_trx_depth: usize,
     sub_stmt_depth: usize,
     is_within_atomic_block: bool,
+    sub_case_stmt_depth: usize,
 }
 
 #[derive(Debug, Clone)]
@@ -34,6 +35,7 @@ impl<'a> StatementSplitter<'a> {
             sub_trx_depth: 0,
             sub_stmt_depth: 0,
             is_within_atomic_block: false,
+            sub_case_stmt_depth: 0,
         }
     }
 
@@ -45,6 +47,9 @@ impl<'a> StatementSplitter<'a> {
             }
             SyntaxKind::EndP => {
                 self.is_within_atomic_block = false;
+                if self.sub_case_stmt_depth > 0 {
+                    self.sub_case_stmt_depth -= 1;
+                }
             }
             _ => {}
         };
@@ -52,6 +57,9 @@ impl<'a> StatementSplitter<'a> {
 
     fn start_nesting(&mut self) {
         match self.parser.nth(0, false).kind {
+            SyntaxKind::Case => {
+                self.sub_case_stmt_depth += 1;
+            }
             SyntaxKind::Ascii40 => {
                 // "("
                 self.sub_stmt_depth += 1;
@@ -79,8 +87,6 @@ impl<'a> StatementSplitter<'a> {
             keep
         });
 
-        println!("removed items: {:?}", removed_items);
-
         removed_items.iter().min().map(|i| *i)
     }
 
@@ -103,7 +109,11 @@ impl<'a> StatementSplitter<'a> {
     }
 
     fn start_new_statements(&mut self) {
-        if self.sub_trx_depth != 0 || self.sub_stmt_depth != 0 || self.is_within_atomic_block {
+        if self.sub_trx_depth != 0
+            || self.sub_stmt_depth != 0
+            || self.is_within_atomic_block
+            || self.sub_case_stmt_depth != 0
+        {
             return;
         }
 
@@ -129,18 +139,19 @@ impl<'a> StatementSplitter<'a> {
                 .filter_map(|stmt| {
                     if self.active_bridges.iter().any(|b| b.def.stmt == stmt.stmt) {
                         None
-                    } else if self
-                        .tracked_statements
-                        .iter_mut()
-                        .any(|s| !s.can_start_stmt_after(&stmt.stmt, self.parser.pos))
-                    {
+                    } else if self.tracked_statements.iter_mut().any(|s| {
+                        !s.can_start_stmt_after(
+                            &stmt.stmt,
+                            self.parser.pos,
+                            stmt.ignore_if_prohibited,
+                        )
+                    }) {
                         None
                     } else {
                         Some(Tracker::new_at(stmt, self.parser.pos))
                     }
                 })
                 .collect();
-            println!("adding stmt: {:?}", to_add);
             self.tracked_statements.append(to_add);
         }
     }
@@ -162,7 +173,6 @@ impl<'a> StatementSplitter<'a> {
     }
 
     fn close_stmt_with_semicolon(&mut self) {
-        println!("closing stmt with semicolon");
         let at_token = self.parser.nth(0, false);
         assert_eq!(at_token.kind, SyntaxKind::Ascii59);
 
@@ -171,7 +181,6 @@ impl<'a> StatementSplitter<'a> {
         // "create rule qqq as on insert to copydml_test do instead (delete from copydml_test; delete from copydml_test);"
         // so we need to check for sub statement depth here
         if self.sub_stmt_depth != 0 || self.is_within_atomic_block {
-            println!("sub stmt depth != 0 or within atomic block");
             return;
         }
 
@@ -189,27 +198,10 @@ impl<'a> StatementSplitter<'a> {
                 .filter(|s| {
                     s.started_at == earliest_complete_stmt_started_at && s.could_be_complete()
                 })
-                .max_by_key(|stmt| {
-                    println!("stmt: {:?} max pos: {:?}", stmt.def.stmt, stmt.max_pos());
-                    stmt.max_pos()
-                })
+                .max_by_key(|stmt| stmt.max_pos())
                 .unwrap();
 
-            println!("earliest complete stmt: {:?}", earliest_complete_stmt);
-            assert_eq!(
-                1,
-                self.tracked_statements
-                    .iter()
-                    .filter(|s| {
-                        s.started_at == earliest_complete_stmt_started_at
-                            && s.could_be_complete()
-                            && s.current_positions()
-                                .iter()
-                                .any(|i| earliest_complete_stmt.current_positions().contains(i))
-                    })
-                    .count(),
-                "multiple complete statements at the same position"
-            );
+            self.assert_single_complete_statement_at_position(earliest_complete_stmt);
 
             let end_pos = at_token.span.end();
             let start_pos = TextSize::try_from(
@@ -221,10 +213,6 @@ impl<'a> StatementSplitter<'a> {
                     .start(),
             )
             .unwrap();
-            println!(
-                "adding stmt from ';': {:?}",
-                earliest_complete_stmt.def.stmt
-            );
             self.ranges.push(StatementPosition {
                 kind: earliest_complete_stmt.def.stmt,
                 range: TextRange::new(start_pos, end_pos),
@@ -275,19 +263,25 @@ impl<'a> StatementSplitter<'a> {
     }
 
     fn assert_single_complete_statement_at_position(&self, tracker: &Tracker<'a>) {
+        let complete_stmts = self
+            .tracked_statements
+            .iter()
+            .filter(|s| {
+                s.started_at == tracker.started_at
+                    && s.could_be_complete()
+                    && s.current_positions()
+                        .iter()
+                        .any(|i| tracker.current_positions().contains(i))
+            })
+            .collect::<Vec<_>>();
         assert_eq!(
             1,
-            self.tracked_statements
+            complete_stmts.len(),
+            "multiple complete statements at the same position: {:?}",
+            complete_stmts
                 .iter()
-                .filter(|s| {
-                    s.started_at == tracker.started_at
-                        && s.could_be_complete()
-                        && s.current_positions()
-                            .iter()
-                            .any(|i| tracker.current_positions().contains(i))
-                })
-                .count(),
-            "multiple complete statements at the same position"
+                .map(|s| s.def.stmt)
+                .collect::<Vec<_>>()
         );
     }
 
@@ -297,18 +291,6 @@ impl<'a> StatementSplitter<'a> {
                 self.parser.advance();
                 continue;
             }
-            println!(
-                "#{:?}: {:?}",
-                self.parser.pos,
-                self.parser.nth(0, false).kind
-            );
-            println!(
-                "tracked stmts before {:?}",
-                self.tracked_statements
-                    .iter()
-                    .map(|s| s.def.stmt)
-                    .collect::<Vec<_>>()
-            );
 
             self.start_nesting();
 
@@ -322,14 +304,6 @@ impl<'a> StatementSplitter<'a> {
 
             self.start_new_bridges();
 
-            println!(
-                "tracked stmts after {:?}",
-                self.tracked_statements
-                    .iter()
-                    .map(|s| s.def.stmt)
-                    .collect::<Vec<_>>()
-            );
-
             if self.parser.nth(0, false).kind == SyntaxKind::Ascii59 {
                 self.close_stmt_with_semicolon();
             }
@@ -389,10 +363,6 @@ impl<'a> StatementSplitter<'a> {
         if let Some(earliest_complete_stmt_started_at) =
             self.find_earliest_complete_statement_start_pos()
         {
-            println!(
-                "earliest complete stmt started at: {:?}",
-                earliest_complete_stmt_started_at
-            );
             let earliest_complete_stmt =
                 self.find_highest_positioned_complete_statement(earliest_complete_stmt_started_at);
 
@@ -403,8 +373,6 @@ impl<'a> StatementSplitter<'a> {
             let end_token = self.parser.lookbehind(1, true, None).unwrap();
             let end_pos = end_token.span.end();
 
-            println!("adding stmt at end: {:?}", earliest_complete_stmt.def.stmt);
-            println!("start: {:?}, end: {:?}", start_pos, end_pos);
             self.ranges.push(StatementPosition {
                 kind: earliest_complete_stmt.def.stmt,
                 range: TextRange::new(start_pos, end_pos),
@@ -415,13 +383,11 @@ impl<'a> StatementSplitter<'a> {
         }
 
         if let Some(earliest_stmt_started_at) = self.find_earliest_statement_start_pos() {
-            println!("earliest stmt started at: {:?}", earliest_stmt_started_at);
             let start_pos = self.token_range(earliest_stmt_started_at).start();
 
             // end position is last non-whitespace token before or at the current position
             let end_pos = self.parser.lookbehind(1, true, None).unwrap().span.end();
 
-            println!("adding any stmt at end");
             self.ranges.push(StatementPosition {
                 kind: SyntaxKind::Any,
                 range: TextRange::new(start_pos, end_pos),
@@ -452,6 +418,11 @@ select lower('test');
 
         let result = StatementSplitter::new(input).run();
 
+        for r in &result {
+            println!("{:?} {:?}", r.kind, r.range);
+            println!("'{}'", input[r.range].to_string());
+        }
+
         assert_eq!(result.len(), 4);
         assert_eq!(
             "select id, name, test1231234123, unknown from co;",
@@ -1420,6 +1391,97 @@ CREATE TABLE tab_settings_flags AS SELECT name, category,
         assert_eq!(SyntaxKind::CreateTableAsStmt, result[0].kind);
     }
 
+    #[test]
+    fn alter_table_owner() {
+        let input = "
+ALTER TABLE seclabel_tbl1 OWNER TO regress_seclabel_user1;
+";
+        let result = StatementSplitter::new(input).run();
+
+        assert_eq!(result.len(), 1);
+        assert_eq!(SyntaxKind::AlterTableStmt, result[0].kind);
+    }
+
+    #[test]
+    fn alter_table_rename() {
+        let input = "
+ALTER TABLE foo_seq RENAME TO foo_seq_new;
+";
+        let result = StatementSplitter::new(input).run();
+
+        assert_eq!(result.len(), 1);
+        assert_eq!(SyntaxKind::RenameStmt, result[0].kind);
+    }
+
+    #[test]
+    fn alter_seq() {
+        let input = "
+ALTER SEQUENCE sequence_test_unlogged SET LOGGED;
+";
+        let result = StatementSplitter::new(input).run();
+
+        assert_eq!(result.len(), 1);
+        assert_eq!(SyntaxKind::AlterTableStmt, result[0].kind);
+    }
+
+    #[test]
+    fn create_op_class() {
+        let input = "
+create operator class part_test_text_ops for type text using hash as
+    operator 1 =,
+    function 2 part_hashtext_length(text, int8);
+";
+        let result = StatementSplitter::new(input).run();
+
+        assert_eq!(result.len(), 1);
+        assert_eq!(SyntaxKind::CreateOpClassStmt, result[0].kind);
+    }
+
+    #[test]
+    fn case_end() {
+        let input = "
+SELECT q1, case when q1 > 0 then generate_series(1,3) else 0 end FROM int8_tbl;
+";
+        let result = StatementSplitter::new(input).run();
+
+        assert_eq!(result.len(), 1);
+        assert_eq!(SyntaxKind::SelectStmt, result[0].kind);
+    }
+
+    #[test]
+    fn just_table() {
+        // wtf?
+        let input = "
+TABLE t1;
+";
+        let result = StatementSplitter::new(input).run();
+
+        assert_eq!(result.len(), 1);
+        assert_eq!(SyntaxKind::SelectStmt, result[0].kind);
+    }
+
+    #[test]
+    fn explain_create_table() {
+        let input = "
+explain (costs off) create table parallel_write as select length(stringu1) from tenk1 group by length(stringu1);
+";
+        let result = StatementSplitter::new(input).run();
+
+        assert_eq!(result.len(), 1);
+        assert_eq!(SyntaxKind::ExplainStmt, result[0].kind);
+    }
+
+    #[test]
+    fn create_table_as_execute() {
+        let input = "
+create table parallel_write as execute prep_stmt;
+";
+        let result = StatementSplitter::new(input).run();
+
+        assert_eq!(result.len(), 1);
+        assert_eq!(SyntaxKind::CreateTableAsStmt, result[0].kind);
+    }
+
     #[allow(clippy::must_use)]
     fn debug(input: &str) {
         for s in input.split(';').filter_map(|s| {
diff --git a/crates/pg_statement_splitter/src/tracker.rs b/crates/pg_statement_splitter/src/tracker.rs
index 771085dc..247336e6 100644
--- a/crates/pg_statement_splitter/src/tracker.rs
+++ b/crates/pg_statement_splitter/src/tracker.rs
@@ -51,7 +51,12 @@ impl<'a> Tracker<'a> {
         }
     }
 
-    pub fn can_start_stmt_after(&mut self, kind: &SyntaxKind, at: usize) -> bool {
+    pub fn can_start_stmt_after(
+        &mut self,
+        kind: &SyntaxKind,
+        at: usize,
+        ignore_if_prohibited: bool,
+    ) -> bool {
         if let Some(x) = self
             .used_prohibited_statements
             .iter()
@@ -68,7 +73,9 @@ impl<'a> Tracker<'a> {
             self.could_be_complete() && self.def.prohibited_following_statements.contains(kind);
 
         if res {
-            self.used_prohibited_statements.push((at, kind.clone()));
+            if !ignore_if_prohibited {
+                self.used_prohibited_statements.push((at, kind.clone()));
+            }
             return false;
         }
 
@@ -154,39 +161,25 @@ impl<'a> Tracker<'a> {
 
         let mut new_positions = Vec::with_capacity(self.positions.len());
 
-        println!(
-            "advancing with {:?} and positions {:?}",
-            kind,
-            self.positions
-                .iter()
-                .map(|x| self.def.tokens.get(x.idx))
-                .collect::<Vec<_>>()
-        );
-
         for mut pos in self.positions.drain(..) {
-            println!("advancing pos {:?}", pos);
             match self.def.tokens.get(pos.idx) {
                 Some(SyntaxDefinition::RequiredToken(k)) => {
-                    println!("required token {:?}", k);
                     pos.advance();
                     if k == kind {
                         new_positions.push(pos);
                     }
                 }
                 Some(SyntaxDefinition::AnyToken) => {
-                    println!("any token");
                     pos.advance();
                     new_positions.push(pos);
                 }
                 Some(SyntaxDefinition::OneOf(kinds)) => {
-                    println!("one of {:?}", kinds);
                     if kinds.iter().any(|x| x == kind) {
                         pos.advance();
                         new_positions.push(pos);
                     }
                 }
                 Some(SyntaxDefinition::OptionalToken(k)) => {
-                    println!("optional token {:?}", k);
                     if k == kind {
                         pos.advance();
                         new_positions.push(pos);
@@ -197,7 +190,6 @@ impl<'a> Tracker<'a> {
                     }
                 }
                 Some(SyntaxDefinition::AnyTokens(maybe_tokens)) => {
-                    println!("any tokens {:?}", maybe_tokens);
                     let next_positions =
                         Tracker::next_possible_positions_from_with(self.def, &pos, kind);
 
@@ -216,7 +208,6 @@ impl<'a> Tracker<'a> {
                     }
                 }
                 Some(SyntaxDefinition::OptionalGroup(tokens)) => {
-                    println!("optional group {:?}", tokens);
                     if pos.group_idx == 0 {
                         // if we are at the beginning of the group, we also need to spawn new
                         // trackers for every possible next token
@@ -228,12 +219,10 @@ impl<'a> Tracker<'a> {
                     // advance group
                     let token = tokens.get(pos.group_idx).unwrap();
                     if token == kind {
-                        println!("advancing group");
                         pos.advance_group();
 
                         // if we reached the end of the group, we advance the position
                         if pos.group_idx == tokens.len() {
-                            println!("advancing pos after group");
                             pos.advance();
                         }
 
@@ -249,14 +238,6 @@ impl<'a> Tracker<'a> {
 
         self.positions = new_positions;
 
-        println!(
-            "new positions {:?}",
-            self.positions
-                .iter()
-                .map(|x| self.def.tokens.get(x.idx))
-                .collect::<Vec<_>>()
-        );
-
         self.positions.len() != 0
     }
 
diff --git a/crates/pg_statement_splitter/tests/skipped.txt b/crates/pg_statement_splitter/tests/skipped.txt
index 1538545e..f4ad8809 100644
--- a/crates/pg_statement_splitter/tests/skipped.txt
+++ b/crates/pg_statement_splitter/tests/skipped.txt
@@ -25,3 +25,8 @@ case
 random
 rangetypes
 regproc
+rowtypes
+sanity_check
+select_distinct
+text
+union
diff --git a/crates/pg_statement_splitter/tests/statement_splitter_tests.rs b/crates/pg_statement_splitter/tests/statement_splitter_tests.rs
index 429f18fd..2fc69f74 100644
--- a/crates/pg_statement_splitter/tests/statement_splitter_tests.rs
+++ b/crates/pg_statement_splitter/tests/statement_splitter_tests.rs
@@ -1,5 +1,8 @@
 use insta::{assert_debug_snapshot, Settings};
-use std::fs::{self};
+use std::{
+    fs::{self},
+    panic,
+};
 
 use pg_lexer::SyntaxKind;
 
@@ -71,7 +74,17 @@ fn test_postgres_regress() {
 
         let libpg_query_split = libpg_query_split_result.unwrap();
 
-        let split = pg_statement_splitter::statements(&contents);
+        let result = panic::catch_unwind(|| pg_statement_splitter::statements(&contents));
+
+        if result.is_err() {
+            panic!(
+                "Failed to split statements for test '{}': {:?}",
+                test_name,
+                result.unwrap_err()
+            );
+        }
+
+        let split = result.unwrap();
 
         // assert_eq!(
         //     libpg_query_split.len(),

From d09f95cb94372afe60078c4d79ddcb75063e08dc Mon Sep 17 00:00:00 2001
From: psteinroe <philipp@steinroetter.com>
Date: Wed, 28 Aug 2024 10:42:34 +0200
Subject: [PATCH 17/19] fix: build

---
 crates/pg_base_db/src/change.rs   | 3 +--
 crates/pg_base_db/src/document.rs | 1 -
 2 files changed, 1 insertion(+), 3 deletions(-)

diff --git a/crates/pg_base_db/src/change.rs b/crates/pg_base_db/src/change.rs
index 26a926ff..4c7b7632 100644
--- a/crates/pg_base_db/src/change.rs
+++ b/crates/pg_base_db/src/change.rs
@@ -126,7 +126,6 @@ impl Change {
             );
             // TODO also use errors returned by extract sql statement ranges
             doc.statement_ranges = pg_statement_splitter::split(&self.text)
-                .ranges
                 .iter()
                 .map(|r| r.clone())
                 .collect();
@@ -248,7 +247,7 @@ impl Change {
                         + 1,
             );
 
-            for range in pg_statement_splitter::split(extracted_text).ranges {
+            for range in pg_statement_splitter::split(extracted_text) {
                 match doc
                     .statement_ranges
                     .binary_search_by(|r| r.start().cmp(&range.start()))
diff --git a/crates/pg_base_db/src/document.rs b/crates/pg_base_db/src/document.rs
index a9838833..0e7297b2 100644
--- a/crates/pg_base_db/src/document.rs
+++ b/crates/pg_base_db/src/document.rs
@@ -50,7 +50,6 @@ impl Document {
                 || Vec::new(),
                 |f| {
                     pg_statement_splitter::split(&f)
-                        .ranges
                         .iter()
                         .map(|range| range.clone())
                         .collect()

From a096c57391670212cbd84ab0cdb4b70ab6dff924 Mon Sep 17 00:00:00 2001
From: psteinroe <philipp@steinroetter.com>
Date: Wed, 28 Aug 2024 10:44:32 +0200
Subject: [PATCH 18/19] chore: cleanup parser

---
 crates/pg_statement_splitter/src/parser.rs | 79 ----------------------
 1 file changed, 79 deletions(-)

diff --git a/crates/pg_statement_splitter/src/parser.rs b/crates/pg_statement_splitter/src/parser.rs
index 1ef24447..fba0297e 100644
--- a/crates/pg_statement_splitter/src/parser.rs
+++ b/crates/pg_statement_splitter/src/parser.rs
@@ -1,18 +1,6 @@
-use std::cmp::min;
-
 use pg_lexer::{SyntaxKind, Token, TokenType, WHITESPACE_TOKENS};
-use text_size::{TextRange, TextSize};
-
-use crate::syntax_error::SyntaxError;
 
-/// Main parser that exposes the `cstree` api, and collects errors and statements
 pub struct Parser {
-    /// The ranges of the statements
-    ranges: Vec<(usize, usize)>,
-    /// The syntax errors accumulated during parsing
-    errors: Vec<SyntaxError>,
-    /// The start of the current statement, if any
-    current_stmt_start: Option<usize>,
     /// The tokens to parse
     pub tokens: Vec<Token>,
     /// The current position in the token stream
@@ -23,62 +11,16 @@ pub struct Parser {
     eof_token: Token,
 }
 
-/// Result of Building
-#[derive(Debug)]
-pub struct Parse {
-    /// The ranges of the errors
-    pub ranges: Vec<TextRange>,
-    /// The syntax errors accumulated during parsing
-    pub errors: Vec<SyntaxError>,
-}
-
 impl Parser {
     pub fn new(tokens: Vec<Token>) -> Self {
         Self {
             eof_token: Token::eof(usize::from(tokens.last().unwrap().span.end())),
-            ranges: Vec::new(),
-            errors: Vec::new(),
-            current_stmt_start: None,
             tokens,
             pos: 0,
             whitespace_token_buffer: None,
         }
     }
 
-    pub fn finish(self) -> Parse {
-        Parse {
-            ranges: self
-                .ranges
-                .iter()
-                .map(|(start, end)| {
-                    let from = self.tokens.get(*start);
-                    let to = self.tokens.get(end - 1);
-                    // get text range from token range
-                    let text_start = from.unwrap().span.start();
-                    let text_end = to.unwrap().span.end();
-
-                    TextRange::new(
-                        TextSize::try_from(text_start).unwrap(),
-                        TextSize::try_from(text_end).unwrap(),
-                    )
-                })
-                .collect(),
-            errors: self.errors,
-        }
-    }
-
-    /// collects an SyntaxError with an `error` message at `pos`
-    pub fn error_at_pos(&mut self, error: String, pos: usize) {
-        self.errors.push(SyntaxError::new_at_offset(
-            error,
-            self.tokens
-                .get(min(self.tokens.len() - 1, pos))
-                .unwrap()
-                .span
-                .start(),
-        ));
-    }
-
     /// applies token and advances
     pub fn advance(&mut self) {
         assert!(!self.eof());
@@ -203,25 +145,4 @@ impl Parser {
     pub fn at(&self, kind: SyntaxKind) -> bool {
         self.nth(0, false).kind == kind
     }
-
-    pub fn expect(&mut self, kind: SyntaxKind) {
-        if self.eat(kind) {
-            return;
-        }
-        if self.whitespace_token_buffer.is_some() {
-            self.error_at_pos(
-                format!(
-                    "Expected {:#?}, found {:#?}",
-                    kind,
-                    self.tokens[self.whitespace_token_buffer.unwrap()].kind
-                ),
-                self.whitespace_token_buffer.unwrap(),
-            );
-        } else {
-            self.error_at_pos(
-                format!("Expected {:#?}, found {:#?}", kind, self.nth(0, false)),
-                self.pos + 1,
-            );
-        }
-    }
 }

From e72146d95b3818fb5c900de0fdfb70a5bf0b2539 Mon Sep 17 00:00:00 2001
From: psteinroe <philipp@steinroetter.com>
Date: Tue, 1 Oct 2024 19:06:47 +0200
Subject: [PATCH 19/19] fix: save

---
 Cargo.lock                                    | 255 +++++++-
 crates/pg_statement_splitter/Cargo.toml       |   5 +
 .../benches/pg_statement_splitter.rs          |  67 ++
 crates/pg_statement_splitter/src/data.rs      | 199 ++++--
 crates/pg_statement_splitter/src/lib.rs       |   1 +
 .../src/statement_splitter.rs                 | 136 +++-
 crates/pg_statement_splitter/src/tracker.rs   | 407 +++++++-----
 .../pg_statement_splitter/src/tracker_new.rs  | 587 ++++++++++++++++++
 .../pg_statement_splitter/tests/skipped.txt   |   2 +
 .../tests/skipped_statements.txt              |   2 +
 .../tests/statement_splitter_tests.rs         |  12 +-
 11 files changed, 1468 insertions(+), 205 deletions(-)
 create mode 100644 crates/pg_statement_splitter/benches/pg_statement_splitter.rs
 create mode 100644 crates/pg_statement_splitter/src/tracker_new.rs
 create mode 100644 crates/pg_statement_splitter/tests/skipped_statements.txt

diff --git a/Cargo.lock b/Cargo.lock
index 71ef619c..5aa27e7a 100644
--- a/Cargo.lock
+++ b/Cargo.lock
@@ -36,6 +36,18 @@ version = "0.2.16"
 source = "registry+https://github.com/rust-lang/crates.io-index"
 checksum = "0942ffc6dcaadf03badf6e6a2d0228460359d5e34b57ccdc720b7382dfbd5ec5"
 
+[[package]]
+name = "anes"
+version = "0.1.6"
+source = "registry+https://github.com/rust-lang/crates.io-index"
+checksum = "4b46cbb362ab8752921c97e041f5e366ee6297bd428a31275b9fcf1e380f7299"
+
+[[package]]
+name = "anstyle"
+version = "1.0.8"
+source = "registry+https://github.com/rust-lang/crates.io-index"
+checksum = "1bec1de6f59aedf83baf9ff929c98f2ad654b97c9510f4e70cf6f661d49fd5b1"
+
 [[package]]
 name = "anyhow"
 version = "1.0.81"
@@ -309,6 +321,12 @@ version = "1.5.0"
 source = "registry+https://github.com/rust-lang/crates.io-index"
 checksum = "a2bd12c1caf447e69cd4528f47f94d203fd2582878ecb9e9465484c4148a8223"
 
+[[package]]
+name = "cast"
+version = "0.3.0"
+source = "registry+https://github.com/rust-lang/crates.io-index"
+checksum = "37b2a672a2cb129a2e41c10b1224bb368f9f37a2b16b612598138befd7b37eb5"
+
 [[package]]
 name = "cc"
 version = "1.0.83"
@@ -333,6 +351,33 @@ version = "1.0.0"
 source = "registry+https://github.com/rust-lang/crates.io-index"
 checksum = "baf1de4339761588bc0619e3cbc0120ee582ebb74b53b4efbf79117bd2da40fd"
 
+[[package]]
+name = "ciborium"
+version = "0.2.2"
+source = "registry+https://github.com/rust-lang/crates.io-index"
+checksum = "42e69ffd6f0917f5c029256a24d0161db17cea3997d185db0d35926308770f0e"
+dependencies = [
+ "ciborium-io",
+ "ciborium-ll",
+ "serde",
+]
+
+[[package]]
+name = "ciborium-io"
+version = "0.2.2"
+source = "registry+https://github.com/rust-lang/crates.io-index"
+checksum = "05afea1e0a06c9be33d539b876f1ce3692f4afea2cb41f740e7743225ed1c757"
+
+[[package]]
+name = "ciborium-ll"
+version = "0.2.2"
+source = "registry+https://github.com/rust-lang/crates.io-index"
+checksum = "57663b653d948a338bfb3eeba9bb2fd5fcfaecb9e199e87e1eda4d9e8b240fd9"
+dependencies = [
+ "ciborium-io",
+ "half",
+]
+
 [[package]]
 name = "clang-sys"
 version = "1.7.0"
@@ -344,6 +389,31 @@ dependencies = [
  "libloading",
 ]
 
+[[package]]
+name = "clap"
+version = "4.5.16"
+source = "registry+https://github.com/rust-lang/crates.io-index"
+checksum = "ed6719fffa43d0d87e5fd8caeab59be1554fb028cd30edc88fc4369b17971019"
+dependencies = [
+ "clap_builder",
+]
+
+[[package]]
+name = "clap_builder"
+version = "4.5.15"
+source = "registry+https://github.com/rust-lang/crates.io-index"
+checksum = "216aec2b177652e3846684cbfe25c9964d18ec45234f0f5da5157b207ed1aab6"
+dependencies = [
+ "anstyle",
+ "clap_lex",
+]
+
+[[package]]
+name = "clap_lex"
+version = "0.7.2"
+source = "registry+https://github.com/rust-lang/crates.io-index"
+checksum = "1462739cb27611015575c0c11df5df7601141071f07518d56fcc1be504cbec97"
+
 [[package]]
 name = "cmake"
 version = "0.1.50"
@@ -422,6 +492,42 @@ dependencies = [
  "cfg-if",
 ]
 
+[[package]]
+name = "criterion"
+version = "0.5.1"
+source = "registry+https://github.com/rust-lang/crates.io-index"
+checksum = "f2b12d017a929603d80db1831cd3a24082f8137ce19c69e6447f54f5fc8d692f"
+dependencies = [
+ "anes",
+ "cast",
+ "ciborium",
+ "clap",
+ "criterion-plot",
+ "is-terminal",
+ "itertools 0.10.5",
+ "num-traits",
+ "once_cell",
+ "oorandom",
+ "plotters",
+ "rayon",
+ "regex",
+ "serde",
+ "serde_derive",
+ "serde_json",
+ "tinytemplate",
+ "walkdir",
+]
+
+[[package]]
+name = "criterion-plot"
+version = "0.5.0"
+source = "registry+https://github.com/rust-lang/crates.io-index"
+checksum = "6b50826342786a51a89e2da3a28f1c32b06e387201bc2d19791f622c673706b1"
+dependencies = [
+ "cast",
+ "itertools 0.10.5",
+]
+
 [[package]]
 name = "crossbeam-channel"
 version = "0.5.12"
@@ -431,6 +537,25 @@ dependencies = [
  "crossbeam-utils",
 ]
 
+[[package]]
+name = "crossbeam-deque"
+version = "0.8.5"
+source = "registry+https://github.com/rust-lang/crates.io-index"
+checksum = "613f8cc01fe9cf1a3eb3d7f488fd2fa8388403e97039e2f73692932e291a770d"
+dependencies = [
+ "crossbeam-epoch",
+ "crossbeam-utils",
+]
+
+[[package]]
+name = "crossbeam-epoch"
+version = "0.9.18"
+source = "registry+https://github.com/rust-lang/crates.io-index"
+checksum = "5b82ac4a3c2ca9c3460964f020e1402edd5753411d7737aa39c3714ad1b5420e"
+dependencies = [
+ "crossbeam-utils",
+]
+
 [[package]]
 name = "crossbeam-queue"
 version = "0.3.11"
@@ -446,6 +571,12 @@ version = "0.8.19"
 source = "registry+https://github.com/rust-lang/crates.io-index"
 checksum = "248e3bacc7dc6baa3b21e405ee045c3047101a49145e7e9eca583ab4c2ca5345"
 
+[[package]]
+name = "crunchy"
+version = "0.2.2"
+source = "registry+https://github.com/rust-lang/crates.io-index"
+checksum = "7a81dae078cea95a014a339291cec439d2f232ebe854a9d672b796c6afafa9b7"
+
 [[package]]
 name = "crypto-common"
 version = "0.1.6"
@@ -834,6 +965,16 @@ dependencies = [
  "wasm-bindgen",
 ]
 
+[[package]]
+name = "half"
+version = "2.4.1"
+source = "registry+https://github.com/rust-lang/crates.io-index"
+checksum = "6dd08c532ae367adf81c312a4580bc67f1d0fe8bc9c460520283f4c0ff277888"
+dependencies = [
+ "cfg-if",
+ "crunchy",
+]
+
 [[package]]
 name = "hashbrown"
 version = "0.12.3"
@@ -874,6 +1015,12 @@ version = "0.3.5"
 source = "registry+https://github.com/rust-lang/crates.io-index"
 checksum = "d0c62115964e08cb8039170eb33c1d0e2388a256930279edca206fff675f82c3"
 
+[[package]]
+name = "hermit-abi"
+version = "0.4.0"
+source = "registry+https://github.com/rust-lang/crates.io-index"
+checksum = "fbf6a919d6cf397374f7dfeeea91d974c7c0a7221d0d0f4f20d859d329e53fcc"
+
 [[package]]
 name = "hex"
 version = "0.4.3"
@@ -965,11 +1112,22 @@ version = "1.0.11"
 source = "registry+https://github.com/rust-lang/crates.io-index"
 checksum = "eae7b9aee968036d54dce06cebaefd919e4472e753296daccd6d344e3e2df0c2"
 dependencies = [
- "hermit-abi",
+ "hermit-abi 0.3.5",
  "libc",
  "windows-sys 0.48.0",
 ]
 
+[[package]]
+name = "is-terminal"
+version = "0.4.13"
+source = "registry+https://github.com/rust-lang/crates.io-index"
+checksum = "261f68e344040fbd0edea105bef17c66edf46f984ddb1115b775ce31be948f4b"
+dependencies = [
+ "hermit-abi 0.4.0",
+ "libc",
+ "windows-sys 0.52.0",
+]
+
 [[package]]
 name = "itertools"
 version = "0.10.5"
@@ -1246,7 +1404,7 @@ version = "1.16.0"
 source = "registry+https://github.com/rust-lang/crates.io-index"
 checksum = "4161fcb6d602d4d2081af7c3a45852d875a03dd337a6bfdd6e06407b61342a43"
 dependencies = [
- "hermit-abi",
+ "hermit-abi 0.3.5",
  "libc",
 ]
 
@@ -1256,6 +1414,12 @@ version = "1.19.0"
 source = "registry+https://github.com/rust-lang/crates.io-index"
 checksum = "3fdb12b2476b595f9358c5161aa467c2438859caa136dec86c26fdd2efe17b92"
 
+[[package]]
+name = "oorandom"
+version = "11.1.4"
+source = "registry+https://github.com/rust-lang/crates.io-index"
+checksum = "b410bbe7e14ab526a0e86877eb47c6996a2bd7746f027ba551028c925390e4e9"
+
 [[package]]
 name = "parking"
 version = "2.2.0"
@@ -1507,6 +1671,7 @@ dependencies = [
 name = "pg_statement_splitter"
 version = "0.0.0"
 dependencies = [
+ "criterion",
  "insta",
  "pg_lexer",
  "pg_query",
@@ -1617,6 +1782,34 @@ version = "0.3.29"
 source = "registry+https://github.com/rust-lang/crates.io-index"
 checksum = "2900ede94e305130c13ddd391e0ab7cbaeb783945ae07a279c268cb05109c6cb"
 
+[[package]]
+name = "plotters"
+version = "0.3.6"
+source = "registry+https://github.com/rust-lang/crates.io-index"
+checksum = "a15b6eccb8484002195a3e44fe65a4ce8e93a625797a063735536fd59cb01cf3"
+dependencies = [
+ "num-traits",
+ "plotters-backend",
+ "plotters-svg",
+ "wasm-bindgen",
+ "web-sys",
+]
+
+[[package]]
+name = "plotters-backend"
+version = "0.3.6"
+source = "registry+https://github.com/rust-lang/crates.io-index"
+checksum = "414cec62c6634ae900ea1c56128dfe87cf63e7caece0852ec76aba307cebadb7"
+
+[[package]]
+name = "plotters-svg"
+version = "0.3.6"
+source = "registry+https://github.com/rust-lang/crates.io-index"
+checksum = "81b30686a7d9c3e010b84284bdd26a29f2138574f52f5eb6f794fc0ad924e705"
+dependencies = [
+ "plotters-backend",
+]
+
 [[package]]
 name = "polling"
 version = "2.8.0"
@@ -1808,6 +2001,26 @@ dependencies = [
  "getrandom",
 ]
 
+[[package]]
+name = "rayon"
+version = "1.10.0"
+source = "registry+https://github.com/rust-lang/crates.io-index"
+checksum = "b418a60154510ca1a002a752ca9714984e21e4241e804d32555251faf8b78ffa"
+dependencies = [
+ "either",
+ "rayon-core",
+]
+
+[[package]]
+name = "rayon-core"
+version = "1.12.1"
+source = "registry+https://github.com/rust-lang/crates.io-index"
+checksum = "1465873a3dfdaa8ae7cb14b4383657caab0b3e8a0aa9ae8e04b044854c8dfce2"
+dependencies = [
+ "crossbeam-deque",
+ "crossbeam-utils",
+]
+
 [[package]]
 name = "redox_syscall"
 version = "0.4.1"
@@ -1949,6 +2162,15 @@ version = "1.0.16"
 source = "registry+https://github.com/rust-lang/crates.io-index"
 checksum = "f98d2aa92eebf49b69786be48e4477826b256916e84a57ff2a4f21923b48eb4c"
 
+[[package]]
+name = "same-file"
+version = "1.0.6"
+source = "registry+https://github.com/rust-lang/crates.io-index"
+checksum = "93fc1dc3aaa9bfed95e02e6eadabb4baf7e3078b0bd1b4d7b6b0b68378900502"
+dependencies = [
+ "winapi-util",
+]
+
 [[package]]
 name = "scopeguard"
 version = "1.2.0"
@@ -2438,6 +2660,16 @@ version = "0.1.2"
 source = "registry+https://github.com/rust-lang/crates.io-index"
 checksum = "ef927ca75afb808a4d64dd374f00a2adf8d0fcff8e7b184af886c3c87ec4a3f3"
 
+[[package]]
+name = "tinytemplate"
+version = "1.2.1"
+source = "registry+https://github.com/rust-lang/crates.io-index"
+checksum = "be4d6b5f19ff7664e8c98d03e2139cb510db9b0a60b55f8e8709b689d939b6bc"
+dependencies = [
+ "serde",
+ "serde_json",
+]
+
 [[package]]
 name = "tinyvec"
 version = "1.6.0"
@@ -2599,6 +2831,16 @@ version = "1.1.1"
 source = "registry+https://github.com/rust-lang/crates.io-index"
 checksum = "f3c4517f54858c779bbcbf228f4fca63d121bf85fbecb2dc578cdf4a39395690"
 
+[[package]]
+name = "walkdir"
+version = "2.5.0"
+source = "registry+https://github.com/rust-lang/crates.io-index"
+checksum = "29790946404f91d9c5d06f9874efddea1dc06c5efe94541a7d6863108e3a5e4b"
+dependencies = [
+ "same-file",
+ "winapi-util",
+]
+
 [[package]]
 name = "wasi"
 version = "0.11.0+wasi-snapshot-preview1"
@@ -2721,6 +2963,15 @@ version = "0.4.0"
 source = "registry+https://github.com/rust-lang/crates.io-index"
 checksum = "ac3b87c63620426dd9b991e5ce0329eff545bccbbb34f3be09ff6fb6ab51b7b6"
 
+[[package]]
+name = "winapi-util"
+version = "0.1.9"
+source = "registry+https://github.com/rust-lang/crates.io-index"
+checksum = "cf221c93e13a30d793f7645a0e7762c55d169dbb0a49671918a2319d289b10bb"
+dependencies = [
+ "windows-sys 0.52.0",
+]
+
 [[package]]
 name = "winapi-x86_64-pc-windows-gnu"
 version = "0.4.0"
diff --git a/crates/pg_statement_splitter/Cargo.toml b/crates/pg_statement_splitter/Cargo.toml
index 243655ff..ce70d1a1 100644
--- a/crates/pg_statement_splitter/Cargo.toml
+++ b/crates/pg_statement_splitter/Cargo.toml
@@ -10,4 +10,9 @@ text-size = "1.1.1"
 [dev-dependencies]
 pg_query = "0.8"
 insta = "1.31.0"
+criterion = { version = "0.5" }
+
+[[bench]]
+name = "pg_statement_splitter"
+harness = false
 
diff --git a/crates/pg_statement_splitter/benches/pg_statement_splitter.rs b/crates/pg_statement_splitter/benches/pg_statement_splitter.rs
new file mode 100644
index 00000000..153adfb2
--- /dev/null
+++ b/crates/pg_statement_splitter/benches/pg_statement_splitter.rs
@@ -0,0 +1,67 @@
+use criterion::{criterion_group, criterion_main, BenchmarkId, Criterion};
+use std::fs::{self};
+
+const POSTGRES_REGRESS_PATH: &str = "../../libpg_query/test/sql/postgres_regress/";
+const SKIPPED_REGRESS_TESTS: &str = include_str!("../tests/skipped.txt");
+
+fn from_elem(c: &mut Criterion) {
+    let mut paths: Vec<_> = fs::read_dir(POSTGRES_REGRESS_PATH)
+        .unwrap()
+        .map(|r| r.unwrap())
+        .collect();
+    paths.sort_by_key(|dir| dir.path());
+
+    for f in paths.iter() {
+        let path = f.path();
+
+        let test_name = path.file_stem().unwrap().to_str().unwrap();
+
+        // these require fixes in the parser
+        if SKIPPED_REGRESS_TESTS
+            .lines()
+            .collect::<Vec<_>>()
+            .contains(&test_name)
+        {
+            continue;
+        }
+
+        println!("Running test: {}", test_name);
+
+        // remove \commands because pg_query doesn't support them
+        let contents = fs::read_to_string(&path)
+            .unwrap()
+            .lines()
+            .filter_map(|l| {
+                if !l.starts_with("\\")
+                    && !l.ends_with("\\gset")
+                    && !l.starts_with("--")
+                    && !l.contains(":'")
+                    && l.split("\t").count() <= 1
+                    && l != "ALTER INDEX attmp_idx ALTER COLUMN 0 SET STATISTICS 1000;"
+                {
+                    if let Some(index) = l.find("--") {
+                        Some(l[..index].to_string())
+                    } else {
+                        Some(l.to_string())
+                    }
+                } else {
+                    None
+                }
+            })
+            .collect::<Vec<_>>()
+            .join("\n");
+
+        let contents_str = contents.as_str();
+
+        c.bench_with_input(
+            BenchmarkId::new(test_name, contents_str),
+            &contents_str,
+            |b, &s| {
+                b.iter(|| pg_statement_splitter::split(&s));
+            },
+        );
+    }
+}
+
+criterion_group!(benches, from_elem);
+criterion_main!(benches);
diff --git a/crates/pg_statement_splitter/src/data.rs b/crates/pg_statement_splitter/src/data.rs
index f3ef0de7..4b32841f 100644
--- a/crates/pg_statement_splitter/src/data.rs
+++ b/crates/pg_statement_splitter/src/data.rs
@@ -3,23 +3,53 @@ use std::{collections::HashMap, sync::LazyLock};
 
 #[derive(Debug)]
 pub enum SyntaxDefinition {
-    RequiredToken(SyntaxKind),          // A single required token
-    OptionalToken(SyntaxKind),          // A single optional token
+    RequiredToken(SyntaxKind),                    // A single required token
+    OptionalToken(SyntaxKind),                    // A single optional token
     OptionalGroup(Vec<SyntaxKind>), // A group of tokens that are required if the group is present
     AnyToken,                       // Any single token
     AnyTokens(Option<Vec<SyntaxKind>>), // A sequence of 0 or more tokens, of which any can be present
     OneOf(Vec<SyntaxKind>),             // One of the specified tokens
+    OptionalRepeatedGroup(Vec<SyntaxDefinition>), // A group of tokens that can be repeated
+}
+
+impl SyntaxDefinition {
+    pub fn is_group(&self) -> bool {
+        match self {
+            SyntaxDefinition::OptionalGroup(_) => true,
+            SyntaxDefinition::OptionalRepeatedGroup(_) => true,
+            _ => false,
+        }
+    }
+
+    pub fn first_required_tokens(&self) -> Vec<&SyntaxKind> {
+        match self {
+            SyntaxDefinition::RequiredToken(k) => vec![k],
+            SyntaxDefinition::OneOf(kinds) => kinds.iter().collect(),
+            _ => vec![],
+        }
+    }
 }
 
 #[derive(Debug)]
 pub struct SyntaxBuilder {
     parts: Vec<SyntaxDefinition>,
+    is_complete: bool,
 }
 
 impl SyntaxBuilder {
     // Start a new builder, which will automatically create a Group
     pub fn new() -> Self {
-        Self { parts: Vec::new() }
+        Self {
+            parts: Vec::new(),
+            is_complete: false,
+        }
+    }
+
+    pub fn new_complete() -> Self {
+        Self {
+            parts: Vec::new(),
+            is_complete: true,
+        }
     }
 
     pub fn any_token(mut self) -> Self {
@@ -83,7 +113,49 @@ impl SyntaxBuilder {
         self
     }
 
-    pub fn build(self) -> Vec<SyntaxDefinition> {
+    pub fn optional_repeated_group(mut self, builder: SyntaxBuilder) -> Self {
+        let res = builder.build();
+        match res.first() {
+            Some(SyntaxDefinition::RequiredToken(_)) => {}
+            Some(SyntaxDefinition::OneOf(_)) => {}
+            _ => panic!("First token in repeated group must be required or one of"),
+        }
+        self.parts
+            .push(SyntaxDefinition::OptionalRepeatedGroup(res));
+        self
+    }
+
+    pub fn cte(mut self) -> Self {
+        self.parts.extend(
+            SyntaxBuilder::new()
+                .required_token(SyntaxKind::With)
+                .optional_token(SyntaxKind::Recursive)
+                .ident_like()
+                .required_token(SyntaxKind::As)
+                .required_token(SyntaxKind::Ascii40)
+                .any_tokens(None)
+                .required_token(SyntaxKind::Ascii41)
+                .optional_repeated_group(
+                    SyntaxBuilder::new()
+                        .required_token(SyntaxKind::Ascii44)
+                        .ident_like()
+                        .required_token(SyntaxKind::As)
+                        .required_token(SyntaxKind::Ascii40)
+                        .any_tokens(None)
+                        .required_token(SyntaxKind::Ascii41),
+                )
+                .build(),
+        );
+        self
+    }
+
+    pub fn build(mut self) -> Vec<SyntaxDefinition> {
+        if !self.is_complete {
+            self.parts.push(SyntaxDefinition::AnyTokens(None));
+        } else {
+            self.parts
+                .push(SyntaxDefinition::OptionalToken(SyntaxKind::Ascii59));
+        }
         self.parts
     }
 }
@@ -198,23 +270,65 @@ pub static STATEMENT_DEFINITIONS: LazyLock<HashMap<SyntaxKind, Vec<StatementDefi
                 .any_token(),
         ));
 
-        // "TABLE t1;"
-        // is syntactic sugar for "SELECT * FROM t1"
+        m.push(StatementDefinition::new(
+            SyntaxKind::SelectStmt,
+            SyntaxBuilder::new()
+                .cte()
+                .required_token(SyntaxKind::Select)
+                .any_token(),
+        ));
+
         m.push(
             StatementDefinition::new(
                 SyntaxKind::SelectStmt,
                 SyntaxBuilder::new()
-                    .required_token(SyntaxKind::Table)
-                    .optional_schema_name_group()
-                    .ident_like()
-                    // this is polluting too much so we require a ";" for now...
-                    .required_token(SyntaxKind::Ascii59),
+                    .required_token(SyntaxKind::Ascii40)
+                    .required_token(SyntaxKind::Select)
+                    .any_tokens(None)
+                    .required_token(SyntaxKind::Ascii41)
+                    .any_tokens(Some(vec![
+                        SyntaxKind::Union,
+                        SyntaxKind::Except,
+                        SyntaxKind::Intersect,
+                        SyntaxKind::All,
+                    ]))
+                    .required_token(SyntaxKind::Ascii40)
+                    .required_token(SyntaxKind::Select)
+                    .any_tokens(None)
+                    .required_token(SyntaxKind::Ascii41)
+                    .optional_repeated_group(
+                        SyntaxBuilder::new()
+                            .one_of(vec![
+                                SyntaxKind::Union,
+                                SyntaxKind::Except,
+                                SyntaxKind::Intersect,
+                            ])
+                            .optional_token(SyntaxKind::All)
+                            .required_token(SyntaxKind::Ascii40)
+                            .required_token(SyntaxKind::Select)
+                            .any_tokens(None)
+                            .required_token(SyntaxKind::Ascii41),
+                    ),
             )
-            // this pollutes the "prohibited following statements" logic too much
-            // so we need to ignore it as a prohibited statement
             .with_ignore_if_prohibited(),
         );
 
+        // // "TABLE t1;"
+        // // is syntactic sugar for "SELECT * FROM t1"
+        // m.push(
+        //     StatementDefinition::new(
+        //         SyntaxKind::SelectStmt,
+        //         // we use "new_complete" here
+        //         SyntaxBuilder::new_complete()
+        //             .required_token(SyntaxKind::Table)
+        //             .optional_schema_name_group()
+        //             .ident_like(),
+        //     )
+        //     // this pollutes the "prohibited following statements" logic too much
+        //     // so we need to ignore it as a prohibited statement
+        //     .with_ignore_if_prohibited(),
+        // );
+
         // VALUES is also legal as a standalone query
         // e.g. VALUES (1,2), (3,4+4), (7,77.7);
         // todo use repeated group
@@ -396,7 +510,8 @@ pub static STATEMENT_DEFINITIONS: LazyLock<HashMap<SyntaxKind, Vec<StatementDefi
                     .optional_schema_name_group()
                     .ident_like(),
             )
-            .with_prohibited_following_statements(vec![SyntaxKind::TransactionStmt]),
+            .with_prohibited_following_statements(vec![SyntaxKind::TransactionStmt])
+            .with_prohibited_tokens(vec![SyntaxKind::As]),
         );
 
         m.push(StatementDefinition::new(
@@ -883,18 +998,18 @@ pub static STATEMENT_DEFINITIONS: LazyLock<HashMap<SyntaxKind, Vec<StatementDefi
             .with_prohibited_following_statements(vec![SyntaxKind::SelectStmt]),
         );
 
-        m.push(StatementDefinition::new(
-            SyntaxKind::DeclareCursorStmt,
-            SyntaxBuilder::new()
-                .required_token(SyntaxKind::Declare)
-                .required_token(SyntaxKind::Ident)
-                .any_tokens(None)
-                .required_token(SyntaxKind::Cursor)
-                .any_tokens(None)
-                .required_token(SyntaxKind::For)
-                .one_of(vec![SyntaxKind::Select, SyntaxKind::With])
-                .any_token(),
-        ));
+        // m.push(StatementDefinition::new(
+        //     SyntaxKind::DeclareCursorStmt,
+        //     SyntaxBuilder::new()
+        //         .required_token(SyntaxKind::Declare)
+        //         .required_token(SyntaxKind::Ident)
+        //         .any_tokens(None)
+        //         .required_token(SyntaxKind::Cursor)
+        //         .any_tokens(None)
+        //         .required_token(SyntaxKind::For)
+        //         .one_of(vec![SyntaxKind::Select, SyntaxKind::With])
+        //         .any_token(),
+        // ));
 
         m.push(
             StatementDefinition::new(
@@ -958,7 +1073,7 @@ pub static STATEMENT_DEFINITIONS: LazyLock<HashMap<SyntaxKind, Vec<StatementDefi
         m.push(
             StatementDefinition::new(
                 SyntaxKind::TransactionStmt,
-                SyntaxBuilder::new()
+                SyntaxBuilder::new_complete()
                     .required_token(SyntaxKind::Rollback)
                     .any_tokens(None)
                     .required_token(SyntaxKind::To)
@@ -971,7 +1086,7 @@ pub static STATEMENT_DEFINITIONS: LazyLock<HashMap<SyntaxKind, Vec<StatementDefi
         m.push(
             StatementDefinition::new(
                 SyntaxKind::TransactionStmt,
-                SyntaxBuilder::new().required_token(SyntaxKind::Rollback),
+                SyntaxBuilder::new_complete().required_token(SyntaxKind::Rollback),
             )
             .with_prohibited_following_statements(vec![SyntaxKind::TransactionStmt]),
         );
@@ -1046,7 +1161,10 @@ pub static STATEMENT_DEFINITIONS: LazyLock<HashMap<SyntaxKind, Vec<StatementDefi
                     .any_tokens(None)
                     .required_token(SyntaxKind::As),
             )
-            .with_prohibited_following_statements(vec![SyntaxKind::SelectStmt]),
+            .with_prohibited_following_statements(vec![
+                SyntaxKind::SelectStmt,
+                SyntaxKind::ExecuteStmt,
+            ]),
         );
 
         m.push(
@@ -1105,9 +1223,8 @@ pub static STATEMENT_DEFINITIONS: LazyLock<HashMap<SyntaxKind, Vec<StatementDefi
                 SyntaxKind::ExplainStmt,
                 SyntaxBuilder::new()
                     .required_token(SyntaxKind::Explain)
+                    .any_tokens(None)
                     .one_of(vec![
-                        SyntaxKind::Analyze,
-                        SyntaxKind::Ascii40,
                         SyntaxKind::Select,
                         SyntaxKind::Insert,
                         SyntaxKind::Update,
@@ -1120,16 +1237,16 @@ pub static STATEMENT_DEFINITIONS: LazyLock<HashMap<SyntaxKind, Vec<StatementDefi
                     ]),
             )
             .with_prohibited_following_statements(vec![
-                SyntaxKind::VacuumStmt,
-                SyntaxKind::SelectStmt,
-                SyntaxKind::CreateTableAsStmt,
-                SyntaxKind::InsertStmt,
-                SyntaxKind::DeleteStmt,
-                SyntaxKind::UpdateStmt,
-                SyntaxKind::MergeStmt,
-                SyntaxKind::ExecuteStmt,
-                SyntaxKind::CreateStmt,
-                SyntaxKind::DeclareCursorStmt,
+                // SyntaxKind::VacuumStmt,
+                // SyntaxKind::SelectStmt,
+                // SyntaxKind::CreateTableAsStmt,
+                // SyntaxKind::InsertStmt,
+                // SyntaxKind::DeleteStmt,
+                // SyntaxKind::UpdateStmt,
+                // SyntaxKind::MergeStmt,
+                // SyntaxKind::ExecuteStmt,
+                // SyntaxKind::CreateStmt,
+                // SyntaxKind::DeclareCursorStmt,
                 // todo remove this again when we include all deps
                 SyntaxKind::VariableSetStmt,
             ]),
diff --git a/crates/pg_statement_splitter/src/lib.rs b/crates/pg_statement_splitter/src/lib.rs
index 049ec533..5913c176 100644
--- a/crates/pg_statement_splitter/src/lib.rs
+++ b/crates/pg_statement_splitter/src/lib.rs
@@ -14,6 +14,7 @@ mod parser;
 mod statement_splitter;
 mod syntax_error;
 mod tracker;
+mod tracker_new;
 
 use statement_splitter::{StatementPosition, StatementSplitter};
 use text_size::TextRange;
diff --git a/crates/pg_statement_splitter/src/statement_splitter.rs b/crates/pg_statement_splitter/src/statement_splitter.rs
index 12011ff3..4c1fd947 100644
--- a/crates/pg_statement_splitter/src/statement_splitter.rs
+++ b/crates/pg_statement_splitter/src/statement_splitter.rs
@@ -4,7 +4,7 @@ use text_size::{TextRange, TextSize};
 use crate::{
     data::{STATEMENT_BRIDGE_DEFINITIONS, STATEMENT_DEFINITIONS},
     parser::Parser,
-    tracker::Tracker,
+    tracker_new::StatementTracker as Tracker,
 };
 
 pub(crate) struct StatementSplitter<'a> {
@@ -80,6 +80,15 @@ impl<'a> StatementSplitter<'a> {
         let mut removed_items = Vec::new();
 
         self.tracked_statements.retain_mut(|stmt| {
+            println!(
+                "started at {:?}, parser pos {:?}",
+                stmt.started_at, self.parser.pos
+            );
+            // dont advace if we started at the current position
+            if stmt.started_at == self.parser.pos {
+                return true;
+            }
+
             let keep = stmt.advance_with(&self.parser.nth(0, false).kind);
             if !keep {
                 removed_items.push(stmt.started_at);
@@ -87,6 +96,8 @@ impl<'a> StatementSplitter<'a> {
             keep
         });
 
+        println!("removed items: {:?}", removed_items);
+
         removed_items.iter().min().map(|i| *i)
     }
 
@@ -128,16 +139,31 @@ impl<'a> StatementSplitter<'a> {
                 .iter()
                 .all(|s| !s.could_be_complete())
         {
+            println!("reutning because none could be completed");
             return;
+        } else {
+            println!(
+                "{:?} {:?} could be complete",
+                self.tracked_statements
+                    .iter()
+                    .map(|x| x)
+                    .collect::<Vec<_>>(),
+                self.tracked_statements
+                    .iter()
+                    .map(|x| x.could_be_complete())
+                    .collect::<Vec<_>>()
+            );
         }
 
         let new_stmts = STATEMENT_DEFINITIONS.get(&self.parser.nth(0, false).kind);
+        println!("potential new stmts {:?}", new_stmts);
 
         if let Some(new_stmts) = new_stmts {
             let to_add = &mut new_stmts
                 .iter()
                 .filter_map(|stmt| {
                     if self.active_bridges.iter().any(|b| b.def.stmt == stmt.stmt) {
+                        println!("not adding because of active bridges");
                         None
                     } else if self.tracked_statements.iter_mut().any(|s| {
                         !s.can_start_stmt_after(
@@ -146,8 +172,10 @@ impl<'a> StatementSplitter<'a> {
                             stmt.ignore_if_prohibited,
                         )
                     }) {
+                        println!("not adding because cant start stmt after");
                         None
                     } else {
+                        println!("tracking new statement: {:?}", stmt.stmt);
                         Some(Tracker::new_at(stmt, self.parser.pos))
                     }
                 })
@@ -184,6 +212,11 @@ impl<'a> StatementSplitter<'a> {
             return;
         }
 
+        println!(
+            "closing statement with semicolon {:?}",
+            self.tracked_statements
+        );
+
         // get earliest statement
         if let Some(earliest_complete_stmt_started_at) = self
             .tracked_statements
@@ -192,6 +225,10 @@ impl<'a> StatementSplitter<'a> {
             .min_by_key(|stmt| stmt.started_at)
             .map(|stmt| stmt.started_at)
         {
+            println!(
+                "earliest complete stmt started at: {}",
+                earliest_complete_stmt_started_at
+            );
             let earliest_complete_stmt = self
                 .tracked_statements
                 .iter()
@@ -286,17 +323,27 @@ impl<'a> StatementSplitter<'a> {
     }
 
     pub fn run(mut self) -> Vec<StatementPosition> {
+        println!("parser pos {:?}", self.parser.pos);
         while !self.parser.eof() {
             if WHITESPACE_TOKENS.contains(&self.parser.nth(0, false).kind) {
                 self.parser.advance();
                 continue;
             }
 
-            self.start_nesting();
+            println!(
+                "############ current token: {:?}",
+                self.parser.nth(0, false).kind
+            );
 
-            let removed_items_min_started_at = self.advance_tracker();
+            println!(
+                "current stmts: {:?}",
+                self.tracked_statements
+                    .iter()
+                    .map(|s| s.def.stmt)
+                    .collect::<Vec<_>>()
+            );
 
-            self.add_incomplete_statement(removed_items_min_started_at);
+            // todo start new stmts first, then advance all others
 
             self.start_new_statements();
 
@@ -304,18 +351,31 @@ impl<'a> StatementSplitter<'a> {
 
             self.start_new_bridges();
 
+            let removed_items_min_started_at = self.advance_tracker();
+
+            self.add_incomplete_statement(removed_items_min_started_at);
+
+            self.start_nesting();
+
             if self.parser.nth(0, false).kind == SyntaxKind::Ascii59 {
                 self.close_stmt_with_semicolon();
             }
 
             self.end_nesting();
 
+            println!("stmts after: {:?}", self.tracked_statements);
+
             // # This is where the actual parsing happens
 
             // 1. Find the latest complete statement
             if let Some(latest_completed_stmt_started_at) =
                 self.find_latest_complete_statement_start_pos()
             {
+                println!(
+                    "latest_completed_stmt_started_at: {:?}",
+                    latest_completed_stmt_started_at
+                );
+
                 // Step 2: Find the latest complete statement before the latest completed statement
                 if let Some(latest_complete_before_started_at) = self
                     .find_latest_complete_statement_before_start_pos(
@@ -326,6 +386,8 @@ impl<'a> StatementSplitter<'a> {
                         latest_complete_before_started_at,
                     );
 
+                    println!("latest_complete_before: {:?}", latest_complete_before);
+
                     self.assert_single_complete_statement_at_position(&latest_complete_before);
 
                     let stmt_kind = latest_complete_before.def.stmt;
@@ -343,6 +405,8 @@ impl<'a> StatementSplitter<'a> {
                     );
                     let end_pos = latest_non_whitespace_token.unwrap().span.end();
 
+                    println!("!!!! adding {:?}", stmt_kind);
+
                     self.ranges.push(StatementPosition {
                         kind: stmt_kind,
                         range: TextRange::new(start_pos, end_pos),
@@ -357,6 +421,8 @@ impl<'a> StatementSplitter<'a> {
             self.parser.advance();
         }
 
+        println!("tracked statements: {:?}", self.tracked_statements);
+
         // we reached eof; add any remaining statements
 
         // get the earliest statement that is complete
@@ -366,6 +432,8 @@ impl<'a> StatementSplitter<'a> {
             let earliest_complete_stmt =
                 self.find_highest_positioned_complete_statement(earliest_complete_stmt_started_at);
 
+            println!("earliest complete stmt: {:?}", earliest_complete_stmt);
+
             self.assert_single_complete_statement_at_position(earliest_complete_stmt);
 
             let start_pos = self.token_range(earliest_complete_stmt_started_at).start();
@@ -373,6 +441,8 @@ impl<'a> StatementSplitter<'a> {
             let end_token = self.parser.lookbehind(1, true, None).unwrap();
             let end_pos = end_token.span.end();
 
+            println!("!!!! adding {:?}", earliest_complete_stmt.def.stmt);
+
             self.ranges.push(StatementPosition {
                 kind: earliest_complete_stmt.def.stmt,
                 range: TextRange::new(start_pos, end_pos),
@@ -388,6 +458,8 @@ impl<'a> StatementSplitter<'a> {
             // end position is last non-whitespace token before or at the current position
             let end_pos = self.parser.lookbehind(1, true, None).unwrap().span.end();
 
+            println!("!!!! adding any");
+
             self.ranges.push(StatementPosition {
                 kind: SyntaxKind::Any,
                 range: TextRange::new(start_pos, end_pos),
@@ -587,6 +659,10 @@ select lower('test');
 
         let result = StatementSplitter::new(input).run();
 
+        for range in &result {
+            println!("Result: '{}'", input[range.range].to_string());
+        }
+
         assert_eq!(result.len(), 3);
         assert_eq!(
             "explain select 1 from contact",
@@ -1482,6 +1558,58 @@ create table parallel_write as execute prep_stmt;
         assert_eq!(SyntaxKind::CreateTableAsStmt, result[0].kind);
     }
 
+    #[test]
+    fn cte_select() {
+        let input = "
+WITH t1 AS (
+    SELECT * FROM t1
+), t2 AS (
+    SELECT * FROM t2
+)
+SELECT 's';
+";
+        let result = StatementSplitter::new(input).run();
+
+        assert_eq!(result.len(), 1);
+        assert_eq!(SyntaxKind::SelectStmt, result[0].kind);
+    }
+
+    #[test]
+    fn cte_select_without_repeated() {
+        let input = "
+WITH t1 AS (
+    SELECT * FROM t1
+)
+SELECT 's';
+";
+        let result = StatementSplitter::new(input).run();
+
+        assert_eq!(result.len(), 1);
+        assert_eq!(SyntaxKind::SelectStmt, result[0].kind);
+    }
+
+    #[test]
+    fn union_intersect() {
+        let input = "
+(select 1) union (select 2) except (select 3) intersect (select 4);
+";
+        let result = StatementSplitter::new(input).run();
+
+        assert_eq!(result.len(), 1);
+        assert_eq!(SyntaxKind::SelectStmt, result[0].kind);
+    }
+
+    #[test]
+    fn alter_table_cluster_on() {
+        let input = "
+ALTER TABLE clstr_tst CLUSTER ON clstr_tst_b_c;
+";
+        let result = StatementSplitter::new(input).run();
+
+        assert_eq!(result.len(), 1);
+        assert_eq!(SyntaxKind::AlterTableStmt, result[0].kind);
+    }
+
     #[allow(clippy::must_use)]
     fn debug(input: &str) {
         for s in input.split(';').filter_map(|s| {
diff --git a/crates/pg_statement_splitter/src/tracker.rs b/crates/pg_statement_splitter/src/tracker.rs
index 247336e6..57e312d6 100644
--- a/crates/pg_statement_splitter/src/tracker.rs
+++ b/crates/pg_statement_splitter/src/tracker.rs
@@ -2,167 +2,55 @@ use pg_lexer::{SyntaxKind, WHITESPACE_TOKENS};
 
 use crate::data::{StatementDefinition, SyntaxDefinition};
 
-#[derive(Debug, Clone)]
-pub struct Position {
-    idx: usize,
-    group_idx: usize,
-}
-
-impl Position {
-    fn new(idx: usize) -> Self {
-        Self { idx, group_idx: 0 }
-    }
-
-    fn new_with_group(idx: usize) -> Self {
-        Self { idx, group_idx: 1 }
-    }
-
-    fn advance(&mut self) {
-        self.idx += 1;
-        self.group_idx = 0;
-    }
-
-    fn advance_group(&mut self) {
-        self.group_idx += 1;
-    }
-}
-
-#[derive(Debug, Clone)]
-pub struct Tracker<'a> {
-    pub def: &'a StatementDefinition,
+#[derive(Debug)]
+pub struct TokenTracker<'a> {
+    pub tokens: &'a Vec<SyntaxDefinition>,
 
     /// position in the definition, and for each position we track the current token for that
     /// position. required for groups.
     pub positions: Vec<Position>,
 
-    /// position in the global token stream
-    pub started_at: usize,
-
-    used_prohibited_statements: Vec<(usize, SyntaxKind)>,
+    /// only for RepeatedGroup
+    child: Option<Box<TokenTracker<'a>>>,
 }
 
-impl<'a> Tracker<'a> {
-    pub fn new_at(def: &'a StatementDefinition, at: usize) -> Self {
+impl<'a> TokenTracker<'a> {
+    pub fn new(tokens: &'a Vec<SyntaxDefinition>) -> Self {
         Self {
-            def,
+            tokens,
             positions: vec![Position::new(1)],
-            started_at: at,
-            used_prohibited_statements: Vec::new(),
-        }
-    }
-
-    pub fn can_start_stmt_after(
-        &mut self,
-        kind: &SyntaxKind,
-        at: usize,
-        ignore_if_prohibited: bool,
-    ) -> bool {
-        if let Some(x) = self
-            .used_prohibited_statements
-            .iter()
-            .find(|x| x.1 == *kind)
-        {
-            // we already used this prohibited statement, we we can start a new statement
-            // but only if we are not at the same position as the prohibited statement
-            // this is to prevent adding the second "VariableSetStmt" if the first was added to the
-            // used list if both start at the same position
-            return x.0 != at;
-        }
-
-        let res =
-            self.could_be_complete() && self.def.prohibited_following_statements.contains(kind);
-
-        if res {
-            if !ignore_if_prohibited {
-                self.used_prohibited_statements.push((at, kind.clone()));
-            }
-            return false;
-        }
-
-        true
-    }
-
-    /// Returns the max idx of all tracked positions while ignoring non-required tokens
-    pub fn max_pos(&self) -> usize {
-        self.positions
-            .iter()
-            .map(|p| {
-                // substract non-required tokens from the position count
-                (0..p.idx).fold(0, |acc, idx| {
-                    let token = self.def.tokens.get(idx);
-                    match token {
-                        Some(SyntaxDefinition::RequiredToken(_)) => acc + 1,
-                        Some(SyntaxDefinition::OneOf(_)) => acc + 1,
-                        Some(SyntaxDefinition::AnyToken) => acc + 1,
-                        _ => acc,
-                    }
-                })
-            })
-            .max()
-            .unwrap()
-    }
-
-    pub fn current_positions(&self) -> Vec<usize> {
-        self.positions.iter().map(|x| x.idx).collect()
-    }
-
-    fn next_possible_positions_from_with(
-        def: &StatementDefinition,
-        pos: &Position,
-        kind: &SyntaxKind,
-    ) -> Vec<Position> {
-        let mut positions = Vec::new();
-
-        for (pos, token) in def.tokens.iter().enumerate().skip(pos.idx.to_owned()) {
-            match token {
-                SyntaxDefinition::RequiredToken(k) => {
-                    if k == kind {
-                        positions.push(Position::new(pos + 1));
-                    }
-                    break;
-                }
-                SyntaxDefinition::OptionalToken(k) => {
-                    if k == kind {
-                        positions.push(Position::new(pos + 1));
-                    }
-                }
-                SyntaxDefinition::AnyTokens(_) => {
-                    //
-                }
-                SyntaxDefinition::AnyToken => {
-                    //
-                }
-                SyntaxDefinition::OneOf(kinds) => {
-                    if kinds.iter().any(|x| x == kind) {
-                        positions.push(Position::new(pos + 1));
-                    }
-                    break;
-                }
-                SyntaxDefinition::OptionalGroup(t) => {
-                    let first_token = t.first().unwrap();
-                    if first_token == kind {
-                        positions.push(Position::new_with_group(pos + 1));
-                    }
-                }
-            }
+            child: None,
         }
-
-        positions
     }
 
     pub fn advance_with(&mut self, kind: &SyntaxKind) -> bool {
-        if WHITESPACE_TOKENS.contains(kind) {
-            return true;
-        }
-
-        if self.def.prohibited_tokens.contains(kind) {
-            return false;
-        }
-
         let mut new_positions = Vec::with_capacity(self.positions.len());
 
         for mut pos in self.positions.drain(..) {
-            match self.def.tokens.get(pos.idx) {
+            match self.tokens.get(pos.idx) {
+                Some(SyntaxDefinition::OptionalRepeatedGroup(definitions)) => {
+                    // if child does not exist, create it
+                    if self.child.is_none() {
+                        // check if we can spawn a new position for the next token
+                        new_positions.extend(TokenTracker::next_possible_positions_from_with(
+                            &self.tokens,
+                            &pos,
+                            kind,
+                        ));
+                        self.child = Some(Box::new(TokenTracker::new(definitions)));
+                        new_positions.push(pos);
+                    } else if self.child.as_mut().unwrap().advance_with(kind) {
+                        if self.child.as_ref().unwrap().could_be_complete() {
+                            new_positions.extend(TokenTracker::next_possible_positions_from_with(
+                                &self.tokens,
+                                &pos,
+                                kind,
+                            ));
+                        }
+                        // and advance it with the current token
+                        new_positions.push(pos);
+                    }
+                }
                 Some(SyntaxDefinition::RequiredToken(k)) => {
                     pos.advance();
                     if k == kind {
@@ -184,14 +72,16 @@ impl<'a> Tracker<'a> {
                         pos.advance();
                         new_positions.push(pos);
                     } else {
-                        new_positions.extend(Tracker::next_possible_positions_from_with(
-                            self.def, &pos, kind,
+                        new_positions.extend(TokenTracker::next_possible_positions_from_with(
+                            &self.tokens,
+                            &pos,
+                            kind,
                         ));
                     }
                 }
                 Some(SyntaxDefinition::AnyTokens(maybe_tokens)) => {
                     let next_positions =
-                        Tracker::next_possible_positions_from_with(self.def, &pos, kind);
+                        TokenTracker::next_possible_positions_from_with(&self.tokens, &pos, kind);
 
                     if next_positions.is_empty() {
                         // we only keep the current position if we either dont care about the
@@ -211,8 +101,10 @@ impl<'a> Tracker<'a> {
                     if pos.group_idx == 0 {
                         // if we are at the beginning of the group, we also need to spawn new
                         // trackers for every possible next token
-                        new_positions.extend(Tracker::next_possible_positions_from_with(
-                            self.def, &pos, kind,
+                        new_positions.extend(TokenTracker::next_possible_positions_from_with(
+                            &self.tokens,
+                            &pos,
+                            kind,
                         ));
                     }
 
@@ -232,6 +124,14 @@ impl<'a> Tracker<'a> {
                 None => {
                     // if we reached the end of the definition, we do nothing but keep the position
                     new_positions.push(pos);
+
+                    // TODO the problem with removing as position when there is no token anymore is
+                    // that we will return false AT the last token, since the last token does not
+                    // have any following tokens. even if the statement is complete at this point
+                    // and still valid until the next token is added.
+                    //
+                    // i think to fix this, we need to track the CURRENT positions and not all
+                    // possible NEXT positions.
                 }
             };
         }
@@ -241,9 +141,70 @@ impl<'a> Tracker<'a> {
         self.positions.len() != 0
     }
 
+    fn next_possible_positions_from_with(
+        tokens: &Vec<SyntaxDefinition>,
+        pos: &Position,
+        kind: &SyntaxKind,
+    ) -> Vec<Position> {
+        let mut positions = Vec::new();
+
+        for (pos, token) in tokens.iter().enumerate().skip(pos.idx.to_owned()) {
+            match token {
+                SyntaxDefinition::RequiredToken(k) => {
+                    if k == kind {
+                        positions.push(Position::new(pos + 1));
+                    }
+                    break;
+                }
+                SyntaxDefinition::OptionalToken(k) => {
+                    if k == kind {
+                        positions.push(Position::new(pos + 1));
+                    }
+                }
+                SyntaxDefinition::AnyTokens(_) => {
+                    //
+                }
+                SyntaxDefinition::AnyToken => {
+                    //
+                }
+                SyntaxDefinition::OneOf(kinds) => {
+                    if kinds.iter().any(|x| x == kind) {
+                        positions.push(Position::new(pos + 1));
+                    }
+                    break;
+                }
+                SyntaxDefinition::OptionalGroup(t) => {
+                    let first_token = t.first().unwrap();
+                    if first_token == kind {
+                        positions.push(Position::new_with_group(pos + 1));
+                    }
+                }
+                SyntaxDefinition::OptionalRepeatedGroup(t) => {
+                    let first_def = t.first().unwrap();
+                    match first_def {
+                        SyntaxDefinition::RequiredToken(k) => {
+                            if k == kind {
+                                positions.push(Position::new(pos + 1));
+                            }
+                        }
+                        SyntaxDefinition::OneOf(kinds) => {
+                            if kinds.iter().any(|x| x == kind) {
+                                positions.push(Position::new(pos + 1));
+                            }
+                        }
+                        _ => {
+                            panic!("OptionalRepeatedGroup must start with RequiredToken or OneOf");
+                        }
+                    }
+                }
+            }
+        }
+
+        positions
+    }
+
     pub fn could_be_complete(&self) -> bool {
-        self.def
-            .tokens
+        self.tokens
             .iter()
             .skip(
                 self.positions
@@ -257,7 +218,149 @@ impl<'a> Tracker<'a> {
                 SyntaxDefinition::RequiredToken(_) => false,
                 SyntaxDefinition::OneOf(_) => false,
                 SyntaxDefinition::AnyToken => false,
+                SyntaxDefinition::OptionalRepeatedGroup(_) => {
+                    if self.child.is_none() {
+                        true
+                    } else {
+                        self.child.as_ref().unwrap().could_be_complete()
+                    }
+                }
                 _ => true,
             })
     }
+
+    pub fn current_positions(&self) -> Vec<usize> {
+        self.positions.iter().map(|x| x.idx).collect()
+    }
+
+    /// Returns the max idx of all tracked positions while ignoring non-required tokens
+    pub fn max_pos(&self) -> usize {
+        self.positions
+            .iter()
+            .map(|p| {
+                // substract non-required tokens from the position count
+                (0..p.idx).fold(0, |acc, idx| {
+                    let token = self.tokens.get(idx);
+                    match token {
+                        Some(SyntaxDefinition::RequiredToken(_)) => acc + 1,
+                        Some(SyntaxDefinition::OneOf(_)) => acc + 1,
+                        Some(SyntaxDefinition::AnyToken) => acc + 1,
+                        _ => acc,
+                    }
+                })
+            })
+            .max()
+            .unwrap()
+    }
+}
+
+#[derive(Debug, Clone)]
+pub struct Position {
+    idx: usize,
+    group_idx: usize,
+}
+
+impl Position {
+    fn new(idx: usize) -> Self {
+        Self { idx, group_idx: 0 }
+    }
+
+    fn new_with_group(idx: usize) -> Self {
+        Self { idx, group_idx: 1 }
+    }
+
+    fn advance(&mut self) {
+        self.idx += 1;
+        self.group_idx = 0;
+    }
+
+    fn advance_group(&mut self) {
+        self.group_idx += 1;
+    }
+}
+
+#[derive(Debug)]
+pub struct Tracker<'a> {
+    pub def: &'a StatementDefinition,
+
+    /// position in the definition, and for each position we track the current token for that
+    /// position. required for groups.
+    // pub positions: Vec<Position>,
+
+    /// position in the global token stream
+    pub started_at: usize,
+
+    used_prohibited_statements: Vec<(usize, SyntaxKind)>,
+
+    token_tracker: TokenTracker<'a>,
+}
+
+impl<'a> Tracker<'a> {
+    pub fn new_at(def: &'a StatementDefinition, at: usize) -> Self {
+        Self {
+            def,
+            // positions: vec![Position::new(1)],
+            started_at: at,
+            used_prohibited_statements: Vec::new(),
+            token_tracker: TokenTracker::new(&def.tokens),
+        }
+    }
+
+    pub fn can_start_stmt_after(
+        &mut self,
+        kind: &SyntaxKind,
+        at: usize,
+        ignore_if_prohibited: bool,
+    ) -> bool {
+        if let Some(x) = self
+            .used_prohibited_statements
+            .iter()
+            .find(|x| x.1 == *kind)
+        {
+            // we already used this prohibited statement, we we can start a new statement
+            // but only if we are not at the same position as the prohibited statement
+            // this is to prevent adding the second "VariableSetStmt" if the first was added to the
+            // used list if both start at the same position
+            println!("used prohibited statement: {:?}", x);
+            return x.0 != at;
+        }
+
+        let res =
+            self.could_be_complete() && self.def.prohibited_following_statements.contains(kind);
+
+        if res {
+            if !ignore_if_prohibited {
+                println!("prohibited statement: {:?}", kind);
+                self.used_prohibited_statements.push((at, kind.clone()));
+            }
+            return false;
+        }
+
+        true
+    }
+
+    /// Returns the max idx of all tracked positions while ignoring non-required tokens
+    pub fn max_pos(&self) -> usize {
+        self.token_tracker.max_pos()
+    }
+
+    pub fn current_positions(&self) -> Vec<usize> {
+        self.token_tracker.current_positions()
+    }
+
+    pub fn advance_with(&mut self, kind: &SyntaxKind) -> bool {
+        if WHITESPACE_TOKENS.contains(kind) {
+            return true;
+        }
+
+        if self.def.prohibited_tokens.contains(kind) {
+            return false;
+        }
+
+        self.token_tracker.advance_with(kind)
+    }
+
+    pub fn could_be_complete(&self) -> bool {
+        self.token_tracker.could_be_complete()
+    }
 }
diff --git a/crates/pg_statement_splitter/src/tracker_new.rs b/crates/pg_statement_splitter/src/tracker_new.rs
new file mode 100644
index 00000000..713f3637
--- /dev/null
+++ b/crates/pg_statement_splitter/src/tracker_new.rs
@@ -0,0 +1,587 @@
+use pg_lexer::{SyntaxKind, WHITESPACE_TOKENS};
+
+use crate::data::{StatementDefinition, SyntaxDefinition};
+
+#[derive(Debug, Clone, PartialEq, Eq)]
+pub struct StatementPosition {
+    at: usize,
+
+    group_idx: Option<usize>,
+}
+
+impl StatementPosition {
+    pub fn new(at: usize) -> Self {
+        StatementPosition {
+            at,
+            group_idx: None,
+        }
+    }
+
+    fn new_within_group(at: usize, group_idx: usize) -> Self {
+        StatementPosition {
+            at,
+            group_idx: Some(group_idx),
+        }
+    }
+
+    fn group_idx(&self) -> usize {
+        self.group_idx
+            .expect("Expected position pointing to a group to have a group index")
+    }
+}
+
+#[derive(Debug)]
+pub struct StatementTracker<'a> {
+    pub def: &'a StatementDefinition,
+
+    /// position in the global token stream
+    pub started_at: usize,
+
+    used_prohibited_statements: Vec<(usize, SyntaxKind)>,
+
+    positions: Vec<StatementPosition>,
+}
+
+impl<'a> StatementTracker<'a> {
+    pub fn new_at(def: &'a StatementDefinition, started_at: usize) -> Self {
+        StatementTracker {
+            def,
+            started_at,
+            used_prohibited_statements: vec![],
+            positions: vec![StatementPosition::new(0)],
+        }
+    }
+
+    pub fn advance_with(&mut self, kind: &SyntaxKind) -> bool {
+        println!("advance with ${:?}", kind);
+        if WHITESPACE_TOKENS.contains(kind) {
+            return true;
+        }
+
+        if self.def.prohibited_tokens.contains(kind) {
+            return false;
+        }
+
+        let mut new_positions = Vec::new();
+
+        for pos in &self.positions {
+            let syntax = self.def.tokens.get(pos.at).expect("invalid position");
+            match syntax {
+                def @ SyntaxDefinition::OptionalRepeatedGroup(defs) => {
+                    if pos.group_idx() == defs.len() - 1 {
+                        // if we are at the end of a repeated group, check next positions
+                        new_positions.extend(next_positions(&self.def.tokens, pos.at, kind));
+                        // also check if we can restart
+                        if def.first_required_tokens().iter().any(|x| x == &kind) {
+                            new_positions.push(StatementPosition::new_within_group(pos.at, 0));
+                        }
+                    } else {
+                        // if we are within a repeated group, we need to check if we can advance within
+                        let next_group_positions = next_positions(&defs, pos.group_idx(), kind);
+
+                        for next_pos in next_group_positions {
+                            new_positions
+                                .push(StatementPosition::new_within_group(pos.at, next_pos.at));
+                        }
+                    }
+                }
+                SyntaxDefinition::OptionalGroup(tokens) => {
+                    if pos.group_idx() == tokens.len() - 1 {
+                        // if we are at the end of a group, check next positions
+                        new_positions.extend(next_positions(&self.def.tokens, pos.at, kind));
+                    } else {
+                        // if we are within a group, we need to check if we can advance within
+                        if tokens[pos.group_idx() + 1] == *kind {
+                            new_positions.push(StatementPosition::new_within_group(
+                                pos.at,
+                                pos.group_idx() + 1,
+                            ));
+                        }
+                    }
+                }
+                SyntaxDefinition::AnyTokens(allowed) => {
+                    let next_pos = next_positions(&self.def.tokens, pos.at, kind);
+
+                    // if within allowed or no next position, keep position
+                    if (allowed.is_some() && allowed.as_ref().unwrap().contains(kind))
+                        || next_pos.is_empty()
+                    {
+                        new_positions.push(StatementPosition::new(pos.at));
+                    }
+
+                    // next positions
+                    new_positions.extend(next_pos);
+                }
+                _ => {
+                    new_positions.extend(next_positions(&self.def.tokens, pos.at, kind));
+                }
+            }
+        }
+
+        self.positions = new_positions;
+
+        !self.positions.is_empty()
+    }
+
+    pub fn can_start_stmt_after(
+        &mut self,
+        kind: &SyntaxKind,
+        at: usize,
+        ignore_if_prohibited: bool,
+    ) -> bool {
+        if let Some(x) = self
+            .used_prohibited_statements
+            .iter()
+            .find(|x| x.1 == *kind)
+        {
+            println!("used prohibited: {:?} at {}", x, at);
+            // we already used this prohibited statement, we we can start a new statement
+            // but only if we are not at the same position as the prohibited statement
+            // this is to prevent adding the second "VariableSetStmt" if the first was added to the
+            // used list if both start at the same position
+            return x.0 != at;
+        }
+
+        let res =
+            self.could_be_complete() && self.def.prohibited_following_statements.contains(kind);
+
+        println!("prohibited: res {} for {:?} at {}", res, kind, at);
+        if res {
+            if !ignore_if_prohibited {
+                self.used_prohibited_statements.push((at, kind.clone()));
+            }
+            return false;
+        }
+
+        true
+    }
+
+    pub fn current_positions(&self) -> Vec<usize> {
+        self.positions.iter().map(|x| x.at).collect()
+    }
+
+    /// Returns the max idx of all tracked positions while ignoring non-required tokens
+    pub fn max_pos(&self) -> usize {
+        self.positions
+            .iter()
+            .map(|p| {
+                // substract non-required tokens from the position count
+                (0..p.at).fold(0, |acc, idx| {
+                    let token = self.def.tokens.get(idx);
+                    match token {
+                        Some(SyntaxDefinition::RequiredToken(_)) => acc + 1,
+                        Some(SyntaxDefinition::OneOf(_)) => acc + 1,
+                        Some(SyntaxDefinition::AnyToken) => acc + 1,
+                        _ => acc,
+                    }
+                })
+            })
+            .max()
+            .unwrap()
+    }
+
+    pub fn could_be_complete(&self) -> bool {
+        let res = self._could_be_complete();
+        // println!(
+        //     "{:?} could be complete: {} with {:?}",
+        //     self.def.stmt, res, self.def.tokens
+        // );
+        res
+    }
+
+    pub fn _could_be_complete(&self) -> bool {
+        let max_pos = self.positions.iter().map(|p| p.at).max().unwrap();
+        // println!("tokens: {:?}", self.def.tokens);
+        // println!("max pos: {} at {:?}", max_pos, self.def.tokens.get(max_pos));
+
+        // if max pos is at group and not at last group idx, we can't be complete
+        match self.def.tokens.get(max_pos) {
+            Some(SyntaxDefinition::OptionalGroup(tokens)) => {
+                if self
+                    .positions
+                    .iter()
+                    .all(|x| x.group_idx() < tokens.len() - 1)
+                {
+                    return false;
+                }
+            }
+            Some(SyntaxDefinition::OptionalRepeatedGroup(tokens)) => {
+                if self
+                    .positions
+                    .iter()
+                    .all(|x| x.group_idx() < tokens.len() - 1)
+                {
+                    return false;
+                }
+            }
+            _ => {}
+        }
+        //
+        // println!(
+        //     "checking tokens after: {:?}",
+        //     self.def.tokens.iter().skip(max_pos + 1).collect::<Vec<_>>()
+        // );
+
+        self.def.tokens.iter().skip(max_pos + 1).all(|x| match x {
+            SyntaxDefinition::RequiredToken(_) => false,
+            SyntaxDefinition::OneOf(_) => false,
+            SyntaxDefinition::AnyToken => false,
+            _ => true,
+        })
+    }
+}
+
+fn next_positions(
+    tokens: &Vec<SyntaxDefinition>,
+    pos: usize,
+    kind: &SyntaxKind,
+) -> Vec<StatementPosition> {
+    let mut new_positions = Vec::new();
+
+    for (pos, token) in tokens.iter().enumerate().skip(pos + 1) {
+        match token {
+            SyntaxDefinition::RequiredToken(k) => {
+                if k == kind {
+                    new_positions.push(StatementPosition::new(pos));
+                }
+                break;
+            }
+            SyntaxDefinition::OptionalToken(k) => {
+                if k == kind {
+                    new_positions.push(StatementPosition::new(pos));
+                }
+            }
+            SyntaxDefinition::AnyTokens(expected) => {
+                if expected.is_none() || expected.as_ref().unwrap().contains(kind) {
+                    new_positions.push(StatementPosition::new(pos));
+                }
+            }
+            SyntaxDefinition::AnyToken => {
+                new_positions.push(StatementPosition::new(pos));
+                break;
+            }
+            SyntaxDefinition::OneOf(kinds) => {
+                if kinds.iter().any(|x| x == kind) {
+                    new_positions.push(StatementPosition::new(pos));
+                }
+                break;
+            }
+            SyntaxDefinition::OptionalGroup(t) => {
+                let first_token = t.first().unwrap();
+                if first_token == kind {
+                    new_positions.push(StatementPosition::new_within_group(pos, 0));
+                }
+            }
+            def @ SyntaxDefinition::OptionalRepeatedGroup(_) => {
+                if def.first_required_tokens().iter().any(|x| x == &kind) {
+                    new_positions.push(StatementPosition::new_within_group(pos, 0));
+                }
+            }
+        }
+    }
+
+    new_positions
+}
+
+#[cfg(test)]
+mod tests {
+    use pg_lexer::{lex, SyntaxKind, WHITESPACE_TOKENS};
+
+    use crate::{
+        data::{SyntaxDefinition, STATEMENT_DEFINITIONS},
+        tracker_new::StatementPosition,
+    };
+
+    use super::StatementTracker;
+
+    #[test]
+    fn test_optional_repeated_group() {
+        let input = "
+WITH t1 AS (
+    SELECT 1
+), t2 AS (
+    SELECT 2
+)
+SELECT 's';
+            ";
+
+        let stmt_def = STATEMENT_DEFINITIONS
+            .get(&SyntaxKind::With)
+            .unwrap()
+            .first()
+            .unwrap();
+
+        // TODO only go to any tokens if there is no other position!
+        println!("{:#?}", stmt_def.tokens);
+
+        let lexed = lex(input);
+
+        let tokens = lexed
+            .iter()
+            .filter(|x| !WHITESPACE_TOKENS.contains(&x.kind))
+            .collect::<Vec<_>>();
+        let mut tokens_iter = tokens.iter();
+
+        while tokens_iter.next().unwrap().kind != SyntaxKind::With {
+            // skip until WITH
+        }
+
+        let mut tracker = StatementTracker::new_at(stmt_def, 1);
+
+        assert_eq!(
+            tracker.positions,
+            vec![StatementPosition {
+                at: 0,
+                group_idx: None
+            }]
+        );
+
+        tracker.advance_with(&tokens_iter.next().unwrap().kind);
+
+        assert_eq!(
+            tracker.positions,
+            vec![StatementPosition {
+                at: 2,
+                group_idx: None
+            }]
+        );
+
+        tracker.advance_with(&tokens_iter.next().unwrap().kind);
+
+        assert_eq!(
+            tracker.positions,
+            vec![StatementPosition {
+                at: 3,
+                group_idx: None
+            }]
+        );
+
+        tracker.advance_with(&tokens_iter.next().unwrap().kind);
+
+        assert_eq!(
+            tracker.positions,
+            vec![StatementPosition {
+                at: 4,
+                group_idx: None
+            }]
+        );
+
+        tracker.advance_with(&tokens_iter.next().unwrap().kind);
+
+        assert_eq!(
+            tracker.positions,
+            vec![StatementPosition {
+                at: 5,
+                group_idx: None
+            }]
+        );
+
+        tracker.advance_with(&tokens_iter.next().unwrap().kind);
+
+        assert_eq!(
+            tracker.positions,
+            vec![StatementPosition {
+                at: 5,
+                group_idx: None
+            }]
+        );
+
+        tracker.advance_with(&tokens_iter.next().unwrap().kind);
+
+        assert_eq!(
+            tracker.positions,
+            vec![StatementPosition {
+                at: 6,
+                group_idx: None
+            }]
+        );
+
+        tracker.advance_with(&tokens_iter.next().unwrap().kind);
+
+        assert_eq!(
+            tracker.positions,
+            vec![StatementPosition {
+                at: 8,
+                group_idx: None
+            }]
+        );
+
+        tracker.advance_with(&tokens_iter.next().unwrap().kind);
+
+        assert_eq!(
+            tracker.positions,
+            vec![StatementPosition {
+                at: 8,
+                group_idx: None
+            }]
+        );
+
+        tracker.advance_with(&tokens_iter.next().unwrap().kind);
+
+        assert_eq!(
+            tracker.positions,
+            vec![StatementPosition {
+                at: 8,
+                group_idx: None
+            }]
+        );
+
+        tracker.advance_with(&tokens_iter.next().unwrap().kind);
+
+        assert_eq!(
+            tracker.positions,
+            vec![StatementPosition {
+                at: 8,
+                group_idx: None
+            }]
+        );
+
+        println!(
+            "{:?}",
+            tracker
+                .positions
+                .iter()
+                .map(|x| stmt_def.tokens.get(x.at))
+                .collect::<Vec<_>>()
+        );
+
+        // tracker.advance_with(&SyntaxKind::Ascii42);
+        //
+        // assert_eq!(tracker.positions.len(), 1);
+        //
+        // assert_eq!(
+        //     tracker.positions[0],
+        //     StatementPosition {
+        //         at: 1,
+        //         group_idx: None
+        //     }
+        // );
+        //
+        // tracker.advance_with(&SyntaxKind::Whitespace);
+        //
+        // assert_eq!(tracker.positions.len(), 1);
+        //
+        // assert_eq!(
+        //     tracker.positions[0],
+        //     StatementPosition {
+        //         at: 1,
+        //         group_idx: None
+        //     }
+        // );
+        //
+        // tracker.advance_with(&SyntaxKind::From);
+        //
+        // assert_eq!(tracker.positions.len(), 1);
+        //
+        // assert_eq!(
+        //     tracker.positions[0],
+        //     StatementPosition {
+        //         at: 2,
+        //         group_idx: None
+        //     }
+        // );
+        //
+        // tracker.advance_with(&SyntaxKind::Whitespace);
+        //
+        // assert_eq!(tracker.positions.len(), 1);
+        //
+        // assert_eq!(
+        //     tracker.positions[0],
+        //     StatementPosition {
+        //         at: 2,
+        //         group_idx: None
+        //     }
+        // );
+        //
+        // tracker.advance_with(&SyntaxKind::Ident);
+        //
+        // assert_eq!(tracker.positions.len(), 1);
+        //
+        // assert_eq!(
+        //     tracker.positions[0],
+        //     StatementPosition {
+        //         at: 2,
+        //         group_idx: None
+        //     }
+        // );
+    }
+
+    #[test]
+    fn test_advance_with() {
+        let new_stmts = STATEMENT_DEFINITIONS.get(&SyntaxKind::Select).unwrap();
+
+        let mut tracker = StatementTracker::new_at(new_stmts.first().unwrap(), 0);
+
+        tracker.advance_with(&SyntaxKind::Whitespace);
+
+        assert_eq!(tracker.positions.len(), 1);
+
+        assert_eq!(
+            tracker.positions[0],
+            StatementPosition {
+                at: 0,
+                group_idx: None
+            }
+        );
+
+        tracker.advance_with(&SyntaxKind::Ascii42);
+
+        assert_eq!(tracker.positions.len(), 1);
+
+        assert_eq!(
+            tracker.positions[0],
+            StatementPosition {
+                at: 1,
+                group_idx: None
+            }
+        );
+
+        tracker.advance_with(&SyntaxKind::Whitespace);
+
+        assert_eq!(tracker.positions.len(), 1);
+
+        assert_eq!(
+            tracker.positions[0],
+            StatementPosition {
+                at: 1,
+                group_idx: None
+            }
+        );
+
+        tracker.advance_with(&SyntaxKind::From);
+
+        assert_eq!(tracker.positions.len(), 1);
+
+        assert_eq!(
+            tracker.positions[0],
+            StatementPosition {
+                at: 2,
+                group_idx: None
+            }
+        );
+
+        tracker.advance_with(&SyntaxKind::Whitespace);
+
+        assert_eq!(tracker.positions.len(), 1);
+
+        assert_eq!(
+            tracker.positions[0],
+            StatementPosition {
+                at: 2,
+                group_idx: None
+            }
+        );
+
+        tracker.advance_with(&SyntaxKind::Ident);
+
+        assert_eq!(tracker.positions.len(), 1);
+
+        assert_eq!(
+            tracker.positions[0],
+            StatementPosition {
+                at: 2,
+                group_idx: None
+            }
+        );
+    }
+}
diff --git a/crates/pg_statement_splitter/tests/skipped.txt b/crates/pg_statement_splitter/tests/skipped.txt
index f4ad8809..35a130b9 100644
--- a/crates/pg_statement_splitter/tests/skipped.txt
+++ b/crates/pg_statement_splitter/tests/skipped.txt
@@ -1,3 +1,5 @@
+alter_table
+
 brin
 brin_bloom
 brin_multi
diff --git a/crates/pg_statement_splitter/tests/skipped_statements.txt b/crates/pg_statement_splitter/tests/skipped_statements.txt
new file mode 100644
index 00000000..edaaef9d
--- /dev/null
+++ b/crates/pg_statement_splitter/tests/skipped_statements.txt
@@ -0,0 +1,2 @@
+alter table atacc1 SET WITH OIDS;
+ALTER INDEX attmp_idx ALTER COLUMN 0 SET STATISTICS 1000;
diff --git a/crates/pg_statement_splitter/tests/statement_splitter_tests.rs b/crates/pg_statement_splitter/tests/statement_splitter_tests.rs
index 2fc69f74..781b3b9c 100644
--- a/crates/pg_statement_splitter/tests/statement_splitter_tests.rs
+++ b/crates/pg_statement_splitter/tests/statement_splitter_tests.rs
@@ -9,6 +9,7 @@ use pg_lexer::SyntaxKind;
 const DATA_DIR_PATH: &str = "tests/data/";
 const POSTGRES_REGRESS_PATH: &str = "../../libpg_query/test/sql/postgres_regress/";
 const SKIPPED_REGRESS_TESTS: &str = include_str!("skipped.txt");
+const SKIPPED_STATEMENTS: &str = include_str!("skipped_statements.txt");
 
 const SNAPSHOTS_PATH: &str = "snapshots/data";
 
@@ -47,8 +48,8 @@ fn test_postgres_regress() {
                     && !l.ends_with("\\gset")
                     && !l.starts_with("--")
                     && !l.contains(":'")
-                    && l.split("\t").count() <= 1
-                    && l != "ALTER INDEX attmp_idx ALTER COLUMN 0 SET STATISTICS 1000;"
+                    && (l.starts_with("\t") || l.split("\t").count() <= 1)
+                    && !SKIPPED_STATEMENTS.contains(l)
                 {
                     if let Some(index) = l.find("--") {
                         Some(l[..index].to_string())
@@ -65,11 +66,10 @@ fn test_postgres_regress() {
         let libpg_query_split_result = pg_query::split_with_parser(&contents);
 
         if libpg_query_split_result.is_err() {
-            eprintln!(
-                "Failed to split statements for test '{}': {:?}",
-                test_name, libpg_query_split_result
+            panic!(
+                "'{}'\nFailed to split statements for test '{}': {:?}",
+                contents, test_name, libpg_query_split_result
             );
-            continue;
         }
 
         let libpg_query_split = libpg_query_split_result.unwrap();