TobikoData · tobymao · Sep 21, 2024 · Sep 20, 2024 · Sep 21, 2024 · izeigerman
diff --git a/sqlmesh/dbt/basemodel.py b/sqlmesh/dbt/basemodel.py
@@ -231,9 +231,6 @@ def relation_info(self) -> AttributeDict[str, t.Any]:
  }
  )
 
- def model_function(self) -> AttributeDict[str, t.Any]:
- return AttributeDict({"config": self.config_attribute_dict})
-
  @property
  def tests_ref_source_dependencies(self) -> Dependencies:
  dependencies = Dependencies()
@@ -280,6 +277,14 @@ def check_for_circular_test_refs(self, context: DbtContext) -> None:
  def sqlmesh_config_fields(self) -> t.Set[str]:
  return {"description", "owner", "stamp", "storage_format"}
 
+ @property
+ def node_name(self) -> str:
+ resource_type = getattr(self, "resource_type", "model")
+ node_name = f"{resource_type}.{self.package_name}.{self.name}"
+ if self.version:
+ node_name += f".v{self.version}"
+ return node_name
+
  def sqlmesh_model_kwargs(self, context: DbtContext) -> t.Dict[str, t.Any]:
  """Get common sqlmesh model parameters"""
  self.check_for_circular_test_refs(context)
@@ -289,10 +294,21 @@ def sqlmesh_model_kwargs(self, context: DbtContext) -> t.Dict[str, t.Any]:
  jinja_macros = model_context.jinja_macros.trim(
  self.dependencies.macros, package=self.package_name
  )
+
+ model_node: AttributeDict[str, t.Any] = AttributeDict(
+ {
+ k: v
+ for k, v in context._manifest._manifest.nodes[self.node_name].to_dict().items()
+ if k in self.dependencies.model_attrs
+ }
+ if context._manifest and self.node_name in context._manifest._manifest.nodes
+ else {}
+ )
+
  jinja_macros.add_globals(
  {
  "this": self.relation_info,
- "model": self.model_function(),
+ "model": model_node,
  "schema": self.table_schema,
  "config": self.config_attribute_dict,
  **model_context.jinja_globals, # type: ignore

diff --git a/sqlmesh/dbt/common.py b/sqlmesh/dbt/common.py
@@ -179,13 +179,15 @@ class Dependencies(PydanticModel):
  sources: t.Set[str] = set()
  refs: t.Set[str] = set()
  variables: t.Set[str] = set()
+ model_attrs: t.Set[str] = set()
 
  def union(self, other: Dependencies) -> Dependencies:
  return Dependencies(
  macros=list(set(self.macros) | set(other.macros)),
  sources=self.sources | other.sources,
  refs=self.refs | other.refs,
  variables=self.variables | other.variables,
+ model_attrs=self.model_attrs | other.model_attrs,
  )
 
  @field_validator("macros", mode="after")

diff --git a/sqlmesh/dbt/manifest.py b/sqlmesh/dbt/manifest.py
@@ -15,6 +15,7 @@
 # Override the file name to prevent dbt commands from invalidating the cache.
 dbt_constants.PARTIAL_PARSE_FILE_NAME = "sqlmesh_partial_parse.msgpack"
 
+import jinja2
 from dbt.adapters.factory import register_adapter, reset_adapters
 from dbt.config import Profile, Project, RuntimeConfig
 from dbt.config.profile import read_profile
@@ -398,6 +399,9 @@ def _extra_dependencies(self, target: str, package: str) -> Dependencies:
  for call_name, node in extract_call_names(target, cache=self._calls):
  if call_name[0] == "config":
  continue
+ elif isinstance(node, jinja2.nodes.Getattr):
+ if call_name[0] == "model":
+ dependencies.model_attrs.add(call_name[1])
  elif call_name[0] == "source":
  args = [jinja_call_arg_name(arg) for arg in node.args]
  if args and all(arg for arg in args):

diff --git a/sqlmesh/utils/__init__.py b/sqlmesh/utils/__init__.py
@@ -81,7 +81,10 @@ def __setitem__(self, k: KEY, v: VALUE) -> None:
 
 
 class AttributeDict(dict, t.Mapping[KEY, VALUE]):
- __getattr__ = dict.get
+ def __getattr__(self, key: t.Any) -> t.Optional[VALUE]:
+ if key.startswith("__") and not hasattr(self, key):
+ raise AttributeError
+ return self.get(key)
 
  def set(self, field: str, value: t.Any) -> str:
  self[field] = value

diff --git a/sqlmesh/utils/jinja.py b/sqlmesh/utils/jinja.py
@@ -16,6 +16,10 @@
 from sqlmesh.utils import AttributeDict
 from sqlmesh.utils.pydantic import PRIVATE_FIELDS, PydanticModel, field_serializer, field_validator
 
+
+if t.TYPE_CHECKING:
+ CallNames = t.Tuple[t.Tuple[str, ...], t.Union[nodes.Call, nodes.Getattr]]
+
 SQLMESH_JINJA_PACKAGE = "sqlmesh.utils.jinja"
 
 
@@ -28,8 +32,6 @@ def environment(**kwargs: t.Any) -> Environment:
 
 ENVIRONMENT = environment()
 
-CallNames = t.Tuple[t.Tuple[str, ...], nodes.Call]
-
 
 class MacroReference(PydanticModel, frozen=True):
  package: t.Optional[str] = None
@@ -136,7 +138,9 @@ def find_call_names(node: nodes.Node, vars_in_scope: t.Set[str]) -> t.Iterator[C
  elif isinstance(child_node, nodes.Macro):
  for arg in child_node.args:
  vars_in_scope.add(arg.name)
- elif isinstance(child_node, nodes.Call):
+ elif isinstance(child_node, nodes.Call) or (
+ isinstance(child_node, nodes.Getattr) and not isinstance(child_node.node, nodes.Getattr)
+ ):
  name = call_name(child_node)
  if name[0][0] != "'" and name[0] not in vars_in_scope:
  yield (name, child_node)
@@ -168,6 +172,7 @@ def extract_macro_references_and_variables(
  for jinja_str in jinja_strs:
  for call_name, node in extract_call_names(jinja_str):
  if call_name[0] == c.VAR:
+ assert isinstance(node, nodes.Call)
  args = [jinja_call_arg_name(arg) for arg in node.args]
  if args and args[0]:
  variables.add(args[0].lower())

diff --git a/tests/core/engine_adapter/test_integration.py b/tests/core/engine_adapter/test_integration.py
@@ -2315,7 +2315,7 @@ def test_to_time_column(
  # specific data type to validate what is returned.
  import re
 
- time_column = re.match("^(.*?)\+", time_column).group(1)
+ time_column = re.match(r"^(.*?)\+", time_column).group(1)
  time_column_type = exp.DataType.build("TIMESTAMP('UTC')", dialect="clickhouse")
 
  time_column = to_time_column(time_column, time_column_type, time_column_format)

diff --git a/tests/core/test_integration.py b/tests/core/test_integration.py
@@ -1386,6 +1386,30 @@ def test_dbt_select_star_is_directly_modified(sushi_test_dbt_context: Context):
  assert plan.snapshots[snapshot_b_id].change_category == SnapshotChangeCategory.NON_BREAKING
 
 
+def test_model_attr(sushi_test_dbt_context: Context, assert_exp_eq):
+ context = sushi_test_dbt_context
+ model = context.get_model("sushi.top_waiters")
+ assert_exp_eq(
+ model.render_query(),
+ """
+ SELECT
+ CAST("waiter_id" AS INT) AS "waiter_id",
+ CAST("revenue" AS DOUBLE) AS "revenue",
+ 3 AS "model_columns"
+ FROM "memory"."sushi"."waiter_revenue_by_day_v2" AS "waiter_revenue_by_day_v2"
+ WHERE
+ "ds" = (
+ SELECT
+ MAX("ds")
+ FROM "memory"."sushi"."waiter_revenue_by_day_v2" AS "waiter_revenue_by_day_v2"
+ )
+ ORDER BY
+ "revenue" DESC NULLS FIRST
+ LIMIT 10
+ """,
+ )
+
+
 @freeze_time("2023-01-08 15:00:00")
 def test_incremental_by_partition(init_and_plan_context: t.Callable):
  context, plan = init_and_plan_context("examples/sushi")

diff --git a/tests/core/test_snapshot_evaluator.py b/tests/core/test_snapshot_evaluator.py
@@ -2673,7 +2673,7 @@ def test_create_managed_forward_only_with_previous_version_doesnt_clone_for_dev_
  )
  )
 
- snapshot: Snapshot = make_snapshot(model)
+ snapshot = make_snapshot(model)
  snapshot.categorize_as(SnapshotChangeCategory.FORWARD_ONLY)
  snapshot.previous_versions = (
  SnapshotDataVersion(

diff --git a/tests/dbt/test_manifest.py b/tests/dbt/test_manifest.py
@@ -31,6 +31,7 @@ def test_manifest_helper(caplog):
  assert models["top_waiters"].dependencies == Dependencies(
  refs={"sushi.waiter_revenue_by_day", "waiter_revenue_by_day"},
  variables={"top_waiters:revenue", "top_waiters:limit"},
+ model_attrs={"columns", "config"},
  macros=[MacroReference(name="ref"), MacroReference(name="var")],
  )
  assert models["top_waiters"].materialized == "view"

diff --git a/tests/fixtures/dbt/sushi_test/models/schema.yml b/tests/fixtures/dbt/sushi_test/models/schema.yml
@@ -2,6 +2,13 @@ version: 2
 
 models:
  - name: top_waiters
+ columns:
+ - name: waiter_id
+ data_type: int
+ - name: revenue
+ data_type: double
+ - name: model_columns
+ data_type: int
  config:
  dialect: postgres
  - name: waiters
@@ -29,4 +36,4 @@ sources:
  external_location: "read_parquet('path/to/external/{name}.parquet')"
  tables:
  - name: items
- - name: orders
+ - name: orders
diff --git a/tests/fixtures/dbt/sushi_test/models/top_waiters.sql b/tests/fixtures/dbt/sushi_test/models/top_waiters.sql
@@ -5,9 +5,13 @@
  )
 }}
 
+{% set columns = model.columns %}
+{% set config = model.config %}
+
 SELECT
  waiter_id::INT AS waiter_id,
- revenue::DOUBLE AS {{ var("top_waiters:revenue") }}
+ revenue::DOUBLE AS {{ var("top_waiters:revenue") }},
+ {{ columns | length }} AS model_columns
 FROM {{ ref('sushi', 'waiter_revenue_by_day') }}
 WHERE
  ds = (