데이터 카탈로그 description 개선방향 #5
Labels
datahub
The integration point that retrieves metadata from DataHub to provide better context for query gener
enhancement
New feature or request
Uh oh!
There was an error while loading. Please reload this page.
Why
현재 상황:
문제점:
사용자 질문에 따라 참조할 수 있는 정보가 빈약해서 질문에 대한 올바른 테이블 데이터를 가져오지 않는 문제점이 있습니다.
현재 가져오는 데이터들은 테이블간의 관계(1:1, 1:N, M:N)가 포함되어 있지 않습니다.
예시:
How
DataHub의 데이터 카탈로그로부터 비즈니스 용어 사전, 테이블 메타 데이터를 생성해 사용자 질문의 맥락에 적합한 정보를 참조할 수 있게 할 수 있습니다.
계층적 구조를 갖는 상위 노드들을 만들어 관계를 명시적으로 표현하고, 이를 통해 테이블 간 JOIN에 사용할 수 있습니다.
프로젝트에 적용한다면 table, column description을 가장 하위 노드로 두고, Table의 관계, pk, fk 정보를 함께 포함시켜 상위 노드로 추가할 수 있습니다. 상위 노드에서 pk, fk 관계를 활용해 테이블을 JOIN 하는 효율적인 쿼리를 작성할 수 있습니다. 이런 계층적 구조를 사용하여 다양한 수준에서의 정보를 얻고, 활용할 수 있습니다.
Table, column description이 충분한 Kaggle 데이터셋을 포함시켜 사용할 수 있습니다.
What
The text was updated successfully, but these errors were encountered: