-
Notifications
You must be signed in to change notification settings - Fork 88
New issue
Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.
By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.
Already on GitHub? Sign in to your account
feat: Add data visualization for Anthropic #432
base: dev
Are you sure you want to change the base?
Changes from 8 commits
daf2d54
b132ff4
7b0bfe9
cf4737b
55e9d64
047948a
3ba98b2
ad07bae
a0e3686
61118dd
e71f852
933d21a
File filter
Filter by extension
Conversations
Jump to
Diff view
Diff view
There are no files selected for viewing
Original file line number | Diff line number | Diff line change | ||||||||||||||||||||||||||||||||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
|
@@ -3,13 +3,17 @@ | |||||||||||||||||||||||||||||||||||||||||||
import asyncio | ||||||||||||||||||||||||||||||||||||||||||||
from contextlib import redirect_stderr, redirect_stdout | ||||||||||||||||||||||||||||||||||||||||||||
|
||||||||||||||||||||||||||||||||||||||||||||
from sqlalchemy.testing.plugin.plugin_base import logging | ||||||||||||||||||||||||||||||||||||||||||||
|
||||||||||||||||||||||||||||||||||||||||||||
import cognee | ||||||||||||||||||||||||||||||||||||||||||||
import mcp.server.stdio | ||||||||||||||||||||||||||||||||||||||||||||
import mcp.types as types | ||||||||||||||||||||||||||||||||||||||||||||
from cognee.api.v1.search import SearchType | ||||||||||||||||||||||||||||||||||||||||||||
from cognee.shared.data_models import KnowledgeGraph | ||||||||||||||||||||||||||||||||||||||||||||
from mcp.server import NotificationOptions, Server | ||||||||||||||||||||||||||||||||||||||||||||
from mcp.server.models import InitializationOptions | ||||||||||||||||||||||||||||||||||||||||||||
from PIL import Image | ||||||||||||||||||||||||||||||||||||||||||||
|
||||||||||||||||||||||||||||||||||||||||||||
|
||||||||||||||||||||||||||||||||||||||||||||
server = Server("cognee-mcp") | ||||||||||||||||||||||||||||||||||||||||||||
|
||||||||||||||||||||||||||||||||||||||||||||
|
@@ -87,9 +91,45 @@ async def handle_list_tools() -> list[types.Tool]: | |||||||||||||||||||||||||||||||||||||||||||
}, | ||||||||||||||||||||||||||||||||||||||||||||
}, | ||||||||||||||||||||||||||||||||||||||||||||
), | ||||||||||||||||||||||||||||||||||||||||||||
types.Tool( | ||||||||||||||||||||||||||||||||||||||||||||
name="visualize", | ||||||||||||||||||||||||||||||||||||||||||||
description="Visualize the knowledge graph.", | ||||||||||||||||||||||||||||||||||||||||||||
inputSchema={ | ||||||||||||||||||||||||||||||||||||||||||||
"type": "object", | ||||||||||||||||||||||||||||||||||||||||||||
"properties": { | ||||||||||||||||||||||||||||||||||||||||||||
"query": {"type": "string"}, | ||||||||||||||||||||||||||||||||||||||||||||
}, | ||||||||||||||||||||||||||||||||||||||||||||
}, | ||||||||||||||||||||||||||||||||||||||||||||
), | ||||||||||||||||||||||||||||||||||||||||||||
Comment on lines
+94
to
+103
There was a problem hiding this comment. Choose a reason for hiding this commentThe reason will be displayed to describe this comment to others. Learn more. 🛠️ Refactor suggestion Clarify query parameter requirement in visualization tool schema The tool's schema defines a "query" property but doesn't mark it as required. Either:
types.Tool(
name="visualize",
description="Visualize the knowledge graph.",
inputSchema={
"type": "object",
"properties": {
"query": {"type": "string"},
},
+ "required": ["query"], # Add this if query is required
},
), 📝 Committable suggestion
Suggested change
🧰 Tools🪛 GitHub Actions: ruff format[warning] File requires formatting. Code does not conform to Ruff's formatting standards. There was a problem hiding this comment. Choose a reason for hiding this commentThe reason will be displayed to describe this comment to others. Learn more. This is a good suggestion from coderabbit There was a problem hiding this comment. Choose a reason for hiding this commentThe reason will be displayed to describe this comment to others. Learn more. @borisarzentar Thank you for confirming! I'm glad the suggestion was helpful. ⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⢀⡀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀⠀ |
||||||||||||||||||||||||||||||||||||||||||||
] | ||||||||||||||||||||||||||||||||||||||||||||
|
||||||||||||||||||||||||||||||||||||||||||||
|
||||||||||||||||||||||||||||||||||||||||||||
def get_freshest_png(directory: str) -> Image.Image: | ||||||||||||||||||||||||||||||||||||||||||||
if not os.path.exists(directory): | ||||||||||||||||||||||||||||||||||||||||||||
raise FileNotFoundError(f"Directory {directory} does not exist") | ||||||||||||||||||||||||||||||||||||||||||||
|
||||||||||||||||||||||||||||||||||||||||||||
# List all files in 'directory' that end with .png | ||||||||||||||||||||||||||||||||||||||||||||
files = [f for f in os.listdir(directory) if f.endswith(".png")] | ||||||||||||||||||||||||||||||||||||||||||||
if not files: | ||||||||||||||||||||||||||||||||||||||||||||
raise FileNotFoundError("No PNG files found in the given directory.") | ||||||||||||||||||||||||||||||||||||||||||||
|
||||||||||||||||||||||||||||||||||||||||||||
# Sort by integer value of the filename (minus the '.png') | ||||||||||||||||||||||||||||||||||||||||||||
# Example filename: 1673185134.png -> integer 1673185134 | ||||||||||||||||||||||||||||||||||||||||||||
try: | ||||||||||||||||||||||||||||||||||||||||||||
files_sorted = sorted(files, key=lambda x: int(x.replace(".png", ""))) | ||||||||||||||||||||||||||||||||||||||||||||
except ValueError as e: | ||||||||||||||||||||||||||||||||||||||||||||
raise ValueError("Invalid PNG filename format. Expected timestamp format.") from e | ||||||||||||||||||||||||||||||||||||||||||||
|
||||||||||||||||||||||||||||||||||||||||||||
# The "freshest" file has the largest timestamp | ||||||||||||||||||||||||||||||||||||||||||||
freshest_filename = files_sorted[-1] | ||||||||||||||||||||||||||||||||||||||||||||
freshest_path = os.path.join(directory, freshest_filename) | ||||||||||||||||||||||||||||||||||||||||||||
|
||||||||||||||||||||||||||||||||||||||||||||
# Open the image with PIL and return the PIL Image object | ||||||||||||||||||||||||||||||||||||||||||||
try: | ||||||||||||||||||||||||||||||||||||||||||||
return Image.open(freshest_path) | ||||||||||||||||||||||||||||||||||||||||||||
except (IOError, OSError) as e: | ||||||||||||||||||||||||||||||||||||||||||||
raise IOError(f"Failed to open PNG file {freshest_path}") from e | ||||||||||||||||||||||||||||||||||||||||||||
|
||||||||||||||||||||||||||||||||||||||||||||
@server.call_tool() | ||||||||||||||||||||||||||||||||||||||||||||
async def handle_call_tool( | ||||||||||||||||||||||||||||||||||||||||||||
name: str, arguments: dict | None | ||||||||||||||||||||||||||||||||||||||||||||
|
@@ -154,6 +194,22 @@ async def handle_call_tool( | |||||||||||||||||||||||||||||||||||||||||||
text="Pruned", | ||||||||||||||||||||||||||||||||||||||||||||
) | ||||||||||||||||||||||||||||||||||||||||||||
] | ||||||||||||||||||||||||||||||||||||||||||||
|
||||||||||||||||||||||||||||||||||||||||||||
elif name == "visualize": | ||||||||||||||||||||||||||||||||||||||||||||
with open(os.devnull, "w") as fnull: | ||||||||||||||||||||||||||||||||||||||||||||
with redirect_stdout(fnull), redirect_stderr(fnull): | ||||||||||||||||||||||||||||||||||||||||||||
try: | ||||||||||||||||||||||||||||||||||||||||||||
result = await cognee.visualize_graph() | ||||||||||||||||||||||||||||||||||||||||||||
results = retrieved_edges_to_string(result) | ||||||||||||||||||||||||||||||||||||||||||||
|
||||||||||||||||||||||||||||||||||||||||||||
return [ | ||||||||||||||||||||||||||||||||||||||||||||
types.TextContent( | ||||||||||||||||||||||||||||||||||||||||||||
type="text", | ||||||||||||||||||||||||||||||||||||||||||||
text=results, | ||||||||||||||||||||||||||||||||||||||||||||
) | ||||||||||||||||||||||||||||||||||||||||||||
] | ||||||||||||||||||||||||||||||||||||||||||||
except (FileNotFoundError, IOError, ValueError) as e: | ||||||||||||||||||||||||||||||||||||||||||||
raise ValueError(f"Failed to create visualization: {str(e)}") | ||||||||||||||||||||||||||||||||||||||||||||
Comment on lines
+198
to
+212
There was a problem hiding this comment. Choose a reason for hiding this commentThe reason will be displayed to describe this comment to others. Learn more. 🛠️ Refactor suggestion Return visualization output instead of text content. The visualization tool returns text content ( return [
- types.TextContent(
- type="text",
- text=results,
- )
+ types.ImageContent(
+ type="image",
+ data=await cognee.visualize_graph(),
+ format="png"
+ )
]
|
||||||||||||||||||||||||||||||||||||||||||||
else: | ||||||||||||||||||||||||||||||||||||||||||||
raise ValueError(f"Unknown tool: {name}") | ||||||||||||||||||||||||||||||||||||||||||||
|
||||||||||||||||||||||||||||||||||||||||||||
|
Some generated files are not rendered by default. Learn more about how customized files appear on GitHub.
Original file line number | Diff line number | Diff line change | ||||||||||||||||||||||||||||||||||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
|
@@ -13,7 +13,7 @@ | |||||||||||||||||||||||||||||||||||||||||||||
import tiktoken | ||||||||||||||||||||||||||||||||||||||||||||||
import nltk | ||||||||||||||||||||||||||||||||||||||||||||||
There was a problem hiding this comment. Choose a reason for hiding this commentThe reason will be displayed to describe this comment to others. Learn more. Add NLTK to project dependencies Multiple pipeline failures indicate that NLTK is not properly declared as a project dependency. Add NLTK to your project dependencies by:
[tool.poetry.dependencies]
nltk = "^3.8.1"
poetry add nltk 🧰 Tools🪛 GitHub Actions: ruff format[warning] File requires formatting using Ruff formatter 🪛 GitHub Actions: test | weaviate[error] 14-14: Missing required dependency: Module 'nltk' not found. Please install the required package using 'poetry add nltk'. 🪛 GitHub Actions: test | milvus[error] 14-14: Missing required dependency: Module 'nltk' not found. Please install the required package using 'pip install nltk' or add it to poetry dependencies. 🪛 GitHub Actions: test | neo4j[error] 14-14: Missing required dependency: Module 'nltk' not found. Please install the package using poetry or pip. 🪛 GitHub Actions: test | qdrant[error] 14-14: Missing required dependency: Module 'nltk' not found. Please install the nltk package. 🪛 GitHub Actions: test | deduplication[error] 14-14: Missing required dependency: Module 'nltk' not found. Please install the package using poetry add nltk or add it to pyproject.toml. 🪛 GitHub Actions: test | pgvector[error] 14-14: Missing required dependency: Module 'nltk' not found. Please install the nltk package. |
||||||||||||||||||||||||||||||||||||||||||||||
import base64 | ||||||||||||||||||||||||||||||||||||||||||||||
|
||||||||||||||||||||||||||||||||||||||||||||||
import time | ||||||||||||||||||||||||||||||||||||||||||||||
|
||||||||||||||||||||||||||||||||||||||||||||||
import logging | ||||||||||||||||||||||||||||||||||||||||||||||
import sys | ||||||||||||||||||||||||||||||||||||||||||||||
|
@@ -30,6 +30,34 @@ | |||||||||||||||||||||||||||||||||||||||||||||
proxy_url = "https://test.prometh.ai" | ||||||||||||||||||||||||||||||||||||||||||||||
|
||||||||||||||||||||||||||||||||||||||||||||||
|
||||||||||||||||||||||||||||||||||||||||||||||
|
||||||||||||||||||||||||||||||||||||||||||||||
def get_entities(tagged_tokens): | ||||||||||||||||||||||||||||||||||||||||||||||
nltk.download("maxent_ne_chunker", quiet=True) | ||||||||||||||||||||||||||||||||||||||||||||||
from nltk.chunk import ne_chunk | ||||||||||||||||||||||||||||||||||||||||||||||
|
||||||||||||||||||||||||||||||||||||||||||||||
return ne_chunk(tagged_tokens) | ||||||||||||||||||||||||||||||||||||||||||||||
Comment on lines
+34
to
+38
There was a problem hiding this comment. Choose a reason for hiding this commentThe reason will be displayed to describe this comment to others. Learn more. 🛠️ Refactor suggestion Add docstring and error handling for get_entities() The function lacks a docstring explaining its purpose and parameters. Also, NLTK resource downloads should be handled with error checking. def get_entities(tagged_tokens):
+ """Extract named entities from POS-tagged tokens using NLTK's ne_chunk.
+
+ Args:
+ tagged_tokens: A list of POS-tagged tokens from nltk.pos_tag()
+
+ Returns:
+ A tree containing chunks of named entities
+ """
+ try:
nltk.download("maxent_ne_chunker", quiet=True)
from nltk.chunk import ne_chunk
+ except Exception as e:
+ logging.error(f"Failed to download NLTK resources: {str(e)}")
+ raise
return ne_chunk(tagged_tokens) 📝 Committable suggestion
Suggested change
🧰 Tools🪛 GitHub Actions: ruff format[warning] File requires formatting using Ruff formatter |
||||||||||||||||||||||||||||||||||||||||||||||
|
||||||||||||||||||||||||||||||||||||||||||||||
|
||||||||||||||||||||||||||||||||||||||||||||||
def extract_pos_tags(sentence): | ||||||||||||||||||||||||||||||||||||||||||||||
"""Extract Part-of-Speech (POS) tags for words in a sentence.""" | ||||||||||||||||||||||||||||||||||||||||||||||
|
||||||||||||||||||||||||||||||||||||||||||||||
# Ensure that the necessary NLTK resources are downloaded | ||||||||||||||||||||||||||||||||||||||||||||||
nltk.download("words", quiet=True) | ||||||||||||||||||||||||||||||||||||||||||||||
nltk.download("punkt", quiet=True) | ||||||||||||||||||||||||||||||||||||||||||||||
nltk.download("averaged_perceptron_tagger", quiet=True) | ||||||||||||||||||||||||||||||||||||||||||||||
|
||||||||||||||||||||||||||||||||||||||||||||||
from nltk.tag import pos_tag | ||||||||||||||||||||||||||||||||||||||||||||||
from nltk.tokenize import word_tokenize | ||||||||||||||||||||||||||||||||||||||||||||||
|
||||||||||||||||||||||||||||||||||||||||||||||
# Tokenize the sentence into words | ||||||||||||||||||||||||||||||||||||||||||||||
tokens = word_tokenize(sentence) | ||||||||||||||||||||||||||||||||||||||||||||||
|
||||||||||||||||||||||||||||||||||||||||||||||
# Tag each word with its corresponding POS tag | ||||||||||||||||||||||||||||||||||||||||||||||
pos_tags = pos_tag(tokens) | ||||||||||||||||||||||||||||||||||||||||||||||
|
||||||||||||||||||||||||||||||||||||||||||||||
return pos_tags | ||||||||||||||||||||||||||||||||||||||||||||||
|
||||||||||||||||||||||||||||||||||||||||||||||
|
||||||||||||||||||||||||||||||||||||||||||||||
def get_anonymous_id(): | ||||||||||||||||||||||||||||||||||||||||||||||
"""Creates or reads a anonymous user id""" | ||||||||||||||||||||||||||||||||||||||||||||||
home_dir = str(pathlib.Path(pathlib.Path(__file__).parent.parent.parent.resolve())) | ||||||||||||||||||||||||||||||||||||||||||||||
|
@@ -243,31 +271,9 @@ async def render_graph( | |||||||||||||||||||||||||||||||||||||||||||||
# return df.replace([np.inf, -np.inf, np.nan], None) | ||||||||||||||||||||||||||||||||||||||||||||||
|
||||||||||||||||||||||||||||||||||||||||||||||
|
||||||||||||||||||||||||||||||||||||||||||||||
def get_entities(tagged_tokens): | ||||||||||||||||||||||||||||||||||||||||||||||
nltk.download("maxent_ne_chunker", quiet=True) | ||||||||||||||||||||||||||||||||||||||||||||||
from nltk.chunk import ne_chunk | ||||||||||||||||||||||||||||||||||||||||||||||
|
||||||||||||||||||||||||||||||||||||||||||||||
return ne_chunk(tagged_tokens) | ||||||||||||||||||||||||||||||||||||||||||||||
|
||||||||||||||||||||||||||||||||||||||||||||||
|
||||||||||||||||||||||||||||||||||||||||||||||
def extract_pos_tags(sentence): | ||||||||||||||||||||||||||||||||||||||||||||||
"""Extract Part-of-Speech (POS) tags for words in a sentence.""" | ||||||||||||||||||||||||||||||||||||||||||||||
|
||||||||||||||||||||||||||||||||||||||||||||||
# Ensure that the necessary NLTK resources are downloaded | ||||||||||||||||||||||||||||||||||||||||||||||
nltk.download("words", quiet=True) | ||||||||||||||||||||||||||||||||||||||||||||||
nltk.download("punkt", quiet=True) | ||||||||||||||||||||||||||||||||||||||||||||||
nltk.download("averaged_perceptron_tagger", quiet=True) | ||||||||||||||||||||||||||||||||||||||||||||||
|
||||||||||||||||||||||||||||||||||||||||||||||
from nltk.tag import pos_tag | ||||||||||||||||||||||||||||||||||||||||||||||
from nltk.tokenize import word_tokenize | ||||||||||||||||||||||||||||||||||||||||||||||
|
||||||||||||||||||||||||||||||||||||||||||||||
# Tokenize the sentence into words | ||||||||||||||||||||||||||||||||||||||||||||||
tokens = word_tokenize(sentence) | ||||||||||||||||||||||||||||||||||||||||||||||
|
||||||||||||||||||||||||||||||||||||||||||||||
# Tag each word with its corresponding POS tag | ||||||||||||||||||||||||||||||||||||||||||||||
pos_tags = pos_tag(tokens) | ||||||||||||||||||||||||||||||||||||||||||||||
|
||||||||||||||||||||||||||||||||||||||||||||||
return pos_tags | ||||||||||||||||||||||||||||||||||||||||||||||
|
||||||||||||||||||||||||||||||||||||||||||||||
|
||||||||||||||||||||||||||||||||||||||||||||||
logging.basicConfig(level=logging.INFO) | ||||||||||||||||||||||||||||||||||||||||||||||
|
@@ -396,6 +402,7 @@ async def create_cognee_style_network_with_logo( | |||||||||||||||||||||||||||||||||||||||||||||
|
||||||||||||||||||||||||||||||||||||||||||||||
from bokeh.embed import file_html | ||||||||||||||||||||||||||||||||||||||||||||||
from bokeh.resources import CDN | ||||||||||||||||||||||||||||||||||||||||||||||
from bokeh.io import export_png | ||||||||||||||||||||||||||||||||||||||||||||||
|
||||||||||||||||||||||||||||||||||||||||||||||
logging.info("Converting graph to serializable format...") | ||||||||||||||||||||||||||||||||||||||||||||||
G = await convert_to_serializable_graph(G) | ||||||||||||||||||||||||||||||||||||||||||||||
|
@@ -443,15 +450,19 @@ async def create_cognee_style_network_with_logo( | |||||||||||||||||||||||||||||||||||||||||||||
) | ||||||||||||||||||||||||||||||||||||||||||||||
p.add_tools(hover_tool) | ||||||||||||||||||||||||||||||||||||||||||||||
|
||||||||||||||||||||||||||||||||||||||||||||||
# Get the latest Unix timestamp as an integer | ||||||||||||||||||||||||||||||||||||||||||||||
timestamp = int(time.time()) | ||||||||||||||||||||||||||||||||||||||||||||||
|
||||||||||||||||||||||||||||||||||||||||||||||
# Construct your filename | ||||||||||||||||||||||||||||||||||||||||||||||
filename = f"{timestamp}.png" | ||||||||||||||||||||||||||||||||||||||||||||||
|
||||||||||||||||||||||||||||||||||||||||||||||
|
||||||||||||||||||||||||||||||||||||||||||||||
|
||||||||||||||||||||||||||||||||||||||||||||||
logging.info(f"Saving visualization to {output_filename}...") | ||||||||||||||||||||||||||||||||||||||||||||||
html_content = file_html(p, CDN, title) | ||||||||||||||||||||||||||||||||||||||||||||||
with open(output_filename, "w") as f: | ||||||||||||||||||||||||||||||||||||||||||||||
f.write(html_content) | ||||||||||||||||||||||||||||||||||||||||||||||
|
||||||||||||||||||||||||||||||||||||||||||||||
logging.info("Visualization complete.") | ||||||||||||||||||||||||||||||||||||||||||||||
|
||||||||||||||||||||||||||||||||||||||||||||||
if bokeh_object: | ||||||||||||||||||||||||||||||||||||||||||||||
return p | ||||||||||||||||||||||||||||||||||||||||||||||
return html_content | ||||||||||||||||||||||||||||||||||||||||||||||
|
||||||||||||||||||||||||||||||||||||||||||||||
|
||||||||||||||||||||||||||||||||||||||||||||||
|
@@ -512,7 +523,7 @@ def setup_logging(log_level=logging.INFO): | |||||||||||||||||||||||||||||||||||||||||||||
G, | ||||||||||||||||||||||||||||||||||||||||||||||
output_filename="example_network.html", | ||||||||||||||||||||||||||||||||||||||||||||||
title="Example Cognee Network", | ||||||||||||||||||||||||||||||||||||||||||||||
node_attribute="group", # Attribute to use for coloring nodes | ||||||||||||||||||||||||||||||||||||||||||||||
label="group", # Attribute to use for coloring nodes | ||||||||||||||||||||||||||||||||||||||||||||||
layout_func=nx.spring_layout, # Layout function | ||||||||||||||||||||||||||||||||||||||||||||||
layout_scale=3.0, # Scale for the layout | ||||||||||||||||||||||||||||||||||||||||||||||
logo_alpha=0.2, | ||||||||||||||||||||||||||||||||||||||||||||||
|
There was a problem hiding this comment.
Choose a reason for hiding this comment
The reason will be displayed to describe this comment to others. Learn more.
Replace hardcoded paths with placeholders.
The instructions contain specific user paths that won't work for other users.
Apply these changes:
Also applies to: 105-105