xmind_tree.py

from XmindCopilot import XmindCopilot
from XmindCopilot.XmindCopilot.core.topic import TopicElement
from XmindCopilot.XmindCopilot.search import topic_search
from XmindCopilot.XmindCopilot.file_shrink import xmind_shrink
from config import *
from gpt_interface import GPTInterface, GPTRequest
from pdf_extract import get_objpixmap


class Xmindtree(TopicElement):

    def __init__(self, stem_node, paper, title='', apibase=APIBASE, apikeys=APIKEYS, model=MODEL, keyword=KEYWORD,
                 gpt_enable=GPT_ENABLE, openai_proxy=PROXY, rate_limit=THREAD_RATE_LIMIT,
                 fake_response=FAKE_GPT_RESPONSE, maxtoken=MAXTOKEN, language=LANGUAGE):
        # Set root node to itself
        self.__dict__ = stem_node.__dict__

        if title:
            self.setTitle(title)
        self.paper = paper
        self.gpt = GPTInterface(apibase=apibase, apikeys=apikeys, model=model, keyword=keyword,
                                gpt_enable=gpt_enable, openai_proxy=openai_proxy,
                                rate_limit=rate_limit)
        self.apibase = apibase
        self.apikeys = apikeys
        self.model = model
        self.keyword = keyword
        self.gpt_enable = gpt_enable
        self.openai_proxy = openai_proxy
        self.rate_limit = rate_limit
        self.fake_response = fake_response
        self.maxtoken = maxtoken
        self.language = language
        # Meta Data
        # self.meta_node = self.addSubTopicbyTitle("Meta")
        # self.meta_node.addSubTopicbyTitle('Title:' + self.paper.title)
        # self.meta_node.addSubTopicbyTitle('Url:' + self.paper.url)
        # self.meta_node.addSubTopicbyTitle('Paper_info:' + self.paper.section_text_dict['paper_info'])

    def gen_table_of_content(self):
        # Note: only support sections named with specified numbering
        ptr = self
        section_list = self.paper.get_section_titles(withlevel=True)
        for title in section_list:
            if title[1] == 1:
                ptr = self.addSubTopicbyTitle(title[0])
            else:
                ptr.addSubTopicbyTitle(title[0])

    def gen_textbrief(self):
        """
        Generate textbrief for each section in xmind
        `Note: This might be time consuming`
        """
        # Add Request Tasks
        content_dict = self.paper.get_section_textdict(remove_title=True)
        section_names = self.paper.get_section_titles()

        # FIXME: Abstract & Introduction Summary may not exist for some time.
        # Abstract
        self.gpt.addRequest(GPTRequest(self.paper.abstract, model=self.model, language=self.language,
                                       keyword=self.keyword, maxtoken=self.maxtoken, gpt_enable=self.gpt_enable,
                                       fake_response=self.fake_response).para2list(), section_names[0])
        # Introduction Summary
        summary_text = '\n'.join(["Title:" + self.paper.title,
                                  "URL:" + self.paper.url,
                                  "Ahthor:" + ' '.join(self.paper.authors),
                                  "Abstract:" + self.paper.abstract,
                                  self.paper.introduction])
        self.gpt.addRequest(GPTRequest(
            summary_text, model=self.model, language=self.language,
            keyword=self.keyword, maxtoken=self.maxtoken, gpt_enable=self.gpt_enable,
            fake_response=self.fake_response).introSummary(), section_names[1])
        for name in section_names[2:-1]:
            self.gpt.addRequest(GPTRequest(
                content_dict[name], model=self.model, language=self.language,
                keyword=self.keyword, maxtoken=self.maxtoken, gpt_enable=self.gpt_enable,
                fake_response=self.fake_response).para2tree(), name)
        # Start GPT req
        self.gpt.gptMultitask()
        # Add to xmind
        for name in section_names[:-1]:
            content = self.gpt.getResponse(name)
            topic_search(self, name).addSubTopicbyMarkDown(content, index=0)

    def gen_equation(self, legacy=True):
        """
        Generate equation for each section in xmind

        :param legacy: if True, use legacy method to extract\
            equation, else use new method.
        `NOTE` It seems that legacy method is more accurate.
        """
        section_names = self.paper.get_section_titles()
        eqa_dict = self.paper.get_section_equationdict(legacy=legacy)
        for name in section_names[:-1]:
            eqa_ls = eqa_dict.get(name)
            if eqa_ls:
                for eqa in eqa_ls:
                    eqa_tempdir = get_objpixmap(self.paper.pdf, eqa)
                    topic_search(self, name).addSubTopicbyImage(
                        eqa_tempdir, eqa_ls.index(eqa))

    def gen_image(self, snap_with_caption, verbose=False):
        """
        Generate image for each section in xmind (Figure/Table)
        """
        section_names = self.paper.get_section_titles()
        img_dict = self.paper.get_section_imagedict(
            snap_with_caption=snap_with_caption, verbose=verbose)
        for name in section_names[:-1]:
            img_ls = img_dict.get(name)
            if img_ls:
                for img in img_ls:
                    img_tempdir = get_objpixmap(self.paper.pdf, img)
                    topic = topic_search(self, name).addSubTopicbyImage(
                        img_tempdir, img_ls.index(img))
                    # FIXME: This is a temporary solution for compatibility
                    if len(img) == 4:
                        topic.setTitle(img[3])
                        topic.setTitleSvgWidth()

    def gen_summary(self, folded=True, verbose=False, gen_equations=GEN_EQUATIONS, gen_imgs=GEN_IMGS, snap_with_caption=SNAP_WITH_CAPTION):
        self.gen_table_of_content()
        print("\033[94mChatGPT Requesting...\033[97m")
        self.gen_textbrief()
        print("\033[94mImages Generating...")
        if gen_equations:
            self.gen_equation(legacy=False)
        if gen_imgs:
            self.gen_image(verbose=verbose,
                           snap_with_caption=snap_with_caption)
        self.removeSubTopicWithEmptyTitle()

        def removeNewlineinTitle(topic):
            title = topic.getTitle()
            if title:
                topic.setTitle(title.replace('\n', ''))
        self.modify(removeNewlineinTitle, recursive=True)
        if folded:
            self.setFolded(True)

    def save_xmind(self, path=None, img_compress=False):
        """Not recommanded yet"""
        XmindCopilot.save(self.getOwnerWorkbook(), path=path)
        if img_compress:
            xmind_shrink(self.getOwnerWorkbook().get_path())