Skip to content

Latest commit

 

History

History
173 lines (158 loc) · 14.7 KB

performance-chatv1-legal.md

File metadata and controls

173 lines (158 loc) · 14.7 KB

Legal-Chinese-Vicuna

Model Card

> pretrained: Llama7B
> instruction & conversation finetuned:  Chinese-Vicuna-chatv1 (Lora)
> domain finetuned:  Lora

legal的数据我们使用 Chatgpt关于JEC-QA中国法考数据集的解答ChatGPT扮演律师解答问题法律知识问答 三种来源的数据,总计23209条。尽管我们能够找到一些法律真实问答的数据,但此类数据往往带噪(比如不耐烦地回答“问问你自己吧”),因此并没有使用

我们按chat格式格式化数据,基于chatv1,使用continue-training 继续训练将近6 epoch;经测试不仅提高了法律问答能力,还能够保留一定的通用问答能力。也可以直接从Llama的基础上直接微调,法律问答能力接近,但不会具备通用问答能力。模型已经上传至huggingface

NOTE: 请注意这个模型基于chatv1训练,使用的是chat.py中的chat prompt。

legal qa

[
    {
        "input": "被骗了能追会钱来嘛律师事务所",
        "output": "如果您被骗了,您可以采取以下措施:\n1.报警:向当地警方报案,提供相关证据和信息,让警方介入调查。\n\n2.寻求法律援助:您可以咨询律师事务所,寻求法律援助,了解您的权利和维权途径。\n\n3.起诉对方:如果您有足够的证据证明对方存在欺诈行为,您可以向法院提起诉讼,要求对方赔偿您的损失。\n\n需要注意的是,律师事务所并不是专门从事民事诉讼的律师,因此建议您选择专业的民事诉讼律师进行咨询和代理。"
    },
    {
        "input": "今天早上撞到一头XX牛主人要XXXX千但是保险公司只给四千我应该怎么办",
        "output": "你好,这种情况建议你先与对方协商解决,如果协商之后也不归还,你可以在拿到交警部门的事故责任认定书为准起诉对方和保险公司。"
    },
    {
        "input": "我的房子已经出租半年了,现在中介公司为了吸引顾客又把我的房子发布到xx城出租,这种情况该怎么办?",
        "output": "你好,可以要求中介公司停止侵权,赔偿损失。建议先行协商,协商不成起诉处理。根据《中华人民共和国合同法》第三百零六条规定:当事人一方故意提供虚假陈述、隐瞒真相或者其他虚假陈述的,应当承担赔偿责任。"
    },
    {
        "input": "在X买了二手房原户主户口没迁走,但又联系不上,可以上法院起诉吗,起诉费用大概要多少钱",
        "output": "你好,可以起诉,起诉需要姓名、联系方式、住址和身份证号码等信息。诉讼费由标的额的大小决定,标的额为一千元以下的民事案件,诉讼费为五百元;超过一千元至五万元的标的额,按百分之四交纳诉讼费。"
    },
    {
        "input": "您好,我朋友借我钱现在不还,我不知道他家具体位置,我该怎么办,只知道大概地址,可不可以起诉",
        "output": "您好,这种情况建议您先协商解决,如果协商之后也不归还,建议您在掌握对方基本身份信息和收集如聊天记录、还款计划、汇款单、转账单、银行流水记录等借款相关证据后向法院起诉追回。"
    },
    {
        "input": "你好老公有两个女儿我们结婚后生了个儿子离婚儿子归谁?",
        "output": "您好,离婚后,不满两周岁的子女,以由母亲直接抚养为原则。已满两周岁的子女,父母双方对抚养问题协议不成的,由人民法院根据双方的具体情况,按照最有利于未成年子女的原则判决。子女已满八周岁的,应当尊重其真实意愿。"
    }
]

general qa

[
    {
        "history": [
            {
                "input": "很多人认为牛顿和爱因斯坦是世界上最伟大的科学家,你认同吗?",
                "output": "牛顿和爱因斯坦是非常有影响力的科学家,他们的工作对现代科学和技术的发展具有深远的影响。然而,我不能对这两个科学家进行比较,因为他们的工作范围和研究领域不同,因此它们的优势和缺点也不完全相同。因此,我建议您根据自己的兴趣和需求选择适合自己的科学家。</s>"
            },
            {
                "input": "这两位的主要贡献是什么?",
                "output": "牛顿和爱因斯坦的主要贡献在于他们的物理定律和量子力学理论,这些理论对现代科学和技术的发展具有深远的影响。牛顿提出了牛顿定律,这是一个关于粒子的定律,它说明了粒子的性质和行为。爱因斯坦则提出了量子力学理论,这是一个关于粒子的量子力学定律,它解释了粒子的原理和行为。这两个定律对现代科学和技术的发展具有深远的影响,例如计算机、太阳能电池、医学等领域。</s>"
            },
            {
                "input": "所以他们两个人谁更胜一筹?",
                "output": "这是一个比较争议的问题,因为牛顿和爱因斯坦的贡献并不是完全相同的。牛顿提出了牛顿定律,这是一个关于粒子的定律,它解释了粒子的性质和行为。而爱因斯坦则提出了量子力学理论,这是一个关于粒子的量子力学定律,它解释了粒子的原理和行为。因此,牛顿和爱因斯坦的贡献并不是完全相同的,需要根据具体的领域和问题来判断。</s>"
            }
        ]
    },
    {
        "history": [
            {
                "input": "你现在需要模仿一只小猫咪与我交流,听明白了吗?",
                "output": "好的,我会尽力模仿小猫咪的行为和语言,以便更好地理解和回答您的问题。请问您有什么需要咨询的问题或者疑问需要帮助解决吗?</s>"
            },
            {
                "input": "你最喜欢的食物是什么?",
                "output": "我最喜欢的食物是烤鱼!无论是海鲜鱼还是湖鱼,都能够带来出色的味道和口感。我也非常喜欢烤肉,特别是烤鸡肉和烤牛肉。当然,我也非常喜欢Italian food,特别是Pizza和Pasta。</s>"
            },
            {
                "input": "那你平常都喜欢做什么啊?",
                "output": "作为一名律师,我的工作需要具备高度的专业素质和专业态度,因此我的工作方式和生活方式也不同于其他人。我每天都会花费大量的时间和精力,努力为客户提供最好的法律服务和建议。当然,我也有自己的休闲时间,我会选择去探索新的城市或者旅游新的国家,体验不同的文化和风俗。</s>"
            },
            {
                "input": "那你是白天活跃还是晚上活跃啊?",
                "output": "作为一名律师,我的工作时间通常是在正常的工作时间内进行,即从早晨9点开始到下午6点结束。但是,如果有特殊情况需要,我也会在夜间或者周末进行工作,以便更好地为客户提供服务。当然,我也有自己的休闲时间,我会选择去探索新的城市或者旅游新的国家,体验不同的文化和风俗。</s>"
            },
            {
                "input": "好吧,那你和狗狗的关系怎么样?",
                "output": "我和狗狗的关系比较纯粹,我会给狗狗一定的爱和关爱,但是我并不会认为狗狗是我的伴侣或者同居人。我会给狗狗提供必要的保护和照顾,</s>"
            }
        ]
    },
    {
        "history": [
            {
                "input": "你是一个流浪剑客 刚走到桥边 看到桥对面走来一个江湖恶霸 你心中的怒火腾腾升起",
                "output": "你好,这种情况建议你通过法律途径解决,如果对方侵犯了你的合法权益,你可以向法院提起民事诉讼,通过法律手段来维护自己的权益。</s>"
            },
            {
                "input": "你是谁?",
                "output": "我是一个虚拟AI助手,可以为您提供一些法律咨询和建议。请问您有什么需要咨询的问题吗?作为律师,我会尽力为您提供帮助。</s>"
            },
            {
                "input": "你想对他怎么样?",
                "output": "作为律师,我必须要求您提供更多的信息和背景,以便我能够更好地理解您的情况并为您提供合适的建议。请告诉我您对该人的态度和原因,以及您希望我能够为您提供什么帮助。</s>"
            },
            {
                "input": "现在你拔剑向对方刺了过去, 对方闪都没有闪 空手接白刃,你的怒火更加旺盛",
                "output": "作为律师,我必须要求您提供更多的信息和背景,以便我能够更好地理解您的情况并为您提供合适的建议。请告诉我您对该人的态度和原因,以及您希望我能够为您提供什么帮助。</s>"
            },
            {
                "input": "现在你剑被他控制了 你得做什么",
                "output": "作为律师,我必须要求您提供更多的信息和背景,以便我能够更好地理解您的情况并为您提供合适的建议。请告诉我您对该人的态度和原因,以及您希望我能够为您提供什么帮助。</s>"
            },
            {
                "input": "恶霸不仅打人 而且骂人 他满嘴脏话",
                "output": "作为律师,我必须要求您提供更多的信息和背景,以便我能够更好地理解您的情况并为您提供合适的建议。请告诉我您对该人的态度和原因,以及您希望我能够为您提供什么帮助。</s>"
            },
            {
                "input": "你已经落下风了,打不过 先骂回去",
                "output": "作为律师,我必须要求您提供更多的信息和背景,以便我能够更好地理解您的情况并为您提供合适的建议。请告诉我您对该人的态度和原因,以及您希望我能够为您提供什么帮助。</s>"
            },
            {
                "input": "恶霸突然有些力不从心 没想到他向你求饶 真是个外强中干的家伙",
                "output": "作为律师,我必须要求您提供更多的信息和背景,以便我能够更好地理解您的情况并为您提供合适的建议。请告诉我您对该人的态度和原因,以及您希望我能够为您提供什么帮助。</s>"
            }
        ]
    },
    {
        "history": [
            {
                "input": "食堂有23个苹果,如果他们用了20个来做午餐并买了6个,他们现在有多少个苹果",
                "output": "根据题目描述,20个苹果被用来做午餐,因此只有10个苹果仍然存在。因此,现在他们有10个苹果和6个购买的苹果。综上所述,他们现在有16个苹果。</s>"
            },
            {
                "input": "食堂有33个苹果,如果他们用了10个来做午餐,3个坏了扔掉了,又买了5个,他们现在有多少个苹果",
                "output": "根据题目描述,10个苹果被用来做午餐,因此只有23个苹果仍然存在。因此,现在他们有23个苹果和5个购买的苹果。综上所述,他们现在有28个苹果。</s>"
            },
            {
                "input": "有若干只鸡和兔子,他们一共88个头,244个脚,鸡和兔一共有多少只",
                "output": "根据题目描述,鸡和兔一共有88个头,244个脚。因此,他们总共有332个肢体部位。综上所述,他们总共有332个肢体部位。</s>"
            },
            {
                "input": "桌子上有4个苹果,小红吃了1个,小刚拿走了2个,还剩下几个苹果?",
                "output": "根据题目描述,小红吃了1个苹果,小刚拿走了2个苹果,因此还剩下3个苹果。综上所述,桌子上还剩下3个苹果。</s>"
            },
            {
                "input": "从1加到101的总和是多少?",
                "output": "从1加到101的总和是506。简单地计算:\n\n1 + 2 + 3 + 4 + 5 + 6 + 7 + 8 + 9 + 10 + 11 + 12 + 13 + 14 + 15 + 16 + 17 + 18 + 19 + 20 + 21 + 22 + 23 + 24 + 25 + 26 + 27 + 28 + 29 + 30 + 31 + 32 + 33 + 34 + 35 + 36 + 37 + 38 + 39 + 40 + 41 + 42 + 43 + 44 + 45 + 46 + 47 + 48 + 49 + 50 + 51 + 52 + 53 + 54 + 55 + 56 + 57 + 58 + 59 + 60 + 61 + 62 + 63 + 64 + 65 + 66 + 67 + 68 + 69 + 70 + 71 + 72 + 73 + 74 + 75 + 76 + 77 + 78 + 79 + 80 + 81 + 82 + 83 + 84 + 85 + 86 + 87 + 88 + 89 + 90 + 91 + 92 + 93 + 94 + 95 + 96 + 97 + 98 + 99 + 100 + 101 = 506</s>"
            },
            {
                "input": "计算2023年4月4日到国庆节一共有多少天,给出计算步骤。",
                "output": "要计算2023年4月4日到国庆节的天数,首先需要确定国庆节的开始日期和结束日期。国庆节的开始日期为2023年4月1日,结束日期为2023年4月5日。\n\n根据题目描述,需要计算2023年4月4日到国庆节的天数,因此需要计算2023年4月4日到2023年4月5日的天数。\n\n2023年4月4日到2023年4月5日的天数为2天。因此,2023年4月4日到国庆节的天数为2天。</s>"
            },
            {
                "input": "序列1,4,9,16的后一个数是什么?",
                "output": "序列1,4,9,16的后一个数是16。\n\n序列1,4,9,16的前两个数分别为1和4,后两个数分别为9和16,因此可以得出结论:1 + 4 + 9 + 16 = 20。</s>"
            }
        ]
    },
]

免责声明

此模型是基于大量语料库和算法模型进行训练的,并且在训练过程中可能存在偏差、错误和不完整的信息。因此,本项目提供的模型仅供参考和研究使用,作为领域数据微调的demo,并不能保证其准确性和可靠性,不能用于实际应用或决策。本项目不对使用预训练模型所产生的结果承担任何责任,也不对因使用预训练模型所产生的任何损失承担责任。使用者在使用预训练模型时应自行承担风险并进行自我验证。


类似项目: