ChatGPT为什么会一本正经胡说八道?我们如何改进它?| 文内附有代码

慈云数据 2024-03-12 技术支持 108 0

ChatGPT为什么会一本正经胡说八道?我们如何改进它?| 文内附有代码

 众所周知,在OpenAI平台上的ChatGPT模型目前有两大痛点:1. 它所学习的数据资料都是截止到2021年为止的,因此无法给出2022年之后的发生的事情。2. 有些时候会出现一些常识性的错误,也就是它会一本正经的胡说八道,比如问它一些历史、数学问题,它可能就会回答出像那么回事儿的错误答案。

 究其原因,主要是ChatGPT是“生成式回复”。它事先学习了大量的人类的知识以及人类对它的引导和奖励的策略。它本质上依托于一个参数量巨大的神经网络模型,其训练过程是基于它的语料库进行的,而这些训练数据本身良莠不齐,并不全都是优质文本,因此有可能出现事实性错误问题。 ChatGPT给出的答案只是基于其理解生成的最佳结果,然而对于某些训练的知识盲区问题,它可能根据字面意思进行推理,从而出现了“一本正经胡说八道”的现象。

 所以为了解决上面的两个问题,我们可以利用搜索引擎向ChatGPT提供准确、及时的辅助信息。总而言之,整体方案就是把在搜索引擎上爬取的问题相关资料丢给CharGPT,让它帮我们整合并输出我们想要的答案。

文章目录

  • ChatGPT为什么会一本正经胡说八道?我们如何改进它?| 文内附有代码
    • 1.快速通道
    • 2. ChatGPT历史的局限性与事实性错误
    • 3. 效果演示
    • 5. 代码示例
    • 4. 参考资料

      1.快速通道

       要是有代码熟练度的读者想直接调试完整代码,可以到我的这个repository直接下载完整可运行的,并且由于CSDN社区规定的原因,完整内容无法写在上面,所以博主将代码和博客全都放在这个repo上了求Star!:https://github.com/lsl1229840757/chatbot。

      2. ChatGPT历史的局限性与事实性错误

       在摘要之中博主已经详细分析了ChatGPT(1)无法回答2022年之后发生的事情;(2)会犯一些常识性的错误,这两大问题。下面让我们举个栗子来看看:

       当我们问他2022世界杯冠军队伍是哪支的时候,它说它无法预测。

      在这里插入图片描述

       当我们问他勾三股四弦五是什么的时候,它会一本正经的告诉我们这是中国古代乐器琴的调弦方法:

      在这里插入图片描述

      3. 效果演示

       没有对比就没有伤害,咱们话不多说,直接上效果展示:

      • 询问2022世界杯冠军队伍

        在这里插入图片描述

      • 询问勾股定理

        在这里插入图片描述

      • 查看近期的新闻

        在这里插入图片描述

        在这里插入图片描述

        5. 代码示例

        import warnings
        import openai
        from Selenium import webdriver
        from selenium.webdriver.common.by import By
        warnings.filterwarnings('ignore')
        class ChatGPT(object):
            def __init__(self, api_key) -> None:
                self._api_key = None
                self.api_key = api_key
                options = webdriver.ChromeOptions()
                options.add_argument('headless')  # 设置不弹出浏览器
                options.add_experimental_option('excludeSwitches',
                                                ['enable-logging'])  # 控制台不输出
                self.browser = webdriver.Chrome(options=options)
            @property
            def api_key(self):
                return self._api_key
            @api_key.setter
            def api_key(self, api_key):
                self._api_key = api_key
                # Load your API key
                openai.api_key = api_key
            def _grabbing_data(self, wd):
                url = f'https://www.baidu.com/s?wd={wd}'
                self.browser.get(url)
                self.browser.execute_script(
                    'window.scrollTo(0, document.body.scrollHeight)')
                data = []
                results = self.browser.find_elements(By.CLASS_NAME, 'c-border') \
                        + self.browser.find_elements(By.CLASS_NAME, 'result-op') \
                        + self.browser.find_elements(By.CLASS_NAME, 'result')
                for result in results[:5]:
                    a_link = result.find_element(By.TAG_NAME, 'a')
                    href = a_link.get_attribute('href')
                    data.append(result.text + f'来源:{href}')
                return data
            def _format_prompt(self, prompt):
                print(f'正在百度中搜索{prompt}相关资料...')
                data = self._grabbing_data(prompt)
                data = '\n'.join(data)
                prompt = f'请根据以下辅助信息回答问题: {data[:1000]}\n 请问:{prompt}'
                return prompt
            def get_answer(self, prompt):
                prompt = self._format_prompt(prompt)
                response = openai.Completion.create(model="text-davinci-003",
                                                    prompt=prompt,
                                                    temperature=0.6,
                                                    max_tokens=2048)
                return response['choices'][0]['text']
            def chat(self):
                flag = True
                print('欢迎使用百度版ChatGPT, 我使用了百度作为资料搜索支撑引擎, 如果您想退出请输入exit!')
                while flag:
                    prompt = input()
                    if prompt != 'exit':
                        print(self.get_answer(prompt))
                    else:
                        print('再见!')
                        flag = False
        

        4. 参考资料

        • https://cloud.tencent.com/developer/article/2190154
        • https://platform.openai.com/account/api-keys
        • https://platform.openai.com/docs/introduction/overview
微信扫一扫加客服

微信扫一扫加客服

点击启动AI问答
Draggable Icon