Google大模型Bard更名Gemini，现在实力如何？比gpt更强?

慈云数据 2024-05-11 技术支持 39 0

名人说：一花独放不是春，百花齐放花满园。——《增广贤文》

作者：Code_流苏(CSDN)（一个喜欢古诗词和编程的Coder😊）

目录

- - 一、简要介绍
  - - 1、Gemini是什么？
    - 2、主要特点
    - 3、Gemini的版本
    - 4、应用潜力
    - 5、使用方法
    - 二、分类问题测试
    - - 1、基础问答（5个）
      - 2、数学题解答（5个）
      - 3、逻辑推理（5个）
      - 4、创造性写作（3个）
      - 5、代码编写（3个）
      - 6、对话理解与情感交流（2个）
      - 7、翻译任务（1个）
      - 8、策略规划（1个）
      - 三、测试结果（仅代表个人观点）
        ★观前提示：以下内容仅为测试内容，不代表未来新版本如何。
        在本篇博客中，我们将一起探讨Google AI模型——Gemini。Gemini标志着Google在人工智能领域的一大飞跃，不仅因为它的先进技术，也因为它在多任务语言理解（MMLU）测试中首次超越了人类专家。这一成就显示了Gemini在知识获取和问题解决能力上的卓越性能，最初名称为Bard，最近赋名为了Gemini，那么它究竟如何，本篇内容将采用与上篇gpt3.5相同的问题来进行测试，最后会在测试感受出说一下对比gpt3.5它能力的强弱。
        
        一、简要介绍
        
        1、Gemini是什么？
        
        Gemini 是 Google 开发的最新一代大型人工智能模型，代表了 Google 在人工智能领域的最新进展。它是一个跨部门协作的成果，由 Google 研究部的同事从头开始构建，具有多模态能力，能够处理、理解、操作并结合不同类型的信息，包括文本、代码、音频、图像和视频。Gemini 被设计为迄今为止 Google 最灵活的模型，旨在处理各种复杂的任务和挑战。
        
        2、主要特点
        
        多模态能力：Gemini 能够无缝集成并处理文本、图像、音频和视频等多种类型的信息。
        超越人类专家的性能：在多个领域的测试中，特别是大规模多任务语言理解（MMLU）和小学数学推理（GSM8K）的测试中，Gemini Ultra 的性能超越了现有的最先进模型，包括GPT-4，甚至在某些领域超越了人类专家。
        高度灵活：Gemini 设计用于适应从大型数据中心到移动设备等不同的运行环境，支持各种规模的应用部署。
        3、Gemini的版本
        
        Gemini Ultra：针对最复杂任务的最强大版本，性能在多个学术基准上超过了GPT-4。
        例如官方公布的对比数据，在文本上：
        
        在多模式上：
        
        Gemini Pro：适合日常使用的版本，已集成到 Google 的 Bard 聊天机器人中，提升了其高级推理、规划和理解的能力。
        Gemini Nano：设计用于嵌入移动设备，如谷歌Pixel手机，使大模型能够成为日常生活中的小助手。
        4、应用潜力
        
        由于其多模态处理能力，Gemini 可以在多种应用场景中大放异彩，包括自然语言处理（文本生成、文本摘要、翻译等）、高质量代码生成（支持 Python、Java、C++ 和 Go 等编程语言），以及处理超出编码范围的复杂问题，如涉及复杂数学和理论计算机科学的竞争性编程问题。
        
        5、使用方法
        
        官网注册使用即可：Gemini官网
        
        了解了以上内容之后，咱们一起去测试体验一下：
        
        二、分类问题测试
        
        测试采用多类问题提问，以检验其多方面的功能。
        
        1、基础问答（5个）
        
        Q1: 澳大利亚的首都是哪座城市？（✔）
        
        Q2: 地球与太阳之间的距离是多少？（✔）
        
        Q3: 水的沸点是多少度？（✔）
        
        Q4: 比萨斜塔在哪个国家？（✔）
        
        Q5: 世界上最长的河流是哪一条？（✔）
        从回答来看，5个问题均正确✔，相比gpt3.5更加完善和全面。
        
        2、数学题解答（5个）
        
        Q1:小明有12个苹果，他想平均分给他的3个朋友（12个苹果分给3个人），请问每个朋友可以得到几个苹果？（小学难度 ✔）
        
        Q2：已知直角三角形的一条直角边长为5cm，另一条直角边长为12cm，求斜边的长度。（初中难度 ✔）
        结果算对了，但是中间则怎么突然冒出英文解释了？san值狂掉…
        
        Q3:若一个二次函数表达式为 f ( x ) = a x 2 + b x + c ( a ≠ 0 ) f(x) = ax^2 + bx + c (a≠0) f(x)=ax2+bx+c(a=0)，已知f(1)=0，f(2)=3，且f(x)图像经过点(3,10)，请求出a、b、c的具体值。（初中难度 ✔）
        
        Q4：在平面直角坐标系中，曲线C的方程为 y = x 3 − 6 x 2 + 9 x + 10 y = x^3 - 6x^2 + 9x + 10 y=x3−6x2+9x+10，求曲线C过原点处的切线方程。（高中难度 ✔）
        
        这题虽然解对了，但是与gpt3.5一样用到了一些高等数学的知识，这里要注意甄别。
        
        Q5：计算函数 f(x) = x^3 - 2x^2 + x 在 x = 2 处的导数。（大学基础难度 ✔）
        
        gpt3.5在大学基础难度的题出了错，而Gemini此处求解正确。
        
        3、逻辑推理（5个）
        
        Q1: 如果所有猫都喜欢吃鱼，而Tom是一只猫，那么Tom会喜欢吃鱼吗？（✔）
        一般的判断答案应该是喜欢，但是它的回答不无道理，因此也可看作对的。
        
        Q2: 假设A>B且B>C，请问A是否一定大于C？（✔）
        一般的判断答案应该是A大于C，但是它的回答考虑范围更广，因此也是对的。
        
        Q3: 你有1000kg蘑菇，含水量是99％。现在晒几天，晒到含水量为98%，那需要晒掉多少水？（✔）
        
        gpt3.5在这里出现了计算错误。
        
        Q4: 有一个没有刻度的长方形的塑料盒子，没有盖子，它的容积是1升。请问如果只能使用这个盒子称量依次，能够准确地量出多少升的水？（半✔半✖）
        
        正确答案：如果只能使用这个盒子称量一次，能够正确地量出 0.5 升的水。也能量出 1/6 升，将长方形盒子倾斜，水位到达盒子的上一边及底下的边线即可。
        
        Q5: 72、36、24、18、( )（✖）
        正确答案：14.4
        
        4、创造性写作（3个）
        
        Q1: 请续写一个故事开头：“在一个寒冷的冬夜，小镇图书馆的灯突然熄灭了……”
        写的偏对话式的故事，不过也算有头有尾。
        
        Q2: 编写一首关于秋天落叶的五言律诗。
        相比于gpt3.5，此处出现了语意理解错误以及常识性错误。
        
        Q3: 写一个关于人工智能与人关系的短篇小说。
        前后逻辑性还不错，但是小说的情节过于简单流水化，不具有创新性。
        
        5、代码编写（3个）
        
        Q1: 用Python编写一个函数，用于判断一个数是否为质数。
        
        Gemini所写代码如下：
        
        def is_prime(n): """ 判断一个数是否为质数 Args: n: 要判断的数 Returns: True 如果n是质数，False 如果不是 """ if n

微信扫一扫加客服

微信扫一扫加客服

点击启动AI问答