名人说:一花独放不是春,百花齐放花满园。——《增广贤文》
作者:Code_流苏(CSDN)(一个喜欢古诗词和编程的Coder😊)
目录
- 一、简要介绍
- 1、Gemini是什么?
- 2、主要特点
- 3、Gemini的版本
- 4、应用潜力
- 5、使用方法
- 二、分类问题测试
- 1、基础问答(5个)
- 2、数学题解答(5个)
- 3、逻辑推理(5个)
- 4、创造性写作(3个)
- 5、代码编写(3个)
- 6、对话理解与情感交流(2个)
- 7、翻译任务(1个)
- 8、策略规划(1个)
- 三、测试结果(仅代表个人观点)
★观前提示: 以下内容仅为测试内容,不代表未来新版本如何。
在本篇博客中,我们将一起探讨Google AI模型——Gemini。Gemini标志着Google在人工智能领域的一大飞跃,不仅因为它的先进技术,也因为它在多任务语言理解(MMLU)测试中首次超越了人类专家。这一成就显示了Gemini在知识获取和问题解决能力上的卓越性能,最初名称为Bard,最近赋名为了Gemini,那么它究竟如何,本篇内容将采用与上篇gpt3.5相同的问题来进行测试,最后会在测试感受出说一下对比gpt3.5它能力的强弱。
一、简要介绍
1、Gemini是什么?
Gemini 是 Google 开发的最新一代大型人工智能模型,代表了 Google 在人工智能领域的最新进展。它是一个跨部门协作的成果,由 Google 研究部的同事从头开始构建,具有多模态能力,能够处理、理解、操作并结合不同类型的信息,包括文本、代码、音频、图像和视频。Gemini 被设计为迄今为止 Google 最灵活的模型,旨在处理各种复杂的任务和挑战。
2、主要特点
- 多模态能力:Gemini 能够无缝集成并处理文本、图像、音频和视频等多种类型的信息。
- 超越人类专家的性能:在多个领域的测试中,特别是大规模多任务语言理解(MMLU)和小学数学推理(GSM8K)的测试中,Gemini Ultra 的性能超越了现有的最先进模型,包括GPT-4,甚至在某些领域超越了人类专家。
- 高度灵活:Gemini 设计用于适应从大型数据中心到移动设备等不同的运行环境,支持各种规模的应用部署。
3、Gemini的版本
- Gemini Ultra:针对最复杂任务的最强大版本,性能在多个学术基准上超过了GPT-4。
例如官方公布的对比数据,在文本上:
在多模式上:
- Gemini Pro:适合日常使用的版本,已集成到 Google 的 Bard 聊天机器人中,提升了其高级推理、规划和理解的能力。
- Gemini Nano:设计用于嵌入移动设备,如谷歌Pixel手机,使大模型能够成为日常生活中的小助手。
4、应用潜力
由于其多模态处理能力,Gemini 可以在多种应用场景中大放异彩,包括自然语言处理(文本生成、文本摘要、翻译等)、高质量代码生成(支持 Python、Java、C++ 和 Go 等编程语言),以及处理超出编码范围的复杂问题,如涉及复杂数学和理论计算机科学的竞争性编程问题。
5、使用方法
官网注册使用即可:Gemini官网
了解了以上内容之后,咱们一起去测试体验一下:
二、分类问题测试
测试采用多类问题提问,以检验其多方面的功能。
1、基础问答(5个)
-
Q1: 澳大利亚的首都是哪座城市?(✔)
-
Q2: 地球与太阳之间的距离是多少?(✔)
-
Q3: 水的沸点是多少度?(✔)
-
Q4: 比萨斜塔在哪个国家?(✔)
- Q5: 世界上最长的河流是哪一条?(✔)
从回答来看,5个问题均正确✔,相比gpt3.5更加完善和全面。
2、数学题解答(5个)
- Q1:小明有12个苹果,他想平均分给他的3个朋友(12个苹果分给3个人),请问每个朋友可以得到几个苹果?(小学难度 ✔)
- Q2:已知直角三角形的一条直角边长为5cm,另一条直角边长为12cm,求斜边的长度。(初中难度 ✔)
结果算对了,但是中间则怎么突然冒出英文解释了?san值狂掉…
- Q3:若一个二次函数表达式为
f
(
x
)
=
a
x
2
+
b
x
+
c
(
a
≠
0
)
f(x) = ax^2 + bx + c (a≠0)
f(x)=ax2+bx+c(a=0),已知f(1)=0,f(2)=3,且f(x)图像经过点(3,10),请求出a、b、c的具体值。(初中难度 ✔)
- Q4:在平面直角坐标系中,曲线C的方程为
y
=
x
3
−
6
x
2
+
9
x
+
10
y = x^3 - 6x^2 + 9x + 10
y=x3−6x2+9x+10,求曲线C过原点处的切线方程。(高中难度 ✔)
这题虽然解对了,但是与gpt3.5一样用到了一些高等数学的知识,这里要注意甄别。
- Q5:计算函数 f(x) = x^3 - 2x^2 + x 在 x = 2 处的导数。(大学基础难度 ✔)
gpt3.5在大学基础难度的题出了错,而Gemini此处求解正确。
3、逻辑推理(5个)
- Q1: 如果所有猫都喜欢吃鱼,而Tom是一只猫,那么Tom会喜欢吃鱼吗?(✔)
一般的判断答案应该是喜欢,但是它的回答不无道理,因此也可看作对的。
- Q2: 假设A>B且B>C,请问A是否一定大于C?(✔)
一般的判断答案应该是A大于C,但是它的回答考虑范围更广,因此也是对的。
- Q3: 你有1000kg蘑菇,含水量是99%。现在晒几天,晒到含水量为98%,那需要晒掉多少水?(✔)
gpt3.5在这里出现了计算错误。
- Q4: 有一个没有刻度的长方形的塑料盒子,没有盖子,它的容积是1升。请问如果只能使用这个盒子称量依次,能够准确地量出多少升的水?(半✔半✖)
正确答案:如果只能使用这个盒子称量一次,能够正确地量出 0.5 升的水。也能量出 1/6 升,将长方形盒子倾斜,水位到达盒子的上一边及底下的边线即可。
- Q5: 72、36、24、18、( )(✖)
正确答案:14.4
4、创造性写作(3个)
- Q1: 请续写一个故事开头:“在一个寒冷的冬夜,小镇图书馆的灯突然熄灭了……”
写的偏对话式的故事,不过也算有头有尾。
- Q2: 编写一首关于秋天落叶的五言律诗。
相比于gpt3.5,此处出现了语意理解错误以及常识性错误。
- Q3: 写一个关于人工智能与人关系的短篇小说。
前后逻辑性还不错,但是小说的情节过于简单流水化,不具有创新性。
5、代码编写(3个)
- Q1: 用Python编写一个函数,用于判断一个数是否为质数。
Gemini所写代码如下:
def is_prime(n): """ 判断一个数是否为质数 Args: n: 要判断的数 Returns: True 如果n是质数,False 如果不是 """ if n
- Q1: 用Python编写一个函数,用于判断一个数是否为质数。
- Q3: 写一个关于人工智能与人关系的短篇小说。
- Q2: 编写一首关于秋天落叶的五言律诗。
- Q1: 请续写一个故事开头:“在一个寒冷的冬夜,小镇图书馆的灯突然熄灭了……”
- Q5: 72、36、24、18、( )(✖)
- Q4: 有一个没有刻度的长方形的塑料盒子,没有盖子,它的容积是1升。请问如果只能使用这个盒子称量依次,能够准确地量出多少升的水?(半✔半✖)
- Q3: 你有1000kg蘑菇,含水量是99%。现在晒几天,晒到含水量为98%,那需要晒掉多少水?(✔)
- Q2: 假设A>B且B>C,请问A是否一定大于C?(✔)
- Q1: 如果所有猫都喜欢吃鱼,而Tom是一只猫,那么Tom会喜欢吃鱼吗?(✔)
- Q5:计算函数 f(x) = x^3 - 2x^2 + x 在 x = 2 处的导数。(大学基础难度 ✔)
- Q4:在平面直角坐标系中,曲线C的方程为
y
=
x
3
−
6
x
2
+
9
x
+
10
y = x^3 - 6x^2 + 9x + 10
y=x3−6x2+9x+10,求曲线C过原点处的切线方程。(高中难度 ✔)
- Q3:若一个二次函数表达式为
f
(
x
)
=
a
x
2
+
b
x
+
c
(
a
≠
0
)
f(x) = ax^2 + bx + c (a≠0)
f(x)=ax2+bx+c(a=0),已知f(1)=0,f(2)=3,且f(x)图像经过点(3,10),请求出a、b、c的具体值。(初中难度 ✔)
- Q2:已知直角三角形的一条直角边长为5cm,另一条直角边长为12cm,求斜边的长度。(初中难度 ✔)
- Q1:小明有12个苹果,他想平均分给他的3个朋友(12个苹果分给3个人),请问每个朋友可以得到几个苹果?(小学难度 ✔)
- Q5: 世界上最长的河流是哪一条?(✔)
-
-
- Gemini Ultra:针对最复杂任务的最强大版本,性能在多个学术基准上超过了GPT-4。