基于Amazon Bedrock

慈云数据 2024-04-27 技术支持 41 0

文章目录

    • 前言
    • 登录Amazon Bedrock
    • Meta Liama2 模型快速体验
    • 效果演示
      • 名词解释
      • 项目工程介绍
      • 效果演示
      • Meta Llama 2 API的调用
          • 打开 Amazon Cloud9 实验环境
          • 创建环境
              • 设置环境详细信息
              • 熟悉 Amazon Cloud9 实验环境
              • 查看对应的文件目录
              • 编写调用 Meta Llama 2 API 应用
                • 请求参数
                • 返回参数
                • 参数说明说明
                • 操作流程讲解
                  • 完整代码
                  • 总结

                    前言

                    随着生成式人工智能(AIGC)技术的蓬勃发展,技术创作者们再次涌入一个充满挑战与机遇的新领域。Amazon Bedrock 是一个专为创新者设计的平台,它提供了构建生成式人工智能应用程序所需的一切工具和资源。无论您的技术背景如何,Amazon Bedrock 都能让您快速上手并体验到最新的生成式人工智能技术。对于AI新手和希望提升技能的专家来说,Amazon Bedrock 都是一个强大的助力。

                    今天我们就来一场酣畅淋漓的手把手教程, 让我们快速轻松的感受生成式人工智能的构建

                    登录Amazon Bedrock

                    点击链接 如下图所示点击开始实验

                    image.png

                    进入操作页面开启生成式ai 之旅吧!!

                    image.png

                    Meta Liama2 模型快速体验

                    image.png

                    模型这里我们选择 Meta => LIama2 Chat 70B 吞吐量 按需即可

                    image.png

                    选择完成之后 点击应用

                    效果演示

                    当我们点击应用之后 效果如下

                    image.png

                    名词解释

                    名称解释
                    随机性和多样性通过将输出限制为更可能的结果或改变输出概率分布的形状来影响生成的响应的变化。
                    长度通过指定结束响应生成的最大长度或字符序列来限制响应。

                    项目工程介绍

                    image.png

                    效果演示

                    我提出的问题是 : JavaScript 中如和理解闭包

                    回复如下:

                    image.png

                    对于代码解释看起来还是有点东西的哦!!

                    Meta Llama 2 API的调用

                    打开 Amazon Cloud9 实验环境

                    打开控制台,搜索Cloud9, 点击进入

                    image.png

                    创建环境

                    设置环境详细信息
                    1. 设置名称为 bedrock
                    2. 设置实例类型 t3.small
                    3. 平台 Ubuntu Server 22.04 LTS
                    4. 超时 30 分钟

                    温馨提示:

                    1. 实验环境中仅限选择Cloud9 EC2实例为 t3.small (2 GiB RAM + 2 vCPU)
                    2. 基于不浪费的原则,创建Cloud9的时候,超时时间只能选择默认的30分钟的选项,且Cloud9实例数量也将自动审核,如果发现异常会关闭Cloud9实例,甚至封禁账号,务必注意文明实验

                    us-west-2.console.aws.amazon.com_cloud9control_home_region=us-west-2 (1).png

                    熟悉 Amazon Cloud9 实验环境

                    首次进入 Cloud9 实验环境中需要等待加载

                    image.png

                    image.png

                    在Amazon Cloud9 IDE中,选择 终端

                    在终端中输入如下命令

                    cd ~/environment/
                    curl 'https://dev-media.amazoncloud.cn/doc/workshop.zip' --output workshop.zip
                    unzip workshop.zip
                    

                    等待解压完成

                    image.png

                    查看对应的文件目录

                    image.png

                    继续使用 终端,安装实验所需的环境依赖项

                    pip3 install -r ~/environment/workshop/setup/requirements.txt -U
                    

                    image.png

                    编写调用 Meta Llama 2 API 应用

                    请求参数
                    参数说明
                    prompt复制要传递给模型的提示,这是必填项。
                    temperature复制降低响应的随机性,默认值为0.5,取值范围是0到1。
                    top_p复制忽略可能性较小的选项,默认值为0.9,取值范围是0到1。
                    max_gen_len复制生成响应的最大令牌数,默认值为512,取值范围是1到2048。
                    返回参数
                    {
                        "generation": "\n\n",
                        "prompt_token_count": int,
                        "generation_token_count": int,
                        "stop_reason" : string
                    }
                    
                    参数说明说明
                    参数解释意思
                    生成指生成的文本。
                    prompt_token_count复制表示提示中的代币数量。
                    generation_token_count复制代表生成的文本中的标记数量。
                    stop_reason复制用于说明响应停止生成文本的原因。其可能的值为:1、stop 意味着模型已结束为输入提示生成文本。2、length表示生成的文本的词元长度超过了对 InvokeModel(如果需要对输出进行流式传输,则为 InvokeModelWithResponseStream)的调用中的 max_gen_len 值。此时响应会被截断为 max_gen_len 个词元。可考虑增大 max_gen_len 的值并重试。

                    操作流程讲解

                    1. 打开workshop/labs/api文件夹,打开文件bedrock_api.py

                    image.png

                    1. 导入依赖语句允许我们使用Amazon boto3库来调用Amazon Bedrock
                    import json
                    import boto3
                    
                    1. 初始化Bedrock客户端库,创建一个Bedrock客户端
                    session = boto3.Session()
                    bedrock = session.client(service_name='bedrock-runtime') #初始化Bedrock客户端库
                    
                    1. 编写API调用代码

                      我们将确定要使用的模型、提示和指定模型的推理参数。

                    bedrock_model_id = "meta.llama2-70b-chat-v1" #设置模型 
                    prompt = "说一下冒泡排序的原理?"  #提示词
                    body = json.dumps({
                        "prompt": prompt, 
                        "max_gen_len": 2048,
                        "temperature":0.5,
                        "top_p":0.9
                    }) 
                    
                    1. 使用Amazon Bedrock的invoke_model函数进行调用
                    response = bedrock.invoke_model(body=body, modelId=bedrock_model_id, accept='application/json', contentType='application/json') #发送调用请求
                    
                    1. 从模型的响应JSON中提取并打印返回的文本
                    response_body = json.loads(response.get('body').read()) 
                    response_text=response_body['generation'] #从 JSON 中返回相应数据
                    print(response_text)
                    
                    1. 保存文件,并准备运行脚本
                    cd ~/environment/workshop/labs/api
                    python bedrock_api.py
                    

                    8 运行结果如下

                    image.png

                    完整代码

                    import json
                    import boto3
                    session = boto3.Session()
                    bedrock = session.client(service_name='bedrock-runtime') #初始化Bedrock客户端库
                    bedrock_model_id = "meta.llama2-70b-chat-v1" #设置模型 
                    prompt = "说一下冒泡排序的原理?"  #提示词
                    body = json.dumps({
                        "prompt": prompt, 
                        "max_gen_len": 2048,
                        "temperature":0.5,
                        "top_p":0.9
                    }) 
                    response = bedrock.invoke_model(body=body, modelId=bedrock_model_id, accept='application/json', contentType='application/json') #发送调用请求
                    response_body = json.loads(response.get('body').read()) 
                    response_text=response_body['generation'] #从 JSON 中返回相应数据
                    print(response_text)
                    

                    是不是很简单呢

                    总结

                    随着生成式人工智能的逐渐火爆, 期待小伙伴们也快快的加入进来体验一番吧!!

微信扫一扫加客服

微信扫一扫加客服

点击启动AI问答
Draggable Icon