20240425 每日AI必读资讯

慈云数据 2024-04-27 技术支持 35 0

💻微软推出Phi-3 mini系列小型开源语言模型 

- 可运行在手机上,性能超越 Llama 3 8B。

- 适应多种环境: 可以在不依赖云计算的情况下本地处理数据,减少延迟,增强隐私保护

- 包括Phi-3-mini(3.8亿参数)、Phi-3-small(70亿参数)和Phi-3-medium(140亿参数)等多种型号。

- 首款支持如此大上下文窗口的小型语言模型。

🔗技术报告:https://arxiv.org/abs/2404.14219

🔗 https://blink.csdn.net/details/1687389

🚫美国宣布禁止竞业协议,企业不得限制员工跳槽或创办竞争公司。 

- 在新规生效后所有企业签署的竞业协议直接作废。

- FTC 主席表示,这项规则将确保美国人民有自由寻求新工作、创立新企业或推广新想法。

- 这一规则还将推动创新,预计在未来十年每年将新增17000到29000项专利。

- 该规则将在《联邦纪事报》发布后120天生效。

🔍Meta AI为Ray-Ban Meta智能眼镜集成多模态能力 

- 视频通话集成:无手操作: 用户可以通过WhatsApp和Messenger进行视频通话,无需使用双手,直接通过眼镜分享视角。

- 实时分享: 无论是在户外活动中的美景还是家庭重要时刻,用户都可以实时共享给朋友或家人。

- 高级Meta AI助手:语音控制: 用户可以通过语音命令控制眼镜的各项功能,实现真正的手-free操作。

- 实时信息获取: Meta AI能够提供实时信息,帮助用户解决眼前问题,如翻译外语菜单或识别商品信息等。

- 高性能硬件:集成音频和12MP超广角相机: 这使得智能眼镜不仅可以捕捉高质量的图片和视频,还可以进行高清晰度的通话。

- 多模态AI功能: 新的AI更新使眼镜能够理解和响应用户所看到的内容,提供智能化建议和信息。

🤖ChatGPT 即将更新的功能曝光

- 新版界面 模型更新

- 网页版音频模式

- 免费用户也可创建GPTs

- 浏览和数据分析工具

- 写作工具(Jidori)

-上下文连接器

- 数据分析 V2版本

-集成 Bing (POR)、Sydney 和 Fortis 搜索引擎

-内部搜索(Labrador)

-图像搜索

🖼️ Adobe 推出新的 Firefly Image 3 Model 模型

- 结构参考和风格参考功能提供了前所未有的用户控制能力。

- 新模型能更有效地结合参考图像和文本提示,减少试错需求,提高工作效率

- 新模型对复杂提示有更深入的理解,生成更丰富详细的图像,使创作过程更加顺畅。

🔗在线体验: https://firefly.adobe.com/inspire/images

🔗生成式填充测试地址: https://firefly.adobe.com/upload/inpaint

🔗 https://blink.csdn.net/details/1687386

图片

😲Synthesia将推新数字人头像模型EXPRESS-1

- Expressive-1能根据文本自动做出皱眉、微笑、皱眉头等表情。

- 而且能精准匹配声音和口型同步。

🔗 https://blink.csdn.net/details/1687420

图片

📱EVI正式发布API 提供转录、语音合成服务

- 可集成到任何应用中。

- 能够分析用户的语音中的语调、节奏和音色,并据此生成具有相应情感色彩的响应。

- 支持将其他大语言模型的响应注入EVI。

- 具备识别对话中何时可以中断发言者以及何时轮次结束的能力。

🔗详细: https://www.hume.ai/blog/introducing-hume-evi-api

🔗API申请:https://beta.hume.ai

🔗在线体验: https://demo.hume.ail

图片

微信扫一扫加客服

微信扫一扫加客服

点击启动AI问答
Draggable Icon