💻微软推出Phi-3 mini系列小型开源语言模型
- 可运行在手机上,性能超越 Llama 3 8B。
- 适应多种环境: 可以在不依赖云计算的情况下本地处理数据,减少延迟,增强隐私保护。
- 包括Phi-3-mini(3.8亿参数)、Phi-3-small(70亿参数)和Phi-3-medium(140亿参数)等多种型号。
- 首款支持如此大上下文窗口的小型语言模型。
🔗技术报告:https://arxiv.org/abs/2404.14219
🔗 https://blink.csdn.net/details/1687389
🚫美国宣布禁止竞业协议,企业不得限制员工跳槽或创办竞争公司。
- 在新规生效后所有企业签署的竞业协议直接作废。
- FTC 主席表示,这项规则将确保美国人民有自由寻求新工作、创立新企业或推广新想法。
- 这一规则还将推动创新,预计在未来十年每年将新增17000到29000项专利。
- 该规则将在《联邦纪事报》发布后120天生效。
🔍Meta AI为Ray-Ban Meta智能眼镜集成多模态能力
- 视频通话集成:无手操作: 用户可以通过WhatsApp和Messenger进行视频通话,无需使用双手,直接通过眼镜分享视角。
- 实时分享: 无论是在户外活动中的美景还是家庭重要时刻,用户都可以实时共享给朋友或家人。
- 高级Meta AI助手:语音控制: 用户可以通过语音命令控制眼镜的各项功能,实现真正的手-free操作。
- 实时信息获取: Meta AI能够提供实时信息,帮助用户解决眼前问题,如翻译外语菜单或识别商品信息等。
- 高性能硬件:集成音频和12MP超广角相机: 这使得智能眼镜不仅可以捕捉高质量的图片和视频,还可以进行高清晰度的通话。
- 多模态AI功能: 新的AI更新使眼镜能够理解和响应用户所看到的内容,提供智能化建议和信息。
🤖ChatGPT 即将更新的功能曝光
- 新版界面 模型更新
- 网页版音频模式
- 免费用户也可创建GPTs
- 浏览和数据分析工具
- 写作工具(Jidori)
-上下文连接器
- 数据分析 V2版本
-集成 Bing (POR)、Sydney 和 Fortis 搜索引擎
-内部搜索(Labrador)
-图像搜索
🖼️ Adobe 推出新的 Firefly Image 3 Model 模型
- 结构参考和风格参考功能提供了前所未有的用户控制能力。
- 新模型能更有效地结合参考图像和文本提示,减少试错需求,提高工作效率。
- 新模型对复杂提示有更深入的理解,生成更丰富详细的图像,使创作过程更加顺畅。
🔗在线体验: https://firefly.adobe.com/inspire/images
🔗生成式填充测试地址: https://firefly.adobe.com/upload/inpaint
🔗 https://blink.csdn.net/details/1687386
😲Synthesia将推新数字人头像模型EXPRESS-1
- Expressive-1能根据文本自动做出皱眉、微笑、皱眉头等表情。
- 而且能精准匹配声音和口型同步。
🔗 https://blink.csdn.net/details/1687420
📱EVI正式发布API 提供转录、语音合成服务
- 可集成到任何应用中。
- 能够分析用户的语音中的语调、节奏和音色,并据此生成具有相应情感色彩的响应。
- 支持将其他大语言模型的响应注入EVI。
- 具备识别对话中何时可以中断发言者以及何时轮次结束的能力。
🔗详细: https://www.hume.ai/blog/introducing-hume-evi-api
🔗API申请:https://beta.hume.ai
🔗在线体验: https://demo.hume.ail