20240402 每日AI必读资讯

慈云数据 2024-04-06 技术支持 56 0

🤖 腾讯将人形机器人写进计划里

- 腾讯发布《2024数字科技前沿应用趋势》报告。

- 腾讯将就三维感知数据和腾讯的混元大模型或开源大模型LLAMA2-7B优化策略控制层。

- 腾讯这两年做了灵巧手、机械臂(相当于人形机器人上半身的手臂控制能力),也做了各种四足机器人。

🔗 88页深度报告,看懂2024数字科技前沿应用趋势

🗣️微软对Azure AI语音服务升级 发布9种更真实的AI语音

- 对中文支持已经很完美。

🔗详细:http://xiaohu.ai/p/5432

🚀 Mini-Gemini:简单有效的AI框架,增强多模态视觉语言模型

- Vision Language Models(VLMs)融合了计算机视觉(CV)和自然语言处理(NLP)的独特集成。

- Mini-Gemini采用双编码器系统和新颖的补丁信息挖掘技术,优化多模态输入处理。

- 在多个零样本基准测试中表现出色,超越了现有模型。

🔗项目入口:https://top.aibase.com/tool/minigemini

🔗论文地址:https://arxiv.org/abs/2403.18814

image.png

🌐最神秘国产大模型团队冒泡 一出手就是两个王炸!

- 阶跃星辰专注多模态融合和Scaling Law,开发出千亿参数的ToC产品。

- 产品包括跃问聊天类应用和冒泡鸭AI开放世界平台。

- Step系列通用大模型表现突出,支持多模态理解和内容创作

🔗跃问产品入口:https://top.aibase.com/tool/yuewen

🔗冒泡鸭产品入口:https://top.aibase.com/tool/maopaoyaai

图片

💬上海人工智能实验室发布一套多模态 LLM 视觉评价体系MMStar

- 全面评估视觉语言模型在6个核心能力和18个具体维度上的多模态能力。

- 小模型TinyLLaVA-3B的表现出乎意料地好。

- 两个新的评估指标:多模态收益(MG)和多模态泄漏(ML)。

🔗 项目地址:https://mmstar-benchmark.github.io/

🔗 https://blink.csdn.net/details/1672591

🌌OPPO 发布移动推理引擎Transformer-Lite

- 专为在手机上高效部署大型语言模型设计。

- 在智能手机上提供智能助手、文本摘要、翻译等功能。

🔗 https://arxiv.org/abs/2403.20041

🔗 https://blink.csdn.net/details/1672592

微信扫一扫加客服

微信扫一扫加客服

点击启动AI问答
Draggable Icon