20240402 每日AI必读资讯-慈云数据

🤖 腾讯将人形机器人写进计划里

- 腾讯发布《2024数字科技前沿应用趋势》报告。

- 腾讯将就三维感知数据和腾讯的混元大模型或开源大模型LLAMA2-7B优化策略控制层。

- 腾讯这两年做了灵巧手、机械臂（相当于人形机器人上半身的手臂控制能力），也做了各种四足机器人。

🔗 88页深度报告，看懂2024数字科技前沿应用趋势

🗣️微软对Azure AI语音服务升级发布9种更真实的AI语音

- 对中文支持已经很完美。

🔗详细：http://xiaohu.ai/p/5432

🚀 Mini-Gemini:简单有效的AI框架，增强多模态视觉语言模型

- Vision Language Models（VLMs）融合了计算机视觉(CV)和自然语言处理(NLP)的独特集成。

- Mini-Gemini采用双编码器系统和新颖的补丁信息挖掘技术，优化多模态输入处理。

- 在多个零样本基准测试中表现出色，超越了现有模型。

🔗项目入口：https://top.aibase.com/tool/minigemini

🔗论文地址：https://arxiv.org/abs/2403.18814

🌐最神秘国产大模型团队冒泡一出手就是两个王炸！

- 阶跃星辰专注多模态融合和Scaling Law，开发出千亿参数的ToC产品。

- 产品包括跃问聊天类应用和冒泡鸭AI开放世界平台。

- Step系列通用大模型表现突出，支持多模态理解和内容创作。

🔗跃问产品入口：https://top.aibase.com/tool/yuewen

🔗冒泡鸭产品入口：https://top.aibase.com/tool/maopaoyaai

💬上海人工智能实验室发布一套多模态 LLM 视觉评价体系MMStar

- 全面评估视觉语言模型在6个核心能力和18个具体维度上的多模态能力。

- 小模型TinyLLaVA-3B的表现出乎意料地好。

- 两个新的评估指标：多模态收益(MG)和多模态泄漏(ML)。

🔗 项目地址：https://mmstar-benchmark.github.io/

🔗 https://blink.csdn.net/details/1672591

🌌OPPO 发布移动推理引擎Transformer-Lite

- 专为在手机上高效部署大型语言模型设计。

- 在智能手机上提供智能助手、文本摘要、翻译等功能。

🔗 https://arxiv.org/abs/2403.20041

🔗 https://blink.csdn.net/details/1672592

20240402 每日AI必读资讯