20240416 每日AI必读资讯

慈云数据 2024-04-19 技术支持 73 0

🌐清华大学设计出用于通用人工智能的光子芯片:太极芯片

- 采用分布式光计算架构,具备亿级神经元的芯片计算能力,显著提高处理速度和能效。

- Taichi芯片能处理接近人类智能水平的复杂任务。

- Taichi能在高精度下处理复杂的分类和内容生成任务。

- 可应用与如自动驾驶、智能制造和高级机器人

🔗新闻:https://www.tsinghua.edu.cn/en/info/1399/12830.htm

🔗论文:https://www.science.org/doi/10.1126/science.adl1203?ref=ai-recon.ghost.io

🔗 https://blink.csdn.net/details/1681350

🌍陶哲轩力荐!史上最全「数学AI资源」清单出炉

- 美国国家科学院「AI辅助数学推理」研讨会期间发起清单行动。

- 由UIUC的助理教授Talia Ringer进行整理。

- 从自学材料、论坛、工具,到研究平台的各种资源。

🔗文档地址:https://docs.google.com/document/d/1kD7H4E28656ua8jOGZ934nbH2HcBLyxcRgFDduH5iQ0/edit

🔗陶哲轩力荐!史上最全「数学AI资源」清单出炉-CSDN博客

 

图片

🎨比换脸更强大!SwapAnything:替换图片中的任意元素

- SwapAnything框架具有精确控制对象和部分、保留上下文像素、适应个性化概念等优势。

- 通过定向变量交换和外观调整技术,SwapAnything展现了精确和忠实的交换能力。

- SwapAnything能在图像中精确控制任意对象,实现高质量的个性化交换。

🔗项目入口:https://github.com/eric-ai-lab/swap-anything

🔗

🎮代码、模型全开源!贾佳亚团队多模态模型 Mini-Gemini登上热榜

- Mini-Gemini模型在多模态任务上取得显著成绩,开源代码和模型数据。

- Mini-Gemini结合图像理解和生成,展现出色图像推理能力。

- 采用Gemini视觉双分支信息挖掘方法,有效处理高分辨率图像并生成内容丰富的视觉和文本内容。

🔗Github 地址:https://github.com/dvlab-research/MiniGemini

🔗Demo 地址: http://103.170.5.190:7860/

🔗论文地址:https://arxiv.org/pdf/2403.18814.pdf

🔗模型地址:https://huggingface.co/collections/YanweiLi/mini-gemini-6603c50b9b43d044171d0854

🔗数据地址:https://huggingface.co/collections/YanweiLi/mini-gemini-data-660463ea895a01d8f367624e

🤖面壁智能开源MiniCPM2.0系列模型 OCR等能力显著增强

- MiniCPM-V2.0是端侧最强的多模态模型,具有强大的OCR能力。

- MiniCPM-1.2B是适配端侧场景的基座模型,推理速度快成本低。

- MiniCPM-2B-128K是目前最小的长文本模型,处理128K文本内容。

🔗MiniCPM-V2.0:https://github.com/OpenBMB/MiniCPM-V

🔗MiniCPM系列开源地址:https://github.com/OpenBMB/MiniCPM

🔗MiniCPM技术Blog地址:https://openbmb.vercel.app/?category=Chinese+Blog

🖼️InstantID团队推新风格迁移方法InstantStyle 一键置身“梵高星空”

- 特征相减:利用CLIP模型的特性,通过特征相减去除内容信息,实现风格和内容解耦。

- 仅风格层注入:在特定风格层完成特征注入,实现风格和内容解耦。

- 通用性强:InstantStyle的方法具有通用性,提供丰富代码实现,支持多种应用场景

🔗论文:InstantStyle: Free Lunch towards Style-Preserving in Text-to-Image Generation

🔗项目主页:https://instantstyle.github.io/

🔗代码链接:https://github.com/InstantStyle/InstantStyle

🔗Demo 地址:https://huggingface.co/spaces/InstantX/InstantStyle

图片

🎭用Gemini 1.5 Pro API和Raspberry Pi制作AI可穿戴设备原型机!

- 利用摄像头拍摄,Gemini 1.5 Pro实时回答任何看到的一切。

- 通过TTS转录成语音来用耳机接受回答内容。

🔗 http://GitHub:https://github.com/advaitpaliwal/insight

🔗 https://blink.csdn.net/details/1681364

微信扫一扫加客服

微信扫一扫加客服

点击启动AI问答
Draggable Icon