加持LLMs的大型多模态模型

AGI之MFM：《多模态基础模型：从专家到通用助手》翻译与解读之统一的视觉模型、加持LLMs的大型多模态模型

AGI之MFM：《Multimodal Foundation Models: From Specialists to General-Purpose Assistants多模态基础模型：从专家到通用助手》翻译与解读之统一的视觉模型、加持LLMs的大型多模态模型目录 4、Unified ...

AGI之MFM：《多模态基础模型：从专家到通用助手》翻译与解读之统一的视觉模型、加持LLMs的大型多模态模型

标签： AI或AGI ai

使用通用的编码器-解码器结构。

大语言模型LLMs应用于多模态推荐系统的实践思考

标签：语言模型推荐系统大模型大语言模型 llm

大语言模型LLMs应用于多模态推荐系统的实践思考

《Multimodal Foundation Models: From Specialists to General-Purpose Assistants多模态基础模型：...

标签：多模态大模型大语言模型

AGI之MFM：《Multimodal Foundation Models: From Specialists to General-Purpose Assistants多模态基础模型：从专家到通用助手》翻译与解读之简介/视觉理解目录相关文章《Multimodal Foundation ...

多模态大语言模型调研《MM-LLMs: Recent Advances in MultiModal Large Language Models》简要介绍

标签：语言模型人工智能自然语言处理

诞生以来，一向以强大的自然语言处理能力而著称，人们试着将大型语言模型（Large Language Models，LLM）的强大推理和生成能力在除文本以外的模态数据上应用起来。例如图像、视频、音频、3D点云等。

多模态大模型综述: LLaVA, MiniGPT4

标签：人工智能深度学习计算机视觉

题目: Visual Instruction Tuning机构：微软论文:任务: 视觉指令微调（具备对话，推理的能力，rather than 图像描述）特点: 利用GPT4做数据生成，以及评测，视觉projection不想BLIP2一样是Q-Former，而是一个简单的...

AGI之MFM：《多模态基础模型：从专家到通用助手》翻译与解读之与LLM协同工作的多模态智能体、结论和研究...

标签：多模态大模型

AGI之MFM：《Multimodal Foundation Models: From Specialists to General-Purpose Assistants多模态基础模型：从专家到通用助手》翻译与解读之与LLM协同工作的多模态智能体、结论和研究趋势目录 6、...

AI多模态模型架构之模态编码器：图像编码、音频编码、视频编码

标签：人工智能音视频计算机视觉

模态编码器(Modality Encoder, ME)：负责将不同模态的输入编码成特征。常见的编码器包括图像的NFNet-F6、...语言模型骨架(LLM Backbone)：利用预训练的语言模型，负责处理各种模态的特征，进行语义理解、推理和决策。

三篇多模态大模型进展综述

标签： AIGC

MLLM 的相关研究课题，包括多模态幻觉、多模态上下文学习...相比于以往的多模态方法，例如以 CLIP 为代表的判别式，或以 OFA 为代表的生成式，新兴的 MLLM 展现出一些典型的特质：（1）模型大。（2）新的训练范式。

LLMs：《A Survey of Large Language Models大语言模型综述》的翻译与解读(一)之序言(挑战+LM四阶段+LLM与...

标签：自然语言处理基础大模型 llama

LLMs：《A Survey of Large Language ...LLMs：大型语言模型发展综述—序言(挑战+LM四阶段+LLM与PLM的三大区别)、概述(两个代表性扩展定律/涌现能力三种典型/六大关键技术+GPT系列技术演进)、资源(开源模型/闭源API

【AI实战】开源大语言模型LLMs汇总

标签： LLM 大语言模型 llama

开源大语言模型LLM汇总

ChatGPT底层架构Transformer技术及源码实现（五）

标签： chatgpt transformer ChatGPT使用

ChatGPT底层架构Transformer技术及源码实现（五）3.5 为何GPT-4才是NLP的真正重大突破？...GPT-4 是OpenAI 最新的大型语言模型，于2023年3月中旬发布，与之前的模型相比，GPT-4有了巨大改进，获得了全球赞誉。

七月论文审稿GPT第2版：用一万多条paper-review数据微调LLaMA2 7B最终反超GPT4

标签： Meta Nougat GPT4审稿 mistral

如此前这篇文章《》中的第三部分所述，对于论文的摘要/总结、对话、翻译、语法检查而言，市面上的学术论文GPT的效果虽暂未有多好，可至少还过得去，而如果涉及到论文的修订/审稿，则市面上已有的学术论文GPT的效果则...

揭秘 LLMs 时代向量数据库的 3 大实用场景

标签：程序人生

相比基础的 top-k 搜索，Rang Search 能够在一定距离内找到与目标相似...此外，新发布的 Cardinal 搜索引擎中进行了多方面的性能优化，包含 Zilliz 自研的向量索引、机器代码级别的计算优化，以及优化缓存感知算法等。

ChatGPT 引领的 AI 革命爆发了，一起上车吧！

标签：人工智能 chatgpt AI

ChatGPT是由总部位于旧金山的初创公司 OpenAI 开发的人工智能聊天机器人。该公司于 2022 年 11 月 30 日推出了 ChatGPT。OpenAI 于 2015 年由 Elon Musk 和 Sam Altman 共同创立，...ChatGPT 是一种大型语言模型 (LLM)

震撼！GPT-4 Turbo级国产大模型登场，周冠宇F1赛事数据秒分析惊呆国际大佬

标签：人工智能 AIGC gpt

中国的，已经震惊了外国科技圈。这不，这几天商量大模型的更新，直接让外国网友惊呼:太疯狂了，中国的AI界究竟还有多少我们不知道的巨变?...所以说了这么多，得到日日新5.0加持的产品，到底会有怎样非一般的体验?

【AIGC调研系列】LLaVA++整合Phi-3和Llama-3能够实现什么

标签： AIGC llama

LLaVA++为Phi-3和Llama-3带来的主要好处是增强了视觉处理能力、提升了指令遵循能力和学术任务处理能力，以及提升了跨模态交互能力，这些改进使得LLaVA++在多个领域内具有更广泛的应用潜力。

LLM Agent零微调范式 ReAct & Self Ask

标签： microsoft 人工智能大模型

看完了SelfAsk和React的实现，不难发现二者存在一些局限性更适合简单的工具调用：这里的简单是指工具的输入和上文的文本语义比较符合，工具输入比较“自然语言”风格例如搜索。高度结构化和符号化的工具输入，使用...

AIGC之GPT-4：GPT-4的简介(核心原理/意义/亮点/技术点/缺点/使用建议)、使用方法、案例应用(计算能力/代码...

标签：人工智能 GPT-4

AIGC之GPT-4：GPT-4的简介(核心原理/意义/亮点/技术点/缺点/使用建议)、使用方法、案例应用(计算能力/代码能力/看图能力等)之详细攻略目录 GPT-4的简介 ...AIGC：ChatGPT(一个里程碑式的对话聊天机器人)的...

一觉醒来 AI科技圈发生的大小事儿 04月25日

标签： AIGC

Vitron是一款通用视觉多模态大模型，支持从视觉理解到视觉生成、从低层次到高层次的一系列视觉任务，解决了图像/视频模型割裂问题，为下一代通用视觉大模型的发展提供了新的方向。最近，字节跳动技术团队开源了一种...

AGI之MFM：《多模态基础模型：从专家到通用助手》翻译与解读之视觉理解、视觉生成

标签：多模态大模型视觉理解视觉生成

AGI之MFM：《Multimodal Foundation Models: From Specialists to General-Purpose Assistants多模态基础模型：从专家到通用助手》翻译与解读之视觉理解、视觉生成目录 2、Visual Understanding视觉理解 ...

LLM-based Agents

标签：人工智能

由于 LLMs 有着优秀的工具调用能力，一个直观的想法就是：代理可以将 LLMs 作为控制枢纽，通过级联的方式调用现有的工具集或者专家模型，感知音频信息。他在《心智社会》（The Society of Mind）一书中提出了一种...

AI Agent十大研究方向，数字员工、超级个体、具身智能与之密切相关

标签：人工智能搜索引擎百度

智能体社会是人工智能代理的最高形态和目标，它是由多个人工智能体组成的一个复杂的、动态的、自组织的、自适应的、协作的、竞争的、进化的系统，它可以根据自身的目标和环境的变化，进行一些复杂和灵活的动作和任务...

RAG相关内容介绍

标签：人工智能

LLM的训练数据集是固定的,一旦训练完成就很难再通过继续训练来更新其知识。LLM的参数量巨大,随时进行fine-tuning需要消耗大量的资源，并且需要相当长的时间。LLM的知识是编码在数百亿个参数中的,无法直接查询或编辑...

李沐论文精度系列之十：GPT-4

标签：人工智能 AIGC

列举了3月的AIGC资讯，跟着视频精读GPT-4

《预训练周刊》第64期：微调新范式：组合、噪音、指令、自我改进等

标签： \N

No.64智源社区预训练组预训练研究观点资源活动周刊订阅告诉大家一个好消息，《预训练周刊》已经开启“订阅功能”，以后我们会向您自动推送最新版的《预训练周刊》。订阅方法：方式1：扫描下面二维码，进入《预训练...

LLMs：《A Survey on Evaluation of Large Language Models大型语言模型评估综述》理解智能本质(具备推理...

标签：自然语言处理基础大模型

LLMs：大型语言模型评估研究综述—理解智能本质(具备推理能力)、AI评估的重要性(识别当前算法的局限性+设计更强大模型的关键工具)、评估LLMs的四大意义、三维度(What+Where+How)综述LLMs评估、LLMs大语言模型的三大...

2023 年热门的大型语言模型 (LLMs)汇总

标签：语言模型人工智能自然语言处理

为了让大家能更加直观的看到大模型领域的发展，我们整理了国内外顶尖的大模型，提供给大家参考和使用。

LLM资料大全：文本多模态大模型、垂直领域微调模型、STF数据集、训练微调部署框架、提示词工程等

标签：人工智能自然语言处理 Prompt工程

LLM资料大全：文本多模态大模型、垂直领域微调模型、STF数据集、训练微调部署框架、提示词工程等