大模型 - 程序员宅基地

LLaMA模型系统解读

本文介绍核心内容为LLaMA模型系统解读，希望对学习和使用大模型的同学们有所帮助。文章目录 1. 前言 2. LLaMA的核心目标和成功诀窍 2.1 核心目标 2.2 成功诀窍一 2.3 成功诀窍二 2.4 成功诀窍三 3. 常见误区 ...

【人工智能】论未来人工智能的大模型生态：重塑技术前景与应用

标签：人工智能机器学习深度学习

然而 ChatGPT 的面市将 Jasper 的优势迅速拉低，模型能力之上过薄的产品令市场质疑其业务的护城河。GPT-1 与 GPT-2 是 OpenAI 在 LLM 模型上的初期产物，这个阶段的 OpenAI 需要更多的高质量文本数据，因此只向有限...

大模型核心技术原理: Transformer架构详解

标签： transformer 深度学习人工智能

大模型核心技术原理: Transformer架构详解

标签： transformer 架构深度学习

在大模型发展历程中，有两个比较重要点：第一，Transformer 架构。它是模型的底座，但 Transformer 不等于大模型，但大模型的架构可以基于 Transformer

如何利用低比特量化技术进一步提升大模型推理性能

标签：网络

OpenVINO™ 2023.2中对int4 权重量化的支持，可以全面提升大模型在Intel平台上的运行性能，同时降低对于存储和内存的容量需求，降低开发者在部署大模型时的门槛，让本地化的大语言模型应用在普通PC上落地成为可能。

Ollama高效、功能齐全的LLM大模型服务工具——只需一条命令即可在本地跑语言大模型

标签： llama 人工智能 pytorch

Ollama是一个开源的大型语言模型服务工具，它帮助用户快速在本地运行大模型，通过简单的安装指令，可以让用户执行一条命令就在本地运行开源大型语言模型。本文旨在简易教会读者如何下载安装配环境以及使用Ollama，...

轻松玩转书生·浦语大模型趣味 Demo

标签： ai python

水墨画是由水和墨调配成不同深浅的墨色所画出的画，是绘画的一种形式，更多时候，水墨画被视为中国传统绘画，也就是国画的代表。墨水是国画的起源，以笔墨运用的技法基础画成墨水画。线条中锋笔，侧锋笔，顺锋和逆锋...

使用Ollama实现本地部署大模型

标签：人工智能自然语言处理语言模型

打开Ollama的官网，整个网页上就只有一句显眼的话：Get up and running with large language models, locally. 中文意思是：在本地快速上手并运行大型语言模型。

百度沈抖：“云智一体”升级，打造大模型服务的“超级工厂”

标签：人工智能百度 dubbo

10月17日，百度世界2023在北京首钢园召开。百度智能云在大会期间宣布：全面升级“云智一体...发布国内首个AI原生应用商店，以及国内首个大模型全链路生态支持体系，赋能伙伴商业增长，共建、共享繁荣的大模型产业生态。

【人工智能】LLM大模型中的词嵌入和上下文理解技术实例讲解，附具体的代码例子

标签：人工智能 tensorflow 深度学习

词嵌入（Word Embeddings）可以将高维的文本数据转换成低维的稠密向量表示，在进行自然语言处理任务时，这样的表示方式可以帮助算法理解...以下是一个使用 TensorFlow 和 Keras 实现 Word2Vec 词嵌入模型的代码实例。

大模型初体验-阿里云百炼入门demo

标签：阿里云数据库 redis

阿里云百炼是一站式的企业专属大模型生产平台，基于通义基础大模型，提供企业专属大模型开发和应用的整套工具链。

AI大模型引领未来智慧科研暨ChatGPT自然科学应用

标签：人工智能 chatgpt 数据分析

使用大模型指令绘制柱状图（误差线）、散点图、相关网络图、热图、小提琴图、箱型图、雷达图、玫瑰图、气泡图、森林图、三元图、三维图等各类科研图、科研选题、思维导图、数据清洗、统计分析、高级编程、代码调试、...

本地大模型运行框架Ollama

标签：群晖 docker 人工智能

Ollama 是一个简明易用的本地大模型运行框架。

【人工智能】LLM 大模型技术调研

标签：人工智能 ChatGPT 大模型

1.主要内容a.大模型技术概览b.关键技术点c.落地应用探讨d.未来发展方向2.术语约定a.大模型：1000亿参数量以上的模型b.中模型：100亿参数量左右的模型c.小模型：10亿参数量以下的模型。

探索设计模式的魅力：MVVM模式在AI大模型领域的创新应用-打破传统，迎接智能未来

标签：设计模式人工智能 AI大模型

MVVM基本概念和核心优势在当今数字化的浪潮中，技术的革新与融合正不断推动着软件开发的边界。其中，MVVM（Model-View-ViewModel）模式的出现，为前端开发带来了一种全新的组织代码和思考设计的方式。...

大模型私有化+精调：面向垂直行业与特定场景之需

标签： python 开发语言 AI大模型

大模型私有化（Model Private Deployment）指的是将预训练的大型人工智能模型（如GPT、BERT等）部署到企业自己的硬件环境或私有云平台上。与公有云服务或模型即服务（Model-as-a-Service）相比，私有化部署能够给...

「小明赠书活动」2024第二期《实战AI大模型》

标签：人工智能 chatgpt AI大模型

你评论我送书~ 参与方式：关注、点赞、收藏，评论 "实战AI大模型

为什么开源语言大模型很重要？

标签：开源大模型语言模型

在LLM领域，开源究竟意味着什么？假设开源社区拥有了真正的开源LLM，其权重、数据集、代码和基础设施都可公开获取，我们又将从中获得哪些重要收益？本文作者为Vikram Sreekanti和Joseph E. Gonzalez，前者是Aqueduct...

《containerd原理剖析与实战》大模型时代下如何学习云原生

标签：学习云原生

作为一名云原生以及容器技术的忠实粉丝，笔者很早就接触到了 containerd 项目，见证了 containerd 项目的发展，并为之取得的成就感到骄傲。也对 containerd 项目充满了信心。因此希望通过这本书让更多的人了解 ...

开源项目Ollama让你的电脑也可以运行大模型

标签：开源 webpack 人工智能

从OPEN AI推出大模型已经过去一年多了，想必大家已经感受到了AI对我们的影响。大型模型极具用途，其提升的准确性和处理更复杂任务的能力都令人赞叹。

大模型与大数据之间的关系

标签：大数据人工智能计算机视觉

大模型和大数据之间是相辅相成、相互促进的关系。大数据指的是规模庞大、类型复杂、处理速度快的数据集合，通常包括结构化数据和非结构化数据。大数据具有广泛的应用场景，例如推荐系统、广告投放、客户关系管理等。...

AquilaChat-7B: 国产开源大模型新成员——AI领域的创新型研发机构智源人工智能研究院出品

标签：开源人工智能机器学习

Aquila语言大模型在技术上继承了GPT-3、LLaMA等的架构设计优点，替换了一批更高效的底层算子实现、重新设计实现了中英双语的tokenizer，升级了BMTrain并行训练方法，在Aquila的训练过程中实现了比Magtron+DeepSpeed ...

人工智能大语言模型微调技术：SFT 监督微调、LoRA 微调方法、P-tuning v2 微调方法、Freeze 监督微调方法

标签：人工智能自然语言处理大语言模型

人工智能大语言模型微调技术：SFT 监督微调、LoRA 微调方法、P-tuning v2 微调方法、Freeze 监督微调方法

大模型入门（一）—— LLaMa/Alpaca/Vicuna

标签： llama transformer 深度学习

相比于ChatGPT或者GPT4来说，LLaMa可能效果上还有差距，但相比Closed AI，至少LLaMa论文和模型都开源出来了，目前hugging face已集成了LLaMa的代码实现和开源模型。Alpaca是斯坦福在LLaMa-7B的基础上监督微调出来的...

基于BERT的大模型容量解决方案总结

标签： BERT bert NLP

1.2 趋势二：大模型训练代价难以负担，成本高居不下 2. 比赛任务 3. 解决方案 3.1 模型显存分析 3.2 优化1：调整计算顺序 3.3 优化2：层间融合 3.4 优化3∶层内内存复用( Memory-Reuse Intra Layer ) 4. 分布式训练...

【中科院】新一代人工智能大模型——紫东太初2.0 发布 —— 六月起AI大模型产品和应用迎来了集中发布

标签：人工智能

人工智能大模型是一个庞大复杂的网络系统，类似于人的大脑，其中的节点和数据量越多，处理能力也越强大，通常这种大模型节点数都在百亿以上。作为我国首个存储千亿参数的图文音三模态大模型，第一代紫东太初人工智能...

【人工智能】基于大模型和脑神经科学相结合的技术，未来原创爆款的能力机会也将悄然到来

标签：人工智能大数据数据挖掘

大数据和大模型密切相关，大数据为大模型提供了庞大的数据资料库，从而使得模型可以从海量数据中学习优化，并提炼出更高水平的规律和知识。从实际应用的角度来看，如何将脑神经科学的理论成果转化为现实生活中的产品...

Instruct-UIE：信息抽取统一大模型

标签：人工智能机器学习自然语言处理

加入NLP交流群复旦大学自然语言处理实验室桂韬、张奇课题组发布信息抽取统一大模型 Instruct-UIE，在领域大模型上取得突破性进展。Instruct-UIE 在信息抽取精度上全面大幅度超越ChatGPT以及基于预训练微调的单一小...

大模型：深度学习领域的“巨无霸”

标签：深度学习人工智能计算机视觉

随着人工智能技术的不断发展，深度学习已经成为了目前最为热门的技术之一。...虽然使用大模型需要一定的技术和资源支持，但是随着技术的不断发展和硬件设备的不断提升，相信大模型将会在未来得到更广泛的应用。

探索文档图像大模型，提升智能文档处理性能

标签：人工智能大模型智能文档处理

尽管多模态大模型技术在智能文档处理领域有着重要的作用，但它并没有完全解决该领域面临的问题。本文通过回顾丁凯博士在第十九届中国图象图形学学会青年科学家会议 - 垂直领域大模型论坛上的报告，介绍了 GPT-4V 在 ...

”大模型“ 的搜索结果

LLaMA模型系统解读

【人工智能】论未来人工智能的大模型生态：重塑技术前景与应用

大模型核心技术原理: Transformer架构详解

大模型核心技术原理: Transformer架构详解

如何利用低比特量化技术进一步提升大模型推理性能

Ollama高效、功能齐全的LLM大模型服务工具——只需一条命令即可在本地跑语言大模型

轻松玩转书生·浦语大模型趣味 Demo

使用Ollama实现本地部署大模型

百度沈抖：“云智一体”升级，打造大模型服务的“超级工厂”

【人工智能】LLM大模型中的词嵌入和上下文理解技术实例讲解，附具体的代码例子

大模型初体验-阿里云百炼入门demo

AI大模型引领未来智慧科研暨ChatGPT自然科学应用

本地大模型运行框架Ollama

【人工智能】LLM 大模型技术调研

探索设计模式的魅力：MVVM模式在AI大模型领域的创新应用-打破传统，迎接智能未来

大模型私有化+精调：面向垂直行业与特定场景之需

「小明赠书活动」2024第二期《实战AI大模型》

为什么开源语言大模型很重要？

《containerd原理剖析与实战》大模型时代下如何学习云原生

开源项目Ollama让你的电脑也可以运行大模型

大模型与大数据之间的关系

AquilaChat-7B: 国产开源大模型新成员——AI领域的创新型研发机构智源人工智能研究院出品

人工智能大语言模型微调技术：SFT 监督微调、LoRA 微调方法、P-tuning v2 微调方法、Freeze 监督微调方法

大模型入门（一）—— LLaMa/Alpaca/Vicuna

基于BERT的大模型容量解决方案总结

【中科院】新一代人工智能大模型——紫东太初2.0 发布 —— 六月起AI大模型产品和应用迎来了集中发布

【人工智能】基于大模型和脑神经科学相结合的技术，未来原创爆款的能力机会也将悄然到来

Instruct-UIE：信息抽取统一大模型

大模型：深度学习领域的“巨无霸”

探索文档图像大模型，提升智能文档处理性能

推荐文章