Sora普通人理解的原理——帧处理_sora每生成一帧需要消耗-程序员宅基地

技术标签: llama  算法  深度学习  人工智能  目标跟踪  

前言

李一舟大家最近都看到过他的视频,或者是听说过他的事情,也都知道Sora还在测试中,但是它发的效果视频还是非常震撼的,并且整个视频时长是60s的,大家也都知道,抖音的中视频计划最低的时间要求就是大于60s的视频,那么,如果利用Sora来生成视频,那么真就可以批量处理了,可以离开剪辑师,一个人用Sora就可生成无数的视频,并且质量都不低,按照这个方法,那真的是一本万利啊。

大家都知道,现阶段文生图的功能基本上已经完全实现了,而且使用的价值也不高,如果自己有一台配置比较高的电脑,自己搭建一个stable diffusion就能生成各类的图片,而且高清处理一下,图片的画质也是相当的可以。那么Sora是依赖于什么生成的呢?

视频原理

我们玩过stablediffusion的都知道一个插件【AnimateDiff】,这个插件就可以生成视频,一般生成2~15s的视频,不会太大,因为对应的资源消耗太大,很多电脑都跑不起来,后来清华除了一款插件可以让内存消耗小一些,可以消耗的时间又是太多,用时间换空间,要不就是用空间换时间,但是对应的原理我们能知道。

如果生成的内容较大,计算机扛不住就会看到以下的提示。

很明显,超了,玩不转了。但是为什么会玩不转呢?其实就是生成的内容比较多,一次性进入到内存里,所以玩不转,如果要是单个图片的生成就是没有问题的呢。

一般电影的帧数为24帧,我们所看的视频16~24帧,连续播放出来即可看到视频,当然,也会有一些超高清的甚至达到60帧,这个帧数代表每秒钟显示的图片数量,数量越多,对应的画质也是越好。

生成一张图片的成本

就拿李一舟网站来说,他那是一般生成一张图需要1万算力起步,提问需要上千算力起步,如果不够了再去购买,好家伙。最贵的钻石会员399元,那是真的贵啊!冲百度的千帆大模型能用好久呢。

你看看,这贵的,受不了,就算我们搭个桥去外网用GPT4也就这么多吧。

我们在从百度上看看价格,这价格也才两分钱一秒啊,一般一张图片也就1毛钱多一些吧。

我们来简单计算一下,1毛钱一张图片,但是非高清的图片哦,如果高清就得翻翻,那么也就是2毛一张,在上上不能每次都能精准的描述图片,损失率我们估计在30%,故而大致需要:

0.22460*1.3=374.4元

算下来可以看到竟然高达374.4元/1min视频,这成本依然是很高的呢。但是我们知道,具体的算法肯定是被优化了的,如果成本这么高的话肯定是无法商业化处理的,对应的我们就可以期待一下了,程序员的一小步,人类的一大步。

在这里我们可以预计一下成本,既然能让大家都用得起,那么应该1$完成1个60s的视频,也就是差不多六块钱,这样的话还是可以控制成本的。

Sora预计发展趋势

我也算在此行深耕了好多年,我来大胆的分析判断一下,Sora发展的方向:

1、降低成本(压力在算法工程师)
2、融合物理计算(例如C4D等工具)
3、融合化学反应原理(真正的去做实验)
4、融合生物学(生命科学药物或科技)

为什么我没有说其它商用呢,因为我们当前的这个世界本质是由少部分超级资本家所掌握的,资本家要长期享受这种高人一等的生活就必须去大力研发生命科学,他们的资本投入完全可能大于某些国家的年生产总值,故而超级科学家们服务的对象肯定是他们,所以说,Sora会给我们普通人一些娱乐方向的产品,但是2~4都是为了更好的服务于资本而发展。

Sora在短视频上的新风口——对于年长人友好

Sora对于越有阅历的人越友好,大家生成的视频也得在一定的语言描述中才能生成,这会大大的提高老年人再就业的机会,让老人们再次贡献他/她们的价值。

最后,祝大家都能赶上这波Sora的风口,让自己的生活更加没满。

大模型岗位需求

大模型时代,企业对人才的需求变了,AIGC相关岗位人才难求,薪资持续走高,AI运营薪资平均值约18457元,AI工程师薪资平均值约37336元,大模型算法薪资平均值约39607元。
在这里插入图片描述

掌握大模型技术你还能拥有更多可能性

• 成为一名全栈大模型工程师,包括Prompt,LangChain,LoRA等技术开发、运营、产品等方向全栈工程;

• 能够拥有模型二次训练和微调能力,带领大家完成智能对话、文生图等热门应用;

• 薪资上浮10%-20%,覆盖更多高薪岗位,这是一个高需求、高待遇的热门方向和领域;

• 更优质的项目可以为未来创新创业提供基石。

整理了我入门大模型的学习路线和自用资料,在全民LLM时期,多输入一些就多一重安全感。

有需要的小伙伴,可以保存图片到wx扫描二v码免费领取【保证100%免费


在这里插入图片描述

人工智能书籍

第一阶段:零基础入门(3-6个月)

新手应首先通过少而精的学习,看到全景图,建立大局观。 通过完成小实验,建立信心,才能避免“从入门到放弃”的尴尬。因此,第一阶段只推荐4本最必要的书(而且这些书到了第二、三阶段也能继续用),入门以后,在后续学习中再“哪里不会补哪里”即可。

第二阶段:基础进阶(3-6个月)

熟读《机器学习算法的数学解析与Python实现》并动手实践后,你已经对机器学习有了基本的了解,不再是小白了。这时可以开始触类旁通,学习热门技术,加强实践水平。在深入学习的同时,也可以探索自己感兴趣的方向,为求职面试打好基础。

第三阶段:工作应用

这一阶段你已经不再需要引导,只需要一些推荐书目。如果你从入门时就确认了未来的工作方向,可以在第二阶段就提前阅读相关入门书籍(对应“商业落地五大方向”中的前两本),然后再“哪里不会补哪里”。

在这里插入图片描述
有需要的小伙伴,可以点击下方链接免费领取或者V扫描下方二维码免费领取

版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。
本文链接:https://blog.csdn.net/AAI666666/article/details/136444674

智能推荐

oracle 12c 集群安装后的检查_12c查看crs状态-程序员宅基地

文章浏览阅读1.6k次。安装配置gi、安装数据库软件、dbca建库见下:http://blog.csdn.net/kadwf123/article/details/784299611、检查集群节点及状态:[root@rac2 ~]# olsnodes -srac1 Activerac2 Activerac3 Activerac4 Active[root@rac2 ~]_12c查看crs状态

解决jupyter notebook无法找到虚拟环境的问题_jupyter没有pytorch环境-程序员宅基地

文章浏览阅读1.3w次,点赞45次,收藏99次。我个人用的是anaconda3的一个python集成环境,自带jupyter notebook,但在我打开jupyter notebook界面后,却找不到对应的虚拟环境,原来是jupyter notebook只是通用于下载anaconda时自带的环境,其他环境要想使用必须手动下载一些库:1.首先进入到自己创建的虚拟环境(pytorch是虚拟环境的名字)activate pytorch2.在该环境下下载这个库conda install ipykernelconda install nb__jupyter没有pytorch环境

国内安装scoop的保姆教程_scoop-cn-程序员宅基地

文章浏览阅读5.2k次,点赞19次,收藏28次。选择scoop纯属意外,也是无奈,因为电脑用户被锁了管理员权限,所有exe安装程序都无法安装,只可以用绿色软件,最后被我发现scoop,省去了到处下载XXX绿色版的烦恼,当然scoop里需要管理员权限的软件也跟我无缘了(譬如everything)。推荐添加dorado这个bucket镜像,里面很多中文软件,但是部分国外的软件下载地址在github,可能无法下载。以上两个是官方bucket的国内镜像,所有软件建议优先从这里下载。上面可以看到很多bucket以及软件数。如果官网登陆不了可以试一下以下方式。_scoop-cn

Element ui colorpicker在Vue中的使用_vue el-color-picker-程序员宅基地

文章浏览阅读4.5k次,点赞2次,收藏3次。首先要有一个color-picker组件 <el-color-picker v-model="headcolor"></el-color-picker>在data里面data() { return {headcolor: ’ #278add ’ //这里可以选择一个默认的颜色} }然后在你想要改变颜色的地方用v-bind绑定就好了,例如:这里的:sty..._vue el-color-picker

迅为iTOP-4412精英版之烧写内核移植后的镜像_exynos 4412 刷机-程序员宅基地

文章浏览阅读640次。基于芯片日益增长的问题,所以内核开发者们引入了新的方法,就是在内核中只保留函数,而数据则不包含,由用户(应用程序员)自己把数据按照规定的格式编写,并放在约定的地方,为了不占用过多的内存,还要求数据以根精简的方式编写。boot启动时,传参给内核,告诉内核设备树文件和kernel的位置,内核启动时根据地址去找到设备树文件,再利用专用的编译器去反编译dtb文件,将dtb还原成数据结构,以供驱动的函数去调用。firmware是三星的一个固件的设备信息,因为找不到固件,所以内核启动不成功。_exynos 4412 刷机

Linux系统配置jdk_linux配置jdk-程序员宅基地

文章浏览阅读2w次,点赞24次,收藏42次。Linux系统配置jdkLinux学习教程,Linux入门教程(超详细)_linux配置jdk

随便推点

matlab(4):特殊符号的输入_matlab微米怎么输入-程序员宅基地

文章浏览阅读3.3k次,点赞5次,收藏19次。xlabel('\delta');ylabel('AUC');具体符号的对照表参照下图:_matlab微米怎么输入

C语言程序设计-文件(打开与关闭、顺序、二进制读写)-程序员宅基地

文章浏览阅读119次。顺序读写指的是按照文件中数据的顺序进行读取或写入。对于文本文件,可以使用fgets、fputs、fscanf、fprintf等函数进行顺序读写。在C语言中,对文件的操作通常涉及文件的打开、读写以及关闭。文件的打开使用fopen函数,而关闭则使用fclose函数。在C语言中,可以使用fread和fwrite函数进行二进制读写。‍ Biaoge 于2024-03-09 23:51发布 阅读量:7 ️文章类型:【 C语言程序设计 】在C语言中,用于打开文件的函数是____,用于关闭文件的函数是____。

Touchdesigner自学笔记之三_touchdesigner怎么让一个模型跟着鼠标移动-程序员宅基地

文章浏览阅读3.4k次,点赞2次,收藏13次。跟随鼠标移动的粒子以grid(SOP)为partical(SOP)的资源模板,调整后连接【Geo组合+point spirit(MAT)】,在连接【feedback组合】适当调整。影响粒子动态的节点【metaball(SOP)+force(SOP)】添加mouse in(CHOP)鼠标位置到metaball的坐标,实现鼠标影响。..._touchdesigner怎么让一个模型跟着鼠标移动

【附源码】基于java的校园停车场管理系统的设计与实现61m0e9计算机毕设SSM_基于java技术的停车场管理系统实现与设计-程序员宅基地

文章浏览阅读178次。项目运行环境配置:Jdk1.8 + Tomcat7.0 + Mysql + HBuilderX(Webstorm也行)+ Eclispe(IntelliJ IDEA,Eclispe,MyEclispe,Sts都支持)。项目技术:Springboot + mybatis + Maven +mysql5.7或8.0+html+css+js等等组成,B/S模式 + Maven管理等等。环境需要1.运行环境:最好是java jdk 1.8,我们在这个平台上运行的。其他版本理论上也可以。_基于java技术的停车场管理系统实现与设计

Android系统播放器MediaPlayer源码分析_android多媒体播放源码分析 时序图-程序员宅基地

文章浏览阅读3.5k次。前言对于MediaPlayer播放器的源码分析内容相对来说比较多,会从Java-&amp;amp;gt;Jni-&amp;amp;gt;C/C++慢慢分析,后面会慢慢更新。另外,博客只作为自己学习记录的一种方式,对于其他的不过多的评论。MediaPlayerDemopublic class MainActivity extends AppCompatActivity implements SurfaceHolder.Cal..._android多媒体播放源码分析 时序图

java 数据结构与算法 ——快速排序法-程序员宅基地

文章浏览阅读2.4k次,点赞41次,收藏13次。java 数据结构与算法 ——快速排序法_快速排序法