过分!虾皮被曝大范围毁约;深度学习技巧全辑;MongoDB开源替代 4.7K★;剑指Offer解题代码;大数据算法笔记汇总;前沿论文 | ShowMeAI资讯日报-程序员宅基地

技术标签: ShowMeAI资讯日报 首席AI资讯收纳官  计算机视觉  人工智能  pytorch  transformer  mongodb  

ShowMeAI日报系列全新升级!覆盖AI人工智能 工具&框架 | 项目&代码 | 博文&分享 | 数据&资源 | 研究&论文 等方向。点击查看 历史文章列表,在公众号内订阅话题 #ShowMeAI资讯日报,可接收每日最新推送。点击 专题合辑&电子月刊 快速浏览各专题全集。点击 这里 回复关键字 日报 免费获取AI电子月刊与资料包。

太过分!虾皮Shopee新加坡被曝大范围毁约,马上入职被收回offer,猝不及防

Shopee 是新加坡互联网集团SEA旗下的明星公司,在东南亚的电商业务领域大杀四方,能在多个市场压制阿里旗下的 Lazada,承担着『东南亚最像中国互联网大厂的超级公司』期待,也成为中国互联网人才涌入新加坡最热门的目的地。

然而,不少求职者在脉脉爆出,自己临近入职却被 Shopee 通知收回 Offer。签了合同,拿了签证,租了房子,买了机票,甚至已经落地新加披,工作却没了。签证、工作、回国成本等问题都很棘手,完全措手不及。

工具&框架

『lm-debugger』用于检查和调整基于transformer语言模型的交互式工具

https://github.com/mega002/lm-debugger

LM-Debugger 是一个开源的交互式工具,用于检查和调整基于 transformer 的语言模型。GitHub 上的资源库包括在 GPT2 Large 和 GPT2 Medium 上运行 LM-Debugger 所需的代码和数据文件的链接,它可以快速适应于其他模型,只需要改变后台的 API。

『camviz』单目深度估计结果可视化库

https://github.com/TRI-ML/camviz

https://www.tri.global/

CamViz 是一个由TRI-ML团队开发的可视化库,目的是为单目深度估计结果的可视化提供一个接口,包括深度图和重建的点云。它使用PyGame进行窗口显示和输入管理,并使用OpenGL进行二维和三维绘图和渲染。它提供了一种简单而直观的方式将信息存储为纹理和数据缓冲区,以便高效显示,也能快速创建用于图像显示的2D环境和用于点云可视化的3D环境。

『surgeon-pytorch』检视PyTorch模型中间层的工具库

https://github.com/archinetai/surgeon-pytorch

surgeon-pytorch 是一个辅助工具库,可以在不修改代码的情况下检查 PyTorch 模型的中间层。这对于获取语言模型的注意矩阵、可视化层嵌入或对中间层应用损失函数都是很有用的。它还支持提取模型的子部分,并独立运行、调试或者训练它们。借助 Surgeon 可以快速完成上述任务,无需改变原始模型的任何一行。

『xh』Rust写的用来发送HTTP请求的友好快速的工具

https://github.com/ducaale/xh

xh是一个友好和快速发送HTTP请求的工具。它重新实现了HTTPie的优秀设计,重点是提高性能。

『FerretDB』类似MongoDB的开源数据服务 · 4.7k Stars

https://github.com/FerretDB/FerretDB

https://www.ferretdb.io/

MongoDB 是一项改变许多开发者生活的技术,使他们能够比使用关系型数据库更快地构建应用程序。然而 MongoDB 放弃了它的开源根基,将许可证改为 SSPL,使其无法用于许多开源和商业项目。对于那些习惯使用 MongoDB 的开发者来说,FerretDB 是一个完美的解决方案,可视作可替代 MongoDB 的开源软件。

博文&分享

『Sketching Algorithms for Big Data』大数据算法基础课·笔记集锦

https://www.sketchingbigdata.org/fall17/lec/

『剑指 Offer』Python/Java/C++解题代码,『LeetBook 图解算法数据结构』配套代码

https://github.com/krahets/LeetCode-Book

LeetBook《图解算法数据结构》面向算法初学者、互联网求职者设计,主要内容包括:剑指 Offer 图文题解、数据结构与算法专栏。作者将内容整理成『剑指 Offer 一个月刷题计划』,核心理念为从易到难、从基础类题目到综合类题目,可以按照知识点类型顺序刷题,一个月搞定!

数据&资源

『MedMCQA』大规模多项选择题问答数据集,旨在解决现实世界的医学入学考试问题

https://github.com/medmcqa/medmcqa

https://medmcqa.github.io/

MedMCQA 拥有超过 19.4万个高质量的 AIIMS 和 NEET PG入学考试题,每个样本都包含一个问题、正确答案和其他需要更深入的语言理解的选项,为自然语言处理社区提供了一个开源数据集。

数据集涵盖 2.4k 个医疗保健主题,收集了麻醉、解剖学、生物化学、牙科、耳鼻喉科、眼科、骨科、儿科、精神病学、放射学等 21 个医学主题,主题多样性很高。

『Efficient Deep Learning』高效深度学习:深度学习过程加速技巧集

https://github.com/Mountchicken/Efficient-Deep-Learning

深度学习飞速发展,吸引着越来越多的学习者和从业者涌向了这个领域。作者整理汇总了自己在深度学习的过程中遇到了各种各样的问题和解决方案,让你获取高效深度学习的技巧。

Repo 包含高效编码的策略、高效数据处理的策略、加快训练过程的策略、提高 GPU 利用率的策略、有用工具的列表等6个部分,每个部分包含几篇文章,详细讲解各主题的技巧细节。

研究&论文

公众号回复关键字日报,免费获取整理好的论文合辑。

科研进展

  • 2022.07.25 『图像超分辨率变换』 Reference-based Image Super-Resolution with Deformable Attention Transformer
  • 2022.07.30 『数据提炼』Delving into Effective Gradient Matching for Dataset Condensation
  • 2022.07.20 『联邦学习』FedDM: Iterative Distribution Matching for Communication-Efficient Federated Learning
  • 2022.07.28 『目标检测』HorNet: Efficient High-Order Spatial Interactions with Recursive Gated Convolutions

论文:Reference-based Image Super-Resolution with Deformable Attention Transformer

论文时间:25 Jul 2022

领域任务:Image Super-Resolution,图像超分辨率变换

论文地址:https://arxiv.org/abs/2207.11938

代码实现:https://github.com/caojiezhang/datsr

论文作者:JieZhang Cao, Jingyun Liang, Kai Zhang, Yawei Li, Yulun Zhang, Wenguan Wang, Luc van Gool

论文简介:Reference-based image super-resolution (RefSR) aims to exploit auxiliary reference (Ref) images to super-resolve low-resolution (LR) images./基于参考的图像超分辨率(RefSR)旨在利用辅助参考(Ref)图像来超解低分辨率(LR)图像。

论文摘要:基于参考的图像超分辨率(RefSR)旨在利用辅助参考(Ref)图像来超解低分辨率(LR)图像。最近,RefSR已经引起了极大的关注,因为它提供了一种超越单幅图像SR的替代方法。然而,解决RefSR问题有两个关键的挑战:(i)当LR图像和参考图像有明显的不同时,很难匹配它们之间的对应关系;(ii)如何从参考图像中转移相关纹理以补偿LR图像的细节是非常具有挑战性的。为了解决RefSR的这些问题,本文提出了一种具有多个尺度的可变形注意力Transformer,即DATSR,每个Transformer由纹理特征编码器(TFE)模块、基于参考的可变形注意力(RDA)模块和残余特征聚合(RFA)模块组成。具体来说,TFE首先为LR和Ref图像提取对图像变换(如亮度)不敏感的特征,然后RDA可以利用多种相关纹理来补偿LR特征的更多信息,最后RFA将LR特征和相关纹理聚合起来,得到视觉上更愉悦的结果。广泛的实验表明,我们的DATSR在数量和质量上都达到了基准数据集的最先进性能。

论文:Delving into Effective Gradient Matching for Dataset Condensation

论文时间:30 Jul 2022

领域任务:Dataset Condensation,数据提炼

论文地址:https://arxiv.org/abs/2208.00311

代码实现:https://github.com/Guang000/Awesome-Dataset-Distillation

论文作者:Zixuan Jiang, Jiaqi Gu, Mingjie Liu, David Z. Pan

论文简介:In this work, we delve into the gradient matching method from a comprehensive perspective and answer the critical questions of what, how, and where to match./在这项工作中,我们从一个全面的角度深入研究了梯度匹配方法,并回答了什么、如何以及在哪里匹配等关键问题。

论文摘要:随着深度学习模型和数据集的迅速扩大,网络训练是非常耗时和资源成本的。与其在整个数据集上进行训练,用一个小的合成数据集进行学习成为一个有效的解决方案。在数据集提炼的方向上已经进行了广泛的研究探索,其中梯度匹配取得了最先进的性能。梯度匹配方法通过在原始数据集和合成数据集上训练时的梯度匹配直接针对训练动态。然而,对这种方法的原理和效果的深入研究是有限的。在这项工作中,我们从全面的角度深入研究梯度匹配方法,并回答了匹配什么、如何匹配、在哪里匹配等关键问题。我们提出,多级梯度的匹配要同时涉及类内和类间的梯度信息。我们证明了距离函数应该集中在角度上,同时考虑幅度以延迟过拟合。我们还提出了一个过拟合感知的自适应学习步骤策略,以修剪不必要的优化步骤,提高算法效率。消融和比较实验表明,与先前的工作相比,我们提出的方法显示出更高的准确性、效率和通用性。

论文:FedDM: Iterative Distribution Matching for Communication-Efficient Federated Learning

论文时间:20 Jul 2022

领域任务:Federated Learning, Image Classification,联邦学习图像分类

论文地址:https://arxiv.org/abs/2207.09653

代码实现:https://github.com/Guang000/Awesome-Dataset-Distillation/blob/main/README.md

论文作者:Yuanhao Xiong, Ruochen Wang, Minhao Cheng, Felix Yu, Cho-Jui Hsieh

论文简介:Federated learning~(FL) has recently attracted increasing attention from academia and industry, with the ultimate goal of achieving collaborative training under privacy and communication constraints./联邦学习~(FL)最近引起了学术界和工业界越来越多的关注,其最终目标是在隐私和通信约束下实现协作训练。

论文摘要:联邦学习~(FL)最近吸引了学术界和工业界越来越多的关注,其最终目标是在隐私和通信约束下实现协作训练。现有的基于迭代模型平均化的FL算法需要大量的通信回合来获得一个表现良好的模型,这是因为不同client之间的数据划分极不平衡且非i.i.d。因此,我们提出了FedDM,从多个本地代理函数中建立全局训练目标,这使得服务器能够获得一个更全局的损失景观。详细来说,我们在每个client上构建合成的数据集,通过分布匹配与原始数据的损失景观进行局部匹配。与笨重的模型权重相比,FedDM通过传输更多信息和更小的合成数据,减少了通信回合,提高了模型质量。我们在三个图像分类数据集上进行了广泛的实验,结果表明,我们的方法在效率和模型性能方面可以超过其他FL对应的方法。此外,我们证明FedDM可以适应高斯机制,以保护差异化的隐私,并在相同的隐私预算下训练一个更好的模型。

论文:HorNet: Efficient High-Order Spatial Interactions with Recursive Gated Convolutions

论文时间:28 Jul 2022

领域任务:Image Classification, object-detection, 图像分类目标检测

论文地址:https://arxiv.org/abs/2207.14284

代码实现:https://github.com/raoyongming/hornet

论文作者:Yongming Rao, Wenliang Zhao, Yansong Tang, Jie zhou, Ser-Nam Lim, Jiwen Lu

论文简介:In this paper, we show that the key ingredients behind the vision Transformers, namely input-adaptive, long-range and high-order spatial interactions, can also be efficiently implemented with a convolution-based framework./在本文中,我们展示了视觉Transformers背后的关键成分,即输入自适应、长距离和高阶空间互动,也可以通过基于卷积的框架有效实现。

论文摘要:最近在视觉Transformers方面取得的进展显示,在基于点积自我注意的新空间建模机制的驱动下,在各种任务中取得了巨大的成功。在本文中,我们展示了视觉Transformers背后的关键成分,即输入自适应、长距离和高阶空间互动,也可以通过基于卷积的框架有效地实现。我们提出了递归门控卷积(gnConv),用门控卷积和递归设计来执行高阶空间互动。新的操作是高度灵活和可定制的,它与卷积的各种变体兼容,并将自我注意中的两阶互动扩展到任意的阶数,而不引入大量的额外计算。gnConv可以作为一个即插即用的模块来改进各种视觉Transformers和基于卷积的模型。基于该操作,我们构建了一个新的通用视觉骨干系列,名为HorNet。在ImageNet分类、COCO物体检测和ADE20K语义分割上的大量实验表明,HorNet在整体架构和训练配置相似的情况下,比Swin Transformers和ConvNeXt要好得多。HorNet还显示了对更多训练数据和更大模型规模的有利可扩展性。除了在视觉编码器中的有效性外,我们还表明gnConv可以应用于特定任务的解码器,并以较少的计算量持续提高密集预测性能。我们的结果表明,gnConv可以成为一个新的视觉建模的基本模块,有效地结合了视觉变形器和CNN的优点。代码可在 https://github.com/raoyongming/HorNet 获取。

我们是 ShowMeAI,致力于传播AI优质内容,分享行业解决方案,用知识加速每一次技术成长!点击查看 历史文章列表,在公众号内订阅话题 #ShowMeAI资讯日报,可接收每日最新推送。点击 专题合辑&电子月刊 快速浏览各专题全集。点击 这里 回复关键字 日报 免费获取AI电子月刊与资料包。

版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。
本文链接:https://blog.csdn.net/ShowMeAI/article/details/126533913

智能推荐

EasyDarwin开源流媒体云平台之EasyRMS录播服务器功能设计_开源录播系统-程序员宅基地

文章浏览阅读3.6k次。需求背景EasyDarwin开发团队维护EasyDarwin开源流媒体服务器也已经很多年了,之前也陆陆续续尝试过很多种服务端录像的方案,有:在EasyDarwin中直接解析收到的RTP包,重新组包录像;也有:在EasyDarwin中新增一个RecordModule,再以RTSPClient的方式请求127.0.0.1自己的直播流录像,但这些始终都没有成气候;我们的想法是能够让整套EasyDarwin_开源录播系统

oracle Plsql 执行update或者delete时卡死问题解决办法_oracle delete update 锁表问题-程序员宅基地

文章浏览阅读1.1w次。今天碰到一个执行语句等了半天没有执行:delete table XXX where ......,但是在select 的时候没问题。后来发现是在执行select * from XXX for update 的时候没有commit,oracle将该记录锁住了。可以通过以下办法解决: 先查询锁定记录 Sql代码 SELECT s.sid, s.seri_oracle delete update 锁表问题

Xcode Undefined symbols 错误_xcode undefined symbols:-程序员宅基地

文章浏览阅读3.4k次。报错信息error:Undefined symbol: typeinfo for sdk::IConfigUndefined symbol: vtable for sdk::IConfig具体信息:Undefined symbols for architecture x86_64: "typeinfo for sdk::IConfig", referenced from: typeinfo for sdk::ConfigImpl in sdk.a(config_impl.o) _xcode undefined symbols:

项目05(Mysql升级07Mysql5.7.32升级到Mysql8.0.22)_mysql8.0.26 升级32-程序员宅基地

文章浏览阅读249次。背景《承接上文,项目05(Mysql升级06Mysql5.6.51升级到Mysql5.7.32)》,写在前面需要(考虑)检查和测试的层面很多,不限于以下内容。参考文档https://dev.mysql.com/doc/refman/8.0/en/upgrade-prerequisites.htmllink推荐阅读以上链接,因为对应以下问题,有详细的建议。官方文档:不得存在以下问题:0.不得有使用过时数据类型或功能的表。不支持就地升级到MySQL 8.0,如果表包含在预5.6.4格_mysql8.0.26 升级32

高通编译8155源码环境搭建_高通8155 qnx 源码-程序员宅基地

文章浏览阅读3.7k次。一.安装基本环境工具:1.安装git工具sudo apt install wget g++ git2.检查并安装java等环境工具2.1、执行下面安装命令#!/bin/bashsudoapt-get-yinstall--upgraderarunrarsudoapt-get-yinstall--upgradepython-pippython3-pip#aliyunsudoapt-get-yinstall--upgradeopenjdk..._高通8155 qnx 源码

firebase 与谷歌_Firebase的好与不好-程序员宅基地

文章浏览阅读461次。firebase 与谷歌 大多数开发人员都听说过Google的Firebase产品。 这就是Google所说的“ 移动平台,可帮助您快速开发高质量的应用程序并发展业务。 ”。 它基本上是大多数开发人员在构建应用程序时所需的一组工具。 在本文中,我将介绍这些工具,并指出您选择使用Firebase时需要了解的所有内容。 在开始之前,我需要说的是,我不会详细介绍Firebase提供的所有工具。 我..._firsebase 与 google

随便推点

k8s挂载目录_kubernetes(k8s)的pod使用统一的配置文件configmap挂载-程序员宅基地

文章浏览阅读1.2k次。在容器化应用中,每个环境都要独立的打一个镜像再给镜像一个特有的tag,这很麻烦,这就要用到k8s原生的配置中心configMap就是用解决这个问题的。使用configMap部署应用。这里使用nginx来做示例,简单粗暴。直接用vim常见nginx的配置文件,用命令导入进去kubectl create cm nginx.conf --from-file=/home/nginx.conf然后查看kub..._pod mount目录会自动创建吗

java计算机毕业设计springcloud+vue基于微服务的分布式新生报到系统_关于spring cloud的参考文献有啥-程序员宅基地

文章浏览阅读169次。随着互联网技术的发发展,计算机技术广泛应用在人们的生活中,逐渐成为日常工作、生活不可或缺的工具,高校各种管理系统层出不穷。高校作为学习知识和技术的高等学府,信息技术更加的成熟,为新生报到管理开发必要的系统,能够有效的提升管理效率。一直以来,新生报到一直没有进行系统化的管理,学生无法准确查询学院信息,高校也无法记录新生报名情况,由此提出开发基于微服务的分布式新生报到系统,管理报名信息,学生可以在线查询报名状态,节省时间,提高效率。_关于spring cloud的参考文献有啥

VB.net学习笔记(十五)继承与多接口练习_vb.net 继承多个接口-程序员宅基地

文章浏览阅读3.2k次。Public MustInherit Class Contact '只能作基类且不能实例化 Private mID As Guid = Guid.NewGuid Private mName As String Public Property ID() As Guid Get Return mID End Get_vb.net 继承多个接口

【Nexus3】使用-Nexus3批量上传jar包 artifact upload_nexus3 批量上传jar包 java代码-程序员宅基地

文章浏览阅读1.7k次。1.美图# 2.概述因为要上传我的所有仓库的包,希望nexus中已有的包,我不覆盖,没有的添加。所以想批量上传jar。3.方案1-脚本批量上传PS:nexus3.x版本只能通过脚本上传3.1 批量放入jar在mac目录下,新建一个文件夹repo,批量放入我们需要的本地库文件夹,并对文件夹授权(base) lcc@lcc nexus-3.22.0-02$ mkdir repo2..._nexus3 批量上传jar包 java代码

关于去隔行的一些概念_mipi去隔行-程序员宅基地

文章浏览阅读6.6k次,点赞6次,收藏30次。本文转自http://blog.csdn.net/charleslei/article/details/486519531、什么是场在介绍Deinterlacer去隔行处理的方法之前,我们有必要提一下关于交错场和去隔行处理的基本知识。那么什么是场呢,场存在于隔行扫描记录的视频中,隔行扫描视频的每帧画面均包含两个场,每一个场又分别含有该帧画面的奇数行扫描线或偶数行扫描线信息,_mipi去隔行

ABAP自定义Search help_abap 自定义 search help-程序员宅基地

文章浏览阅读1.7k次。DATA L_ENDDA TYPE SY-DATUM. IF P_DATE IS INITIAL. CONCATENATE SY-DATUM(4) '1231' INTO L_ENDDA. ELSE. CONCATENATE P_DATE(4) '1231' INTO L_ENDDA. ENDIF. DATA: LV_RESET(1) TY_abap 自定义 search help