持续创作,加速成长!这是我参与「掘金日新计划 · 10 月更文挑战」的第5天,点击查看活动详情
📢 新研究!AI扫描视网膜,即可精准预测心脏病和中风
British Journal of Ophthalmology(英国眼科杂志在线)发表的一项研究发现,全自动 AI 算法(QUantitative Analysis of Retinal vessels Topology and siZe,简称 QUARTZ)可以扫描视网膜图像,了解血管健康状况,并帮助预测识别心脏病/中风的高危患病人群。
研究人员将 QUARTZ 应用于 88052 名 40-69 岁的参与者视网膜图像,专门观察视网膜小动脉和小静脉的宽度、血管面积和弯曲度(曲折度),以开发中风/心脏病发作的预测模型。随后将模型应用于欧洲 EPIC 研究项的 7411 名 48-92 岁的参与者的视网膜图像,并跟踪所有参与者的健康状况长达 7-9 年,对 QUARTZ 的性能与泛化能力进行验证。
结果显示,AI驱动的系统(当与年龄、性别、吸烟状况和病史相结合时)可以提供中风和心脏病的10年风险分数,这与最常用的诊断工具——弗雷明汉风险评分(FRS)——效果相当。但是,FRS诊断需要验血和测量血压,而自动眼球扫描技术则不需要——这意味着如果该技术被广泛部署,那么更多的人可以得到更好的监测。
工具&框架
🚧 『MLOps Platform Skeleton』MLOps 简化平台
MLOps Platform Skeleton 包含一个简化的 MLOps 平台(包括训练、服务和监控),是受到 MLOps Zoomcamp 的启发而开发的。项目中包含的教程展示了各个服务的作用以及它们如何共同工作。代码被保持在精简程度,所有东西都被捆绑在docker compose中。它可以作为一个骨架,扩充后用于更高级的项目。
🚧 『detrex』基于 Transformer 的检测算法工具包
detrex.readthedocs.io/en/latest/
detrex 是一个开源的工具箱,提供最先进的基于 Transformer 的检测算法。它建立在 Detectron2 之上,其模块设计部分借鉴了 MMDetection 和 DETR。主分支可以在 Pytorch 1.10 以上版本中工作(推荐 Pytorch 1.12)。
🚧 『WeGongYi』 公益培训报名小程序
公益培训报名小程序,提供给文化馆,图书馆,文体中心,青少年活动中心,少年宫等社会公益机构进行公益培训活动报名登记的小工具,前后端代码完整,主要功能包括公告通知,课堂风采,报名列表,报名登记,采用腾讯提供的小程序云开发解决方案,无须服务器和域名。
🚧 『DetHub』开源目标检测 / 实例分割实验中心
DetHub 是一个开源的物体检测/实例分割实验中心。我们希望通过它支持检测数据集和基线分享,包括:
- 支持越来越多的数据集
- 为这些数据集提供可重复的基线配置
- 为这些数据集提供预训练的模型、结果和推理代码
🚧 『CodeGeeX』具有130亿参数的多编程语言代码生成预训练模型
CodeGeeX 是一个拥有130亿个参数的大规模多语言代码生成模型,在20多种编程语言的大型代码语料库上进行预训练获得。CodeGeeX有以下特性:
- 多语言代码生成。CodeGeeX 在生成几种主流编程语言的可执行程序方面具有良好的性能,包括 Python、C++、Java、JavaScript、Go 等。
- 跨语言的代码翻译。CodeGeeX 支持不同语言间的代码片段的翻译。只需点击一下,CodeGeeX 就可以将程序转化为任何预期的语言,而且精度很高。
- 可定制的编程助手:CodeGeeX 在 VS Code 扩展市场上是免费提供的。
- 开源和跨平台。所有的代码和模型权重将被公开用于研究目的。
如下图所示,为代码生成和代码翻译两个任务的 DEMO!
博文&分享
👍 『CS4780 / CS5780 | Machine Learning for Intelligent Systems』康奈尔大学 · 智能系统机器学习 · 课程及资料
www.cs.cornell.edu/courses/cs4…
如何构建随着经验自动改进的计算机程序,是机器学习领域关注的方向,许多应用程序也取得了成功——从学习检测欺诈性信用卡交易的数据挖掘程序,到学习用户阅读偏好的信息过滤系统,再到学习驾驶的自动驾驶汽车。
本课程将对机器学习领域进行广泛的介绍。课程学习需要有一定的数学基础,如矩阵代数、概率论/统计学、多元微积分。
- Machine Learning Setup(机器学习设置)
- k-Nearest Neighbors / Curse of Dimensionality(k-最近邻/维度灾难)
- Perceptron(感知器感知器)
- Estimating Probabilities from data(从数据估计概率)
- Bayes Classifier and Naive Bayes(贝叶斯分类器和朴素贝叶斯)
- Logistic Regression / Maximum Likelihood Estimation / Maximum a Posteriori(逻辑回归/最大似然估计/最大后验)
- Gradient Descent(梯度下降)
- Linear Regression(线性回归)
- Support Vector Machine(支持向量机)
- Empirical Risk Minimization(经验风险最小化)
- Model Selection(模型选择)
- Bias-Variance Tradeoff(偏差-方差权衡)
- Kernels(核)
- Gaussian Processes(高斯过程)
- k-Dimensional Trees(k 维树)
- Decision Trees(决策树)
- Bagging
- Boosting
- Neural Networks(神经网络)
- Deep Learning / Stochastic Gradient Descent(深度学习/随机梯度下降)
课程参考书籍是以下两本:『Machine Learning A Probabilistic Perspective』『The Elements of Statistical Learning』。
数据&资源
🔥 『Awesome Graph Neural Network Systems』图神经网络(GNN)系统相关文献资源列表
本资源列表包含图神经网络(GNN)系统相关资源,包括常用工具库和如下研究方向的论文和代码:
- GNN 综述
- GNN 内核
- GNN 编译器
- 分布式 GNN 训练系统
- 大型图的训练系统
- 量化的 GNNs
- GNN 数据加载器
- GNN 训练加速器
- GNN 推理加速器
研究&论文
公众号后台回复关键字 日报,免费获取整理好的论文合辑。
科研进展
- 2022.09.15 『看图说话』 LAVIS: A Library for Language-Vision Intelligence
- 2022.09.20 『反色调映射』 Text2Light: Zero-Shot Text-Driven HDR Panorama Generation
- 2022.09.18 『语义分割』 SegNeXt: Rethinking Convolutional Attention Design for Semantic Segmentation
⚡ 论文:LAVIS: A Library for Language-Vision Intelligence
论文时间:15 Sep 2022
领域任务:Image Captioning, Image Retrieval, 看图说话,图像检索
论文作者:Dongxu Li, Junnan Li, Hung Le, Guangsen Wang, Silvio Savarese, Steven C. H. Hoi
论文简介:We introduce LAVIS, an open-source deep learning library for LAnguage-VISion research and applications./我们推出LAVIS,一个用于LAnguage-VISION研究和应用的开源深度学习库。
论文摘要:我们推出LAVIS,一个用于语言-视觉研究和应用的开源深度学习库。LAVIS旨在成为一个一站式的综合平台,为研究人员和从业人员提供语言-视觉领域的最新进展,并促进未来的研究和发展。它有一个统一的界面,可以方便地访问最先进的图像语言、视频语言模型和通用数据集。LAVIS支持各种任务的训练、评估和基准测试,包括多模态分类、检索、字幕、视觉问题回答、对话和预训练。同时,该库还具有高度的可扩展性和可配置性,便于未来的开发和定制。在这份技术报告中,我们描述了该库的设计原则、关键组件和功能,并介绍了常见语视任务的基准测试结果。该库的网址是:github.com/salesforce/…
⚡ 论文:Text2Light: Zero-Shot Text-Driven HDR Panorama Generation
论文时间:20 Sep 2022
领域任务:inverse tone mapping, Inverse-Tone-Mapping, 反色调映射
论文作者:Zhaoxi Chen, Guangcong Wang, Ziwei Liu
论文简介:To achieve super-resolution inverse tone mapping, we derive a continuous representation of 360-degree imaging from the LDR panorama as a set of structured latent codes anchored to the sphere./为了实现超分辨率反色调映射,我们从LDR全景图中导出了360度成像的连续表示,作为一组锚定在球体上的结构化潜伏编码。
论文摘要:高质量的HDRI(高动态范围图像),通常是HDR全景图,是在图形中创建逼真的照明和360度反射的3D场景的最流行的方法之一。鉴于捕捉HDRIs的难度,人们非常需要一个通用的、可控的生成模型,让普通用户能够直观地控制生成过程。然而,现有的最先进的方法仍然难以合成复杂场景的高质量全景图。在这项工作中,我们提出了一个零拍摄文本驱动的框架,即Text2Light,以生成4K+分辨率的HDRIs,而不需要配对的训练数据。给定一个自由格式的文本作为场景的描述,我们通过两个专门的步骤合成相应的HDRI。1)文本驱动的低动态范围(LDR)和低分辨率的全景图生成,以及2)超分辨率反色调映射,在分辨率和动态范围上扩大LDR全景图。具体来说,为了实现零拍摄文本驱动的全景图生成,我们首先建立双编码簿作为不同环境纹理的离散表示。然后,在预先训练好的CLIP模型的驱动下,一个文本条件下的全局采样器学会根据输入文本从全局编码簿中采样整体语义。此外,一个结构感知的局部采样器在整体语义的指导下,学习逐片合成LDR全景图。为了实现超分辨率反色调映射,我们从LDR全景图中导出了360度成像的连续表示,作为锚定在球体上的一组结构化潜伏编码。这种连续表示使一个多功能模块可以同时提高分辨率和动态范围。大量的实验证明了Text2Light在生成高质量HDR全景图方面的卓越能力。此外,我们还展示了我们的工作在现实渲染和沉浸式VR中的可行性。
⚡ 论文:SegNeXt: Rethinking Convolutional Attention Design for Semantic Segmentation
论文时间:18 Sep 2022
领域任务:Semantic Segmentation,语义分割
代码实现:github.com/visual-atte… , github.com/Jittor/JSeg
论文作者:Meng-Hao Guo, Cheng-Ze Lu, Qibin Hou, ZhengNing Liu, Ming-Ming Cheng, Shi-Min Hu
论文简介:Notably, SegNeXt outperforms EfficientNet-L2 w/ NAS-FPN and achieves 90. 6% mIoU on the Pascal VOC 2012 test leaderboard using only 1/10 parameters of it./值得注意的是,SegNeXt的性能优于EfficientNet-L2 w/NAS-FPN,在Pascal VOC 2012测试排行榜上只用了1/10的参数就达到了90. 在Pascal VOC 2012测试排行榜上,仅用其1/10的参数就达到了6%的mIoU。
论文摘要:我们提出了SegNeXt,一个用于语义分割的简单卷积网络架构。由于自我注意在编码空间信息方面的效率,最近基于变压器的模型在语义分割领域占主导地位。在本文中,我们表明卷积注意是一种比变压器中的自我注意机制更有效率和效果的编码上下文信息的方式。通过重新审视成功的分割模型所拥有的特征,我们发现了导致分割模型性能提高的几个关键成分。这促使我们设计了一个新颖的卷积注意力网络,它使用廉价的卷积操作。在没有任何附加条件的情况下,我们的SegNeXt大大改善了以前最先进的方法在流行基准上的性能,包括ADE20K、Cityscapes、COCO-Stuff、Pascal VOC、Pascal Context和iSAID。值得注意的是,SegNeXt的性能优于EfficientNet-L2 w/ NAS-FPN,在Pascal VOC 2012测试排行榜上只用了它的1/10的参数就达到了90.6%的mIoU。与最先进的方法相比,SegNeXt在ADE20K数据集上以相同或更少的计算量平均实现了约2.0%的mIoU改进。代码可在 github.com/uyzhang/JSe… (Jittor)和 github.com/Visual-Atte… (Pytorch)。
我们是 ShowMeAI,致力于传播AI优质内容,分享行业解决方案,用知识加速每一次技术成长!
◉ 点击 日报合辑,在公众号内订阅话题 #ShowMeAI资讯日报,可接收每日最新推送。
◉ 点击 电子月刊,快速浏览月度合辑。